Vous êtes responsable du choix de votre projet. Les meilleurs projets sont en général ceux qui correspondent à un véritable choix personnel, réfléchi, ou suivant une passion pour un domaine particulier (eg. le Tennis).
Une limitation importante dans le choix des sujets: évitez les séries temporelles (eg. prédiction des cours de la Bourse), car on a pas vu les outils "classiques" pour traiter ces séries, faute de temps, et ce sont des projets qui, en général, ne marchent pas.
Voilà des exemples de "Mauvais" sujets de projet -- a priori: vous pourriez tout à fait faire un projet génial en suivant un de ces sujets, mais il faudra éviter les problèmes que je cite
- Anti-Spam SMS: on l'a vu en cours.
- Prédire le cours de la Bourse: 1) C'est de la série temporelle, ce que je vous déconseille très très fortement. 2) Ça ne marchera jamais :-)
- Deep Learning "pour faire du deep learning": Le Deep Learning, c'est ce qu'on fait quand rien d'autre ne marche. Il faut être capable de justifier ça. Et aussi, le Deep Learning, c'est pas très rigolo quand on le fait marcher, car ça revient souvent à faire tourner une très grosse simulation plusieurs fois avec plusieurs valeurs de paramètres qu'on ne comprend pas, sans savoir ce qu'on va obtenir a la fin (et donc si ca va marcher ou pas).
- Une super interface / démo / app mobile, très jolie, mais qui n'a pas de contenu "Data mining / Deep learning" suffisant.
Voilà des exemples de "Bons" sujets de projet:
- Reconnaissance de caractères chinois
- Bien car: C'est "classique", mais la méthodologie peut être très personnalisée: choix de modèle, de paramètres.
- Prédiction du résultat de combats UFC (en fonction des caractéristiques des combattants et leur historique)
- Bien car: C'est original, on peut espérer d'assez bon résultats, et on peut essayer de prédire le résultat d'un événement futur (ça met la pression)
- Moteur de recommandation d'e-books
- Bien car: Contrairement à la plupart des moteurs de recommandation, on peut faire de l'analyse de contenu poussée (pas seulement des méta-données, comme les tags etc)