Accueil

https://sites.google.com/site/dataminingp7/home/wordcloud_datamining.png?attredirects=0

Bienvenue sur le site du cours de Fouille de Données et Aide à la Décision ! Vous trouverez sur ces pages toutes les informations relatives au cours, ainsi que des supports CM / TP.

Les cours/TD commencent à la rentrée des M2 et s'étalent sur 10 séances + la soutenance de projet. En 2018, ils ont lieu le Jeudi après-midi de 13h30 à 16h30, en salles 1009 (cours, de 13h30 a 15h) puis 2032 (TD/TP, de 15h à 16h30).

"Fouilles de données" se traduit en anglais par "datamining", un mot que vous avez peut-être déjà entendu. Il y a beaucoup de confusion autour de ce terme, et sa différence avec "data science" ou "machine learning" (voire "intelligence artificielle"). C'est de tout ça dont parle ce cours. De manière générale, il s'agit d'apprendre aux ordinateurs à prendre des décisions eux-mêmes.

Le domaine au départ vient des statistiques, mais il est aujourd'hui au croisement de statistiques et de l'informatique. Il faut développer des algorithmes efficaces et les implémenter de manière intelligente car les quantités de données sont immenses. En particulier, on essaie d'écrire des algorithmes parallélisables dans la mesure du possible.

Dans le détail, on parlera d'apprentissage supervisé, non supervisé, par renforcement, ou encore de moteurs de recommandation (voir le programme détaillé).

Il n'y a aucun pré-requis pour le cours. Mais il ne faut pas avoir d'aversion aux maths. Vous n'aurez pas besoin d'apprendre des formules par coeur, ce n'est pas un cours de maths, mais si vous êtes allergiques à X et Y, cela risque de poser problème.

Le TD/TP se fera en python! Je sais que vous avez peut-être un a priori négatif sur le language, je comprends pourquoi. Il n'est pas adapté à tout type de développement, en revanche c'est en python qu'on trouve les librairies les plus complètes et en entreprise c'est le language qui est aujourd'hui préféré dans ce domaine, en particulier pour les "preuves de concept". Bref, TP en python à prendre ou à laisser!

Il y a de nombreux changements par rapport à l'an dernier, il ne faut donc pas trop se fier à ce que vous ont dit les étudiants des années passées:

  • Je remplace l'ancienne enseignante (Anne-Claire Haury), qui a conçu ce cours et me "lègue" son contenu. Je ferai de mon mieux pour être à la hauteur.
  • Ce domaine évolue vite, donc le cours peut changer en partie d'année en année. Cette année, si le temps me le permet j'essaierai de consacrer un peu plus de temps aux réseaux de neurones, et de vous faire utiliser la librairie tensorflow, qui est "la nouvelle librairie à la mode".
  • Le mode d'évaluation va sans doute changer. Certains TD/TP seront peut-être notés. Il y aura toujours une soutenance de projet à la fin.

Les ordinateurs et téléphones seront interdits pendant le cours magistral. Autrement dit, si vous vous inscrivez à ce cours sachez qu'il faudra vous passer de Facebook et de Youtube pendant une matinée... A vos cahiers et stylos!

Les transparents du cours seront accessibles en ligne après chaque cours.

Le cours sera limité à 35 étudiants, pour pouvoir suivre vos projets plus efficacement.