Introduction au traitement du texte et à la recherche d'information
Le modèle vectoriel, tf.idf
Indexation de pages web: PageRank
Sémantique Latente (LSA, LSI)
Calcul distribué: MapReduce, Hadoop, Spark
Défi 6.01 modélisation statistique pour données complexes: https://www.kaggle.com/t/a11b1243c35d4997aebb951b94b76643