Introduction au traitement du texte et à la recherche d'information
Le modèle vectoriel, tf.idf
Indexation de pages web: PageRank
Sémantique Latente (LSA, LSI)
Calcul distribué: MapReduce, Hadoop, Spark
Défi 6.01 modélisation statistique pour données complexes: https://www.kaggle.com/t/6f2e4515a47147f4bae4a54b21ead689