R6.01 Big Data: enjeux, stockage et extraction
Syllabus
Syllabus
Introduction au traitement du texte et à la recherche d'information
Le modèle vectoriel, tf.idf
Indexation de pages web: PageRank
Sémantique Latente (LSA, LSI)
Calcul distribué: MapReduce, Hadoop, Spark
SAE 6.01 modélisation statistique pour données complexes
SAE 6.01 modélisation statistique pour données complexes
Défi 6.01 modélisation statistique pour données complexes: https://www.kaggle.com/t/3b751998339541519168eea3834878e4
Formulaire pour la composition des équipes: https://forms.gle/YuNSVBGgRm6XY4qBA