M1 TAL: Introduction au traitement des langues
Institut Galilée
Institut Galilée
Introduction au traitement du texte et à la Recherche d’Information
Techniques d’indexation: bag of words, tf.idf
Moteurs de recherche
Classification des documents (méthode Naïve Bayes)
Modèles de langue n-gramme / entropie / perplexité / smoothing /
sampling et génération
Tagging HMM / étiquetage / viterbi / n-gramme
entités /morphosyntaxique
Parsing avec grammaires
algorithme CKY
Théorie de la traduction automatique:
modèle noisy channel / traduction “IBM” / problèmes d’alignement
Tout le matériel est disponible sur Moodle: