NLP (Natural Language Processing) / TALN (Traitement Automatique des Langues Naturelles)
. Text tokenization / Segmentation de textes
. Mophological analysis / Analyse morphologique
. Syntactic analysis / Analyse syntaxique
. Semantic analysis / Analyse sémantique
Plagiarism Detection / Détection de plagiat
. Intrinsic plagiarism detection / Détection intrinsèque de plagiat
. Extrinsic plagiarism detection / Détection extrinsèque de plagiat
. Plagiarism tools evaluation / Evalaution des outils de détection de plagiat
Author identification / Identification d'auteurs
. Author clustering / Groupement automatique des auteurs
. Author diarization / Diarisation des auteurs
Big Data
. Hadoop/ Environnement distribué Hadoop
. Spark