Presentation /fr


Le projet RefLex a pour objectif de mettre à la disposition de la communauté scientifique un corpus lexical de référence pour les langues d'Afrique, ainsi que des outils de traitement et d'analyse adaptés à ce corpus. Une description plus détaillée est disponible au format PDF.

Ce projet fait suite au projet Sumale, qui avait pour objectif de réunir une vaste collection de données lexicales sur les langues d'Afrique. Sumale était l'équivalent, pour le LLACAN, du projet Sahélia développé à Nice par Robert Nicolaï. Ces deux entités avaient en commun le logiciel Mariama, conçu et réalisé par Robert Nicolaï et Jeanne Zerner.
Aujourd'hui, les objectifs sont à la fois plus réalistes et plus ambitieux. Plus réalistes, car il n'est plus question de lexiques parfaitement étiquetés et organisés de manière hiérarchique ; plus ambitieux, car il s'agit maintenant de mettre un maximum de données à la disposition de la communauté scientifique dans son ensemble, via une interface web simple et intuitive.

Un des avantages de ce projet est son immédiate faisabilité. Des lexiques saisis existent déjà, qu'il suffit de mettre en ligne. L'interface de consultation est disponible ici-même. Il est dans l'esprit même du projet de pouvoir mettre en ligne des données incomplètes ou fragmentaires, avec toujours la possibilité d'une révision ultérieure.
A terme, RefLex sera un corpus de référence pour les langues africaines, librement consultable et utilisable par les chercheurs. Cette ambition suppose que les sources originales des données soient parfaitement respectées. Le principe est que chaque chercheur puisse consulter un même document, ancien ou non, dans les mêmes conditions.

Dans un premier temps, on mettra en ligne deux types de documents :
  • Des documents anciens supposés libres de droits, comme par exemple le dictionnaire joola Kasa de E. Wintz, publié en 1909, ou le dictionnaire Limba de M. L. Clarke, publié en 1922.
  • Des documents récents, de première main, publiés ou non, dont la diffusion aura été explicitement autorisée par leur auteur. Dans cette catégorie figurent par exemple les deux lexiques bijogo de G. Segerer (dont un seul a fait l'objet d'une publication) et le lexique day de P. Nougayrol.

  • Dans un second temps, on s'efforcera de se mettre en conformité avec le droit d'auteur pour tous les documents qui n'entrent pas dans l'une ou l'autre des catégories ci-dessus. Les données correspondantes seront alors mises en ligne.
    Comments