Evaluation d’un système de recherche ad-hoc à base de modèle de thèmes latents.
Réalisé par Mlle Benzineb Zohra et Mlle Mimouni Siham.
Département d'Informatique, Mostaganem, Juin 2012.
Les moteurs de recherche sur le Web sont largement utilisés par des millions d’utilisateurs dont l’activité en dépend quotidiennement. Les gens s’en servent de plus en plus pour faciliter leurs travaux dans l’éducation, le commerce, l’administration …etc. Des moteurs de recherche tels que Google, Yahoo ou Bing, qui sont devenus des stars du Web, épuisent pleinement des modèles fondamentaux et des nouvelles techniques de la recherche d’information et des services Web afin d’offrir les dernières nouveautés technologiques, de localiser les groupes et les organisations, de résumer les nouvelles de presse ou de simplifier le shopping.
Du point de vue de l’utilisateur, un système de recherche d’information (SRI) doit réaliser trois tâches fondamentales : l’acquisition et l’analyse de la requête, le filtrage des documents pertinents et la visualisation des résultats. Mais du côté concepteur, la tâche de représentation des documents constitue la plate-forme sur laquelle tout SRI puisse capturer le contenu documentaire avant de pouvoir l’indexer et de mesurer sa pertinence par rapport à une requête donnée. Un modèle de RI fournit le cadre théorique pour cette représentation qui peut conduire à des performances de recherche plus ou moins satisfaisantes. Ainsi, chaque modèle de représentation des documents définit une stratégie de recherche impliquant une méthode d’indexation et une fonction de calcul de pertinence.
Ce projet vise à étudier, réaliser et évaluer l’intégration d’un modèle de thèmes (LDA : Allocation latente de Dirichlet) dans un système de recherche ad-hoc.
Le travail demandé consiste à :
Mots clés :
Recherche d’information, traitement linguistique, modèle de thème, modèle de recherche, mesure de pertinence.