RISE 2009

Premier Atelier Recherche d'Information SEmantique RISE

associé au 27ème Congrès INFORSID 2009, à Toulouse http://www.irit.fr/inforsid09/

Introduction

Notre société actuelle produit de plus en plus de documents numériques. La numérisation massive, le développement de la communication numérique (email, blog, etc...) génèrent une quantité importante d'information numérique. Même les téléphones portables sont maintenant raccordés à Internet. Toutefois, même si ces informations sont disponibles, la difficulté majeure reste d'accéder à l'information adéquate, pertinente : par filtrage, sélection, navigation ou interrogation.

Les systèmes de Recherche d'Information (RI) proposaient une première réponse à ce problème d'accès à l'information pertinente. Les modèles développés en RI sont maintenant largement utilisés, par exemple dans les moteurs de recherche du Web. Les technologies actuelles sont basées sur des modèles statiques qui gèrent des informations bas niveaux. Par exemple, la plupart des moteurs de recherche sont basés sur le comptage de mots simples. En RI, les avancées récentes sont orientées vers l'utilisation des modèles de langue statistiques. L'idée sous-jacente est d'ajouter de la sémantique pour obtenir des modèles statistiques intelligents. La sémantique permet d'améliorer la précision des résultats d'un système de RI en évitant les problèmes liés à l'ambiguïté ou au manque d'expressivité des mots simples. En résumé, un système d'accès à l'information idéal doit traiter le besoin de l'utilisateur au niveau sémantique et non plus rester au niveau le plus bas de l'information.

Pour toutes ces raisons, nous croyons que l'avenir des systèmes de Recherche d'Information actuels sera de jouer le rôle de "concierge de l'information" en ajoutant de plus en plus de sémantique au flux d'information. Pour atteindre cet objectif, le sens de l'information devrait être explicitement codé, par exemple dans des ontologies. Le but de cet atelier est de discuter de ce nouveau terrain de recherche: les systèmes de "concierge d'information" où le flux d'information est enrichi par une interprétation de son contenu. Nous appellerons ce nouveau paradigme: Recherche d'Information Sémantique. Cet atelier est dédié à tous les types de Recherche d'Information sans contrainte sur le mode de stockage de cette information. Par exemple la Recherche d'Information peut s'appliquer sur des documents textuels, des images , des vidéo, des flux XML etc...

Objectifs

Les travaux sur les ontologies ou les ressources sémantiques sont de plus en plus répandus dans les différentes communautés en Informatique comme : le Web, la bio-informatique ou les systèmes d'information géographiques. Ainsi, les ressources sémantiques comme les ontologies, les bases de données lexicales, les thésaurii, se sont développées et sont maintenant disponibles. Cet atelier est dédié à l'usage des ressources sémantiques dans les systèmes de Recherche d'Information Multimedia et/ou Multilingue.

Des systèmes de Recherche d'Information Multimedia et/ou Multilingue cherchent à retrouver des documents Multimédia qui correspondent à un thème indépendamment de leur langue d'écriture. Dans le cas de documents non textuels, ces données textuelles peuvent être extraites de leur contenu, apparaître dans le voisinage du document ou être issues d'annotations manuelles. Malheureusement, la nature peu structurée et le volume énorme d'information rendent difficilement accessible l'information pertinente aux utilisateurs. Pour résoudre ce problème, les travaux en Recherche d'Information (RI) se sont orientés vers les technologies issues du Web Sémantique et plus précisément sur l'usage des ressources sémantiques comme les ontologies, les thésaurii ou les bases de données lexicales.

Themes

L'atelier RISE a pour but de proposer un lieu de rencontre entre des chercheurs issus de différentes communautés comme la Recherche d'Information, le Web Sémantique, le TALN, le Multimedia, l'Ingéniérie des Connaissances.

Les principaux thèmes abordés peuvent être (liste non exhaustive, d'autres thèmes pouvant être traités par les auteurs) :

  • Indexation Conceptuelle et Indexation Sémantique,
  • Recherche d'Information Multimedia
  • Recherche d'Information Multilingue
  • Extraction d'Information Multilingue et Multimedia
  • Annotation Sémantique
  • Web Sémantique
  • Ontologies Multilingues et Multimedia,
  • Alignement d'Ontologie et Correspondance pour la Recherche d'Information ,
  • Graphes Conceptuels, Logiques de Description, Langages de Représentation des connaissances pour la Recherche d'Information.
  • Utilisation des Distances Sémantiques pour la Recherche d'Information

Organisation de l'atelier

L'Atelier RISE se déroulera pendant la journée du 26 mai. L’atelier s’organisera autour des présentations des articles sélectionnés par le comité de programme, et de discussions-débats.

Consignes aux auteurs

Les communications proposées pour l'atelier RISE devront décrire des contributions originales en cours de développement et pas encore assez matures pour être proposées dans une conférence. Ces contributions devront décrire des recherches en cours et non simplement des propositions de recherche.

Les contributions en français ou en anglais pourront être soumises à l’atelier au format LNCS (http://www.springer.com/computer/lncs?SGWID=0-164-7-72376-0). Concernant les publications définitives, Il n'y a pas de contraintes de taille imposée pour l'atelier, (la publication se fera sous forme de CDRom) mais nous recommandons que les contributions fassent entre 8 et 12 pages en tenant compte des figures et des références.

Les contributions seront évaluées par au moins 2 membres du comité de programme. Les versions étendues des meilleurs papiers de l'atelier RISE seront proposés à une revue de Recherche d'Information.

Les articles devront être envoyés par email à catherine.roussey@liris.cnrs.fr et à Jean-Pierre.Chevallet@imag.fr, au plus tard le 9 avril 2009.

Dates importantes

Date limite de réception des articles : 9 avril 2009

Notification aux auteurs : 1er mai.

Date limite de réception des textes définitifs (à envoyer par emails aux organisateurs): 10 mai 2009.

Atelier RISE: 26 mai 2009

Organisateur

  • ROUSSEY Catherine, LIRIS, Lyon (France)
  • CHEVALLET Jean-Pierre, LIG, Grenoble (France)

Comité de Programme

Membres

  • AUSSENAC-GILLES Nathalie, IRIT Toulouse (France)
  • CALABRETTO Sylvie, LIRIS, Lyon, (France)
  • CHEVALLET Jean-Pierre, LIG, Grenoble (France)
  • GRAU Brigitte, ENSIIE (France)
  • DAMAS Luc, LISTIC, Annecy (France)
  • FALQUET Gilles, CUI, Genève (Switzerland)
  • GAUSSIER Eric, LIG, Grenoble (France)
  • GESCHE Samuel, LIRIS, Lyon (France)
  • MAISONNASSE Loïc, LIRIS, Lyon (France)
  • ROCHE Christophe, LISTIC, Annecy (France)
  • ROUSSEY Catherine, LIRIS, Lyon (France)
  • SERASSET Gilles, LIG, Grenoble (France)
  • SIMONET Michel, TIM-C, Grenoble (France)
  • ZWEIGENBAUM Pierre, LIMSI (France)

Programme


Les actes de cet atelier sont disponibles dans RISE Documents

9H30-10H50: session sémantique et données médicales

  • Loïc MAISONNASSE, Eric GAUSSIER, Jean-Pierre CHEVALLET: Combinaison d’analyses sémantiques pour la recherche d’information médicale.
  • Kunalè KUDAGBA, Omar El BEQQALI, Hassan BADIR: Réécriture sémantique de bio - requêtes centrée sur les préférences de l'utilisateur. 

11H10-12H30: session indexation sémantique de documents textuels

  • Farah HARRATHI, Catherine ROUSSEY, Sylvie CALABRETTO, Loïc MAISONNASSE, Mohamed Mohsen GAMMOUDI: Une approche d’indexation sémantique des documents multilingues guidée par une ontologie. 
  • Samaneh CHAGHERI, Cyril DUMOULIN: Semantic Indexing of Technical Documentation.

14H00-15H20: session ressources sémantiques

  • Nebrasse ELLOUZE, Nadira LAMARI, Elisabeth METAIS, Mohamed Ben AHMED: CITOM: Approche de construction incrémentale de Topic Map multilingue. 
  • Arnaud RENARD, Sylvie CALABRETTO, Beatrice RUMPLER: Recherche d’Information Sémantique: Appariement sémantique flou de documents semi-structurés.

15H40-17H00

Discussions

Listes des Participants

  • Samir AMIR, LIFL, Lille, Doctorant.
  • Sylvie CALABRETTO, LIRIS, Lyon, MCF HDR.
  • Samaneh CHAGHERI, LIRIS, Lyon, Doctorant 1ere année de thèse.
  • Jean Pierre CHEVALLET, LIG, Grenoble, MCF.
  • Farah HARRATHI, LIRIS, Lyon, Doctorant en cotutelle 5ème année de thèse.
  • Nathalie HERNANDEZ, IRIT, Toulouse, MCF.
  • Laurence LONGO, LILPA, Strasbourg, Doctorant.
  • Loïc MAISONNASSE, LIRIS, Lyon, Docteur ATER.
  • Elisabeth METAIS, CNAM, Paris, Professeur.
  • Arnaud RENARD, LIRIS, Lyon, Master Recherche.
  • Mina ZIANI, MODEME, Lyon, Doctorant.
  • Benoit RICARD, EDF R&D, Paris, DER.
  • Catherine ROUSSEY, LIRIS, Lyon MCF.

Compte Rendu des Discussions

RISE la suite

  • Les participants aimeraient rester dans un cadre francophone mais en ouvrant sur d'autres conférences pour élargir le public.
  • Conférence pressentie rapidemment: CORIA ou IC.
  • Autres conférences possibles: TALN, LRec, ToTh.
  • Les conférences ayant lieu en métropole seront préférées pour des raisons budgétaires et ainsi permettre au plus grand nombre de participants de venir.
  • Le but serait d'avoir une vision des travaux des équipes francophones qui travaillent dans la thématique de RISE.
  • Suite à ce premier Atelier, une liste de personnes intéressées par cette thématique sera établi pour envoyer le prochain appel à publication RISE.

Remarque sur les présentations

  • les travaux présentés sont pour la plupart des travaux de doctorants: il faudrait indiquer le nombre d'années de thèse. Pour cette année l'information est indiquée dans la liste des participants.
  • il n'y a eu qu'une seule définition de ce qu'est une ontologie, pourtant il n'y a pas de consensus sur la définition de ce terme (loin de la)...:)
  • les présentations ne couvraient pas tous les thèmes liés à l'utilisation des ontologies pour l'accès aux documents multimedia.

Problemes récurrants des équipes qui travaillent dans le domaine

  • trouver des corpus et des ressources sémantiques du même domaine.
  • transformer les formats des documents pour obtenir un format XML.
    • quelqu'un a t il une liste d'outils à proposer?
  • trouver des base de tests avec une évaluation humaine.

Idées

  • identifier des chercheurs qui auraient un peu de temps à consacrer pour annoter manuellement des documents
  • trouver un corpus de documents libres de droit ou nous serions des experts, ainsi on pourrait comprendre les annotations et les erreurs produites.
    • corpus d'informatique
      • corpus de manuelle d'informatique,
      • Farah tu avais un corpus à proposer?
      • l'équipe de Gilles Kassel à commencer à construire une ontologie de l'informatique, serait elle accessible et utile pour le corpus d'informatique?
    • corpus d'actes dans le domaine de la recherche d'information ou des ontologies
      • est ce que les actes de IC ou de coria sont libres de droit?
      • partir de la classification des index term de ACM.
      • demander à une équipe spécialisée dans la construction d'ontologie de construire une ontologie sur ce domaine
  • répartir les taches d'annotations entre les chercheurs pour construire notre propre base de test.
Comments