RISE 2010

Second Atelier Recherche d'Information SEmantique RISE

associé à la conférence INFORSID 2010

MIRO:RISE2010CallForWorkshop

MIRO:RISE2010CallForPaper

Inforsid 2010: http://www.lsis.org/inforsid/

Présentation

Organisateurs

  • ROUSSEY Catherine, LIRIS Lyon en délégation au CEMAGREF de Clermont-Ferrand (France)
  • CHEVALLET Jean-Pierre, LIG, Grenoble (France)


Contexte

Les documents produits actuellement sont essentiellement numériques. Une frénésie de numérisation est en passe de rendre accessible les ouvrages les plus anciens. La communication est également massivement numérique et voit l'émergence de nouvelles pratiques (blogs, SMS, réseaux sociaux), en plus des média textuels numériques bien implantés (email). Cette tendance s'intensifie avec la nomadisation de l'accès à l'information (téléphone portable, ultra-portables, iPad). Les objectifs à court terme sont alors une connexion ubiquitaire pour tous au réseau internet. Toutefois, même si cette masse d'informations est disponible, la difficulté majeure réside dans l'accès à de l'information ciblée, c'est à dire réellement en adéquation avec un besoin personnel et ponctuel. Cet accès se fait par filtrage, sélection, navigation ou interrogation.

Les systèmes de Recherche d'Information (RI) ont proposé une première réponse à ce problème d'accès à l'information pertinente. Les modèles développés en RI sont maintenant largement utilisés, par exemple dans les moteurs de recherche du Web. Les technologies actuelles sont basées sur des modèles statiques qui manipulent des informations de bas niveau. Par exemple, la plupart des moteurs de recherche sont basés sur le comptage des mots ou des liens sur les pages. Les dernières avancées de la recherche en RI ont concerné essentiellement l'amélioration des modèles statistiques d'appariement de documents, comme les modèles de langue statistiques. De nouvelles pistes de recherche consistent à ajouter de la sémantique pour obtenir des modèles statistiques intelligents. La sémantique permet d'améliorer la précision des résultats d'un système de RI en évitant les problèmes liés à l'ambiguïté ou au manque d'expressivité des mots simples. Même s'il ne semble pas nécessaire qu'un système de RI "comprenne" le document qu'il indexe, traiter le besoin de l'utilisateur au niveau sémantique permet plus de précision dans les réponses.

Nous pensons donc que l'avenir des systèmes de Recherche d'Information passe par la prise en compte de la sémantique du contenu des documents, permettant à un utilisateur de mieux maîtriser le flux d'information pour cibler l'information dont il a réellement besoin. Une façon d'atteindre cet objectif est de coder explicitement des connaissances associées aux termes, par exemple dans des ontologies. Le but de cet atelier est de discuter de ce nouveau terrain de recherche: les systèmes de "concierge d'information" où le flux d'information est enrichi par une interprétation de son contenu. Nous appellerons ce nouveau paradigme: Recherche d'Information Sémantique. Cet atelier est dédié à tous les types de Recherche d'Information sans contrainte sur le mode de stockage de cette information. Par exemple la Recherche d'Information peut s'appliquer sur des documents textuels, des images, des vidéos, des flux XML etc...

Objectifs

Les travaux sur les ontologies ou les ressources sémantiques existent et sont actifs dans les différentes communautés informatique comme : le Web, la bio-informatique ou les systèmes d'information géographiques. Ainsi, les ressources sémantiques comme les ontologies, les bases de données lexicales, les thésaurii, se développent et sont maintenant disponibles. Cet atelier est spécialement dédié à l'usage des ressources sémantiques dans les systèmes de Recherche d'Information Multimedia et/ou Multilingue.

Des systèmes de Recherche d'Information Multilingue cherchent à retrouver des documents qui correspondent à un thème indépendamment de leur langue d'écriture. Dans le cas de documents non textuels (Multimédia), des données textuelles peuvent être extraites de leur contenu, apparaître dans le voisinage du document ou être issues d'annotations manuelles. Malheureusement, la nature peu structurée et le volume important d'information rendent difficilement accessible l'information pertinente aux utilisateurs. Pour résoudre ce problème, les travaux en Recherche d'Information (RI) se sont orientés vers les technologies issues du Web Sémantique et plus précisément sur l'usage des ressources sémantiques comme les ontologies, les thésaurii ou les bases de données lexicales.

L'atelier RISE a pour but de proposer un lieu de rencontre entre des chercheurs issus de différentes communautés comme la Recherche d'Information, le Web Sémantique, le TALN, le Multimedia, l'Ingénierie des Connaissances.

Thèmes

Les principaux thèmes abordés peuvent être (liste non exhaustive, d'autres thèmes pouvant être traités par les auteurs) :

  • Indexation Conceptuelle et Indexation Sémantique,
  • Recherche d'Information Multimedia
  • Recherche d'Information Multilingue
  • Extraction d'Information Multilingue et Multimedia
  • Annotation Sémantique
  • Web Sémantique
  • Ontologies Multilingues et Multimedia,
  • Alignement d'Ontologie et Correspondance pour la Recherche d'Information,
  • Graphes Conceptuels, Logiques de Description, Langages de Représentation des connaissances pour la Recherche d'Information.
  • Utilisation des Distances Sémantiques pour la Recherche d'Information

Organisation de l'atelier

L'Atelier RISE se déroulera pendant une journée et se composera d'une dizaine de présentations orales issues des meilleures contributions reçues. Pour clôturer l'atelier une discussion sera engagée autour de l'usage des ressources sémantiques pour la Recherche d'Information Multimédia et Multilingue. Une vingtaine de personnes sont attendues pour participer à cet atelier.

Les contributions seront évaluées par au moins deux membres du comité de programme.

Comité de Programme 2010

  • AUSSENAC-GILLES Nathalie, IRIT Toulouse (France)
  • CHEVALLET Jean-Pierre, LIG, Grenoble (France)
  • DAMAS Luc, LISTIC, Annecy (France)
  • GRAU Brigitte, ENSIIE (France)
  • HERNANDEZ Nathalie , IRIT, Toulouse (France)
  • METAIS Elisabeth, CNAM Paris (France)
  • MAISONNASSE Loic, TecKnowMetrix, Lyon (France)
  • ROCHE Christophe, LISTIC, Annecy (France)
  • ROUSSEY Catherine, LIRIS, Lyon (France)
  • RUMPLER Béatrice, LIRIS, Lyon (France)
  • SCHWAB Didier ,LIG-GETALP, Grenoble (France)
  • SERASSET Gilles, LIG, Grenoble (France)
  • SIMONET Michel, TIM-C, Grenoble (France)
  • ZARGAYOUNA Haïfa , LIPN, Paris (France)
  • ZWEIGENBAUM Pierre, LIMSI (France)

Dates Importantes

  • Intention de soumission : le plus tôt possible
  • Date limite de réception des articles : 7 avril 2010
  • Notification aux auteurs : 29 avril 2010
  • Date limite de réception des textes définitifs  : 6 mai 2010
  • La conférence Inforsid aura lieu du 25 au 28 mai 2010.
  • L'atelier RISE aura lieu le mardi 25 mai 2010 après midi.

Instructions aux auteurs

Les communications proposées pour l'atelier RISE pourront décrire des contributions originales en cours de développement et pas encore assez matures pour être proposées dans une conférence. Ces contributions devront décrire des recherches en cours et non simplement des propositions de recherche.

Les auteurs sont invités à soumettre la version pdf de leur communication sur easychair. Le site de soumission est le suivant : http://www.easychair.org/conferences/?conf=rise2010. En cas de difficulté, les auteurs peuvent envoyer leur article sous forme électronique en pièce jointe à catherine.roussey[@]liris.cnrs.fr et Jean-Pierre.Chevallet[@]imag.fr (avec un sujet débutant par [Soumission RISE 2010])

Les contributions en français ou en anglais pourront être soumises à l’atelier au format LNCS (http://www.springer.com/computer/lncs?SGWID=0-164-7-72376-0). Concernant les publications définitives, Il n'y a pas de contraintes de taille imposée pour l'atelier, (la publication se fera sous forme de CDRom) mais nous recommandons que les contributions fassent entre 8 et 12 pages en tenant compte des figures et des références.

Programme

L'après midi RISE s'organisera en deux sessions, chacune composée de deux présentations informelles de 30 minutes et se terminera par une discussion. Les orateurs sont invités à préciser le contexte générale de leur projet et leur situation professionnelle (post-doc, 2ème année de thèse etc...).


Les présentations et les actes sont disponibles dans RISE Documents

Session: Mesure de similarité et usage

14H00-14H30 Architecture d’un système d’aide à l’alignement d'ontologies

Mina ZIANI, Danielle BOULANGER and Guilaine TALENS.

Abstract. L’interopérabilité sémantique basée sur les ontologies est devenue un challenge important. Dans une coopération de sources de connaissances partagées, l’utilisation des ontologies demande de pouvoir définir des « mises en correspondances » pour les aligner. L’alignement d’ontologies est une tâche complexe basée sur la définition de mesures de similarité (appelés également ‘matchers’). Nous classons ces différentes méthodes et présentons quelques outils existant qui combinent, a priori, plusieurs types de méthodes pour construire des ‘mappings’ de façon semi-automatique. A l’inverse de ces outils, nous proposons un système d’aide au choix de mesures de similarité à la demande. Nous effectuerons une proposition réaliste, applicable au domaine de la géotechnique qui recouvre plusieurs sous-domaines métier.

14H30-15H00: Une approche de recherche sémantique dans les documents semi-structurés

Rami Harrathi and Sylvie Calabretto.

Abstract. Dans cet article, nous proposons une approche de recherche d’information sémantique des documents semi-structurés. L’idée centrale de notre travail est que l’utilisation de ressources sémantiques externes telles que les ontologies et les thésaurus peut améliorer l’efficacité du processus de recherche. Ainsi, nous proposons d’utiliser le modèle vectoriel sémantique où une partie d’un document ainsi que la requête sont représentées par deux vecteurs de concepts. Nous proposons également d’utiliser les mesures de similarité sémantique pour l’évaluation d’une mesure de pertinence. La mesure proposée se base sur la comparaison entre des graphes sémantiques.

Session: Ressource sémantique et Classification

15H00-15H30: Classification supervisée sémantique d’articles de presse en français

Samuel Gesche, Elöd Egyed-Zsigmond, Sylvie Calabretto, Guy Caplat and Jean Beney.

Abstract. La classification supervisée est un champ de recherche fertile, qui ne dispose pas encore d’une théorie figée. Elle se nourrit donc régulièrement d’avancées dans d’autres domaines. Nous présentons ici nos récentes expériences en classification supervisée de textes cours de presse francophone. Ces expériences tirent parti des bases sémantiques généralistes de grande taille qui ont été récemment mises en place dans le cadre du Web sémantique. Nous effectuons un enrichissement sémantique de nos documents afin de pallier à leur petite taille qui rend les approches classiques inefficaces. L’utilisation de ressources multilingues nous permet de tirer partie des ressources disponibles en anglais.

15H30-16H00: Pause

16H00-16H30: Classication multilingue et multimédia pour la recherche d'images dans le projet OMNIA

David Rouquet, Achile Fallaise, Didier Schwab, Hervé Blanchon, Vallérie Bellynck, Christian Boitet, Emmanuel Dellandréa, Ningning Liu, Liming Chen, Alexandre Saidi, Sandra Skaff, Luca Marchesotti, Gabriela Csurka

Abstract. Cet article expose différents traitements pour l'indexation automatique d'images accompagnées de textes multilingues. La combinaison de ces traitements a pour but d'obtenir des descripteurs multi-facettes d'images (thématique, affectif, esthétique, etc.). Cette approche est évaluée dans le cadre du projet ANR OMNIA qui rassemble des équipes de XRCE, du LIRIS et du LIG.

16H30-17H: Discussion et clôture de l'atelier

Participants

  1. ALBITAR Shereen, LSIS, MArseille (France)
  2. BOITET Christian, LIG, Grenoble (France)
  3. CALABRETTO Sylvie, LIRIS, Lyon (France)
  4. CHEVALLET Jean-Pierre, LIG, Grenoble (France)
  5. DELLANDREA Emmanuel, LIRIS, Lyon (France)
  6. DINH Ba-Duy, IRIT, Toulouse (France)
  7. FALAISE Achille, LIG, Grenoble (France)
  8. GERETTO Patricia, ONP, Paris (France)
  9. GESCHE Samuel, LIRIS, Lyon (France)
  10. HARRATHI Rami, LIRIS, Lyon (France)
  11. HUBERT Gilles, IRIT, Toulouse (France)
  12. ROUQUET David, LIG, Grenoble (France)
  13. ROUSSEY Catherine, LIRIS, Lyon (France)
  14. RUMPLER Béatrice, LIRIS, Lyon (France)
  15. SAIDI Alexandre, LIRIS, Lyon (France)
  16. SALOTTI Sylvie, LIPN, Paris (France)
  17. ZARGAYOUNA Haïfa , LIPN, Paris (France)
  18. ZIANI Mina , MODEME, Lyon (France)

Actes

Les actes de l'atelier sont aussi disponible pour le téléchargement sur le site du laboratoire LIRIS https://liris.cnrs.fr/publis?id=4723

Comments