RISE 2013

5ème Atelier Recherche d'Information SEmantique

L’atelier RISE aura lieu pour la cinquième fois. Cette année il sera associé à la conférence IC, après avoir été organisé conjointement avec les conférences EGC 2012, CORIA 2011, INFORSID 2010 et 2009.


Présentation

Contexte

Notre société actuelle produit de plus en plus de documents numériques. La numérisation massive, le développement de la communication numérique (email, blog, etc...) génèrent une quantité importante d'information numérique. Même les téléphones portables sont maintenant raccordés à Internet. Toutefois, même si ces informations sont disponibles, la difficulté majeure reste d'accéder à l'information adéquate, pertinente : par filtrage, sélection, navigation ou interrogation.

Les systèmes de Recherche d'Information (RI) proposaient une première réponse à ce problème d'accès à l'information pertinente. Les modèles développés en RI sont maintenant largement utilisés, par exemple dans les moteurs de recherche du Web. Les technologies actuelles sont basées sur des modèles statiques qui gèrent des informations bas niveaux. Par exemple, la plupart des moteurs de recherche sont basés sur le comptage de mots simples. En RI, les avancées récentes sont orientées vers l'utilisation des modèles de langue statistiques. L'idée sous-jacente est d'ajouter de la sémantique pour obtenir des modèles statistiques intelligents. La sémantique permet d'améliorer la précision des résultats d'un système de RI en évitant les problèmes liés à l'ambiguïté ou au manque d'expressivité des mots simples. En résumé, un système d'accès à l'information idéal doit traiter le besoin de l'utilisateur au niveau sémantique et non plus rester au niveau le plus bas de l'information.

Pour toutes ces raisons, nous croyons que l'avenir des systèmes de Recherche d'Information actuels sera de jouer le rôle de "concierge de l'information" en ajoutant de plus en plus de sémantique au flux d'information.

Pour atteindre cet objectif, le sens de l'information devrait être explicitement codé, par exemple dans des ontologies. Le but de cet atelier est de discuter de ce nouveau terrain de recherche: les systèmes de "concierge d'information" où le flux d'information est enrichi par une interprétation de son contenu. Nous appellerons ce nouveau paradigme: Recherche d'Information Sémantique. Cet atelier est dédié à tous les types de Recherche d'Information sans contrainte sur le mode de stockage de cette information. Par exemple la Recherche d'Information peut s'appliquer sur des documents textuels, des images, des vidéo, des flux XML etc...

Cet atelier est alors à la confluence de l’Ingénierie des Connaissances, l’Extraction des Con-naissances, le Traitement Automatique des Langues Naturelles et la Recherche d'Information.

Objectifs

Les travaux sur les ontologies ou les ressources sémantiques sont actifs dans les différentes communautés informatique comme : le Web, la bioinformatique, le domaine médical ou les systèmes d'information géographiques. Ainsi, les ressources sémantiques comme les ontologies, les bases de données lexicales, les thésaurii, se développent et sont facilement disponibles.

Cet atelier est spécialement dédié à l'usage des ressources sémantiques dans les systèmes de Recherche d'Information Multimedia et/ou Multilingue.

Les systèmes de Recherche d'Information Multilingue permettent de retrouver des documents qui correspondent à un thème indépendamment de leur langue d'écriture. Dans le cas de documents non textuels (Multimédia), des données textuelles sont soit extraites dans le voisinage du document ou sont issues d'annotations manuelles. Malheureusement, la nature peu structurée et le volume important d'information rendent difficilement accessible l'information pertinente aux utilisateurs. Pour résoudre ce problème, les travaux en Recherche d'Information (RI) se sont orientés vers les technologies issues du Web Sémantique et plus précisément sur l'usage des ressources sémantiques comme les ontologies, les thésaurii ou les bases de données lexicales.

L'atelier RISE a pour but de proposer un lieu de rencontre entre des chercheurs issus de différentes communautés comme la Recherche d'Information, le Web Sémantique, le Traitement Automatique des Langues Naturelles, le Multimedia, l'Ingénierie des Connaissances.

Thèmes

Les principaux thèmes abordés sont alors (liste non exhaustive, d'autres thèmes connexes peuvent être traités par les auteurs) :

  • Recherche d'Information Multilingue et Multimédia,
  • Extraction d'Information Multilingue et Multimédia
  • Annotation Sémantique, Recherche d'Information Sémantique
  • Ontologies Multilingues et Multimédia,
  • Alignement d'Ontologie et Correspondance pour la Recherche d'Information,
  • Graphes Conceptuels, Logiques de Description, Langages de Représentation des connaissances pour la Recherche d'Information
  • Utilisation des Distances Sémantiques pour la Recherche d'Information
  • Construction et l’enrichissement d’Ontologies ou de Ressources Sémantiques pour la gestion documentaire
  • Usage de larges Bases de Connaissances pour la Recherche d'Information, Web de données documentaires

Organisation

Le cinquième Atelier RISE se déroulera pendant une journée et se composera des présentations orales issues des meilleures contributions reçues. La durée de l’atelier dépendra du nombre de présentations sélectionnées. Elle débutera par un conférencier invité choisi parmi les chercheurs francophones du domaine de la Recherche d’Information (RI) pour mettre en évidence les différences entre un système de RI et un système à base de connaissances .

Pour clôturer l'atelier une discussion sera engagée autour des techniques de Recherche d'Information Sémantique et de la convergence entre RI et IC. La question de la poursuite de l’atelier et de ses modalités sera aussi abordée lors de cette discussion.

L’ensemble des informations du cinquième atelier RISE sera publié sur le site web de l’atelier sites.google.com/site/frenchsemanticir/

Comité de Programme

Organisateurs:

  • CHEVALLET Jean-Pierre, LIG, Grenoble (France)
  • ROUSSEY Catherine,IRSTEA, Clermont Ferrand (France)
  • ZARGAYOUNA Haïfa , LIPN, Paris (France)


Membres

    BELLOT Patrice, LSIS Avignon (France)

    BERTIN Marc, STIH  Paris (France),  CIRST Montreal (Canada)

    CABANAC Guillaume, IRIT Toulouse (France)

    CALABRETTO Sylvie, LIRIS Lyon (France)

    CHEVALLET Jean-Pierre, LIG, Grenoble (France)

    DAMAS Luc, LISTIC, Annecy (France)

    GRAU Brigitte, ENSIIE (France)

    HERNANDEZ Nathalie, IRIT Toulouse (France)

    KAMEL Mouna, IRIT Toulouse (France)

    PINET-SAUVAGNAT Karen, IRIT Toulouse (France)

    ROCHE Christophe, LISTIC, Annecy (France)

    ROUSSEY Catherine,IRSTEA, Clermont Ferrand (France)

    SCHWAB Didier ,LIG-GETALP, Grenoble (France)

    SERASSET Gilles, LIG, Grenoble (France)

    ZARGAYOUNA Haïfa , LIPN, Paris (France)

    ZWEIGENBAUM Pierre, LIMSI (France)

Dates importantes

    Soumission de résumés (facultatif) : 19 avril 2013

    (Nouvelle date) Soumission des articles : 3 mai 2013 26 avril 2013

    Notification aux auteurs: 17 mai 2013

    Soumission de la version définitive: 29 mai 2013

    Atelier RISE à IC: 1 juillet 2013

Instructions aux auteurs

Les communications proposées pour l'atelier RISE devront décrire des contributions originales en cours de développement (et non simplement des propositions de recherche).
Les contributions en français ou en anglais pourront être soumises à l’atelier. Le format à utiliser est la dernière version du modèle de la conférence IC disponible sur le site de la conférence : http://pfia2013.univ-lille1.fr/doku.php?id=fr:ic
Concernant les publications définitives, Il n'y a pas de contraintes de taille imposée pour l'atelier, mais nous recommandons que les contributions fassent entre 8 et 12 pages en tenant compte des figures et des références.
Les soumissions se feront sur le site de easychair. En cas de soucis vous pouvez envoyer un email aux 3 organisateurs (catherine.roussey at irstea.fr, Jean-Pierre.Chevallet at imag.fr, haifa.zargayouna at lipn.univ-paris13.fr)


Les contributions seront évaluées par au moins 2 membres du comité de programme.

Programme

Les actes et les présentations de l'atelier sont disponibles dans RISE Documents.

9H30 - 10H30: Conférence invitée
Semantic Search Evaluations: Gaps, Challenges and Best Practices

Khadija Elbedweihy

Recent work on searching the Semantic Web has yielded a wide range of approaches with respect to the underlying search mechanisms; result management and presentation; and indeed the style of input. Each approach impacts upon the quality of the information retrieved and the user’s experience of the search process. Despite the wealth of experience accumulated from a variety of Information Retrieval (IR) evaluations, evaluations for searching the Semantic Web have largely been developed in isolation with no coherent overall design. This has led to slow progress and low interest when compared to other established evaluation series, such as TREC for IR or OAEI for Ontology Matching. Thus, part of this talk will discuss the missing aspects in current semantic search evaluations and the challenges they are facing and present a set of best practice procedures for designing semantic search evaluations which are motivated by the IR literature and our experience in running semantic search evaluations. Additionally, it is acknowledged that usability and user satisfaction are of paramount importance when designing interactive software solutions. Furthermore, the optimal design can be dependent not only on the task but also on the type of user. Evaluations can shed light on these issues; however, there has been a limited focus on assessing the usability of semantic search systems in current evaluation initiatives. Therefore, the other part of this talk will present the methodology and results of a first-time user-based study that assessed the usability and user satisfaction of different semantic search query input approaches (natural language and view-based) from the perspective of different user types (experts and casuals).

10H30 - 11H00: Pause café
11H00 - 12H30: Session Modèle de Recherche d'Information Sémantique

Language Model: Extension to the Similarity of Non-matching Terms in Retrieval Time

Kianlam Tan, Jean-Pierre Chevallet and Philippe Mulhem

Une approche basée sur des relations pour la RI sémantique

Marie-Noelle Bessagnet, Davide Buscaldi, Albert Royer and Christian Sallaberry

A Multi-level Dimension-based Semantic Query and Document Structuring
Mohannad Almasri and Jean-Pierre Chevallet

12H30 - 14H30: Repas

14H30 - 15H30: Conférence Invitée de  PFIA

15H30 - 16H00: Pause café

16H00 - 17H00: Session Ontologie et annotations sémantiques


Une ontologie documentaire pour la recherche d'information relationnelle

Nada Mimouni, Adeline Nazarenko and Sylvie Salotti

Les Bulletins de Santé du Végétal : spécification d’une base d’annotations pour la recherche d’information sémantique
en français

Catherine Roussey, Jean-Pierre Chanet and Stephan Bernard

17H00 - 17H30: Session Similarité

Une mesure de Similarité Sémantique basée sur la Recherche d'Information

Davide Buscaldi

17H30 - 18H00: Bilan et perspectives des ateliers RISE

Sponsors

Atelier RISE 2013 est sponsorisé par:

  • l'ARIA: Association Francophone de Recherche d'Information et Applications.
  • L'irstea de Clermont Ferran: Institut national de recherche en sciences et technologies pour l'environnement et l'agriculture
  • le LIG: Laboratoire d'Informatique de Grenoble
  • le LIPN: Laboratoire d'Informatique de Paris Nord

Participants

  1. ALMASRI mohannad, LIG, Grenoble (France)
  2. AMARGER Fabien, IRIT/ IRSTEA Clermont (France)
  3. BUSCALDI Davide, LIPN, Paris (France)
  4. CARON Anne-Cécile, LIFL, Lille (France)
  5. CHERFI Hacene, Mondeca
  6. CHEVALLET Jean-Pierre, LIG, Grenoble (France)
  7. COMPAROT Catherine, IRIT, Toulouse (France)
  8. CORMAN Julien, IRIT (France)
  9. DANESI Charlotte, Ubiquick
  10. DEPARIS Etienne, UTC / Thales
  11. ELBEDWEIHY Khadija, LIPN, Paris (France)
  12. GILLET Pascal, IRIT, Toulouse (France)
  13. MINOUDI Nada, LIPN, Paris (France)
  14. PRADEL Camille, IRIT, Toulouse (France)
  15. ROUSSEY Catherine,IRSTEA, Clermont Ferrand (France)
  16. SALOTTI Sylvie, LIPN, Paris (France)
  17. SZULMAN Sylvie, LIPN, Paris (France)
  18. TAN Kian Lam, LIG, Grenoble (France)
  19. TELLIER Isabelle, Lattice, Paris (France)
  20. ZARGAYOUNA Haïfa , LIPN, Paris (France)
  21. ZWEIGENBAUM Pierre, LIMSI (France)

Synthèse des discussions

Pour faciliter la soumission dans les prochains ateliers RISE, les soumissions de résumé donnant lieu à une présentation seront permises. Les étudiants ont expressément demandé à conserver la soumission d'articles longs plus valorisant pour eux.

Les ateliers RISE ont fait le tour des conférences francophones sur ses thèmes de prédilections et donc nous recommençons notre tour de France. Le prochain Atelier RISE sera associé si possible à la conférence CORIA en Recherche d'Information. En 2014 CORIA aura lieu pendant la semaine du document numérique.

Il est à noter que le nom de l'atelier n'incite pas les auteurs intéressés dans l'accès aux web de données à soumettre un article dans cet atelier alors que les travaux sur ce thème ont leur place dans l'atelier.

Pour faciliter la communication et l'échange entre les différents intervenants l'idée de monter un groupe de travail sur les thèmes de RISE a aussi été évoqué.


Comments