RISE 2016

8ème Atelier Recherche d'Information SEmantique    Toulouse, 8 mars 2016

L'atelier RISE en est à sa huitième édition. Cette année il sera associé à la Conférence CORIA 2016 de la Semaine du Document Numérique, après avoir été organisé conjointement avec les conférences  IC 2015 de la plateforme IA, CORIA 2014 (SDNRI 2014), IC 2013 ,EGC 2012, CORIA 2011, INFORSID 2010 et 2009.

L'atelier RISE est soutenu par l'ARIA (Association Francophone de Recherche d'Information et Applications).

ARIA

Les actes ainsi que les présentations sont accessibles dans RISE Documents.


Présentation

Les systèmes d'accès à l'information peuvent désormais traiter le contenu informationnel au niveau sémantique et non plus seulement au niveau signal (texte, image, etc). Les ressources sémantiques mises en ligne permettent de conceptualiser les besoins des utilisateurs et les contenus des documents. Un des enjeux actuels est de proposer des fonctionnalités sémantiques pertinentes pour exploiter au mieux les ressources sémantiques telles que les ontologies, les bases de données lexicales, les thesaurii. 

Le passage au niveau conceptuel permet de s'abstraire du niveau signal ainsi que, dans certains cas, de la langue. Le raisonnement au niveau conceptuel peut être exploité pour la recherche d'information multimédia et multilingue.

Les précédentes éditions de cet atelier ont montré l'intérêt de la recherche d'information sémantique dans des domaines de spécialité tels que le domaine agricole, médical, juridique, environnement, etc.

Cet atelier a pour but de proposer un lieu d'échange entre des chercheurs issus de différentes communautés comme la Recherche d'Information, le Web Sémantique, l’Extraction des Connaissances et le Traitement Automatique des Langues Naturelles et le Multimédia.

Thèmes

Les principaux thèmes abordés sont alors (liste non exhaustive, d'autres thèmes connexes peuvent être traités par les auteurs) :

  • Modèles de Recherche d'Information Sémantique,
  • Extraction d'Information,
  • Expansion de requêtes,
  • Question/Réponse Sémantique,
  • Annotation Sémantique, Indexation Sémantique,
  • Alignement d'ontologies et correspondances pour la Recherche d'Information,
  • Langages de Représentation des connaissances pour la Recherche d'Information (Graphes Conceptuels, Logiques de Description, RDF),
  • Utilisation des distances Sémantiques pour la Recherche d'Information,
  • Construction et enrichissement de Ressources Sémantiques pour la gestion documentaire,
  • Usage de larges Bases de Connaissances pour la Recherche d'Information, Web de données  documentaires,
  • Évaluation de nouvelles méthodes d'accès sémantique,
  • Passage à l'échelle.

Organisation

La participation à la journée de l'atelier est gratuite. Mais vous devrez cependant vous inscrire sur le site de SDNRI de sciencesconf.org. Pour ceux qui ne souhaite venir qu'à la journée gratuite il y a une catégorie spéciale "Journée seule Hackday RISE".

Comité de Programme 

Organisateurs :

  • CHEVALLET Jean-Pierre, LIG, Grenoble (France)
  • ROUSSEY Catherine,IRSTEA, Clermont Ferrand (France)
  • ZARGAYOUNA Haïfa , LIPN, Paris (France)

Membres :  en cours de constitution

    BELLOT Patrice, LSIS Avignon (France)

    BERTIN Marc, STIH  Paris (France),  CIRST Montreal (Canada)

    BUSCALDI Davide, LIPN, Paris (France)

    CALABRETTO Sylvie, LIRIS Lyon (France)

    CHEVALLET Jean-Pierre, LIG, Grenoble (France)

    GRAU Brigitte, ENSIIE (France)

    HERNANDEZ Nathalie, IRIT, Toulouse (France)    

    KAMEL Mouna, IRIT, Toulouse (France)

    ROUSSEY Catherine, IRSTEA, Clermont Ferrand (France)

    SALLABERRY Christian, LIUPPA, Pau (France)

    SALOTTI Sylvie, LIPN, Paris (France)

    SCHWAB Didier, LIG-GETALP, Grenoble (France)

    TAMINE LECHANI Lynda, IRIT, Toulouse (France)

    ZARGAYOUNA Haïfa, LIPN, Paris (France)


Dates importantes

   
    Soumission facultative des résumés  :  1 février 2016

    Soumission des articles :  5 février 2016

    Notification aux auteurs:  19 février 2016

    Soumission de la version définitive:  29 février 2016

    Atelier RISE à SDNRI :  8 mars 2016


Soumissions

Deux types de soumissions seront possibles (en anglais ou en français), donnant lieu à une présentation de 20 minutes + 10 minutes de questions. Le format des soumissions est celui de SDNRI 2016 (Latex ou Word). Les soumissions se feront sur le site de easy chair https://easychair.org/conferences/?conf=rise2016. Les soumissions seront évaluées par au moins 2 membres du comité de programme.

Articles longs  :

Article d'au moins 8 pages. Les articles longs  devront décrire des contributions originales en cours de développement (et non simplement des propositions de recherche). Les articles longs peuvent être soumis en français ou en anglais. Concernant les publications définitives, Il n'y a pas de contraintes de taille imposée pour l'atelier, mais nous recommandons que les articles longs fassent entre 8 et 12 pages en tenant compte des figures et des références.

Articles courts  :

Résumé de 2 à 4 pages, présentant un projet en cours de développement ou un début de thèse.


Programme

8h30 - 9h30 Inscription, accueil SDNRI

9H30 - 9H45 : Accueil RISE

9h45 - 10h45 : Conférencier invité Jean-Pierre Chevallet

Modéliser la correspondance RI avec une logique: liens entre logique et sémantique

Dans le domaine de la Recherche d'Information (RI), modéliser la notion de pertinence à l'aide d'une logique est une idée ancienne, puis que dès 1971, Cooper propose de définir la pertinence par un lien logique entre un document et une requête. Ce choix impose de représenter les documents et les requêtes comme des formules logiques. Cette idée a ensuite été particulièrement étudiée dans les années 1990, avec comme point de départ une intuition de Van Rijbergen sur le lien entre déduction logique et probabilité de pertinence. Pourtant, cette approche ne semble pas s'être effectivement développée pour être utilisée dans les moteurs de recherche actuels. Alors que la logique est également un outil pour modéliser et déduire des connaissances, il semble également approprié d'utiliser les outils mathématiques offerts par la logique formelle pour modéliser et mettre en œuvre un moteur de recherche sémantique. 

Dans cet exposé, nous proposerons des clés pour mieux comprendre le paradoxe historique des promesses offertes par la logique pour la modélisation de la pertinence et les relatifs échecs quant à son usage effectif dans des moteurs de recherche d'information. 

Cette présentation rappelle en premier les fondements de la logique formelle. Nous mettons l'accent sur les notions de syntaxe, de niveau de langage et de sémantique. Nous proposons ensuite un bref parcours historique de la modélisation logique pour la Recherche d'Information. Nous présentons en particulier l'idée fondatrice de Rijbergen, et des propositions plus récentes comme celle de Losada et Barreiro. Nous mentionnerons les propositions de fusion entre les logiques de descriptions, et les probabilités. Enfin, nous terminons avec les moteurs de recherche sémantiques et les perspectives nouvelles de recherche qui s'offrent avec l'usage de connaissances formalisées en logique pour calculer la pertinence.

Jean-Pierre Chevallet  est Maître de conférences à l'Université Grenoble Alpes (UGA) et membre du groupe de recherche Modélisation et Recherche d'Information Multimédia (MRIM) du Laboratoire l'Informatique de Grenoble (LIG)

10h45 - 12h15 : Session Doctorants 

Extraction des informations d'entreprises 

            Armel Fotsoh Tawofaing, Annig Le Parc-Lacayrelle, Christian Sallaberry et Tanguy Moal



Propagation d'activation dans les graphes pour la recherche d'information sémantique 

            Ines Bannour, Haïfa Zargayouna et Adeline Nazarenko


Exploring Deep Learning for Query Expansion

            Mohannad ALMasri, Catherine Berrut et Jean-Pierre Chevallet


12h15 - 14h00 : Repas

14h00 - 15h00 : Conférencier invité Brigitte Grau

Répondre à des questions, à partir de textes ou de bases de connaissances.

Les systèmes de question-réponse ont pour but de fournir des réponses précises à des questions posées en langage naturel, réponses qui peuvent être trouvées dans des bases de connaissances ou dans des textes. De cette façon, l'utilisateur n'a pas à savoir comment l'information est représentée ou comment elle est recherchée. Les questions auxquelles je m'intéresserai dans cette présentation sont des questions factuelles, du type "A qui est mariée la fille de Bill Clinton" par exemple, dont on peut trouver la réponse dans une base de connaissances comme DBPedia, aussi bien que dans des textes. Dans les deux cas, l'objectif est de produire une représentation de la question de manière à pouvoir la rapprocher de la formulation de la réponse. Selon le type de ressource interrogée, les systèmes existants reposent sur des processus différents, chacun devant gérer la variabilité linguistique entre la formulation de l'utilisateur et la forme cherchée.

Cette présentation permettra de balayer l'existant pour ces deux types de recherche : les problèmes qui se posent et les réponses apportées, afin de pouvoir faire un parallèle entre les recherches dans les deux types de ressources. En effet, bien qu'à l'heure actuelle les deux problématiques soient principalement abordées séparément, l'obtention de systèmes plus performants pourrait résulter d'approches hybrides alliant leurs spécificités et leurs complémentarités. Cela permettrait d'étendre le champs des informations que l'on peut fournir et les possibilités de les retrouver effectivement. Je présenterai les quelques travaux existant dans ce domaine pour conclure sur la manière dont on peut envisager cette hybridation.

Brigitte Grau est Professeur à l’École nationale supérieure d'informatique pour l'industrie et l'entreprise (ENSIIE) et membre du groupe Information, Langue écrite et signée (ILES) du LIMSI-CNRS.

15h00 - 16h00 : Conférencier invité Lynda Tamine Lechani

Sur l’usage de la sémantique en recherche d’information contextuelle.

La recherche d’information contextuelle concerne l’intégration de facteurs, autres que la requête et le document, dans la modélisation du processus de sélection de l’information pertinente en réponse à un besoin exprimé par un utilisateur. Ces facteurs sont multiples : utilisateur incluant ses centres d’intérêts, sa tâche, sa localisation et son voisinage social, le domaine, le dispositif matériel etc. Lors de cette présentation :

  • (a) j’introduirai les principes et verrous de la recherche d’information contextuelle,
  • (b) je mettrai en évidence les ressources et les méthodes utilisées pour la représentation sémantique du contexte (contexte utilisateur et domaine spécifique) et son intégration dans un modèle d’appariement requête-document, et
  • (c) je présenterai une revue de résultats empiriques issus des campagnes d’évaluation TREC et CLEF permettant d’identifier les apports et limites de l’usage de la sémantique dans le domaine ainsi que les pistes de recherche futures.

Lynda Tamine Lechani est Professeur au département d'Informatique, faculté des Sciences de l'Ingénieur de l'université Paul Sabatier et membre de l'Institut de Recherche en Informatique de Toulouse (IRIT), équipe SIG.

16H00 - 16H30 : Pause

16H30 - 17H30 : Session Entreprises

Mise en place d'un cycle de RI sémantique sur un domaine technique.

            Axel Reymonet (Ingénieur R&D ACTIA Automotive  www.actia.com)

Solution d’alerte et de détection de risques fondée sur des technologies de recherche et analyse sémantique
            Arnaud Cassaigne (Ingénieur R&D www.mondeca.com) et Gilles Delaporte (Directeur commercial Mondeca)
            

17h30 - 18H00 - : Bilan et Clôture


Comments