8ème Atelier Recherche d'Information SEmantique Toulouse, 8 mars 2016
L'atelier RISE en est à sa huitième édition. Cette année il sera
associé à la Conférence CORIA 2016 de la Semaine du Document Numérique,
après avoir été organisé conjointement avec les conférences IC 2015 de la plateforme IA, CORIA 2014
(SDNRI 2014), IC 2013 ,EGC 2012, CORIA 2011, INFORSID 2010 et 2009.
L'atelier RISE est soutenu par l'ARIA (Association Francophone de Recherche d'Information et
Applications).
Les actes ainsi que les présentations sont accessibles dans RISE Documents.
Présentation
Les systèmes d'accès à l'information peuvent
désormais traiter le contenu informationnel au niveau sémantique et non
plus seulement au niveau signal (texte, image, etc). Les ressources sémantiques mises en ligne permettent de
conceptualiser les besoins des utilisateurs et les contenus des
documents. Un des enjeux
actuels est de proposer des fonctionnalités sémantiques pertinentes pour
exploiter au mieux les ressources sémantiques telles que les
ontologies, les bases de données lexicales, les thesaurii.
Le passage au niveau conceptuel permet de s'abstraire du niveau signal
ainsi que, dans certains cas, de la langue. Le raisonnement au niveau
conceptuel peut être exploité pour la recherche d'information multimédia
et multilingue.
Les précédentes éditions de cet atelier ont montré l'intérêt de la
recherche d'information sémantique dans des domaines de spécialité tels
que le domaine agricole, médical, juridique, environnement, etc.
Cet atelier a pour but de proposer un lieu d'échange entre des
chercheurs issus de différentes communautés comme la Recherche
d'Information, le Web Sémantique, l’Extraction des Connaissances et le
Traitement Automatique des Langues Naturelles et le Multimédia.
Thèmes
Les principaux thèmes abordés sont alors (liste non exhaustive, d'autres thèmes connexes peuvent être traités par les auteurs) :
- Modèles de Recherche d'Information Sémantique,
- Extraction d'Information,
- Expansion de requêtes,
- Question/Réponse Sémantique,
- Annotation Sémantique, Indexation Sémantique,
- Alignement d'ontologies et correspondances pour la Recherche d'Information,
- Langages de Représentation des connaissances pour la Recherche
d'Information (Graphes Conceptuels, Logiques de Description, RDF),
- Utilisation des distances Sémantiques pour la Recherche d'Information,
- Construction et enrichissement de Ressources Sémantiques pour la gestion documentaire,
- Usage de larges Bases de Connaissances pour la Recherche d'Information, Web de données documentaires,
- Évaluation de nouvelles méthodes d'accès sémantique,
- Passage à l'échelle.
Organisation
La participation à la journée de l'atelier est gratuite. Mais vous devrez cependant vous inscrire sur le site de SDNRI de sciencesconf.org. Pour ceux qui ne souhaite venir qu'à la journée gratuite il y a une catégorie spéciale "Journée seule Hackday RISE".
Comité de Programme
Organisateurs :
- CHEVALLET Jean-Pierre, LIG, Grenoble (France)
- ROUSSEY Catherine,IRSTEA, Clermont Ferrand (France)
- ZARGAYOUNA Haïfa , LIPN, Paris (France)
Membres : en cours de constitution
BELLOT Patrice, LSIS Avignon (France)
BERTIN Marc, STIH Paris (France), CIRST Montreal (Canada)
BUSCALDI Davide, LIPN, Paris (France)
CALABRETTO Sylvie, LIRIS Lyon (France)
CHEVALLET Jean-Pierre, LIG, Grenoble (France)
GRAU Brigitte, ENSIIE (France)
HERNANDEZ Nathalie, IRIT, Toulouse (France)
KAMEL Mouna, IRIT, Toulouse (France)
ROUSSEY Catherine, IRSTEA, Clermont Ferrand (France)
SALLABERRY Christian, LIUPPA, Pau (France)
SALOTTI Sylvie, LIPN, Paris (France)
SCHWAB Didier, LIG-GETALP, Grenoble (France)
TAMINE LECHANI Lynda, IRIT, Toulouse (France)
ZARGAYOUNA Haïfa, LIPN, Paris (France)
Dates importantes
Soumission facultative des résumés : 1 février 2016
Soumission des articles : 5 février 2016
Notification aux auteurs: 19 février 2016
Soumission de la version définitive: 29 février 2016
Atelier RISE à SDNRI : 8 mars 2016
Soumissions
Deux types de soumissions seront possibles (en anglais ou en français),
donnant lieu à une présentation de 20 minutes + 10 minutes de questions.
Le format des soumissions est celui de SDNRI 2016 (Latex ou Word). Les soumissions se feront sur le site de easy chair https://easychair.org/conferences/?conf=rise2016.
Les soumissions seront évaluées par au moins 2 membres du comité de programme.
Articles longs :
Article
d'au moins 8 pages. Les articles longs devront décrire des
contributions originales en cours de développement (et non simplement
des propositions de recherche). Les articles longs peuvent être soumis
en français ou en anglais. Concernant les publications définitives, Il
n'y a pas de contraintes de
taille imposée pour l'atelier, mais nous recommandons que les articles
longs fassent entre 8 et 12 pages en tenant compte des figures
et des références.
Articles courts :
Résumé de 2 à 4 pages, présentant un projet en cours de développement ou un début de thèse.
Programme
8h30 - 9h30 Inscription, accueil SDNRI
9H30 - 9H45 : Accueil RISE
9h45 - 10h45 : Conférencier invité Jean-Pierre Chevallet
Modéliser la correspondance RI avec une logique: liens entre logique et sémantique
Dans le domaine de la Recherche d'Information (RI), modéliser la notion de pertinence à l'aide d'une logique est une idée ancienne, puis que dès 1971, Cooper propose de définir la pertinence par un lien logique entre un document et une requête. Ce choix impose de représenter les documents et les requêtes comme des formules logiques. Cette idée a ensuite été particulièrement étudiée dans les années 1990, avec comme point de départ une intuition de Van Rijbergen sur le lien entre déduction logique et probabilité de pertinence. Pourtant, cette approche ne semble pas s'être effectivement développée pour être utilisée dans les moteurs de recherche actuels. Alors que la logique est également un outil pour modéliser et déduire des connaissances, il semble également approprié d'utiliser les outils mathématiques offerts par la logique formelle pour modéliser et mettre en œuvre un moteur de recherche sémantique.
Dans cet exposé, nous proposerons des clés pour mieux comprendre le paradoxe historique des promesses offertes par la logique pour la modélisation de la pertinence et les relatifs échecs quant à son usage effectif dans des moteurs de recherche d'information.
Cette présentation rappelle en premier les fondements de la logique formelle. Nous mettons l'accent sur les notions de syntaxe, de niveau de langage et de sémantique. Nous proposons ensuite un bref parcours historique de la modélisation logique pour la Recherche d'Information. Nous présentons en particulier l'idée fondatrice de Rijbergen, et des propositions plus récentes comme celle de Losada et Barreiro. Nous mentionnerons les propositions de fusion entre les logiques de descriptions, et les probabilités. Enfin, nous terminons avec les moteurs de recherche sémantiques et les perspectives nouvelles de recherche qui s'offrent avec l'usage de connaissances formalisées en logique pour calculer la pertinence.
Jean-Pierre Chevallet est Maître de conférences à l'Université Grenoble Alpes (UGA) et membre du groupe de recherche
Modélisation et Recherche d'Information Multimédia (MRIM) du
Laboratoire l'Informatique de Grenoble (LIG)
10h45 - 12h15 : Session Doctorants
Extraction des informations d'entreprises
Armel Fotsoh Tawofaing, Annig Le Parc-Lacayrelle, Christian Sallaberry et Tanguy Moal
Propagation d'activation dans les graphes pour la recherche d'information sémantique
Ines Bannour, Haïfa Zargayouna et Adeline Nazarenko
Exploring Deep Learning for Query Expansion
Mohannad ALMasri, Catherine Berrut et Jean-Pierre Chevallet
12h15 - 14h00 : Repas
14h00 - 15h00 : Conférencier invité Brigitte Grau
Répondre à des questions, à partir
de textes ou de bases de connaissances.
Les systèmes de question-réponse ont pour but de fournir des réponses précises à des questions posées en langage naturel, réponses qui peuvent être trouvées dans des bases de connaissances ou dans des textes. De cette façon, l'utilisateur n'a pas à savoir comment l'information est représentée ou comment elle est recherchée. Les questions auxquelles je m'intéresserai dans cette présentation sont des questions factuelles, du type "A qui est mariée la fille de Bill Clinton" par exemple, dont on peut trouver la réponse dans une base de connaissances comme DBPedia, aussi bien que dans des textes. Dans les deux cas, l'objectif est de produire une représentation de la question de manière à pouvoir la rapprocher de la formulation de la réponse. Selon le type de ressource interrogée, les systèmes existants reposent sur des processus différents, chacun devant gérer la variabilité linguistique entre la formulation de l'utilisateur et la forme cherchée.
Cette présentation permettra de balayer l'existant pour ces deux types de recherche : les problèmes qui se posent et les réponses apportées, afin de pouvoir faire un parallèle entre les recherches dans les deux types de ressources. En effet, bien qu'à l'heure actuelle les deux problématiques soient principalement abordées séparément, l'obtention de systèmes plus performants pourrait résulter d'approches hybrides alliant leurs spécificités et leurs complémentarités. Cela permettrait d'étendre le champs des informations que l'on peut fournir et les possibilités de les retrouver effectivement. Je présenterai les quelques travaux existant dans ce domaine pour conclure sur la manière dont on peut envisager cette hybridation.
Brigitte Grau est Professeur à l’École nationale supérieure d'informatique pour l'industrie
et l'entreprise (ENSIIE) et membre du groupe Information,
Langue
écrite et signée (ILES) du LIMSI-CNRS.
15h00 - 16h00 : Conférencier invité Lynda Tamine Lechani
Sur l’usage de la sémantique en recherche d’information contextuelle.
La recherche d’information contextuelle concerne l’intégration de facteurs, autres que la requête et le document, dans la modélisation du processus de sélection de l’information pertinente en réponse à un besoin exprimé par un utilisateur. Ces facteurs sont multiples : utilisateur incluant ses centres d’intérêts, sa tâche, sa localisation et son voisinage social, le domaine, le dispositif matériel etc.
Lors de cette présentation :
- (a) j’introduirai les principes et verrous de la recherche d’information contextuelle,
- (b) je mettrai en évidence les ressources et les méthodes utilisées pour la représentation sémantique du contexte (contexte utilisateur et domaine spécifique) et son intégration dans un modèle d’appariement requête-document, et
- (c) je présenterai une revue de résultats empiriques issus des campagnes d’évaluation TREC et CLEF permettant d’identifier les apports et limites de l’usage de la sémantique dans le domaine ainsi que les pistes de recherche futures.
Lynda Tamine Lechani est Professeur au département d'Informatique, faculté des Sciences de l'Ingénieur de l'université Paul Sabatier et membre de l'Institut de Recherche en Informatique de Toulouse (IRIT), équipe SIG.
16H00 - 16H30 : Pause
16H30 - 17H30 : Session Entreprises
Mise en place d'un cycle de RI sémantique sur un domaine technique.
Axel Reymonet (Ingénieur R&D ACTIA Automotive www.actia.com)
Solution d’alerte et de détection de risques fondée sur des technologies de recherche et analyse sémantique
Arnaud Cassaigne (Ingénieur R&D www.mondeca.com) et Gilles Delaporte (Directeur commercial Mondeca)
17h30 - 18H00 - : Bilan et Clôture