RISE 2018

10ème Atelier Recherche d'Information SEmantique. Rennes, 15 Mai 2018

Nous fêtons la dixième édition de l'atelier !!  Cette année il sera associé à la Conférence  CORIA-TALN-RJC 2018, dans le cadre de la Semaine des technologies de langue et de l’information, après avoir été organisé conjointement avec les conférences IC 2017 (PFIA 2017),  CORIA 2016 de la Semaine du Document Numérique, IC 2015 (PFIA 2015), CORIA 2014 (SDNRI 2014), IC 2013 ,EGC 2012, CORIA 2011, INFORSID 2010 et 2009.

L'atelier est soutenu par l'ARIA (Association francophone en Recherche d’Information et Applications) et le Collège Science de l'Ingénierie des Connaissances  de l'AFIA (Association Francophone d'Intelligence Artificielle).

Les présentations sont accessibles dans RISE Documents.


ARIA


Programme prévisionnel

9h00-9h15 Accueil

9h15-9h30 Introduction Atelier : 10 ans de RISE. Haïfa Zargayouna

9h30-10h30 Conférence invitée. Bhaskar Mitra (Microsoft Cambridge) (chair : Jean-Pierre Chevallet) 

5 Lessons Learned from Designing Neural Models for Information Retrieval (slides)

Neural Information Retrieval (or neural IR) is the application of shallow or deep neural networks to IR tasks. Unlike classical IR models, these machine learning (ML) based approaches are data-hungry, requiring large scale training data before they can be deployed. Traditional learning to rank models employ supervised ML techniques—including neural networks—over hand-crafted IR features. By contrast, more recently proposed neural models learn representations of language from raw text that can bridge the gap between the query and the document vocabulary.

Neural IR is an emerging field and research publications in the area has been increasing in recent years. While the community explores new architectures and training regimes, a new set of challenges, opportunities, and design principles are emerging in the context of these new IR models. In this talk, I will share five lessons learned from my personal research in the area of neural IR. I will present a framework for discussing different unsupervised approaches to learning latent representations of text. I will cover several challenges to learning effective text representations for IR and discuss how latent space models should be combined with observed feature spaces for better retrieval performance. Finally, I will conclude with a few case studies that demonstrates the application of neural approaches to IR that go beyond text matching.

10h30-11hO0 Pause

11h00-12h30 Session 1 (chair : Catherine Roussey) 

Looking for Semantics in Open-source Semantic Information Retrieval Systems 

            Davide Buscaldi

Enrichissement lexical par apprentissage non-supervisé d’une ressource de type connaissance 

            Armel Fotsoh Tawofaing, Christian Sallaberry and Annig Le Parc - Lacayrelle

Vers une cartographie automatique des thématiques et profils d’experts associés à une conférence 

scientifique : 9 ans d’ateliers Recherche d'Information SEmantique (RISE) 

            Stella Zevio, Haïfa Zargayouna, Guillaume Santini and Thierry Charnois

12h30-14h00 Déjeuner

14h00-15h30 Session Entreprises (chair : Haïfa Zargayouna) 

Calcul de représentation sémantiques de documents et requêtes à l'échelle de web 

            Guillaume Pitel (CEO eXensa, Chief Scientist)

De l’e-réputation à la recommandation fine des restaurants 

            Hamid Hammouche (CEO Advanced decision, Strategy and Innovation)

15h30-16h00 Session 2  (chair : Catherine Roussey) 

Néonaute, Enrichissement sémantique pour la recherche d'information 

            Emmanuel Cartier, Loïc Galand, Peter Stirling, Sara Aubry

16h00-16h30 Pause

16h30-17h45 Table ronde : Enjeux et perspectives de la recherche d'information sémantique. Haïfa Zargayouna 

Animateur (Jean-Pierre Chevallet)

            Intervenants : Catherine Berrut (LIG, Grenoble), Gilles Falquet (KE@ISS, Genève),  

            Jean Charlet (LIMICS, Paris), Christophe Servan (Qwant), Didier Schwab (LIG, Grenoble), 

            Lynda Tamine (IRIT, Toulouse)

17h45-18h00 Discussion et clôture


Présentation

10 ans c’est l’heure du bilan ! Nous voulons que cette dixième édition soit à l’image des éditions précédentes, festive et riche scientifiquement. L'atelier est un lieu d’échanges autour des questions issues de différentes communautés comme la Recherche d'Information, le Web Sémantique, l’Extraction des Connaissances et le Traitement Automatique des Langues Naturelles.

Nous comptons continuer la programmation (entre autres) de sessions dédiées et notamment une session doctorants et une session entreprise. N’hésitez pas à soumettre vos propositions.

Soumissions

Deux types de soumissions sont possibles (en anglais ou en français), donnant lieu à une présentation de 20 minutes + 10 minutes de questions. Le format des soumissions est celui de CORIA-TALN. Les soumissions se feront sur le site de easy chair. Les soumissions seront évaluées par au moins 2 membres du comité de programme.

Articles longs :

Article d'au moins 8 pages. Les articles longs devront décrire des contributions originales en cours de développement (et non simplement des propositions de recherche). Les articles longs peuvent être soumis en français ou en anglais. Concernant les publications définitives, Il n'y a pas de contraintes de taille imposée pour l'atelier, mais nous recommandons que les articles longs fassent entre 8 et 12 pages en tenant compte des figures et des références.

Articles courts :

Résumé de 2 à 4 pages, présentant un projet en cours de développement ou un début de thèse.

Thèmes

Les principaux thèmes abordés sont alors (liste non exhaustive, d'autres thèmes connexes peuvent être traités par les auteurs) :

  •  Modèles de Recherche d'Information Sémantique
  •  Extraction d'Information
  •  Expansion de requêtes
  •  Question/Réponse Sémantique
  •  Annotation Sémantique, Indexation Sémantique
  •  Alignement d'ontologies et correspondances pour la Recherche d'Information
  •  Langages de Représentation des connaissances pour la Recherche d'Information (Graphes Conceptuels, Logiques de Description, RDF)
  •  Utilisation des distances ou similarités sémantiques pour la Recherche d'Information
  •  Construction et enrichissement de Ressources Sémantiques pour la gestion documentaire
  •  Usage de larges Bases de Connaissances pour la Recherche d'Information, Web de données documentaires
  •  Évaluation de nouvelles méthodes d'accès sémantique
  •  Passage à l'échelle
  •  Sémantique latente et apprentissage (LSA, deep learning)


Organisation


Comité de Programme 

Organisateurs :

  • CHEVALLET Jean-Pierre, LIG, Grenoble (France)
  • ROUSSEY Catherine,IRSTEA, Clermont Ferrand (France)
  • ZARGAYOUNA Haïfa , LIPN, Paris (France)

Membres :  

  • BELLOT Patrice, LITIS Marseille (France)
  • BERTIN Marc, ELICO, Lyon (France)
  • CALABRETTO Sylvie, LIRIS Lyon (France)
  • CHEVALLET Jean-Pierre, LIG, Grenoble (France)
  • FALQUET Gilles, CUI, Genève (Suisse)
  • GRAU Brigitte, ENSIIE (France)
  • HERNANDEZ Nathalie , IRIT, Toulouse (France)
  • METAIS Elisabeth, CNAM Paris (France)
  • PINET-SAUVAGNAT Karen, IRIT Toulouse (France)
  • ROCHE Christophe, LISTIC, Annecy (France)
  • ROUSSEY Catherine, LIRIS, Lyon (France)
  • SALLABERRY Christian, LIUPPA, Pau (France)
  • SCHWAB Didier ,LIG-GETALP, Grenoble (France)
  • ZARGAYOUNA Haïfa , LIPN, Paris (France)
  • ZWEIGENBAUM Pierre, LIMSI (France)




Comments