EmcSci

1er atelier sur l' Extraction et la Modélisation de Connaissances à partir de textes scientifiques

IC 2017, Caen, France

Nouveauté: Francesco Osborne (Knowledge Media institute, The Open University) sera le conférencier invité de l'atelier

Le programme est en ligne!

22/06: les actes sont en ligne!

Présentation

L’extraction de connaissances à partir du texte, également connue sous le nom de la fouille de texte, est une tâche clé dans le contexte du TAL. Les techniques d'analyse de texte permettent d'identifier concepts et leurs relations dans des textes non structurés.

Les textes scientifiques constituent un champ d'application stimulant et intéressant pour telles techniques: trouver des concepts clés [Lopez 2010], identifier des domaines de recherche et leurs relations [Gabor 2016b] permet d'améliorer l'accès aux collections de textes scientifiques [Osborne 2012, Osborne 2013]. Le fait que les articles aient des auteurs et une date de publication permet pas seulement d'extraire des informations de collaboration [Roth 2010] et autres informations qui peuvent être représentées sous forme de graphes [Nuzzolese 2016], mais aussi de déterminer l'évolution de certains concepts dans le temps [Chavalarias 2013]. L'extraction de connaissances peut également être utilisée pour automatiser la découverte scientifique (discovery science) [Kitano 2016], un défi majeur pour les systèmes d'intelligence artificielle du futur.

L'intérêt pour ce type d'extraction des connaissances est attesté par l'apparition récente d'ateliers et de défis dédiés, tels que SAVE-SD (http://cs.unibo.it/save-sd/2015/) et ScienceIE (tâche 10 à Semeval 2017: https://scienceie.github.io/index.html), comme des projets émergents, encouragés par des importants éditeurs, tels que SpringerNature SciGraph et Elsevier Labs , mais aussi par la communauté de recherche tels que Scholarly Data portal et Open Citations.

L'objectif de cet atelier est de rassembler des chercheurs qui s'intéressent à divers aspects du processus d'extraction de connaissances à partir de textes scientifiques, en particulier, mais sans s'y limiter, à: la recherche d'experts et la detection de communautés, la découverte des tendances de recherche, les méthodes d'extraction de phrases clés et de relations, de construction ou d'expansion automatique d'ontologies dédiées à l'analyse de données scientifiques.

Thèmes:

  • Extraction de mots clés et / ou de relations à partir de textes scientifiques;
  • Similiarité sémantique entre concepts scientifiques;
  • Identification des experts;
  • Recherche d'information sémantique (limité au contexte des documents scientifiques);
  • Analyse et prédiction des citations;
  • Ontologies pour la description de domaines scientifiques;
  • Enrichissement des ontologies par des concepts et des relations scientifiques;
  • Resumé automatique;
  • Aspects de dynamique de la recherche (évolution des concepts, des communautés, identification des «domaines oubliés» ou des champs de recherche émergents).

Bibliographie:

[Chavalarias 2013] David Chavalarias et Jean-Philippe Cointet. “Phylomemetic patterns in science evolution - the rise and fall of scientific fields”. PLOS ONE, 8(2).

[Gabor 2016a] Gabor K., Zargayouna H., Buscaldi D., Tellier I., Charnois T. Semantic Annotation of the ACL Anthology Corpus for the Automatic Analysis of Scientific Literature. In: LREC 2016. Portorose, Slovenia.

[Gabor 2016b] Gábor K., Zargayouna H., Tellier I., Buscaldi D., Charnois T. Unsupervised Relation Extraction in Specialized Corpora Using Sequence Mining. IDA 2016: 237-248

[Lopez 2010] Patrice Lopez and Laurent Romary. 2010. HUMB: Automatic key term extraction from scientific articles in GROBID. In Proceedings of the 5th International Workshop on Semantic Evaluation (SemEval '10). Association for Computational Linguistics, Stroudsburg, PA, USA, 248-251.

[Kitano 2016] Hiroaki Kitano: Artificial Intelligence to Win the Nobel Prize and Beyond: Creating the Engine for Scientific Discovery. AI Magazine 37(1): 39-49 (2016)

[Nuzzolese 2016] Andrea Giovanni Nuzzolese, Anna Lisa Gentile, Valentina Presutti, Aldo Gangemi: Conference Linked Data: The ScholarlyData Project. International Semantic Web Conference (2) 2016: 150-158

[Osborne 2012] Francesco Osborne et Enrico Motta. “Mining semantic relations between research areas”. In : International Semantic Web Conference (ISWC2012). Springer Berlin Heidelberg, 2012. p. 410-426.

[Osborne 2013] Francesco Osborne, Enrico Motta et Paul Mulholland. “Exploring scholarly data with rexplore”. In : International Semantic Web Conference (ISWC2013). Springer Berlin Heidelberg, 2013. p. 460-477.

[Roth 2010] Camille Roth et Jean-Philippe Cointet. “Social and semantic coevolution in knowledge networks” Social Networks 32.1 (2010): 16-29.