Période 2017-2019
Participants : INRA (coordinateur), FAO (coordinateur), AgroKnow (coordinateur), CABI (coordinateur),
Irstea, LIRMM, …
Appel Groupe de travail Research Data Alliance International
Porteur(s): Sophie Aubin, Caterina Caracciolo, Panagiotis Zervas, Brandon Whitehead
L’objectif du groupe est de rassembler les besoins et les cas d’usage en agriculture pour développer une infrastructure utilisant les technologies Web sémantique afin de résoudre les problèmes d’interopérabilité des données. Un premier rapport a été publié en 2017 [Rap4] qui dresse le panorama des bonnes pratiques de structuration de données illustrées par des exemples concrets de ressources sémantiques (ontologies, thésaurus, plateforme etc.).
J’ai participé aux réunions de ce groupe de travail de la RDA, ainsi qu’à la rédaction du rapport [Rap4]. Mon expertise originale était sur l’usage de l’ontologie Semantic Sensor Network pour la publication de données capteurs. J’ai aussi participé à la rédaction de la publication qui a suivi [RI11].
https://www.rd-alliance.org/groups/agrisemantics-wg.html
Finance: Project funded by eContent plus Programme
Project Coordinator: Stefania De Zorzi dezorzi@corila.it
Participants : CORILA - Consortium for Coordination of Research Activities concerning the Venice Lagoon System (Italy), GERIN - Intergraph Deutschland (Germany), VUGK - Research Institute of Geodesy and Cartography in Bratislava (Slovakia), UDG - University of Girona, GIS Centre (Spain), ICC - Institut Cartogràfic de Catalunya (Spain), GISIG - Geographical Information Systems International Group (Italy), FOMI - The Institute of Geodesy, Cartography and Remote Sensing (Hungary), RLIG - Regione Liguria (Italy), RPIE - Regione Piemonte (Italy), UNOTT - Centre for Geospatial Science at the University of Nottingham (UK), CGE - Comune di Genova (Italy), UNISAP - University of Rome "LA SAPIENZA" (Italy), POLIN - Intergraph Polska Sp.z o.o. (Poland), IGP - Instituto Geográfico Português (Portugal), INSA - National Institute for Applied Sciences (France), INSIEL - INSIEL (Italy), CSI-Piemonte - Consortium for Information Systems (Italy), UNIMUN - Institute for Geoinformatics of the University of Muenster (Germany), INTIT - Intergraph Italia LLC (Italy), RVEN - Regione del Veneto (Italy), MAV - Venice Water Authority - Information Service (Italy), IUAV- Università IUAV di Venezia (Italy).
Ce projet a pour but de rendre interopérable la cartographie de base en conformité avec les directives européennes INSPIRE. Le but est de créer un serveur qui permettra l’accès par des services standard aux données de sources différentes [http://www.gisig.it/gis4eu/]. Ce projet regroupe surtout des fournisseurs de données. Intergraph est chargé de l’implémentation du serveur. L’Université de Munster et l’INSA sont les seuls partenaires universitaires qui ont la charge de fournir des états de l’art sur certaines thématiques.
Dans ce projet je participe au groupe thématique Hydrographie et je suis chargée d’expliquer les différents types d’ontologies et leur utilisation. Ce projet a choisi de travailler avec l’ontologie terminologique AGROVOC pour annoter leurs données avant de les intégrer [CI15].
Participants : University of Thessaloniki, Greece - CSTB, France, EPFL, Switzerland - Norwegian Building Research Institute, Norway - Politecnico di Bari, Italy - Politecnico di Milano, Italy - Queens University of Belfast, United Kingdom - Romanian Academy, Romania - Tampere University of Technology, Finland - Technical University of Civil Engineering, Romania - Universidad de Zaragoza, Spain - Universidad Politecnica de Madrid, Spain - Università degli Studi della Basilicata, Italy - Universite de Geneve, Switzerland - Université de Liège, Belgium - Université d'Evry, France - University "Tor Vergata" Rome, Italy - University of Edinburgh, United Kingdom - University of Firenze, Italy - University of Genoa, Italy
Ce projet s’intéresse à l’utilisation des ontologies dans le domaine du Génie Civil. J’étais responsable du Working Group 1 consacré à la conception d’ontologies [E1, E3].
Période 2020-2022
Participants: UMR INRAE SADAPT (coordinateur), UR INRAE TSCF, UMR INRAE LISIS, UMR INRAE
Agronomie, Educagrie, Elzeard, ACTA, ITAB, Bio Occitanie, FRAB Bretagne, AFAUP.
Appel INRAE Metaprogramme METABIO
Porteur Kevin MOREL UMR INRAE SADAPT
Ce projet a pour objectif d’étudier les leviers fournis par l’agriculture numérique et plus particulièrement les technologies Web sémantique pour favoriser le partage et la capitalisation des connaissances en Agriculture Biologique.
Ce projet est très lié au projet D2KAB et à la plateforme GECO. L’entreprise Elzeard participe activement à ce projet. Je travaille avec eux pour construire un graphe de connaissances dans le domaine du maraîchage biologique qui sera partagé comme bien commun agricole. Ce graphe est intitulé la serre des savoirs. Elle intègre des connaissances issues du thésaurus FrenchCropUsage. L’ontologie sous-jacente à ce graphe de connaissances s’appelle C3PO [CI40, CI41, CI43, CN37].
Durée 2020 2022
Financement ANR 2019 AAP Flash données ouvertes
Porteur Sophie Aubin Dipso INRAE
Partenaires:
AGAP : Amélioration Génétique et Adaptation des Plantes méditerranéennes et tropicales
DIADE : DIversité – Adaptation – DEveloppement des plantes
DipSO (anciennement DIST INRA et DRISE Irstea)
LIRMM : Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
MISTEA : Mathématiques, Informatique et STatistique pour l’Environnement et l’Agronomie
MOISA : Marchés, organisations, institutions et stratégies d’acteurs
TETIS : Territoires, environnement, télédétection et information spatiale
TSCF: Technologies et systèmes d’information pour les agro-systèmes
Le projet FooSIN développe en France le Food Systems Implementation Network (IN) créé sous l’égide de GO FAIR.
Période 2017 à 2020
Financement CASDAR AAP Recherche Technologique 2017
Porteur Bruno LAUGA d’ARVALIS
Partenaires : ACTA, FIEA, IDELE, IRSTEA, ORANGE, SMAG
Le projet MULTIPASS souhaite mettre à disposition des producteurs et valorisateurs de données agricoles, un écosystème de gestion des consentements des agriculteurs protégeant les échanges de données des exploitations [CI37, CI38].
Dans ce projet j’interviens sur la présentation des référentiels agricoles permettant de structurer les données des exploitations. Mon expérience dans les projets GIEEA et GIS4EU sur l’usage de thésaurus et de dictionnaire de données UML montre que parfois le type de ressource à utiliser n’est pas forcément une ontologie.
https://portail-intranet.arvalis.fr/mesgroupes/MULTIPASS/Pages/default.aspx
financement PSPE "Pour et Sur le Plan Ecophyto » 2012Durée 2013-2016
porteur INRA Xavier Reboud
L’un des objectifs de ce projet est de sauvegarder et valoriser un ensemble de bulletins d’alerte agricole datant de 1963 à 2008 [artTech1, artTech3]. Les Bulletins de Santé du Végétal (BSV) issu du plan Ecophyto font parti de ce corpus. Les BSV sont un réseau de surveillance des cultures permettant de donner l’état de développement des cultures par région et de donner l’alerte sur les attaques de ces cultures. Ainsi il sera possible de constituer à partir de ces textes une base de données scientifique permettant de suivre l’évolution des bio-agresseurs sur le long terme.
J’ai coordonné les travaux de l’Irstea sur la structuration des annotations des bulletins. L’implémentation a été réalisée par Stephan BERNARD de l’équipe Copain. Nous participions au volet Archive des bulletins d'alerte agricole dirigé par Vincent Cellier de l'INRA de Dijon spécialiste des grandes cultures. Cette archive contient la numérisation des deux types de Bulletins d’alerte agricole. Notre participation a pour but de construire une archive pérenne des Bulletins de Santé du Végétal depuis leur apparition. Notre archive est mise à disposition à l'aide de technologies Web sémantique [BD4]. J’ai proposé une méthode d’annotation sémantique des bulletins agricoles à l’aide de trois composantes : une composante spatiale, une composante temporelle et une composante thématique qui était dans ce cas les cultures observées dans le bulletin [RI7, CN28]. Pour se faire, j’ai construit un thésaurus des usages des cultures en France [BD3]. Ce projet m’a permis de définir le sujet de thèse de Fabien Amarger sur la construction de référentiel par détection de consensus.
Ce projet a débuté avec une action du projet Rhone Alpes Web Intelligence, intitulée Ontologie Multilingue. Cette action a permis à plusieurs chercheurs Rhone alpiens de se retrouver pour discuter de leur thématique de recherche. Ce groupe de chercheurs s'est étendu pour proposer chaque année un atelier sur la Recherche d'Information Semantique RISE. Voir le site associé pour accéder aux actes de ces ateliers.
Financement CASDAR
Durée: 2009-2010
Participants : ACTA Informatique est en charge du projet; les instituts techniques agricoles Arvalis-Institut du Végétal, Ctifl, Acta; Cemagref; des partenaires du développement compétents dans les systèmes d’information pour l’agriculture France Informatique Elevage et Agriculture (FIEA), Agro EDI Europe.
Résumé: Ce projet fait suite au projet GIEA (Gestion des Informations de l'Exploitation Agricole) conduit par l'APCA (Assemblée Permanente des Chambres d'Agriculture). Le projet GIEEA réunit l'ensemble des acteurs de la sphère agricole désireux d'échanger des données « environnement » informatisées sur l’exploitation agricole. Ce projet a pour objectif de définir et d’enrichir des dictionnaires métiers favorisant l'interopérabilité des applications informatiques ou statistiques d'évaluation, de comparaison, de prévision de risque.
J’utilise les dictionnaires issus de ce projet, et les autres référentiels de données défini au niveau international pour tester notre méthode de construction d’ontologies de données [RN3].
Période 2008-2010
Appel Projet régional du Cluster 2 Informatique, Signal, Logiciels Embarqués (ISLE) de la région Rhône Alpes
Partenaires extérieurs : CLIPS, LSR, LEIBNITZ, TIMC, RIM, EURISE, INRIA, ERIC, G2I, LCIS, LISTIC.
L’objectif général du projet est de créer une synergie de coopération au sein de la communauté scientifique en Rhône-Alpes sur le thème du Web Intelligence via la structuration et la mise en place d’une action de recherche concertée. Les directions de recherche envisagées sont Web Adaptatif, Web Centré Utilisateur, Web médiation et Web Ethique.
J’ai été l’animatrice de l’action coopérative ontologie multilingue de la thématique web centré Utilisateur. Dans le cadre de cette action, j’ai créé avec Jean-Pierre Chevallet un atelier Recherche d’Information Sémantique RISE qui a duré une dizaine d'années [E3, E4, E5, E6, E7, E8, E9, E10, E13].
Période 2006-2007
Partenaires : LIRIS, société Continew
Appel : projet régional industriel d’appui laboratoire pour l’incubation d’entreprise
Le programme d’appui laboratoire a permis de tester en laboratoire la technologie de SyDoM sur un corpus à grande échelle. SYDOM étant le nom du système de recherche d’information sémantique et multilingue développé au cours de ma thèse. L’objectif était d’évaluer la pertinence du moteur de recherche multilingue développé dans SyDoM. De plus, le laboratoire a établi une collaboration sur le long terme avec l’entreprise CONTINEW SBC en développant des recherches sur la classification et l’indexation de documents structurés XML. Notre but était de participer aux spécifications du logiciel de gestion des documents techniques multilingues dédié aux besoins de l’entreprise CONTINEW.
J’étais le référent principal du laboratoire pour le projet d’incubation d’entreprise et donc le contact principal avec l’entreprise. Mon implication s’est matérialisée par la définition des sujets et le co-encadrement de stagiaire INSA et du master recherche de Wafa Mefteh. Enfin, cette incubation m’a permis de définir le sujet de la thèse CIFRE de Samaneh CHAGHERI soutenue en 2012.
Projet en collaboration entre les laboratoires LIRIS et EDU (BQR Insa).
Ce projet nous a permis de participer à l'Action COST C21 Urban Ontologies for an improved communication in urban civil engineering projects. Lien vers l'action COST
Ce projet a fait l'objet de la thése de Abdel Kader KEITA, Thèse en informatique de l’INSA de Lyon " Conception Coopérative d’Ontologies Pré-Consensuelles : Application au domaine de l’Urbanisme"soutenue en juin 2006.
L'objectif principal de ce projet est de construire les bases d'une ontologie urbaine, c'est-à-dire de rassembler les termes utilisés dans la discipline ( Aménagement et Urbanisme) dans un réseau sémantique. J’interviens dans ce projet pour guider les étudiants en urbanisme dans la construction de cette ontologie. Ma connaissance dans ce domaine me permet aussi de participer au choix technologique pour l’élaboration d’un logiciel de manipulation d'ontologie développé aux cours de la thèse de Kader Keita.
Période 2007-2009
Partenaires : Mairie de Châtillon-sur-Chalaronne, Conseil Général de l’Ain et Archives départementales de l’Ain.
Appel : Programme Numérisation du Ministère de la Recherche (Appel 2007)
Châtillon-sur-Chalaronne possède un des fonds les plus riches du département de l’Ain. L’objectif du projet est de permettre l’accès sur Internet des archives de Châtillon-sur-Chalaronne en prenant en compte la diversité des publics et usages dans la consultation des archives. Le projet a obtenu le prix rhônalpin du patrimoine 2007 dans la catégorie « projets ».
J’ai été membre du comité scientifique pour conseiller sur l’indexation des documents.
Ce projet a débuté pendant ma thése, soutenue le 10 décembre 2001 sous la Direction de Jean Marie Pinon et Sylvie Calabretto.
Titre : Une méthode d’indexation sémantique adaptée aux corpus multilingues.
Ma thèse a abouti au développement d’un système de recherche d’information multilingue capable de retrouver un document répondant à une requête écrite dans une langue différente. Nous avons développé un prototype, intitulé SyDoM (Système Documentaire Multilingue), permettant de gérer des documents XML contenant des langues différentes. Notre système de recherche d’information multilingue s'appuie sur une gestion des connaissances d'indexation. Nous affirmons qu'une bonne indexation ne peut se faire sans au préalable, et parallèlement, effectuer une gestion des connaissances du domaine. Ce système utilise un nouveau modèle de représentation des connaissances proche des graphes conceptuels de Sowa : les graphes sémantiques. Le modèle des graphes sémantiques distingue les connaissances du domaine, du vocabulaire utilisé pour présenter ces connaissances. L’ensemble de ces connaissances sont stockées dans un thésaurus sémantique, qui allie à une ontologie, plusieurs terminologies. SyDoM utilise des algorithmes d'indexation et de recherche permettant de diminuer les temps de recherche en précalculant au moment de l'indexation des sous requêtes possible.
Développeur de SyDoM:
José Cuba (Stagiaire CNAM),
Thomas NGuyen (Stagiare DUT),
Catherine Roussey (PhD),
Bruno Pivano (Stagiaire CNAM),
Veronique Chretiennot (Stagiare CNAM)
Ce travail a été poursuivi dans la thèse de Farah Harrathi soutenue en Sept 2009. Thèse en informatique en cotutelle avec la Faculté des Sciences de Tunis et l’INSA de Lyon, " Extraction de concepts et de relations entre concepts à partir de documents multilingues : Approche statistique et ontologique. "