Stage Master 2 @Irstea – Chèque Recherche Innovation Programme Hub Innovergne Action 3.2 partager l’innovation de I-Site CAP 20-25 « Implémentation et chargement d’un entrepôt de données pour l’analyse des données (spatiales) d’agri-biodiversité »

Stage Master 2 @Irstea – Chèque Recherche Innovation Programme Hub Innovergne Action 3.2 partager l’innovation de I-Site CAP 20-25

« Implémentation et chargement d’un entrepôt de données pour l’analyse des données (spatiales) d’agri-biodiversité »

Contexte

Dans le cadre du dispositif Chèque Recherche Innovation de I-Site CAP 20-25, un stage Master 2 pour travailler en stricte collaboration avec l’association Symbiose Allier est financé.

L’importance de la protection de la biodiversité et sa relation aux pratiques agricoles est bien connue. Pour construire les indices de biodiversité, des données d'observation sont nécessaires à grande échelle spatiale et temporelle. Un grand nombre d'observateurs doit être mobilisé, à un coût qui serait prohibitif à moins qu'ils ne soient volontaires dans des programmes de science citoyenne. Dans ce cadre intervient l’Observatoire Agricole de la Biodiversité (OAB) qui se propose de faire remonter des données de biodiversité dans le milieu agricole (en particulier pour les systèmes en arboriculture, cultures pérennes, grandes cultures, maraichage, prairie et viticulture et sur 4 types de taxon). L’OAB est pilotés par le Ministère en charge de l'Agriculture. Quatre protocoles sont actuellement proposés concernant des taxons choisis et mis en place depuis 2011. L’OAB est structuré en relais départementaux, qui mettent en oeuvre la récolte de données. Aujourd’hui, l’association Symbiose représente le relais OAB pour l’Allier. Symbiose s’occupe de structurer la récolte de données OAB dans le département.

Dans ce contexte, le projet ANR en cours VGI4Bio (vgi4bio.fr), démarré en 2018, vise à proposer une méthodologie pour permettre aux volontaires de concevoir les indicateurs de biodiversité agricole dans une démarche participative et les implémenter dans les systèmes d’entrepôts de données spatiales (EDS) et OLAP spatial (SOLAP). Les systèmes SOLAP permettent l’analyse de grandes quantités de données via des interfaces web avec des tableaux de bords composés de tableaux croisés dynamiques et cartes interactives. Le succès d’un projet SOLAP repose essentiellement sur deux facteurs : (i) une conception d’un modèles de données EDS et (ii) une représentation cartographique conforment aux attentes et aux besoins de décideurs.

Objectifs

Les objectifs principaux du stage sont : (1) la finalisation du modèle d’entrepôts de données spatiales et du processus d’ETL ; (2) le déploiement de l’outil SOLAP sur un serveur web pour mettre à disposition des décideurs l’entrepôt de données.

Pour attendre l’objectif une analyse des besoins d’analyse chez Symbiose doit être finalisée. Ces besoins d’analyse concernent les données à analyser mais aussi les méthodes de geovisualization à utiliser. En plus, la complexité de données de l’OAB nécessite de mettre en place des structures d’entrepôts de données spatiales qui nécessitent des réflexions importantes pour pouvoir les implémenter dans l’architecture SOLAP du projet vgi4bio.

Le projet de stage nécessite donc de :

1. Travailler sur les entrepôts de données

2. Travailler avec des vrais décideurs et problèmes d’analyse

3. Travailler en équipe

4. Travailler dans une vraie architecture OLAP

Planning

1. Etude de l’entrepôt de données existant

2. Etude de besoins d’analyse de Symbiose

3. Extension du modèle d’entrepôt de données existant

4. Extension de l’ETL existant

5. Configuration du serveur web pour la mise en ligne de l’application OLAP

6. Définition des politiques d’accès à l’application en ligne

Compétences

1. Entrepôts de données et OLAP (Mondrian est un plus)

2. ETL (Talend est un plus)

3. SGBD (Postgres est un plus)

Des connaissances en SIG et données spatiales est un plus important

Détails administratifs

Lieu : Irstea, Clermont Ferrand

Dates : du 1 Avril au 31 septembre 2019

Rétribution : 500-600 euros par mois

Encadrant : Sandro Bimonte, Irstea Clermont Ferrand

Envoyer le CV et lettre de motivation à sandro.bimonte@irstea.fr

NOTA BENE : tous les étudiants (M2, doctorant, postdoc, etc.) ayant travaillé dans l’équipe de l’encadrant sur les thématiques OLAP ont trouvé un emploi après le stage (https://sites.google.com/site/sandrobimonte/students/students-follow-up)