Statistiques spatio-temporelles pour l'environnement
Résumé :
Les données en sciences de l'environnement, telles que les données climatiques, d'usage des sols, ou de qualité de l'air, présentent très fréquemment des dépendances temporelles ou spatiales en lien avec leur processus d'observation.
Ces dépendances sont indispensables à prendre en compte dans une modélisation statistique car elles peuvent avoir un impact sur les prédictions et les conclusions. Il est possible de s'appuyer sur ces dépendances afin de réaliser des prévisions dans le futur ou à des points de l'espace non échantillonnés.
De plus, la notion de risque environnemental est très prégnante dans ce domaine. Les statistiques extrêmes permettent d'estimer les niveaux de retour de certains phénomènes extrêmes (crues centennales, dépassement de températures extrêmes).
Nous verrons dans ce cours comment modéliser les dépendances temporelles et spatiales et les utiliser en prévision. Nous présenterons aussi les méthodes des extrêmes en statistique. Les cours seront accompagnées de séances de TP sous R où seront mises en œuvre les techniques vues en cours sur des jeux de données en sciences environnementales.
Thèmes abordés :
• Statistiques temporelles : méthodes de décomposition des séries temporelles, processus auto-régressifs et à moyennes mobiles, fonction d'autocorrélation, prévisions.
• Statistiques spatiales et spatio-temporelles : géostatistique, fonctions aléatoires, processus Gaussiens, analyse structurale, estimation de paramètres par méthode des moments et maximum de vraisemblance, krigeage, simulations conditionnelles.
• Extrêmes : loi d'extremum généralisée, loi de Pareto généralisée, estimation de niveaux de retour, mesures de dépendance des extrêmes, processus R-Pareto.
Planning des séances :
Séance 1 : statistiques temporelles
Séance 2 : TP statistiques temporelles
Séance 3 : statistiques spatiales (et spatio-temporelles)
Séance 4 : TP statistiques spatiales
Séance 5 : statistiques des valeurs extrêmes
Séance 6 : TP statistiques des valeurs extrêmes
Séance 7 : Évaluation sous la forme d'une présentation orale d'un projet sur un jeu de données
Volume horaire :
7 séances de 3h = 21 heures
Evaluation :
Projet avec présentation orale
Pré-requis :
• Bases de programmation sur R
• Statistique inférentielle
• Probabilités continues
Lieu :
AgroParisTech