Séance du 19 mars 2018
Séance organisée par Estelle Kuhn et Mathilde Mougeot.
Lieu : IHP, Amphi Hermite
14.00 : Michaël Zamo (Météo France, Toulouse)
Titre : Post-traitement des prévisions déterministes et d'ensemble de vent sur une grille
Résumé : Comme de nombreux services météorologiques nationaux, Météo-France utilise des modèles numériques pour prévoir le comportement futur de l’atmosphère. Ces prévisions ne sont pas exemptes de défauts, dont certains sont systématiques. En tant que tels, ils peuvent être étudiés et corrigés par des méthodes de post-traitement statistique. Un modèle numérique prévoit en général une valeur, on parle alors de prévision déterministe. L’atmosphère étant un système chaotique, son état futur peut être considéré comme une variable aléatoire. Afin de quantifier l’incertitude des prévisions météorologiques, plusieurs prévisions sont effectuées avec des conditions initiales et/ou des approximations physiques différentes. Ces prévisions d’ensemble possèdent également des défauts systématiques qui peuvent être corrigés par des méthodes statistiques.
Ces méthodes de post-traitement statistiques des prévisions météorologiques (adaptations statistiques ou AS) nécessitent une archive d’observations. Les AS sont donc traditionnellement appliquées aux prévisions pour les emplacements des stations météorologiques (typiquement environ un millier de points sur la France). Cependant, de nombreux utilisateurs bénéficieraient d’AS disponibles avec une couverture spatiale plus fine, comme une grille d’un modèle de prévision numérique. Cela nécessite un changement d’échelle du post-traitement (pour la France, une grille typique de 10 km compte plusieurs dizaines de milliers de points de grille). L’approche choisie à Météo-France pour construire de telles AS en points de grille pour le vent (moyen et rafales) consiste dans un premier temps à construire une nouvelle analyse puis d’appliquer des méthodes d’AS en considérant cette analyse comme l’observation à prévoir. Les résultats de cette approche seront présentés, ainsi que les solutions trouvées pour traiter rapidement la quantité de données en points de grille.
En ce qui concerne le post-traitement des prévisions d’ensemble de vent, des méthodes ont été testées pour post-traiter différents ensembles (canadien, européen, américain et français). Les résultats montrent d’une part que ces méthodes améliorent significativement la qualité des prévisions et d’autre part qu’une combinaison statistique de ces ensembles bruts et post-traités permet d’améliorer encore les performances de la prévision finale. La combinaison de différentes méthodes avec des temps d’apprentissage et pour des ensembles différents vise également à pallier automatiquement les changements des modèles post-traités.
15.00 : Kevin Scaman (Huawei, Noah's Ark, Paris)
Titre : Optimal convergence rates for distributed optimization
Résumé : The training of machine learning methods on large-scale datasets often requires the use of distributed computing platforms, both to parallelize computation and allow the storage of the whole dataset across multiple machines. In such a context, a slow communication between machines may downgrade the performance of inference or optimization algorithms. In this presentation, I will show how the ideas of optimization theory can be extended to understand the fundamental limitations of distributed algorithms when machines are bound to communicate across a network of limited bandwidth, and how to derive optimal distributed optimization algorithms. More specifically, I will provide optimal convergence rates for the distributed optimization of strongly convex and smooth functions in two settings (centralized and decentralized architectures), along with algorithms meeting these optimal rates.
16.00 : Thanh Mai Pham Ngoc (LMO, Université Paris-Sud)
Titre : Estimation non paramétrique adaptative pour des graphes géométriques.
Résumé : We study the recovery of graphons when they are convolution kernels on compact (symmetric) metric spaces. This case is of particular interest since it covers the situation where the probability of an edge depends only on some unknown nonparametric function of the distance between latent points, referred to as Nonparametric Geometric Graphs (NGG). In this setting, almost minimax adaptive estimation of NGG is possible using a spectral procedure combined with a Goldenshluger-Lepski adaptation method. The latent spaces covered by our framework encompasses (among others) compact symmetric spaces of rank one, namely real spheres and projective spaces. For these latter, explicit computations of the eigenbasis and of the model complexity can be achieved, leading to quantitative non-asymptotic results. The time complexity of our method scales cubicly in the size of the graph and exponentially in the regularity of the graphon. Hence, our procedure is algorithmically and theoretically efficient to estimate smooth NGG. As a by product, we show a non-asymptotic concentration result on the spectrum of integral operators defined by symmetric kernels (not necessarily positive). This is a joint work with Yohann de Castro and Claire Lacour.