Séance du 31 octobre 2016

14h00 : Matthieu Lerasle (CNRS et Ecole Polytechnique)

Titre : Estimateurs sous-gaussiens de la moyenne

Résumé : On s’intéresse aux possibilités et aux limites du problème d’estimation de la moyenne d’une variable aléatoire par des estimateurs présentant des bornes de déviations sous-gaussiennes. De manière surprenante peut-être, il est possible de construire de tels estimateurs même lorsque les données sont à queues lourdes, jusqu’à des niveaux exponentiellement petits en le nombre d'observations. Ce travail reprend et affine des résultats de Catoni, Nemirovski et Yudin, Jerrum et Sinclair, Alon Matthias et Szegedy entre autres. Il fait l’objet d’une publication à venir (https://arxiv.org/abs/1509.05845) avec L. Devroye, G. Lugosi et R. I. Oliveira.

15h00 : Gwennaëlle Mabon (Humboldt-Universität zu Berlin, Institut für Mathematik)

Titre : Adaptive estimation on the nonnegative real line in the convolution model with unknown error

Résumé : Nous étudions le problème d’estimation adaptative de densité dans le modèle additif défini par Z = X + Y, avec X indépendant de Y. Ces deux variables aléatoires sont supposées positives. Notre but est d’estimer la densité de X à partir de n observations i.i.d. de Z quand la loi de Y est inconnue. L'étude de ce modèle à loi du bruit connue a déjà été menée dans Mabon (2015). Ainsi pour rendre le problème identifiable nous supposons que nous avons accès à un échantillon préliminaire de la loi du bruit Y. Nous construisons alors des estimateurs par projection de la densité de X sur la base de Laguerre, particulièrement adaptée au caractère positif des variables aléatoires en jeu. La dimension de l’espace de projection est obtenue par une procédure de sélection de modèles par pénalisation. Enfin nous montrons que l'estimateur ainsi obtenu vérifie une inégalité de type oracle. Il est à noter que l'étude du risque quadratique intégré repose sur des inégalités de concentration de type Bernstein développées pour les matrices aléatoires (voir Tropp (2015)). Il s'agit d'un travail en collaboration avec F. Comte.

Références : Mabon, G. (2015) Adaptive deconvolution on the nonnegative real line, preprint MAP5 2014-33. Tropp, J. A. (2015). An introduction to matrix concentration inequalities. Found. Trends Mach. Learn., 8(1-2):1–230.

16h00 : Pierre Barbillon (AgroParisTech)

Titre : Estimation paramétrique pour des modèles mixtes complexes à l'aide de méta-modèles"

Résumé : Les processus biologiques sont très souvent mesurés de manière répétée sur un même sujet. Cela donne naturellement lieu à des données longitudinales. Ces données sont généralement analysées grâce à des modèles mixtes qui permettent de discriminer la variabilité inter-sujet de la variabilité intra-sujet. Les fonctions de régression utilisées dans ces modèles intègrent des mécanismes biologiques complexes qui peuvent être des solutions d'équations différentielles ordinaires multi-dimensionnelles ou d'équations aux dérivées partielles. Lorsque ces solutions n'ont pas de forme analytique, on fait appel à des méthodes numériques qui se révèlent très coûteuses en temps de calcul.Les méthodes statistiques couramment utilisées pour estimer les paramètres des modèles mixtes se fondent sur l'utilisation d'une version stochastique de l'algorithme EM (SAEM) que l'on couple avec un algorithme MCMC. Cet algorithme demande un grand nombre d'évaluations des fonctions de régression du modèle ce qui n'est pas praticable si ces fonctions sont coûteuses. C'est pourquoi nous aurons recours à un méta-modèle fondé sur une approximation par processus gaussien des fonctions coûteuses. Nous intégrerons la nouvelle source d'incertitude due à cette approximation dans ce que nous appellerons un méta-modèle mixte. Nous établirons le lien entre la qualité d'approximation du méta-modèle et la proximité entre les estimations obtenues dans le modèle mixte exact et dans le ``méta-modèle'' mixte. Des simulations numériques seront également proposées pour illustrer la pertinence de cette approche.