Séance du 24 septembre 2018

Séance organisée par Marc Hoffmann et Thanh Mai Pham Ngoc.

Lieu : IHP, Amphi Hermite

14.00 : Christophe Giraud (Université Paris Saclay)

Titre : Partial recovery bounds for clustering with (corrected) relaxed Kmeans

Résumé :We will explain why, in a clustering context, Kmeans must and can be debiased. We will then discuss how a convex relaxation of the corrected Kmeans can be applied in various setting (including mixture of sub-Gaussian distribution, SBM, Ising-Block model, etc) and we will provide some optimal exponential bounds in terms of partial recovery of the clusters. Hence, the relaxed (corrected) Kmeans appears to be a versatile clustering tool, with the nice feature to have a single tuning parameter (the number K of clusters). Based on a joint work with Nicolas Verzelen.

15.00 : Minh-Lien Jeanne Nguyen (Université Paris Saclay)

Titre : Sélection gloutonne de fenêtres multivariées pour l'estimation de densité conditionnelle

Résumé : Dans cet exposé, on s'intéresse à l'estimation de densités conditionnelles en modérément grandes dimensions. La densité conditionnelle, moins restrictive que la fonction de régression, permet d'en dériver de nombreuses autres quantités d'intérêt (quantiles, intervalles de confiance, modes...). A partir d'une famille d'estimateurs à noyau adaptée pour l'estimation de densité conditionnelle, on revisite l'algorithme Rodeo [2, 3] pour sélectionner une fenêtre locale multivariée. La méthode répond à plusieurs enjeux : éviter le fléau de la dimension en combinant une exécution rapide et la détection de variables non pertinentes (en cas de fonction parcimonieuse) et converger à vitesse optimale au sens minimax (à un facteur logarithmique près).

Références :

[1] Nguyen, M.-L.J. (2018, pr.e-publication) Nonparametric method for sparse conditional density esti-

mation in moderately large dimensions. hal-01688664.

[2] La.erty J.D., Wasserman L.A. (2008) Rodeo: Sparse, greedy nonparametric regression. Annals of

Statistics, Vol. 36, No. 1, 28-63.

[3] Liu H., La.erty J.D., Wasserman L.A. (2007) Sparse Nonparametric Density Estimation in High

Dimensions Using the Rodeo. AISTATS, 283-290.

16.00 : Markus Reiß (Humboldt-Universität)

Titre : Nonparametric estimation for SPDEs via localisation

Résumé : We shall first discuss differences for parametric drift estimation between stochastic ordinary and partial differential equations (SODEs/SPDEs). For parabolic SPDEs the usual approach is based on the spectral decomposition of the generator, which is assumed to be known (at least for the main symbol). For nonparametric problems this is no longer feasible. We consider the specific problem of estimating the space-dependent diffusivity of a stochastic heat equation from time-continuous observations with space resolution $h$. The rather counterintuitive result and its efficiency as $h\to 0$ will be discussed in details. Finally, more general SPDE models will be treated. (joint work with Randolf Altmeyer, Berlin)