Activités de recherche
Manuscrit de thèse
Soutenance de thèse
Sujet de Thèse
Titre : Sélection de variables pour la classification non supervisée en grande dimension.
> Résumé (en français) / Summary (in English)
J'ai effectué ma thèse sous la direction de Pascal Massart, au sein de l'Equipe Probabilités et Statistiques du laboratoire de Mathématiques d'Orsay (Université Paris-Sud XI) et de l'Equipe INRIA SELECT (Saclay).
J'ai soutenu ma thèse le 9 novembre 2012 à la Faculté des Sciences d'Orsay devant le jury constitué de Francis Bach (rapporteur), Gérard Biau (examinateur), Christophe Biernacki (rapporteur), Gilles Celeux (président du jury), Pascal Massart (directeur de thèse) et Marie-Anne Poursat (examinatrice).
Mes travaux de recherche portent sur :
la régularisation l1
les problèmes de grande dimension
les modèles de mélange gaussiens
la sélection de modèles par critère non asymptotique
la calibration de pénalité
Ils trouvent des applications en classification non supervisée en grande dimension, par exemple en classification de courbes avec reconstruction parcimonieuse de profil type.
Publications
C. Meynet et C. Maugis-Rabusseau (2012), A sparse variable selection procedure in model-based clustering. [INRIA - hal00734316, PDF]
P. Massart et C. Meynet (2012), Somes rates of convergence for the selected Lasso estimator. [Lectures Notes in Computer Science, Springer, Vol. 7568/2012, 17-33, PDF]
C. Meynet (2012), An l1-oracle inequality for the Lasso in finite mixture Gaussian regression models. [ESAIM Probabilty and Statistics, 10.1051/ps/2012016, PDF]
P. Massart et C. Meynet (2011), The Lasso as an l1-Ball Model Selection Procedure. [Electronic Journal of Statistics, Vol. 5, 669-687, PDF]
P. Massart et C. Meynet (2010), An l1-Oracle Inequality for the Lasso. [INRIA, RR-7356, PDF]
Communications orales
Soutenance de thèse, Faculté des Sciences d'Orsay (11/2012) : "Sélection de variables pour la classification non supervisée en grande dimension." [transparents]
Exposé au Working Group on Model-Based Clustering Summer Session, Guelph, Canada (07/2012) : "Variable selection via l1-penalization in model-based clustering." [transparents]
Exposé au groupe de travail sur la classification et les analyses en neuroimagerie CEA Saclay Neurospin (04/2012) : "Liens de la régularisation l1 avec la sélection de modèles parmi des boules l1." [transparents]
Exposé aux tutoriels et Exposés de Statistiques à Télécom, Télécom ParisTech (03/2012) : "How can we obtain l1-oracle inequalities for the Lasso via model selection?" [transparents], [notes de démonstration]
Exposé au séminaire des doctorants de mathématiques de l'Université Paris-Sud, Faculté des Sciences d'Orsay (10/2011) : "Sélection de modèles par pénalisation : de la régression linéaire à la classification non supervisée." [notes d'exposé]
Exposé au séminaire d'apprentissage statistique SMILE in Paris, ENS d'Ulm (01/2011) : "Une nouvelle approche en sparsité." [transparents]
Exposé à la journée des doctorants, Faculté des Sciences d'Orsay (01/2011) : "Sélection de variables pour la classification non supervisée en grande dimension." [transparents]
Exposé au colloque de Statistique Mathématique et Applications, Fréjus (09/2010) : "An l1-Oracle Inequality for the Lasso." [transparents]
Présentation de ma thèse en classe préparatoire HECS au Lycée Carnot de Dijon (04/2010)
Exposé au groupe de travail de l'équipe SELECT, Faculté des Sciences d'Orsay (04/2010) : "Le Lasso : sélection de variables et régularisation l1."
Compte-rendu de mes lectures sur le Lasso, Faculté des Sciences d'Orsay (12/2009)
Séminaires et groupes de travail
J'ai participé à différents séminaires et groupes de travail autour des statistiques :
Groupe de travail sur la classification et les analyses en neuroimagerie SELECT (INRIA Saclay/Paris XI) - PARIETAL (INRIA Saclay) - LNAO (CEA/Neurospin) (2012)
Tutoriels et Exposés de Statistiques à Télécom, Télécom ParisTech (2012)
Working Group on Model-Based Clustering Summer Session, Glasgow en Ecosse (07/2011), Guelph au Canada (07/2012)
Journée Apprentissage et Parcimonie du GdR ISIS (Information, Signal, Images et ViSion), Telecom ParisTech (11/2010)
Colloque de Statistique Mathématique et Applications, Fréjus (09/2010)
Séminaires de statistiques, Faculté des Sciences d'Orsay (2009-2011)
Séances du groupe de travail autour de la classification, Faculté des Sciences d'Orsay / Ecole Polytechnique (2009-2011)
Réunions de l'équipe SELECT, Faculté des Sciences d'Orsay (2009-2011)
Séminaires d'apprentissage statistique SMILE (Statistical Machine Learning) in Paris, ENS d'Ulm (2009-2011)
Groupe de travail SONATA (Stress Orphean Network and Transcriptome in Arabidopsis) de l'INRA (2011)
Formation doctorale
J'ai suivi différents cours de statistiques durant ma thèse :
Cours CREST GENES : "Uniform Probability Inequalities with Applications in High-dimensional Statistical Models", Sara van de Geer, ENSAE - Paris (02-03/2011)
Cours Peccot 2011 : "Sélection de modèles et sélection d'estimateurs pour l'apprentissage statistique", Sylvain Arlot, Collège de France - Paris (01/2011)
Cours de Master 2 Probabilités-Statistiques : "Classification et statistiques en grandes dimensions", Vincent Rivoirard, Faculté des Sciences d'Orsay (2010)