Séance du 17 mars 2014

Séance organisée par Erwan Le Pennec et Thanh Mai Pham Ngoc.

Lieu : IHP, Amphithéâtre Hermite.

14h00 : André Beinrucker (Université de Potsdam)

Titre : How to Identify Informative Covariates? Stability Selection and Extensions.

Résumé : In many applications, a challenging task is to find the covariates that are related to an outcome, like genes associated to a predisposition to diseases. Variable selection methods identify relevant covariates even if they are hidden between thousands of noise covariates. Unfortunately, variable selection procedures often select different covariates as relevant, if they are applied to different subsamples of the data. This makes the interpretation of the results very difficult in practice. Stability Selection is a procedure introduced by Meinshausen and Bühlmann that can be employed on any variable selection method in order to stabilise it. It consists of applying a variable selection method repeatedly on subsamples of the data and averaging the results. In this talk, we give an introduction to the subject and present two extensions of Stability Selection: First we draw smaller subsets of the observations and investigate the effect of the subsample size on the quality of the selection. Second we improve the final selection by randomising the variable selection method. We motivate this randomisation with a model that relates the problem of selecting the best covariates to extreme value theory. Further, we illustrate our theoretical findings with empirical results.

15h00 : Emmanuel Bacry (CNRS, Ecole Polytechnique)

Titre : Processus de Hawkes et Applications.

Résumé : Les processus de Hawkes sont des processus ponctuels auto-excitants particulièrement bien adaptés à l'utilisation dans un cadre applicatif. Introduits dans les années 70, ils sont utilisés depuis longtemps pour la modélisation de répliques de tremblements de terre. Plus récemment, ils ont été utilisés dans des domaines aussi variés que la modélisation de séries financières hautes fréquences ou la propagation d'information dans les réseaux sociaux. Après les avoir introduits, nous aborderons divers problématiques liées à leur utilisation comme modèles et notamment les problèmes liés à l'estimation paramétriques (en grande dimension) et non paramétriques. Nous présenterons aussi diverses applications.

16h00 : Marie-Anne Poursat (Université Paris-Sud)

Titre : Quel BIC dans les modèles mixtes?.

Résumé : Le critère BIC est très utilisé pour faire de la sélection de variables dans les modèles mixtes. En pratique, il est curieux de constater qu'il est codé di.fféremment selon les logiciels statistiques. Nous avons examiné l'étude asymptotique de la vraisemblance de modèles mixtes très généraux pour proposer un critère BIC adapté à la fois à la structure des données analysées (typiquement des données répétées) et à la structure de covariance des e.ffets aléatoires. Nous illustrons le comportement de ce BIC à travers une étude de simulation et recommandons de l'utiliser comme alternative aux di.fférentes versions existantes. (Collaboration avec Maud Delattre et Marc Lavielle.)