Lundi 15 février 2010
Organisateurs: Estelle Kuhn et Catherine Matias
14h00 Antoine Chambaz (MAP 5 Université Paris Descartes)
Analyse statistique d'études cliniques randomisées à designs adaptatifs
en collaboration avec Mark van der Laan (UC Berkeley)
Résumé: Dans une étude clinique randomisée visant à comparer les effets d'un traitement à ceux d'un placébo, chaque patient se voit attribuer au hasard l'un ou l'autre des protocoles médicaux.L'utilisation d'une randomisation équilibrée (probabilité 1/2 accordée aux deux protocoles) est une démarche sous-optimale en termes d'efficacité statistique. Puisqu'il existe une randomisation optimale, pourquoi ne pas l'estimer sur la base des n premières observations, pour ensuite l'utiliser pour la collecte de la (n+1)-ème observation, etc. ? Nous décrirons les estimateurs du maximum de vraisemblance de la randomisation optimale et de l'effet du traitement relatif au placébo qui en découlent, ainsi que leurs propriétés statistiques.Nous verrons ensuite comment mettre au point une procédure de test séquentiel à partir de ceux-ci.
15h00 Pierre Nicolas (INRA MIG Jouy-en-Josas)
Statistical models for the analysis of genome-wide expression data.
Abstract: Genome expression in the model bacterium Bacillus subtilis is being assessed with an unprecedented resolution by the Basysbio consortium. Here we will present two distinct statistical models motivated by the analysis of this data obtained by hybridization on tiling arrays.The purpose of the first model is to improve the processing of the hybridization signal. It consists of a hidden-Markov model aimed at recovering a continuous-valued discrete-time underlying signal whose trajectory evolves via abrupt shifts and small drifts. Parameters are estimated in a Maximum-Likelihood framework using an EM algorithm.The second model intends to relate the expression data to the presence of sequence motifs in the genome. A transdimensional MCMC algorithm is used. Compared to other motif searching algorithms, the main originality of the proposed approach is to involve a "mixture" model where the distribution of the hidden variable depends on a tree structure.
16h00 Gilles Stoltz (CNRS ENS et HEC Paris)
Bandits à plusieurs bras dans les cadres stochastique et de suites individuelles : une vue d'ensemble et quelques résultats nouveaux prouvés par différents chercheurs franciliens et lillois
Résumé: On parle de bandits à plusieurs bras lorsqu'un statisticien doit choisir, à chacun des tours d'un jeu répété, une action parmi K possibles; à chacune d'elles est associé un paiement, mais des K paiements disponibles, seul celui correspondant au bras choisi est observé. L'objectif est de maximiser la somme de ces paiements. Les bandits forment un cadre simple dans lequel il s'agit de faire un compromis entre exploration (jouer un peu tous les bras pour voir ce qu'ils ont dans le ventre) et exploitation (une fois qu'on pense avoir compris ceux qui permettent de rapporter gros, se concentrer sur eux). Dans le souci de plaire à tou(te)s, j'effectuerai un survol pédagogique d'une partie des résultats obtenus ces dix dernières années dans le domaine, en le coupant par trois fois de résultats plus récents, prouvés par Jean-Yves Audibert, Sébastien Bubeck, Rémi Munos et moi-même.