Séance du 6 avril 2009
Lundi 06 avril 2009
Organisateurs: Stéphane Gaiffas et Catherine Laredo
14h00 Peter Bühlman (ETH Zürich)
Variable selection for high-dimensional data: stable solutions and P- values
Abstract: High-dimensional data exhibit the feature that the number of covariates (or of unknown parameters) is much larger than sample size. There are numerous applications nowadays where such data occurs, e.g in imaging, economics or biology. Despite remarkable progress over the past 5 years in computation and understanding statistical optimality, estimation of high-dimensional structure, such as variable selection in (generalized) regression or graphical modeling, remains difficult. Among the main problems are: (i) the choice of an appropriate amount of regularization; (ii) a potential lack of stability of a solution; and (iii) assigning significance of a selected structure or of a set of selected variables. We will address the three issues (i)-(iii) mentioned above and apply the principles to problems from molecular biology.
15h00 Kevin Bleakley (INSERM)
A short history of local models: with biological applications
Abstract: Supervised learning methods have been proven to be rather useful in various biological prediction problems, including protein-protein interaction networks, metabolic networks, regulatory networks and recently, drug-target interaction networks. Local models are one such class of supervised methods that in particular have shown excellent experimental results on real biological networks.I will present local models and their previous results on some biological networks, as well as competing methods. I will then show how local models can be modified to predict drug-target interactions, where network nodes are no longer homogeneous. It turns out that we can obtain several independent predictions of each particular drug-target interaction and that efficiently aggregating these predictions can further improve classification results in an application to four human drug-target interaction networks.
16h00 Olivier Lopez (LSTA UPMC)
Modèle de régression single-index en présence de censure dépendant des variables explicatives
Résumé: Nous considérons un vecteur aléatoire $(X',Y)'$, où $X$ est de dimension $d$ et $Y$ unidimensionnel. Nous supposons que $Y$ est censurée aléatoirement à droite. Contrairement au cadre classique, nous considérons le cas où la variable de censure n'est pas indépendante des variables explicatives. Nous proposons un nouvel estimateur de la fonction de répartition jointe de $(X',Y)'$ basé sur l'estimateur Kaplan-Meier conditionnel de Beran (1981). Cet estimateur non paramétrique utilise une nouvelle technique de réduction de dimension qui le rend performant même dans un contexte où $X$ est de grande dimension. Grâce à ce nouvel estimateur, nous définissons une procédure de $M-$estimation pour estimer le paramètre d'un modèle de régression single-index dans ce cadre censuré. Les propriétés asymptotiques de l'estimateur du paramètre, ainsi que de l'estimateur de la fonction de régression, sont présentées et mises en perspective avec les résultats connus en l'absence de censure, et dans le cas d'une censure indépendante de $X$.