Séance du 21 novembre 2011

Lundi 21 novembre 2011

Organisateurs: Adeline Samson et Marie-Luce Taupin

14h00 Yves Rozenholc (Paris Descartes)

Laplace deconvolution in regression for angiogenesis follow-up in cancer.

En collaboration avec F. Abramovich et M. Pensky.

Résumé: Dans le cadre du suivi de l'angiogénèse des modèles paramétriques sanguins ont été introduits et étudiés statistiquement. Ces modèles qui sont tissus dépendants présentent toutefois des limitations dans le cadre du cancer où le développement de la tumeur change la nature du tissus considéré. Pour remédier à ce problème, nous introduisons une modélisation non-paramétrique des échanges sanguins qui fait intervenir la fonction de répartition des temps de transit à l'intérieur du tissus.

Après avoir rappelé le contexte médical qui nous a motivé et décrit les observations, j'introduirai la modélisation non-paramétrique des échanges sanguins qui s'appuie sur un modèle de déconvolution en régression de type Laplace avec observations discrètes. La suite de l'exposé présentera la construction d'un estimateur qui fait appel à la théorie des équations de Volterra disponible dans le contexte de la déconvolution de type Laplace. Cet estimateur est montré adaptatif à vitesse optimale. Cette étude théorique est complétée d'une étude sur simulation.

15h00 Sandra Plancade (Institute of Community Medicine, University of Tromso, Norvège)

Modèle à variable latente pour la genèse du cancer.

Résumé: Cet expose présente un modèle à variable latente permettant l'étude des changements d'expression génique (ARN) antérieurs au diagnostique du cancer. Pour un échantillon de patients i = 1, ..., n, nous disposons d'une mesure de l'expression de l'ensemble du génome G_i à un temps aléatoire Ti avant le diagnostique, ainsi que de données d'exposition Ei (utilisation de th erapie hormonale, etc). Le but est d'étudier l'évolution de l'expression génique en fonction du temps en se basant sur la modélisation biologique suivante :

- L'expression G^g_i de chaque gène dépend de l'exposition Ei

- Pour un ensemble de gènes G (inconnu), un changement d'expression apparait à un temps aléatoire LS_i avant le diagnostique (inconnu également). Nous introduisons un modèle linéaire pour l'expression G^g de chaque gène incluant l'exposition E et la variable latente LS, ainsi qu'un modèle paramétrique pour LS. Les paramètres sont estimés par un algorithme SEM, permettant simultanément l'estimation de la distribution de LS et la détection des gènes impliqués dans la carcinogenèse (ensemble G). Les performances de cette procédure sont présentées sur des données simulées, et comparées à des méthodes classiquement utilisées dans les études d'associations entre cancer et expression génique, en particulier le modèle de Cox.

16h00 Julien Chiquet (Evry Val d'Essone)

Sparsity with sign-coherent groups of variables.

Résumé: The cooperative-Lasso is a Lasso-type regularization method motivated by the inference of gene regulatory networks from multiple experiments (Chiquet, Grandvalet, Ambroise, 2011). Based upon the assumption that groups of covariates are sign-coherent, namely that coefficients within a group are either all null, non-negative or non-positive, the cooperative-Lasso acquires robustness to possible miss-specifications in the group structure compared to the group-Lasso, without paying the price for an additional penalty term as for the sparse group-Lasso. This regularization methods comes with the appropriate tools, namely, an active-set algorithm, consistency results, approximated selection criteria and a hopefully user friendly R package. We illustrate its use on two examples, one on the inference of gene regulatory networks, the other on ordinal covariate coding.