Séance du 16 novembre 2015

Séance organisée par Fabienne Comte et Eva Löcherbach.

Lieu : IHP, Amphithéâtre Perrin.

14h : Adélaïde Olivier (CEREMADE, Université Paris-Dauphine)

Titre : Estimation du taux de division dans des modèles de croissance-fragmentation

Résumé : Cette présentation est centrée sur les modèles de croissance-fragmentation, pouvant servir à modéliser la croissance d’une population de cellules. D’un point de vue stochastique, nous nous intéressons à un système de particules évoluant à travers deux phénomènes. D’une part, les particules évoluent de façon déterministe (elles vieillissent, elles croissent). D’autre part, les particules se divisent au bout d'un temps aléatoire : une particule d'âge a ou de taille x se divise en deux nouvelles particules (d'âge 0, de taille initiale x/2) selon un taux de division B(.) dépendant de l'âge a ou de la taille x de la particule. Un objectif majeur est alors de reconstruire de façon non-paramétrique le taux de division. Dans une première partie, je présenterai l'estimation du taux de division dépendent de l’âge, à partir de l’observation du système en temps continu entre les instants 0 et T. Des difficultés sont intrinsèquement liées au cadre du temps continu, dont un phénomène de biais de sélection. Dans une seconde partie, une étude générale sur les chaînes de Markov bifurquantes, autrement dit adaptées à la structure d'arbre binaire, est menée. Cette étude nous permet de reconstruire de façon adaptative un taux de division dépendant de la taille à partir de l’observation des tailles à la naissance de toutes des cellules jusqu’à une génération fixée dans l’arbre généalogique de la population.

15h : Etienne Birmelé (MAP5, Université Paris-Descartes)

Titre: Analyse de la dérégulation dans les cellules cancéreuses à l'aide d'expression de gènes.

Résumé : Certains types de cancer de la vessie se caractérisent par un comportement cellulaire très proche de celui de cellules saines en train de proliférer ou de se différencier, indiquant que la tumeur semble utiliser des processus préexistants mais mal régulés. Trouver ces régulations défectueuses est d'intérêt à la fois pour comprendre la carcinogénèse et orienter la recherche de cibles thérapeutiques.

Les données générées par l'équipe de François Radvanyi à l'institut Curie se présentent sous la forme de données d'expression de gènes dans des tissus normaux et tumoraux. Leur utilisation afin de répondre au problème des dérégulations pose plusieurs problèmes statistiques: comment inférer les régulations actives en situation normale? quel modèle proposer pour la dérégulation et comment évaluer la probabilité à posteriori qu'un gène soit dérégulé? comment énumérer les jeux de régulateurs dont la faillite explique au mieux les dérégulations observées?

Certaines réponses et des problèmes ouverts concernant ces questions seront abordés durant cet exposé.

16h : Sylvain Delattre (LPMA, Université Paris-Diderot)

Titre : Statistical inference versus mean field limit for Hawkes processes

Résumé : We consider a population of $N$ individuals, of which we observe the number of actions

as time evolves. For each couple of individuals $(i,j)$, $j$ may or not influence $i$, which we model by i.i.d. Bernoulli$(p)$-random variables, for some unknown parameter $p\in (0,1]$.

Each individual acts autonomously at some unknown rate $\mu>0$ and acts by mimetism at some rate depending on the number of recent actions of the individuals which influence him, the age of these actions being taken into account through an unknown function $\varphi$ (roughly, decreasing and with fast decay). Our goal is to estimate $p$, which is the main charateristic of the graph of interactions, in the asymptotic $N\to\infty$, $t\to\infty$. The main issue is that the mean field limit (as $N \to \infty$) of this model is unidentifiable, in that it only depends on the parameters $\mu$ and $p\varphi$. Fortunately, this mean field limit is not valid for large times. We distinguish the subcritical case, where, roughly, the mean number $m_t$ of actions per individual increases linearly and the supercritical case, where $m_t$ increases exponentially. Although the nuisance parameter $\varphi$ is non-parametric, we are able, in both cases, to estimate $p$ without estimating $\varphi$ in a nonparametric way, with a precision of order $N^{-1/2}+N^{1/2}m_t^{-1}$, up to some arbitrarily small loss. We explain, using a Gaussian toy model, the reason why this rate of convergence might be (almost) optimal. (Collaboration avec Nicolas Fournier)