Séance du 24 octobre 2011

Lundi 24 octobre 2011

Organisateurs: Karine Tribouley

14h00 Sylvain Delattre (Paris Diderot)

Limite d'échelle pour certains processus de Hawkes multivariés et applications.

(Travail joint avec E. Bacry, M. Hoffmann and J.F Muzy)

Résumé: Les processus de Hawkes sont des processus ponctuels auto-excités de manière linéaire. On décrit le comportement diffusif en temps grand des processus de comptage associés et aussi la convergence des covariances empiriques des accroissements en fonction du pas de temps considéré (le "signature plot"). La motivation première pour obtenir ces résultats est un modèle de prix en haute fréquence qui fait un intervenir un processus de Hawkes de dimension 2 et qui reproduit bien l'effet du "bruit de microstructure". Des résultats similaires peuvent être obtenus pour des processus ponctuels plus généraux que les processus de Hawkes, par exemple ceux du modèle ETAS (Epidemic-Type Aftershock Sequence model) introduits par Ogata pour modéliser les tremblements de terre.

15h00 Eric Kolaczyk (Boston University)

A Compressed PCA Subspace Method for Anomaly Detection in High-Dimensional Data

(Travail joint avec Qi Ding)

Résumé: Random projection is widely used as a method of dimension reduction. In recent years, its combination with standard techniques of regression and classification has been explored. Here we examine its use with principal component analysis (PCA) and subspace detection methods. Specifically, we show that, under appropriate conditions, with high probability the magnitude of the residuals of a PCA analysis of randomly projected data behaves comparably to that of the residuals of a similar PCA analysis of the original data. Our results indicate the feasibility of applying subspace-based anomaly detection algorithms to randomly projected data, when the data are high-dimensional but have a covariance of an appropriately compressed nature. We illustrate in the context of computer network traffic anomaly detection.

16h00 Cécile Hardouin (Paris Ouest Nanterre)

Modélisation spatio-temporelle pour des données de nature mixte.

Résumé: Nous considérons l'étude de données spatiales de nature mixte qui sont composées de valeurs discrètes et continues, typiquement des données avec un grand nombre de zéros. Ce type de données se rencontre dans de nombreux domaines, par exemple en pluviométrie, en épidémiologie, ou en analyse d'images. Nous proposons une modélisation non hiérarchique et souple. L'idée générale est de considérer une chaîne de Markov temporelle de champs de Markov de type auto-modèles généralisés qui permettent de prendre en compte la nature mixte des variables. Nous présentons la construction et les propriétés du modèle, puis une application à des textures de mouvement.