Lundi 12 janvier 2009
Organisateurs: Estelle Kuhn et Catherine Matias
14h00 Alain Célisse (Agro Paris Tech)
Segmentation in the mean of heteroscedastic data via cross-validation.
Abstract: We tackle the problem of detecting change-points in the mean of a signal with additive noise. There is neither any distribution assumption about the signal, nor any prior knowledge on the noise level, which can be different from one point to another. The number of changes and their positions are unknown, and we want to estimate them so that the resulting estimator minimizes its quadratic risk. To this aim, we consider model selection criteria such as cross-validation that we compare to penalized criteria through simulation experiments.In several situations given the number of change-points, it appears that the breakpoint positions should not be chosen through the usual empirical risk minimization. We obtain quite better estimators by taking into account the variations of the noise level at this step of the model selection procedure, which is reached via cross-validation. Furthermore in order to reduce the computational burden, closed-form expressions are derived for the cross-validation-based estimators of the risk. The resulting procedure is nearly as fast as the empirical risk minimization to compute. Besides, we show that some classical penalized least-squares criteria, which were proved to be valid in the homoscedastic case by Birgé and Massart, can fail dramatically when the noise level is indeed depending on the position. On the contrary, cross-validation appears to be quite robust to heteroscedasticity, while having similar performances in the homoscedastic case.
15h00 Sébastien Gadat (LSP, Université Paul Sabatier)
Problème inverse et estimation adaptative pour des courbes shiftées aléatoirement.
Résumé: Nous étudions le problème de l'estimation d'un signal qui subit une perturbation à la fois par un bruit blanc additif et une translation aléatoire de loi connue. L'approche d'estimation adaptative utilise des outils classiques de problème inverse au travers d'estimation de coefficients d'ondelettes. Nous montrons par ailleurs que ce problème d'estimation fait intervenir un problème inverse relié à la régularité de la loi des translations aléatoires. Nous concluons par quelques simulations et comparaisons avec d'autres algorithmes récents d'estimation et de recalage.
16h00 Céline Lévy-Leduc (CNRS, Telecom Paris Tech)
Détection d'anomalies dans les réseaux à l'aide de tests de rang.
Résumé: Nous proposons une méthode pour faire de la détection en temps réel d'anomalies dans les réseaux conduisant à des changements dans les données de trafic internet. Notre méthode est composée d'une étape de filtrage par records suivie d'un test de présence de rupture non-paramétrique. A l'aide de cette méthode, nous pouvons traiter d'importants volumes de données et identifier en temps réel les adresses IP attaquées. Nous montrerons les résultats obtenus sur des données réelles de trafic internet fournies par France-Télécom R&D ainsi que sur des données simulées et nous la comparerons à des méthodes utilisées dans le domaine des réseaux.