Séance du 21 juin 2021

Séance organisée par Liliane Bel et Claire Lacour.

Lieu : IHP, amphi Hermite


14.00 : Madalina Olteanu (Université Paris Dauphine)

Titre : Clustering de données mixtes et sélection de variables

Résumé : Dans cet exposé, nous nous intéresserons à la question du clustering des données mixtes, et plus particulièrement en grande dimension, lorsque la sélection des variables est nécessaire. Nous présenterons une approche basée sur un algorithme k-means régularisé, ainsi qu'une illustration du package R associé. Dans un second temps, nous nous intéresserons à l'impact de la corrélation sur différents critères d'importance de variables, et donnerons quelques heuristiques, dans un cadre supervisé et non-supervisé.


15.00 : Anouar Meynaoui (Université de Rouen)

Titre : Minimax estimation in the functional regression model with a functional output

Résumé : We address the non-parametric estimation of a linear regression model, with functional input and output. We first introduce projection estimators, constructed by minimizing the contrast function. Then, we achieve a non-asymptotic sharp upper-bound of the prediction risk as a classical bias-variance trade-off. We then show that for a particular theoretical choice of the projection dimensions, the associated estimators are non-asymptotically minimax over ellipsoidal regularity spaces.


16.00 : Christophe Denis (Université Paris-Est Marne-la-Vallée)

Titre : A novel regularized approach for functional data clustering : An application to milking kinetics in dairy goats

Résumé : Motivated by an application to the clustering of milking kinetics of dairygoats, we propose in this talk a novel approach for functional data clustering. This issue is of growing interest in precision livestock farming that has been largely based on the development of data acquisition automation and on the development of interpretative tools to capitalize on high-throughput raw data and to generate benchmarks for phenotypic traits. The method that we propose falls in this context. Our methodology relies on a piecewise linear estimation of curves based on a novel regularized change-point estimation method. Our technique is applied to milk emission kinetics data with the aim of a better characterization of inter-animal variability and toward a better understanding of the lactation process. Joint work with E. Lebarbier, C. Lévy-Leduc, O. Martin and L. Sansonnet.