Lieu : IHP, salle 314 (Grisvard)
14.00 : Arthur Stéphanovitch (CREST, ENSAE)
Titre : Regularity of the score and convergence rates of generative diffusion models
Résumé : We show that diffusion-based generative models adapt to the smoothness of the target distribution: the learned score function inherits the target’s regularity. Leveraging this adaptivity, we obtain a concise proof that diffusion models achieve minimax-optimal rates for density estimation.
15.00 : Roland Sogan (LPSM, Sorbonne Université)
Titre : Low-Complexity Graphon Estimation from Multiple Networks
Résumé : Recovering a random graph model from an observed collection of networks is a challenging task, particularly when the networks do not share a common node set and may have different sizes. In this setting, the goal is to estimate the graphon function underlying a nonparametric exchangeable random graph model. Existing approaches typically face a trade-off between statistical accuracy and computational complexity.
We propose a new histogram-based estimator with low algorithmic complexity that achieves high accuracy by jointly aligning nodes across all networks, in contrast to conventional methods that order nodes independently for each graph. We establish consistency results for the proposed estimator. Numerical experiments show that our method improves estimation accuracy compared to existing approaches, especially when the dataset consists of small networks with varying sizes, while also significantly reducing computation time. Finally, we illustrate the practical benefits of the estimator on several real-world network datasets.
16.00 : El Medhi Issouani (LMAC, UTC)
Titre : Conception d’aptamères d’ADN pour le diagnostic de la maladie de Lyme : combinaison d’approches expérimentales et computationnelles
Résumé : Les aptamères sont de courtes séquences d’ADN sélectionnées pour leur capacité à se lier à une cible moléculaire. Le protocole SELEX génère un jeu de données évoluant au fil de plusieurs cycles, pouvant être interprété comme un processus d’échantillonnage progressif, de plus en plus biaisé vers les séquences à forte affinité.À partir de données SELEX liées à la maladie de Lyme, nous proposons un cadre computationnel visant à modéliser la distribution des séquences issues du dernier cycle de sélection et à générer de nouveaux candidats aptamères. Notre approche repose sur des Restricted Boltzmann Machines (RBM), étendues par l’intégration de représentations de séquences inspirées du traitement automatique du langage naturel. Nous combinons ainsi un plongement continu dérivé du modèle RBM avec un plongement indépendant fondé sur des statistiques de type n-grammes, permettant une comparaison géométrique entre les séquences expérimentales et les séquences générées. Cette représentation combinée offre un moyen pratique d’explorer l’espace des séquences malgré un volume limité de données expérimentales. Les candidats générés in silico ont été sélectionnés puis évalués expérimentalement, montrant des résultats de liaison prometteurs et soutenant la pertinence de la méthodologie proposée.