Similarité de données complexes et massives

Colloque

24-25 juin 2025

MOBE, Université d'Orléans

Description

Programme du Mardi 24 juin (au MOBE)

Programme du Mercredi 25 juin (9h30, au LIFO)

Pour s'inscrire

Pour venir

Description

Ce colloque se veut le point de départ de la structuration d'une communauté de recherche pluridisciplinaire travaillant sur l'analyse de données par des études de similarités de gros volumes de données complexes. Il vise à rassembler des chercheurs intéressés par les verrous scientifiques soulevés par ces approches qu'il s'agisse de :

Méthodes théoriques (définition des similarités, algorithmes de jointure par similarité/ recherche par similarité, traitement d'images,...)
Problématiques liées à la qualité et à la complexité des données (séquences vs séries, données manquantes, données non alignées)
Optimisation, calcul haute performance, parallélisation et accélération GPU
Nature des données et domaines d'applications (santé, biologie, ...)

L’organisation du colloque alterne entre exposés scientifiques couvrant ces différentes thématiques et temps d’échanges, notamment sous forme d’ateliers thématiques permettant de favoriser les discussions croisées et les rapprochements interdisciplinaires.

Le colloque se prolongera le lendemain matin par une réunion du groupe de travail, ouverte à tous les participants intéressés, afin de définir les prochaines actions collectives à mener dans ce cadre.

Programme du Mardi 24 juin (au MOBE)

9h30 Ouverture

9h45-10h30 Mike Gowanlock (School of Informatics, Computing, and Cyber Systems, Northern Arizona University)

Parallel Similarity Searches on Heterogeneous Architectures

10h30-11h15 Pr. Véronique Avettand Fenoel et Pr. Etienne Carbonnelle (CHU Orléans)

Analyses of microbial genomes with ultra-deep sequencing: virological and bacteriological issues

Pause/Discussions 11h15-11h45

11h45-12h30 Michele Linardi (ETiS, CY Cergy Paris University)

Actionable Explainability of Time Series Deep Learning Models

Repas 12h30-14h

14h-14h45 Veronika Peralta (LIFAT, Université de Tours)

Similarity of Temporal Semantic Sequences: challenges and applications

14h45-15h30 Pierre Monnin (INRIA, Université Côte d'Azur)

Aligning complex units in knowledge graphs - Symbolic and neuro-symbolic approaches for pharmacogenomics

Pause/Discussions 15h30 16h

16h-17h30 Ateliers

17h30 Clôture

ATELIER 1 : Données santé

(Christel Dartigues-Pallez et Lucile Mollet)

Problématiques liées aux données de santé (nature des données, leur qualité, la confiance)

Lien entre les différentes applications

ATELIER 2 : Similarités et HPC

(Sébastien Limet et Patrick Marcel)

Gestion de gros volumes de données

Les outils utilisés et leurs limites

Les besoins en calcul haute performance

Programme du Mercredi 25 juin (9h30, au LIFO)

Dans le prolongement des échanges du colloque, nous proposons une réunion du groupe de travail "Similarités" (atelier SIMDAC du GdR MaDICS), ouverte à l’ensemble des participants. Cette réunion vise à prolonger les réflexions initiées lors des exposés, ainsi que des deux ateliers proposés

L’objectif de cette séance est double :

Faire un bilan collectif des idées, besoins ou perspectives soulevés pendant le colloque,
Discuter ensemble des pistes d’action à engager dans le cadre du groupe de travail,

Nous vous invitons à venir partager vos retours, vos questionnements autour de l’étude des similarités dans des contextes de données massives et hétérogènes.