Ce colloque se veut le point de départ de la structuration d'une communauté de recherche pluridisciplinaire travaillant sur l'analyse de données par des études de similarités de gros volumes de données complexes. Il vise à rassembler des chercheurs intéressés par les verrous scientifiques soulevés par ces approches qu'il s'agisse de :
Méthodes théoriques (définition des similarités, algorithmes de jointure par similarité/ recherche par similarité, traitement d'images,...)
Problématiques liées à la qualité et à la complexité des données (séquences vs séries, données manquantes, données non alignées)
Optimisation, calcul haute performance, parallélisation et accélération GPU
Nature des données et domaines d'applications (santé, biologie, ...)
L’organisation du colloque alterne entre exposés scientifiques couvrant ces différentes thématiques et temps d’échanges, notamment sous forme d’ateliers thématiques permettant de favoriser les discussions croisées et les rapprochements interdisciplinaires.
Le colloque se prolongera le lendemain matin par une réunion du groupe de travail, ouverte à tous les participants intéressés, afin de définir les prochaines actions collectives à mener dans ce cadre.
9h30 Ouverture
9h45-10h30 Mike Gowanlock (School of Informatics, Computing, and Cyber Systems, Northern Arizona University)
Parallel Similarity Searches on Heterogeneous Architectures
10h30-11h15 Pr. Véronique Avettand Fenoel et Pr. Etienne Carbonnelle (CHU Orléans)
Analyses of microbial genomes with ultra-deep sequencing: virological and bacteriological issues
Pause/Discussions 11h15-11h45
11h45-12h30 Michele Linardi (ETiS, CY Cergy Paris University)
Actionable Explainability of Time Series Deep Learning Models
Repas 12h30-14h
14h-14h45 Veronika Peralta (LIFAT, Université de Tours)
Similarity of Temporal Semantic Sequences: challenges and applications
14h45-15h30 Pierre Monnin (INRIA, Université Côte d'Azur)
Aligning complex units in knowledge graphs - Symbolic and neuro-symbolic approaches for pharmacogenomics
Pause/Discussions 15h30 16h
16h-17h30 Ateliers
17h30 Clôture
ATELIER 1 : Données santé
(Christel Dartigues-Pallez et Lucile Mollet)
Problématiques liées aux données de santé (nature des données, leur qualité, la confiance)
Lien entre les différentes applications
ATELIER 2 : Similarités et HPC
(Sébastien Limet et Patrick Marcel)
Gestion de gros volumes de données
Les outils utilisés et leurs limites
Les besoins en calcul haute performance
Dans le prolongement des échanges du colloque, nous proposons une réunion du groupe de travail "Similarités" (atelier SIMDAC du GdR MaDICS), ouverte à l’ensemble des participants. Cette réunion vise à prolonger les réflexions initiées lors des exposés, ainsi que des deux ateliers proposés
L’objectif de cette séance est double :
Faire un bilan collectif des idées, besoins ou perspectives soulevés pendant le colloque,
Discuter ensemble des pistes d’action à engager dans le cadre du groupe de travail,
Nous vous invitons à venir partager vos retours, vos questionnements autour de l’étude des similarités dans des contextes de données massives et hétérogènes.
Mardi 24 Juin au MOBE
Muséum d’Orléans pour la Biodiversité et l’Environnement
(face à la gare d'Orléans)
Mercredi 25 Juin au LIFO Université d'Orléans