SiDoS : similarité de données séquentielles massives

SiDoS est le premier atelier portant sur l’optimisation du calcul de distances sur de gros volumes de données de type séquences. Ce thème est à la croisée des domaines HPC et analyse et exploration de données. L’objectif de l’atelier est de structurer la communauté française traitant de séquences massives et du calcul de leur similarité. 

Description et objectif

De nombreux domaines nécessitent l’analyse de gros volumes de séquences de diverses complexités (en termes de périodicité, complétude, multivariée ou non, etc.) et en particulier de leur similarité. On peut citer les domaines aussi variés que le médical (e.g., stratification de patients, alignements de gènes), le social (analyse de trajectoires sémantiques), la science des données (génération et recommandation de pipelines d’exploration), etc.  

 

L’atelier porte sur la définition et l’optimisation du calcul de similarités sur de gros volumes de données de type séquences. Ce thème est à la croisée des domaines HPC (calcul haute performance) et analyse et exploration de données. Il recouvre différents challenges scientifiques : prise en compte de la spécificité des données (séquences, séries, trajectoires, etc.), définition de méthodes de réduction de dimensionalité et indexation, parallélisation du calcul de similarité, adaptation d’approches existantes (par exemple, sur séries temporelles ou données spatio-temporelles), etc. 

 

Cet atelier se veut le point de départ de la structuration de la communauté de recherche travaillant sur ce thème et ces données. Il constitue un temps d’échange entre les membres des communautés traitement de la donnée et HPC. 

Thèmes de l'atelier

Programme

Soumissions

Deux types de soumissions sont possibles : 

 

Les articles longs pourront inclure tout travail de recherche original, description d’application, expérimentation, résumé de papiers internationaux. Les articles courts sont réservés à là description de travaux en cours, de démonstration ou de déclaration d’intention. 

 

Les articles soumis seront relus par 3 membres du comité de programme. Les soumissions devront être au format PDF exclusivement et devront utiliser le format RNTI latex : https://www.editions-rnti.fr/files/RNTI-202208.zip. Les soumissions se feront via easychair : https://easychair.org/conferences/?conf=sidos2025

 

Les dates de soumission/notification sont celles définies pour EGC 2025 : 

Comité de programme

Organisation 


SiDoS est lié à l'atelier SIMDAC du GDR MADICS.