Atelier IACD - EGC 2026
27 janvier 2026 à Anglet
27 janvier 2026 à Anglet
L'Intelligence Artificielle centrée sur les données (Data Centric AI, ou DCAI) est une approche prometteuse qui place les données au cœur du processus d'apprentissage automatique, contrairement aux approches traditionnelles centrées sur les algorithmes et les architectures de modèles.
Cette approche est axée sur la qualité, la quantité et la représentativité des données qui sont des facteurs clés de la fiabilité et de la robustesse des systèmes d’IA. En effet, des données mal étiquetées, biaisées ou incomplètes peuvent conduire à des prédictions erronées et à des biais dans les décisions prises par les systèmes d'IA. La DCAI met aussi l'accent sur l’automatisation de tout le pipeline de la science des données incluant la préparation des données, leur nettoyage, leur annotation et leur représentation. Ce paradigme permet le développement de méthodes qui soient plus interprétables et équitables tout en ayant une interaction continue avec l’humain.
L’IA centrée sur les données est une thématique émergente ces dernières années comme le montre les différents ateliers organisés dans les conférences de premier plan (p.ex. NeurIPS 2021, ICDM 2023, ICML 2024, VLDB 2024, WWW 2024). L’objectif de l’atelier est de présenter les travaux des équipes francophones concernant l’IA centrée sur les données (data centric AI), et de fédérer les chercheurs travaillant sur cette thématique. Le premier atelier sur cette thématique au niveau national a été organisé lors d’EGC 2025. Il a regroupé une trentaine de participants en moyenne autour de 13 présentations (longues et courtes).
Automatisation des pipelines de science des données
Ingénierie des caractéristiques
labellisation, augmentation, nettoyage, sélection, agrégation, représentation …
détection d'anomalies, quantification de l'incertitude
Méthodes centrées sur les données pour l’apprentissage automatique et la fouille de données
interprétabilité, confiance, éthique, biais, …
Génération de jeux de données ou de Benchmarks
génération assistée par des modèles, framework d’évaluation, …
Outils pour l’IA centrée sur les données
Applications de méthodes centrées sur les données
Titre de la présentation : « Statistical tools for deep network diagnostics »
Résumé : Diagnostic measures are popular tools in statistics that estimate the influence of each individual example on a given quantity, such as model fit, parameter values, or predictions on other examples. These tools provide a principled methodology to identifying important training examples and outliers, or estimating uncertainty at test time. Among these tools, infinitesimal influence functions have already been successfully applied to deep networks (Koh & Liang, 2017). In this ongoing work, we aim to promote the use of other common diagnostic measures for use in deep learning by leveraging recent results in deep network linearization and efficient approximate Fisher information matrices.
Les articles, en langue française, pourront porter sur des travaux originaux ou correspondre à des travaux déjà acceptés dans des conférences internationales. Ils pourront aussi décrire des solutions mises en place par des entreprises.
Deux types de soumissions :
Articles courts : 2 à 4 pages
Articles longs : 8 à 12 pages
Les soumissions devront être au format PDF exclusivement et devront utiliser le format RNTI latex : https://www.editions-rnti.fr/files/RNTI-202208.zip. Chaque article soumis sera évalué en double aveugle. Les soumissions se feront via easychair : https://easychair.org/conferences?conf=egc2026 en sélectionnant la track "Intelligence Artificielle Centrée sur les Données".
Les dates de soumission/notification sont celles définies pour EGC 2026 :
Date de soumissions : 28 novembre 2025
Notification aux auteurs : 9 décembre 2025
Date de l'atelier : 27 janvier 2026
Un numéro spécial de la revue RNTI sera préparé et regroupera une sélection d'articles de l'atelier 2025 et 2026.
L'inscription à l'atelier est gratuite (hors repas) si elle est faite avant le 5 janvier. Après cette date, le tarif est de 100 euros. Plus de détails peuvent être trouvés sur le site de la conférence : https://inscription.egc.asso.fr/event/egc2026
Lylia Abrouk (LIB, Université Bourgogne Europe)
Feda Almuhisen (CEA)
Khalid Belhajjame (LAMSADE, Université de Paris-Dauphine)
Sandro Bimonte (INRAE Clermont-Ferrand)
Sandra Bringay (LIRMM, Université Paul Valéry Montpellier)
Guillaume Cleuziou (LIFO, Université d'Orléans)
Nadine Cullot (LIB, Université Bourgogne Europe)
Nicolas Durand (LIS, Aix-Marseille Université)
Alexis Guyot (LIS, Aix-Marseille Université)
Matthieu Exbrayat (LIFO, Université d'Orléans)
Constance Thierry (IRISA, Université de Rennes 1)
Imen Megdiche (IRIT, INU J-F Champollion)
Sébastien Nedjar (LIS, Aix-Marseille Université)
Marinette Savonnet (LIB, Université Bourgogne Europe)
Marwa Boulakbech (LIS, Aix-Marseille Université)
Davide Andrea Guastella (LIS, Aix-Marseille Université): davide-andrea.guastella@univ-amu.fr
Alexis Guyot (LIS, Aix-Marseille Université) : alexis.guyot@univ-amu.fr
Sana Sellami (LIS, Aix-Marseille Université): sana.sellami@univ-amu.fr
Frédéric Flouvat (LIS, Aix-Marseille Université): frederic.flouvat@univ-amu.fr