pascal.cuxac[at]gmail.com
Je suis ingénieur de recherche à l'INIST / CNRS (Institut de l'information scientifique et technique / Centre National de la Recherche Scientifique) à Nancy, France.
Après un doctorat en "Génie Géologique et Minier" à l' Ecole Nationale Supérieure de Géologie de Nancy (1991) j'ai travaillé sur le comportement mécanique de roches anisotropes.
En 1993, je rejoins le CNRS comme ingénieur de recherche.
Actuellement responsable du service TDM (Text and Data Mining) de l'INIST-CNRS, j'encadre une équipe en charge du développement et de la mise à disposition d'outils d'IA.
JOURNEES ISTEX 2018
Paris
ISTEX, au service de l'exploration et de la fouille de texte
12es Journées Médici
Lyon, 2024
L'IA pour contrer l'IA : détection de citations peu fiables dans les articles scientifiques
* Classifications automatiques non supervisées (clustering) de textes
* Classifications supervisées de textes, Sélection de variables
* Estimations de la qualité d’une classification
* Classifications incrémentales
* Comparaisons de classifications
* Méthodes de désambiguïsation des affiliations d'auteurs
* Méthodes de visualisation
* Deep-learning
* Intelligence Artificielle
* IJCNN (International Joint Conference on Neural Networks) depuis 2012
* ISKO-Maghreb 2013, 2014
* IEA/AIE 2011
* IEEE CIS depuis 2013
* IMMM depuis 2017
* Scientometrics
* Knowledge and Information System
* atelier TextMine (Text Mining - Fouille de textes), dans le cadre de la conférence EGC 2019, Metz, 22 Janvier 2019. Co-organisé par Vincent Lemaire (Orange Labs)
* atelier TextMine (Text Mining - Fouille de textes), dans le cadre de la conférence EGC 2018, Paris, 23 Janvier 2018. Co-organisé par Vincent Lemaire (Orange Labs)
* Colloque "Analyser la science : les bibliothèques numériques comme objet de recherche", dans le cadre du 85e congrès de l'ACFAS, Université McGill, Montréal, Canada, 08-09 Mai 2017. Co-organisé avec Lyne Da Sylva (EBSI - U. de Montréal)
* atelier TextMine (Text Mining - Fouille de textes), dans le cadre de la conférence EGC 2017, Grenoble, 24 Janvier 2017. Co-organisé par Vincent Lemaire (Orange Labs) et Jean-Charles Lamirel (Synalp-Loria)
* atelier CluCo (Clustering et Co-clustering), dans le cadre de la conférence EGC 2016, Reims, 19 Janvier 2016. Co-organisé par Vincent Lemaire (Orange Labs) et Jean-Charles Lamirel (Synalp-Loria)
* Journée sur le clustering , Issy Les Moulineaux, 20 octobre 2015. Co-organisé par Vincent Lemaire (Orange Labs) et Jean-Charles Lamirel (Synalp-Loria)
* atelier CluCo (Clustering et Co-clustering), dans le cadre de la conférence EGC 2015, Luxembourg City, Luxembourg, 27 Janvier 2015. Co-organisé par Vincent Lemaire (Orange Labs) et Jean-Charles Lamirel (Synalp-Loria)
* atelier IClaNoV (Incremental Clustering, Concept drift and Novelty detection), dans le cadre de la conférence internationale ICDM'14, Shenzen (Chine) , 14 décembre 2014. Co-organisé par Jean-Charles Lamirel (Synalp-Loria) et Vincent Lemaire (Orange Labs).
* atelier CluCo (Clustering et Co-clustering), dans le cadre de la conférence EGC 2014, Rennes, 28 Janvier 2014. Co-organisé par Vincent Lemaire (Orange Labs) et Jean-Charles Lamirel (Synalp-Loria)
* atelier IClaNoV (Incremental Clustering, Concept drift and Novelty detection), dans le cadre de la conférence internationale ICDM'13, Dallas (USA) , 7 décembre 2013. Co-organisé par Jean-Charles Lamirel (Synalp-Loria) et Vincent Lemaire (Orange Labs).
* 3 ateliers CIDN (Classification Incrémentale et Détection de Nouveauté) dans le cadre des conférences EGC 2011-12-13. Co-organisés avec Jean-Charles Lamirel (Synalp-Loria), Vincent Lemaire (Orange Labs), puis Thomas Guyet (IRISA)
* atelier AIL (Active and Incremental Learning), dans le cadre de la conférence internationale ECAI'12, Montpellier, 27 Aout 2012. Co-organisé par Vincent Lemaire (Orange Labs) et Jean-Charles Lamirel (Synalp-Loria)
* session spéciale Incremental Clustering and Novelty detection techniques and their application to intelligent analysis of time varying information, dans le cadre de la conférence internationale IEA/AIE 2011. Co-organisé avec Jean-Charles Lamirel (Synalp-Loria)
* LLMs4EU : Initiative européenne lancée en mars 2025 et prévue jusqu’en février 2028, financée dans le cadre du programme Digital Europe Programme. L’idée centrale de LLMs4EU est de permettre le développement, la diffusion et l’utilisation de grands modèles de langage (LLM) dans toutes les langues de l’Union européenne, y compris celles qui sont peu représentées ou « à ressources faibles ». (https://www.alt-edic.eu/fr/projects/llms4eu/)
* RAPIDO : Le projet RAPIDO vise à enrichir les publications scientifiques en reliant automatiquement les toponymes archéologiques à des référentiels d’autorité grâce à des outils de reconnaissance d’entités nommées. Il est le fruit d'un partenariat entre Persée, l’Inist (Institut de l'information scientifique et technique), l’EfR, l’École française de Rome), l’EfA (École française d’Athènes) et l’Abes (Agence bibliographique de l'enseignement supérieur).(lien vers l'article TALN 2025)
* CONDITOR : L’objectif de Conditor est de recenser la production scientifique des établissements et laboratoires relevant de l’enseignement supérieur et de la recherche (ESR) français (http://www.cnrs.fr/dist/Projet-conditor.html)
* CPER LCHN (Langues, Connaissances et Humanités Numériques) : projet MultiMETA - Génération automatique de métadonnées à partir du plein texte – L’objectif du projet est d’étudier l’exploitation des processus d’auto-catégorisation en combinaison avec les techniques de traitement automatique des langues pour la génération automatique de métadonnées de contenu (en coopération avec le LORIA)
* ISTEX - RD : projet visant à enrichir les données de la plateforme ISTEX à partir de méthodes de text mining .
* ISTEX - R : ISTEX-R est un projet de recherche appliquée visant à intégrer et à mettre à disposition sur la plateforme ISTEX des outils d'accès au contenu opérant sur des textes intégraux et permettant de construire et capitaliser des connaissances sur un domaine scientifique ou technique. Ce projet est un partenariat ATILF-LORIA-INIST. Je participe au WP1- "Analyse et cartographies diachroniques". Depuis début 2015 je suis Chef de projet ISTEX-RD.
* DBF : (Development and Verification of a Bibliometric Model for the Identification of Frontier Research) projet du programme IDEAS du 7ème PCRD de la Commission Européenne. L'objectif principal du projet est de tester de nouvelles méthodes de suivi de l'efficacité des processus d'évaluation par les pairs en adoptant une perspective scientométrique des propositions de recherche, au-delà des seules statistiques de publication et de citation.
* QUAERO – TIAE : Le projet Quaero porte sur le traitement automatique des contenus numériques multimédias. Il est réalisé par un consortium de 23 partenaires français et allemands des secteurs public et privé. Je participe au projet applicatif TIAE (Text & Image Annotation Engine). Tache de classification supervisée de textes scientifiques dans un plan de classement des brevets.
* CPER 2007-20013 : "Modélisations, informations et systèmes numériques", participation au projet "Analyse de flux d'information par classifications incrémentales" du pole "Traitement automatique des Langues et des Connaissances (TALC)". L’objectif global du projet est de faire évoluer les outils de veille existants afin de capter et représenter l'évolution des thèmes de recherche dans le te