Graphe de réseau lexical issu de la base de données utilisée dans le projet
Projet personnel pour ma thèse - en cours
Collecte et analyse de bases de tweets se voulant les plus représentatives du contenu publié entre 2017 et 2023 en français avec différents hashtags connexes à #Metoo
Convention avec l'INA pour la mise à disposition d'une partie des données (dépôt légal du web et OTMedia)
Avis favorable du comité d'éthique de la recherche de Sciences Po pour l'utilisation des données identifiantes (sous conditions de traitement et de conservation)
Méthodologie :
Scraping à partir de l'API academic de Twitter [obsolète depuis 2023], concaténation et comparaison avec les collectes du dépôt légal du web et d'OTMedia
NLP/TAL : Classification supervisée du contenu textuel à partir d'un entrainement de l'algorithme CamemBERT (Martin et al. , 2020)
Analyses sociologiques des modes de publication de dicibilité des témoignages de violence
Sciences Po - Programme PRESAGE
Sept. 2023 - Sept. 2024
Photographie de Violette Toye
Assistante de recherche en statistiques et sciences sociales
Coordination de l'enquête SAFEDUC dont l'objectif est d'étudier la prévalence des violences sexistes et sexuelles dans l'enseignement supérieur
Equipe : Hélène Périvier (OFCE, Directrice du programme PRESAGE) - Virginie Bonnot (Université Paris Cité, Directrice de la cité du genre) - Victor Coutolleau (post-doctorant, OFCE) - Marta Dominguez Folgueras (CRIS, Sciences Po) - Joëlle Kivits (Université Paris Cité, Cité du Genre)
Mes missions : construction du questionnaire - implémentation sur Qualtrics - gestion juridique et éthique (échanges avec les DPO, comité d'éthique, équipes juridiques) - enquête pilote - échanges avec le comité scientifique, des étudiant·es, associations, directions des établissements - suivi de la passation de l'enquête - analyse des données
Productions : - questionnaire reproductible
- avis favorable du comité d'éthique de l'Inserm (CEEI-IRB)
- articles scientifiques
- conférence, interview, podcast de restitution des résultats
Unité INSERM U970 - Hôpital Européen Georges Pompidou Paris
Juin 2021 - Nov. 2021
Graphique issu de mon travail sur le clustering des patients
Assistante de recherche en statistiques et épidémiologie (stage)
Analyse statistique des trajectoires de soin pour identifier des patients à risque de mort subite
Direction : Xavier Jouven (PARCC, Inserm) et Younès Youssfi (CREST, ENSAE)
Méthodologie :
Représentation vectorielle (embedding par Word2Vec) du dictionnaire médical (pathologies, médicaments, types d'hospitalisation)
Représentation vectorielle des trajectoires des patients
Clustering des patients (algorithme des k-moyennes)
Visualisation (t-stochastic neighbor embedding (t-SNE))