Email : romain.cravic@univ-grenoble-alpes.fr
CV : ici
Agrégé de Mathématiques
Doctorant depuis 2021 à INRIA Grenoble, équipe POLARIS
Maitre de thèse : Nicolas Gast et Bruno Gaujal.
Sujet de thèse : Apprentissage dans les jeux stochastiques
Rentrée 2025 : ATER à l'IUT2 Grenoble
Romain CRAVIC en bref
Je suis doctorant à l'INRIA, Université Grenoble Alpes. Je travaille sur des algorithmes d'apprentissage dans les jeux stochastiques qui sont des modèles où des agents interagissent avec un environnement (au comportement éventuellement aléatoire) afin de maximiser leurs propres gains au cours du temps.
Agrégé de mathématiques en 2019, j'aspire à devenir professeur agrégé des universités (PRAG) à l'issue de ma thèse.
Mes travaux de recherche étudient deux problématiques distinctes :
1) L'apprentissage boite noire dans les jeux à information complète (Q-learning optimiste)
2) La résolution de jeux à information incomplète (Monte-Carlo CFR)
Publications associées :
1) Decentralized model-free reinforcement learning in stochastic games with average-reward objectives : ici
2) Learning discounted Nash equilibrium in imperfect information games using counterfactual regret : en review.
Mon manuscrit de thèse et les slides de ma soutenance viendront plus tard.
Liste des enseignements effectués :
L1 IMA TD Algèbre linéaire.
L1 IMA CTD Algorithmique et programmation en Python.
L1 INF TD Système et environnement de programmation.
L1 SV CTD Outils fondamentaux de mathématiques pour les sciences de la nature.
L3 MMA TP Introduction à la modélisation numérique.
M2 ORCO CM Optimization Under Uncertainty.
2022, Polaris-tt : Stochastic games and Nash equilibria (slides)
2022, LiPhy non-permanent's seminar : Optimal strategies in random situations (slides)
2023, Polaris-tt : Learning in finite-horizon MDP with UCB (slides)
2023, Conference AAMAS : Decentralized Model-free RL for stochastic games with average-reward objective (slides, poster)
2024, Séminaire-tutoriel POLARIS : IIEFG, algorithmes CFR et variantes de Monte-Carlo, partie 1 (Slides)
2024, Séminaire-tutoriel POLARIS : IIEFG, algorithmes CFR et variantes de Monte-Carlo, partie 2 (Slides)
Eté 2023 : j'ai été le co-encadrant d'Abel Douzal, un étudiant de l'ENS Ulm, pour son stage de L3 qui a duré 2 mois. Le stage consistait à comprendre le modèle des jeux stochastiques à observation partielle et les algorithmes existant dans la littérature qui permettent de les résoudre, pour ensuite les appliquer sur un jeu de proie-chasseur.
Eté 2024 : J'ai été le co-encadrant de Rafael Mascarenhas-dall-nery un étudiant de L3 info à l'UGA, pour son stage de L3 qui a duré 2 mois. Le but du stage était de comprendre le fonctionnement des algorithmes type MCCFR dans les jeux à information incomplète sous forme extensive et d'appliquer ces algos à une variante de Poker faite maison pour comparer les performences des différentes variantes de l'algorithme. Rafael s'est intéressé également à la combinaison de ces algorithmes avec des réseaux de neurones.