Comment des agents artificiels peuvent-ils découvrir des compétences, inventer des moyens de communiquer et développer des stratégies coopératives complexes sans qu'on leur dise quoi faire ? ECOCURL étudie comment la curiosité, l'apprentissage et l'évolution dans des populations d'agents en interaction peuvent susciter l'émergence spontanée d'une communication partagée et de capacités collectives, en écho aux dynamiques qui ont façonné le langage et la culture dans les populations vivantes.
Les systèmes d'IA les plus puissants — comme les modèles de langage — sont largement conçus : leurs compétences résultent d'objectifs définis par des humains, de vastes jeux de données et de signaux de récompense soigneusement élaborés. Pourtant, beaucoup des aptitudes les plus remarquables du vivant — coopération, langage, compétences techniques, organisation sociale complexe — n'ont pas été conçues : elles ont émergé dans des populations en interaction avec leur environnement et entre elles. ECOCURL étudie dans quelle mesure des dynamiques similaires peuvent être reproduites chez des agents artificiels, avec pour ambition à long terme des systèmes d'IA qui découvrent et maîtrisent de façon autonome de nouvelles compétences par l'interaction, plutôt qu'on leur dise quoi faire.
Le projet a abordé trois questions centrales. Premièrement, des populations d'agents guidés par la curiosité — la motivation interne à explorer de nouvelles capacités — peuvent-elles collectivement découvrir une riche diversité de compétences ? Deuxièmement, quels systèmes de coopération et de communication émergent entre eux, et comment leur environnement et leur architecture cognitive façonnent-ils ces systèmes ? Troisièmement, comment ces systèmes de communication peuvent-ils soutenir des stratégies coopératives de plus en plus complexes, ouvrant la voie à une évolution culturelle dans des populations artificielles ?
Répondre à ces questions exigeait de réunir plusieurs axes restés largement séparés. L'apprentissage guidé par la curiosité, conçu pour des agents individuels découvrant en autonomie des compétences variées, n'avait pas été transposé aux populations. L'étude de l'émergence de communication partagée entre agents s'était cantonnée à des cadres simples. Les dynamiques mêlant coopération et compétition, qui peuvent encourager des comportements de plus en plus complexes, étaient restées déconnectées des recherches sur la communication. ECOCURL a combiné ces axes pour étudier comment curiosité, communication et coopération nourrissent ensemble la découverte de compétences et comportements collectifs variés.
Ces questions débordent le cadre de l'apprentissage multi-agents. Elles rejoignent les dynamiques écologiques et évolutives, puisque les conditions de l'environnement — complexité, variabilité, distribution des ressources — façonnent fortement les comportements émergents. Elles rejoignent l'évolution culturelle : des populations capables d'inventer et de transmettre compétences et signaux constituent elles-mêmes des systèmes culturels. Elles rejoignent enfin la découverte scientifique automatisée : les algorithmes guidés par la curiosité, développés pour des agents, se révèlent de puissants outils pour explorer des systèmes dynamiques complexes — une IA inspirée de la curiosité du vivant peut aussi servir d'instrument pour étudier la nature.
La méthodologie d'ECOCURL a consisté à construire des mondes artificiels où des populations d'agents apprennent, interagissent et évoluent, puis à observer quels comportements collectifs et schémas de communication émergent. Leur complexité a été progressivement accrue, depuis de petits environnements comportant quelques agents jusqu'à des simulations peuplées de milliers d'agents.
Au cœur du projet, les agents ont été dotés d'apprentissage par renforcement — une famille d'algorithmes où un agent améliore son comportement par essais et erreurs guidés par des récompenses. Les agents ont ensuite reçu la capacité de se fixer leurs propres buts et d'être animés par la curiosité pour découvrir et maîtriser de nouvelles compétences, prolongeant des travaux antérieurs en exploration autonome dirigée par des buts. La structure compositionnelle de ces buts — la façon dont des compétences simples se combinent en compétences plus élaborées — a fourni une base pour étudier comment une communication symbolique partagée peut émerger entre agents engagés dans des tâches coopératives.
Pour aborder des questions qui dépassent l'apprentissage individuel, l'outillage méthodologique a été progressivement étendu. L'évolution artificielle a permis d'étudier comment les architectures d'apprentissage et les comportements sont façonnés, au fil des générations, par des pressions écologiques — rareté des ressources, variabilité environnementale, parenté. Des techniques initialement développées pour entraîner un agent sur une large distribution de situations ont été étendues au cadre multi-agents, permettant à des populations d'acquérir des stratégies coopératives qui se généralisent à des tâches non rencontrées auparavant. Les grands modèles de langage ont été introduits comme nouvel outil expérimental : jouant le rôle d'agents communicants dans des simulations contrôlées, ils ont permis d'étudier l'évolution culturelle et la transmission d'information dans des populations dotées d'un langage riche et compositionnel.
Ces ingrédients ont convergé dans Vivarium, une plateforme de simulation flexible hébergeant des milliers d'agents en interaction dans un environnement continu doté d'une physique réaliste. Pensée pour les processeurs graphiques modernes, elle s'utilise à plusieurs niveaux — démonstrations web interactives accessibles sans programmation, ou expériences à grande échelle sur supercalculateur. Enfin, la même famille d'algorithmes d'exploration guidée par la curiosité a été appliquée à un autre type de question : l'exploration systématique de mondes computationnels complexes — comme les automates cellulaires, où des motifs élaborés émergent de règles locales simples — ouvrant une direction où les méthodes d'IA servent d'instruments à la découverte scientifique.
Un résultat central concerne le lien entre curiosité et communication. Lorsque chaque agent est animé par sa propre curiosité, les agents sélectionnent indépendamment des buts différents — moteur puissant de diversité, mais obstacle à la coopération, puisque deux agents aux buts divergents ne peuvent se coordonner. Le projet a montré que cette tension se résout lorsque les agents peuvent communiquer : un protocole de signalisation partagé émerge spontanément pour aligner les buts [1]. La communication apparaît donc non comme une fonctionnalité ajoutée, mais comme la solution au problème de coordination que crée la curiosité. Dans des environnements riches en activités possibles, ces populations ont aussi acquis des stratégies coopératives généralisant bien au-delà de leur distribution d'entraînement.
Un deuxième axe concerne le rôle de l'environnement dans le façonnement des comportements. Un cadre computationnel a été développé pour des simulations évolutives de longue durée où les agents se reproduisent, meurent et s'adaptent continuellement [2]. Le transfert altruiste de ressources entre générations y apparaît spontanément en présence de reconnaissance de parenté. Des populations exposées à des feux de forêt se propageant à travers un paysage ont développé des stratégies collectives qui atténuent les extrêmes environnementaux tout en préservant leurs ressources [3].
À l'échelle culturelle, nous avons montré que des populations alternant exploration individuelle et partage collectif surpassent des populations entièrement connectées sur des tâches exigeant la combinaison progressive d'innovations [4], reproduisant des schémas observés en laboratoire chez l'humain. Des grands modèles de langage faisant circuler des messages le long de chaînes ont révélé des attracteurs culturels dans l'évolution des textes — biais vers certains niveaux de toxicité, positivité, longueur et difficulté [5] ; un logiciel open source a été publié pour étudier ces dynamiques.
Enfin, les méthodes d'exploration guidée par la curiosité se sont révélées de puissants instruments de découverte scientifique. Appliquées aux automates cellulaires — mondes simulés où des motifs complexes émergent de règles locales simples — elles ont automatisé la recherche de structures auto-organisées aux propriétés analogues à celles du vivant, incluant des formes primitives d'agentivité et des écosystèmes d'espèces en interaction [6]. La méthodologie a été intégrée à un logiciel open source désormais utilisé pour étudier d'autres systèmes complexes, notamment des réseaux biologiques, avec des partenaires internationaux.
[1] https://hal.science/hal-03898121 [2] https://hal.science/hal-03898121 [3] https://hal.science/hal-04356920 [4] https://hal.science/hal-03715924 [5] https://hal.science/hal-04714994 [6] https://hal.science/hal-04865117
Au-delà des résultats scientifiques, le projet a produit des outils et des retombées pour la communauté. Au premier rang figure Vivarium [7], plateforme de simulation open source dédiée à des populations de milliers d'agents en interaction. Elle s'adresse à des publics variés : interface web sans code pour les étudiants, simulations massivement parallèles sur GPU pour les chercheurs. Vivarium a été adoptée comme plateforme pédagogique à l'Université Pompeu Fabra et dans des écoles d'ingénieurs bordelaises. Le projet a aussi organisé des ateliers académiques sur la communication émergente (SMILES) et des hackathons (Hack1Robo) réunissant étudiants, chercheurs et entreprises, à l'origine de plusieurs démonstrations artistiques, articles scientifiques et start-ups.
Le projet a aussi ouvert deux axes qui ancrent les travaux en cours. L'axe éco-évolutif — comment les dynamiques environnementales et écologiques façonnent le comportement des populations — a produit des résultats sur l'émergence d'altruisme en présence de reconnaissance de parenté [8] (best paper et best student paper awards à EvoStar 2025), et une collaboration industrielle avec Pontos sur la gestion durable des écosystèmes marins. Un second axe sur l'évolution culturelle a émergé d'expériences où des grands modèles de langage tiennent le rôle de populations communicantes — un paradigme pour étudier comment information, normes et innovations se propagent, avec une pertinence directe pour les écosystèmes humains–IA.
Un axe complémentaire a appliqué les algorithmes guidés par la curiosité à l'exploration systématique de systèmes computationnels complexes. Il a attiré une large attention publique, dont un article dans Pour la Science sur l'IA comme outil d'étude des dynamiques analogues au vivant [9], et plusieurs distinctions internationales, dont le Best Paper Award à la conférence ALife [10] et un prix à la Virtual Creature Competition [11].
Plusieurs directions à long terme se dégagent. L'une concerne la conception de communautés mêlant humains et agents d'IA guidés par la curiosité — à la fois pour comprendre les dynamiques culturelles d'écosystèmes hybrides où humains et grands modèles de langage échangent de l'information, et pour organiser des agents d'IA collaborant avec des chercheurs à l'exploration scientifique. Un autre défi est d'intégrer les contributions du projet dans un cadre unifié où évolution biologique, interactions sociales et transmission culturelle produisent ensemble des formes ouvertes d'intelligence — en s'appuyant sur le cadre conceptuel développé dans la thèse d'habilitation du porteur du projet [12].
[7] https://github.com/flowersteam/vivarium [8] https://hal.science/hal-04865103 [9] https://hal.science/hal-04848954 [10] https://hal.science/hal-03904389 [11] https://www.youtube.com/watch?v=sSrHoe-iPiU [12] https://hal.science/tel-03875448