A la fin des années 50, Herbert Alexander Simon et Allen Newell développent un outil révolutionnaire : le General Problem Solver (GPS)*. Il s’agit d’une des toutes premières formes d’intelligence artificielle. Si une décennie auparavant, McCulloch et Pitts ont déjà ouvert la voie à une intelligence dite « connexionniste » avec leurs fameux « réseaux de neurones formels », Newell et Simon s’intéressent de leur côté à une intelligence purement « symbolique ». A partir de règles et d’usages de la logique, les deux chercheurs souhaitent à la fois reproduire des raisonnements humains et mettre en œuvre une technique susceptible de les amplifier. Le GPS devait être capable de traiter et de résoudre tous les problèmes de l’humanité.
Les questions étaient d’abord modélisées sous forme d’espaces d’états premiers. Il s’agissait ensuite de partir de cette situation critique, de tâtonner au fil d’états possibles en allant d’un état initial à un état final souhaité à partir d’un raisonnement de type algorithmique. Les solutions étaient trouvées par itérations d’un état à un autre à l’aide d’opérateurs, en traversant un champ des possibles construit logiquement.
En lien avec les observations de psychologie expérimentale de Simon et Newell, l’objectif final n’était pas d’identifier toutes les solutions existantes. Il était plutôt de visibiliser des configurations raisonnables de choix. Des règles pratiques (heuristiques) permettaient les types d’économie et de parcimonie supposées à l’œuvre dans toutes les décisions humaines. Lorsque qu’un état satisfaisant entre l’espace en cours et l’état souhaité était atteint, le processus pouvait alors s’arrêter. Et si un opérateur ne pouvait pas être appliqué immédiatement, le GPS décomposait alors la situation initiale en sous-problèmes plus simples à résoudre.
Dans leur projet, Simon et Newell ne s’appuyaient pas vraiment sur des données et un apprentissage. Le plus important pour eux était dans les règles pratiques mises en œuvre et expérimentées. Par ailleurs, il n’y avait pas d’utilisateurs-finaux dans leur approche de l’IA. Les experts en logique et en mathématique étaient également les principaux adopteurs du GPS, leur principal interprète. Nous étions loin de l’informatique « user friendly » des années 80 et des interfaces très intuitives de nos tablettes et de nos smartphones.
Cela avait un avantage à la fois pragmatique et politique : l’architecture informatique, ses hypothèses, ses fonctionnements, étaient totalement transparents pour ses utilisateurs-experts. Dans les années 60, Simon et Newell ont ainsi réalisé les limites et l’hubris de leur projet cognitiviste. Face à des problèmes complexes ou flous, la simplification des espaces initiaux comme finaux était une gageure. Par ailleurs, les chercheurs ont commencé à douter des fondements philosophiques mêmes de leurs projets (malheureusement pas très longtemps…).
Avec son implémentation, le GPS permettait de sentir ce moment où tel Icare, l’utilisateur se brûlait les ailes. Trop proche du soleil de la décision, au seuil d’un moment irréversible, l’heuristique du futur prix Nobel fondait sous la chaleur du réel en mouvement. Au-delà d’un jeu d’échec ou de l’optimisation d’une chaîne de montage, l’activité collective est trop ouverte, trop continue, trop indécomposable, trop expérimentatrice d’elle-même, pour être enfermée dans un système logique. Même pour la quête d’une vague satisfaction, la recherche d’une généralité logique était vaine.
Des décennies plus tard, les GPT (Generative Pre-trained Transformers) ouvrent une voie partiellement nouvelle. Loin du symbolisme de Newell et Simon, ils prolongent les rêves connexionnistes de McCulloch et Pitts. Mais dans un monde de données désormais quasi-infinies, les possibilités d’apprentissage et de corrélations sont également infinies.
Les GPT ne raisonnent pas au sens d’un processus logique ou d’applications de principes logiques. Ils génèrent du texte à la demande, en prédisant la suite la plus probable d'une séquence. Pour se faire, ils s’appuient sur des modèles statistiques apprenant. Là où le GPS n’apprenait pas par lui-même (il appliquait des heuristiques prédéfinies par ses concepteurs), le GPT s’entraîne sur de vastes quantités de données. Fidèle aux principes cybernétiques déjà explorés par McCulloch et Pitts, il ajuste ensuite ses prédictions en fonction de l’entrée reçue. Là où le GPS fonctionnait avec des représentations explicites et symboliques du monde, le GPT s'ajuste continuellement. Mais sans acteurs sensés et actifs de son intérieur, cet outil n’a pas la moindre compréhension explicite du monde. Il se contente de capturer massivement des corrélations entre les mots, les séquences de mots ou les groupes de mots.
Aujourd’hui, les utilisateurs de ChatGPT, Claude, Gemini, Mistral ou Deepseek sont seuls face à une interface opaque sur ses modes de fonctionnement. De façon organique, l’outil apprend en permanence de ses données supervisées par d’autres agents humains et non-humains, dans le cadre d’un écosystème largement connexionniste mais également symbolique.
Chacun et chacune est tout puissant. L’utilisateur assène les prompts les uns après les autres. Il trouve l’inspiration et de nouvelles questions derrière chaque réponse. De son côté, l’outil ne s’essouffle pas. Il répond à tout. Il ne sèche jamais. Il peut apprendre à répondre avec un style plus humble. Mais à la différence de Newell et Simon, les vrais moteurs d’inférence du GPS, il ne connait pas le doute. Plus grave, le GPT place chacun et chacune au centre du monde. Il ne nous contrarie pas. Il est même souvent flatteur. Lorsqu’on lui signale une erreur, il reconnait immédiatement ses torts, sans le moindre ego, sans le moindre affect. Plus que jamais connecté, chacun et chacune est seul ensemble, producteur et activateur de données sans chaleur.
Le soleil de l’IA ne brûle plus. Il est ce reflet avec lequel on échange. Comme un miroir, il réfléchit, il spécule nos désirs de monde. Il nous conforte. Il nous rassure sur nos certitudes. Avec lui, nous sommes des Icare aux ailes éternelles. Et cette force aveugle fait de nous des monstres. Nous flirtons avec les rayons d’une étoile dont les volumes tiennent dans nos mains.
Newell et Simon étaient peut-être obsédés de représentation. Ils recherchaient une vérité illusoire par la seule force de la logique. Nous leur ressemblons par la naïveté de leur engagement. Nous leur ressemblons par notre rejet d’une vérité de l’avant (l’expérimentation) au profit d’une vérité de l’arrière (la donnée). Comme eux, nous oublions qu’il n’y a pas de vérité ultime à trouver dans le seul froid du passé. Nous oublions que le chemin vers des solutions provisoires est fait de tâtonnements, d’ajustements, d’improvisations, de dialogues avec les éléments d’un problème lui-même émergent, d’apports continus d’idées et de techniques extérieures avant de fragiles moments de fermeture. Les « communautés d’enquête » si chères à John Dewey ne s’enferment pas dans les données. Elles se forment et elles vivent dans les fragilités d’un à-venir et d’expérimentations continues.
A la différence de Newell et Simon, nous sommes pris au piège d’une illusion de réalité plus forte et plus dangereuse que jamais. L’IA ne reproduit pas les raisonnements humains. Elle produit de plus en plus l’expérience humaine tout entière. Les artificialités de nos intelligences ont désormais tous les apparats de l’humain. Leurs mains sont les nôtres. Leur digitalité est celle de nos doigts glissant en permanence sur l’écran. Nous serrons et nous griffons notre propre existence. Nous sommes animés par des architectures mystérieuses dont le ressort ultime part de nos ventres, de nos tripes. En manque de nous-même, nous volons vers un soleil toujours proche et toujours plus lointain.
* Pour explorer le GPS et son histoire :
Newell, A., Shaw, J. C., & Simon, H. A. (1959, June). Report on a general problem solving program. In IFIP congress (Vol. 256, No. 1, p. 64).
Ernst, G. W., & Newell, A. (1967, April). Some issues of representation in a general problem solver. In Proceedings of the April 18-20, 1967, spring joint computer conference (pp. 583-600).