L'intérêt de l'IA (donc en résumé des LLM) pour le gros du public tient beaucoup aux caractéristiques des documents analysés par le logiciel durant la phase préalable à son utilisation d'apprentissage.
Ces documents (dits corpus, dataset...) valent par leur originalité, exhaustivité, précision, univocité, fraîcheur, objectivité (absence de biais), concision, bonne structuration...
Pour un professionnel bénéficiant de l'IA la valeur de tout contenu de bonne facture selon ces critères augmente, et il voudra de plus en plus en disposer exclusivement.
À ce titre l'IA ne menace pas l'auteur souhaitant être rémunéré mais seulement sa volonté de publier largement ses oeuvres, par exemple sur un site web accessible à tous, plutôt que de les réserver à ses clients.
Cela dynamise le marché des experts et outils capables d'évaluer des corpus, de les cataloguer, d'en réserver l'accès à qui paie pour cela...
Ce marché de l'AI-ready data, en particulier de la donnée premium (rare et de qualité donc chère) connait une croissance soutenue. Des groupes de presse et assimilés signent des contracts de concession exclusive ou prioritaire (Reddit, Le Monde...).
Ceci vaut pour de nombreuses formes de création de l'esprit, métadonnées (description, popularité...), oeuvres artistiques et façon (création «à la manière de») comprises: Shutterstock, Getty Images...
La valeur d'une offre jugée adéquate tient à sa rareté donc exclusivité. Celle des soubassements (LLM, circuits électroniques, réseaux...) diminue car ils deviennent autant de commodités. Celle des informations de qualité perdurera.
Pour le patron-type l'information de qualité doit être non seulement parfaitement utilisée par ses salariés afin d'améliorer l'efficacité de l'entreprise, mais aussi maintenue confidentielle afin qu'aucun concurrent ne l'obtienne.
Ces objectifs antagonistes étaient jusqu'à présent poursuivis en acceptant de préserver certaines informations sous forme orale plutôt que consignées par écrit, donc il n'existait pas d'ensemble de documents formant une recette décrivant comment reproduire les actions de l'entreprise, facilement exploitable par un concurrent.
Cela rassurait le patron ainsi que les salariés dont la valeur reposait pour partie sur ces informations, chacun d'eux s'en réservant ainsi un pan, plus ou moins partagé afin de réduire le facteur d'autobus (qui reflète bien certains aspects de la qualité d'une organisation: s'il est trop élevé la valeur du savoir-faire local est douteuse, s'il est trop faible l'entreprise est fragile).
L'IA ébranle cela car, pour en bénéficier au mieux, on la laisse reposer sur un apprentissage dont le corpus est non seulement générique afin de permettre la conversation avec l'humain, mais aussi constitué de données abritées dans le système d'information de l'entreprise, chacune étant une parcelle de la recette.
Pour en préserver la confidentialité le logiciel animant le LLM est isolé de sorte que seuls les habilités à y accéder le pourront. Ils seront réputés sûrs et le LLM apprendra en continu grâce à eux, donc sa capacité à produire une bonne recette et de l'expliquer (grâce à son corpus générique) augmentera au gré d'interactions.
Aujourd'hui un humain comprenant le besoin du moment (un problème à résoudre, une possible amélioration de l'existant) et capable de vite et bien décrire les moyens et résultats correspondants peut efficacement utiliser un LLM, et si ce dernier apprend ainsi à mesure il devient de plus en plus apte à le remplacer.
Plus généralement la proportion des interactions entre les acteurs de l'entreprise (salariés, partenaires, fournisseurs...) analysée par le LLM augmentera vite, surtout s'il écoute des conversations (la surveillance ainsi rendue possible aura des effets intéressants)
Plus il sera utile, plus il sera utilisé, plus il sera utile et meilleure sera la recette qu'il pourra livrer, donc plus il sera utile.
Avant l'avènement de l'informatique la recette était surtout orale, incomplète, diffuse, obsolète, mal structurée...
Le système d'information d'aujourd'hui abrite le gros des données et quelques éclairages (procédures, documentations techniques...), sous forme brute, et est déjà considéré déterminant pour la bonne marche et la compétitivité de l'entreprise.
Celui de demain reposera sur un LLM qui disposera en temps réel du gros des informations échangées donc pourra à tout moment livrer au moins une bonne part de la recette, et l'expliquer clairement à quasi n'importe qui.
L'impact sur la capacité à concurrencer ou fusionner des entreprises sera majeur.
Ce que l'on fait savoir au LLM l'alimente en savoir-faire, il devient ainsi un enseignant capable de l'expliquer donc de le transmettre... y compris à un autre LLM disposant d'autres connaissances (des effets d'interconnexions de LLMs surprendront).
Il deviendra de plus en plus vital de déterminer, y compris à la volée, qui peut ou non modifier une information ou en prendre connaissance.