L'intérêt de l'IA (donc en résumé des LLM) pour le gros du public tient beaucoup aux caractéristiques des documents analysés par ces logiciels (corpus d'apprentissage), en particulier à leur originalité, exhaustivité, précision, univocité, objectivité (absence de biais), concision, bonne structuration...
Pour un professionnel bénéficiant de l'IA la valeur de tout contenu de bonne facture selon ces critères augmente, et il voudra de plus en plus disposer exclusivement.
À ce titre l'IA ne menace pas l'auteur souhaitant être rémunéré mais seulement sa volonté de publier largement ses oeuvres, par exemple sur un site web accessible à tous, plutôt que de les réserver à ses clients.
Cela dynamise le marché des experts et outils capables d'évaluer un corpus, de les cataloguer...
Ce marché de l'AI-ready data, en particulier de la donnée premium (rare et de qualité donc chère) connait une croissance soutenue. Des groupes de presse et assimilés signent des contracts de concession exclusive ou prioritaire (Reddit, Le Monde...).
Ceci vaut pour de nombreuses formes de créations de l'esprit, métadonnées (description, popularité...), oeuvres artistiques et façon (création «à la manière de») comprises: Shutterstock, Getty Images...
Ce mouvement s'accentue pour partie parce que des entreprises soucieuses de préserver la valeur de leur offre, qui tient à sa rareté donc exclusivité, constate que celle du seul logiciel diminue à mesure que l'IA réduit le coût de son développement et qu'il devient une commodité.