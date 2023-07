Les intelligences artificielles génératives textuelles, à l'instar de la plus connue, ChatGPT, rédigent en quelques secondes un texte concis et compréhensible sur un sujet donné. L'utilisateur peut ensuite affiner le résultat en demandant à l'outil de préciser certains éléments, ou d'en retirer d'autres. Pour donner naissance à sa prose, l'IA générative s'appuie sur les textes disponibles en accès libre sur le web.

Ce recours à des sources externes, non créditées, soulève des questions relatives au droit d'auteur et à l'honnêteté intellectuelle : si le texte généré semble original, il s'apparente en réalité à une sorte de patchwork d'éléments composites glanés çà et là.

La conception même des intelligences artificielles génératives interroge, puisqu'elle fait entrer en jeu un volume considérable de textes, utilisés pour « entraîner » les machines — l'apprentissage automatique. Or, certains de ses écrits sont couverts par le droit d'auteur, et leurs rédacteurs n'ont tiré ni rémunération ni reconnaissance de cette exploitation.

Deux auteurs américains ont récemment porté plainte, à ce titre, contre OpenAI, la société derrière ChatGPT, pour violation du copyright sur leurs œuvres...

Des livres à l'infini

Généralement mises à profit pour rédiger des textes simples, les intelligences artificielles génératives demandent une attention soutenue de la part de l'utilisateur, dès lors qu'il souhaite les pousser dans leurs retranchements. D'une part, parce qu'il est nécessaire de vérifier la plupart des éléments avancés par l'outil, faute d'indication des sources. D'autre part, parce que des interventions fréquentes sont requises, pour affiner et corriger le résultat obtenu.

Le 20 juin dernier, Matt Shumer, PDG de la société HyperWriteAI, qui commercialise un « assistant d'écriture basé sur l'intelligence artificielle », publie un message pour présenter « gpt-author ». Après la description de quelques points au sein d'une interface de programmation, celle-ci utilise GPT-4 pour rédiger un « roman fantasy original ».

L'IA est invitée à générer une liste d'intrigues potentielles à partir d'une suggestion de l'utilisateur. Elle sélectionne ensuite l'intrigue la plus engageante, la corrige et en extrait un titre. Puis, elle créé un scénario détaillé avec un nombre spécifié de chapitres, avant de tenter d'améliorer ce scénario. Chaque chapitre est ainsi écrit individuellement par l'IA, en suivant l'intrigue et en tenant compte du contenu des chapitres précédents. Une commande pour concevoir la pochette est générée et la couverture est créée. Enfin, tout est rassemblé et le roman est proposé dans un fichier EPUB. – Mode d'emploi de « gpt-author » sur GitHub

En retirant les nécessaires interventions de l'utilisateur, GPT-4 deviendrait un « romancier » autonome, capable de produire plus de romans que Barbara Cartland elle-même...

La boutique déborde

Difficile d'établir un lien de causalité, mais la présentation au monde de « gpt-author » a été suivie, quelques jours plus tard, d'une prise d'assaut de la plateforme Kindle, d'Amazon, par des ouvrages rédigés par des intelligences artificielles.

Ces livres peinent à dissimuler la véritable nature de leur auteur, dès le titre : Apricot bar code architecture, Department of Vinh Du Stands in Front of His Parents’ Tombstone (La filiale de Vinh Du se tient devant la tombe de ses parents) ou encore Ma La Er snorted scornfully (Ma La Er renifla avec mépris) sont quelques-uns des exemples les plus improbables relevés par Vice. Les textes sont largement incompréhensibles, et totalement incohérents.

En cette fin de mois de juin, des dizaines de livres numériques générés par des IA se sont retrouvés dans les classements des best-sellers, notamment dans la catégorie « Romance pour adolescents et jeunes adultes », comme l'indique Caitlyn Lynch, autrice indépendante américaine, dans un message sur Twitter.

D'autres sections, parfois de niche, sont concernées, comme la « fiction militaire » ou les textes demandant deux heures de lecture, selon DailyDot.

Amazon a visiblement corrigé les listes des meilleures ventes dans la foulée des messages et articles sur le sujet, mais les titres restaient disponibles sur la plateforme, selon Vice.

L'appât du gain

L'automatisation de l'écriture fait bien sûr saliver les magouilleurs de tout poil : la perspective de se tailler une bibliographie sans trop se fatiguer peut stimuler. Et semble lucrative, puisque les classements des meilleures ventes s'emballent.

Selon DailyDot, l'explication est simple : ces livres générés automatiquement sont lus, de manière tout aussi automatique, par des « bots », une application logicielle à laquelle cette tâche est confiée. Les titres se retrouvent ainsi mis en avant dans l'écosystème Kindle et sont susceptibles d'être achetés, ou même simplement parcourus, via l'abonnement Kindle des utilisateurs.

Certes, les sommes récoltées à chaque lecture sont minimes, mais restent appréciables lorsqu'aucun effort n'est fourni derrière.

Respecter les règles et les auteurs

Dans un message adressé à Vice, Amazon indique que la société investit « massivement, des fonds, du temps et des ressources internes, afin de proposer une expérience d'achat en toute confiance et de protéger les consommateurs et les auteurs des abus ».

En mars dernier, un porte-parole d'Amazon nous précisait, au sujet des livres écrits à l’aide d’une intelligence artificielle : « Tous les livres disponibles dans notre boutique doivent être conformes à nos règles relatives au contenu, et notamment aux droits de propriété intellectuelle et à la législation en vigueur. »

Amazon n'est pas la seule plateforme concernée : du côté de Wattpad, un de ses concurrents dans le domaine de l'autopublication, des sections réunissent déjà des contenus générés automatiquement. Interrogée, la société, qui appartient désormais au Sud-Coréen Naver, nous indique :

En tant que plateforme mondiale phare pour les webnovels, notre priorité a toujours été de soutenir les auteurs, leurs intérêts et leur carrière. Alors que les technologies d'intelligence artificielle pour l'écriture et la publication évoluent rapidement, nos équipes suivent avec attention l'émergence de la législation sur ces outils et développent de nouvelles règles pour nous assurer qu'ils pourront nous aider dans notre mission : divertir et relier les publics à travers des récits, tout en portant une nouvelle génération d'auteurs du monde entier. - Wattpad

Autrement dit, les plateformes restent à l'affût, mais agissent encore avec prudence. Accumuler les contenus, pour commencer, permet de multiplier le trafic. Toutefois, une trop mauvaise expérience des utilisateurs peut aussi les amener à déserter une application ou une librairie en ligne...

Un domaine public multiplié ?

À ce jour, il reste par ailleurs complexe de déterminer le statut légal de tous ces textes rédigés par des IA : étant donné qu'aucune intervention humaine n'aurait participé à la conception de l’oeuvre, celle-ci ne pourrait pas être couverte par le droit d'auteur, du moins aux États-Unis.

En février dernier, le Copyright Office avait en effet tranché, au moins de manière temporaire : le copyright ne pouvait s'appliquer qu'à des éléments reconnus comme le fruit d'une création humaine. Allant plus loin, l'institution américaine ajoutait même que les fameuses prompts, ou les directives données à l'IA par l'utilisateur, ne pouvaient pas être assimilées « aux éléments traditionnels de l'auctorialité ».

Tous ces textes commercialisés relèveraient donc en réalité du domaine public : chacun pourrait s'en emparer et les vendre à son tour, dans une autre édition.

Du côté de l'Union européenne, un règlement, qui reste à adopter, pourrait obliger à la présence d'une mention, en cas de contenu créé avec ou par une intelligence artificielle.

Une chose est certaine : les IA auront de quoi lire, à l'avenir.

Photographie : illustration, Matthew Hurst, CC BY-SA 2.0