Les actions en justice se suivent et se ressemblent, aux États-Unis, contre les sociétés qui développent des intelligences artificielles et les outils qui vont avec. OpenAI, filiale de Microsoft qui porte notamment le médiatique ChatGPT, est ainsi visée par plusieurs plaintes d'auteurs qui dénoncent une utilisation non autorisée de leurs œuvres, sans aucune compensation.

Trois procédures ont déjà été ouvertes en 2023, le 28 juin, le 7 juillet et début septembre, par des auteurs et deux avocats, Joseph Saveri et Matthew Butterick, qui entendent mener la fronde.

La dernière charge contre OpenAI est collective : des auteurs s'estimant lésés peuvent la rejoindre, pour obtenir des compensations en cas de victoire devant la cour. Elle implique l'Authors Guild, organisation qui représente les écrivains américains, et plusieurs grands noms du secteur, de George R.R. Martin à Jodi Picoult, en passant par Jonathan Franzen ou David Baldacci.

Une « menace pour les auteurs »

Dans un communiqué, l'Authors Guild assure que, « sans les œuvres des plaignants, [OpenAI] proposerait des produits très différents », selon les termes de l'avocate Rachel Geman. « Le choix de copier les œuvres des plaignants, sans leur autorisation et sans verser de compensation, constitue une menace pour les auteurs et leurs revenus. »

Les intelligences artificielles derrière les outils comme ChatGPT sont entrainées à l'aide d'un volume massif de données, et notamment des textes accessibles en ligne. Ces derniers sont « lus » et traités par les algorithmes, afin d'en améliorer la vélocité, la compréhension des requêtes, mais aussi la cohérence des réponses fournies.

L'utilisation de textes couverts par le copyright par les sociétés de développement des intelligences artificielles a soulevé de nombreuses questions ces derniers mois. D'autant plus que l'accès à ces textes pourrait avoir été réalisé via des plateformes pirates, dont Library Genesis, Z-Library, Sci-Hub ou encore Bibliotik... Un moyen d'accéder à des réservoirs massifs de textes, sans alourdir la facture.

Par ailleurs, les auteurs reprochent aux créateurs d'IA de s'être passés de leur autorisation, mais aussi d'avoir omis de verser une compensation et d'avoir oublié toute notion de mention des sources.

En juillet, l'Authors Guild avait publié une lettre ouverte, cosignée par plus de 10.000 auteurs américains, réclamant plusieurs promesses des sociétés visées. Elles devaient, pour satisfaire l'organisation, s'engager « à obtenir le consentement, à créditer et à rémunérer équitablement les auteurs pour l'utilisation d'écrits protégés par le droit d'auteur à des fins d'entrainement de l'intelligence artificielle ». Visiblement, les discussions ne se sont pas déroulées comme prévu...

Copyright et fair use

La plainte de l'Authors Guild s'appuie sur plusieurs violations du copyright qu'auraient réalisées les entreprises. Dans l'accès aux textes, pour commencer, puisque l'organisation reprend l'hypothèse selon laquelle « les livres des plaignants ont été téléchargés depuis des répertoires pirates puis intégrés dans les rouages de GPT 3.5 et GPT 4, qui sont à la source de ChatGPT, utilisé par des milliers d'entreprises et d'applications, et grâce auquel OpenAI espère engranger des milliards ».

Une autre violation surviendrait par l'exploitation sans autorisation des œuvres des auteurs, qui ne peuvent pas, par ailleurs, s'opposer à celle-ci.

Enfin, l'Authors Guild assure que l'entrainement de ChatGPT par des créations littéraires permet à cette intelligence artificielle d'imiter le style de leurs auteurs, menaçant l'intégrité de leur œuvre et leur identité.

GPT est déjà utilisé pour générer des livres qui singent les travaux d'auteurs humains, comme la tentative récente de générer les volumes 6 et 7 de la saga Le Trône de fer de George R.R. Martin le montre, ainsi que d'autres ouvrages de l'IA postés sur Amazon pour essayer d'usurper l'identité et la réputation d'auteurs humains. – L'Authors Guild

« Il est impératif de mettre un coup d'arrêt à ce vol à grande échelle », martèle Mary Rasenberger, PDG de l'Authors Guild, dans un communiqué.

Se profile au tribunal un énième affrontement entre le copyright et le fair use, une sorte d'exception au premier, qui s'applique dans certains cas uniquement, notamment la recherche ou l'intérêt pédagogique. OpenAI et Meta (visé pour son IA LLaMA) ont tous deux mis en avant des usages permis par le fair use, pour se défendre des accusations de violations du copyright à leur égard.

Aux États-Unis, la question de l'utilisation de contenus sous droits à des fins d'entrainement des IA est loin d'être tranchée. Fin juillet, Joe Biden assurait que plusieurs sociétés technologiques avaient accepté, sur le principe, d'appliquer des « garde-fous » proposés par la Maison-Blanche, comme le fait d'intégrer des filigranes aux productions, pour faciliter la distinction entre une œuvre générée et une œuvre originale.

Mais aucune nouvelle d'un système de compensation, si ce n'est une vague promesse de Sam Altman, PDG d'OpenAI, quant à un système permettant de rémunérer les créateurs dès lors qu'une intelligence artificielle « s'appuie sur [leur] style » pour générer un texte.

L'Union européenne, pour sa part, travaille à un IA Act, qui intégrerait quelques mesures relatives au droit d'auteur, notamment une relative transparence quant aux données utilisées pour l'entrainement des IA et une information claire sur l'aspect artificiel d'une œuvre générée. Le Conseil des écrivains européens a appelé de ses vœux un meilleur encadrement des usages des textes, en imposant le recours à une licence aux sociétés — et donc le versement d'une compensation.

La plainte de l'Authors Guild est accessible ci-dessous.

Photographie : G.R.R. Martin, en 2016 (Gage Skidmore, CC BY-SA 2.0)