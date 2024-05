OpenAI avait d'abord résisté à la demande de l'Authors Guild, en mettant en avant des questions de confidentialité, avant de révéler que ces données, qui n'étaient plus utilisées depuis la fin de l'année 2021, avaient été supprimées courant 2022.

L'entreprise a par ailleurs affirmé que ces données n'avaient pas été utilisées pour former les derniers modèles d'IA à disposition du public — comprendre ChatGPT 3.5 et 4. OpenAI a alors demandé au tribunal de maintenir sous scellé les informations concernant ces bases de données, ainsi que le nom des deux employés qui en sont à l'origine, et qui aujourd'hui ne travaillent plus pour la start-up. L'Authors Guild s'est opposé à cette demande, arguant du droit du public à être informé.

Quelques gros auteurs — parmi lesquels G.R.R. Martin, Jodi Picoult, John Grisham ou encore Jonathan Franzen — s'étaient alliés à l'Authors Guild dans son combat. Ces derniers s'estiment lésés par l'utilisation, non autorisée et ne donnant lieu à aucune compensation, qui est faite de leur travail protégé par le copyright.

La start-up est également soupçonnée de s'être servie dans des répertoires illicites d'œuvres, comme la plateforme pirate Z-Library, pour remplir ses différentes bases de données servant à l'entrainement des outils d'intelligence artificielle.

Une pluie de procès pour les IA

En plus de son procès contre l'Authors Guild, qui débutait en septembre dernier, OpenAI fait face à d'autres procédures — dont certaines visent également Méta et son outil LLaMA — ouvertes par des auteurs en juin, juillet, et septembre 2023, avec à chaque fois les mêmes griefs faits à l'entreprise.

En novembre, c'était au tour de Julian Sancton de passer à l'attaque, ce dernier affirmait que ChatGPT avait été développé à l'aide de son livre Cauchemar en Antarctique (traduit en français par Odile Demange, Payot). Il en tenait pour preuve une conversation avec l'IA elle-même qui avait alors simplement reconnu : « Oui, le livre Cauchemar en Antarctique de Julian Sancton fait bien partie de mes données d'entrainement ».

En décembre, le New York Times venait ajouter son grain de sel, accusant OpenAI d'avoir utilisé sans autorisation une quantité d'articles du journal, toujours pour l'entrainement ses technologies d'intelligence artificielle.

Sans oublier la lettre ouverte à destination de OpenAI (concepteur de ChatGPT), Alphabet (maison-mère de Google), Meta (celle de Facebook), Stability AI (derrière Stable Diffusion), IBM et Microsoft, publiée en juillet par l'Authors Guild, et signée entre autres par Dan Brown, James Patterson, Jennifer Egan, Suzanne Collins, Margaret Atwood, Jonathan Franzen, Roxane Gay, Celeste Ng, Louise Erdrich, Viet Thanh Nguyen ou encore George Saunders.

10.000 écrivains y parlaient d'une seule voix pour dénoncer l'usage qui était fait de leurs écrits. Ils y réclamaient l'obligation de la part des entreprises d'obtenir un accord explicite des auteurs pour l'usage de leurs textes, le versement d'une compensation lorsque ces textes étaient utilisés pour entrainer les machines, ainsi que d'une rémunération pour l'intéressé lorsqu'il était demandé à l'IA d'écrire « à la manière de » tel ou tel auteur.

OpenAI prépare la suite

En janvier, dans le cadre d’un questionnaire de la Chambre des Lords du Royaume-Uni, OpenAI admettait qu'« il serait impossible d'entraîner les modèles d'IA leaders d'aujourd'hui sans utiliser de matériaux protégés par le droit d'auteur ».

La défense des entreprises qui développent des modèles d'intelligence artificielle repose alors sur une spécificité du droit américain, le fair use. Elle permet l'utilisation, dans certaines circonstances, de contenu protégé sans en demander la permission du propriétaire.

Et c'est sans doute, en partie, pour se préparer à une issue défavorable dans ses différents procès qu'OpenAI commence à s'ouvrir à la conclusion d'accord avec différents acteurs du monde de l'édition et de la presse.

Dernièrement, l'entreprise a annoncé un partenariat avec le Financial Times. Le média rejoint ainsi l’agence de presse américaine Associated Press, le quotidien espagnol El País, le groupe allemand Axel Springer ou encore Le Monde en France. Ces alliances permettent à OpenAI de piocher dans l'immense corpus d'articles que ces groupes ont à disposition pour améliorer ses solutions d'IA générative.

Crédit image : fabio / unsplash