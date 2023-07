Les outils basés sur l'intelligence artificielle, notamment les célèbres agents conversationnels, seraient-ils issus d'un vol à grande échelle ? Aux États-Unis, deux plaintes l’assurent, déposées à quelques jours d'intervalle seulement.

Dans les deux cas, des auteurs affirment que leurs ouvrages ont été utilisés dans le cadre d'un apprentissage automatique, permettant d'améliorer la compréhension des requêtes et la rédaction des réponses des agents conversationnels.

Des sources illégales ?

Les trois auteurs à l'origine des plaintes, Sarah Silverman, Christopher Golden et Richard Kadrey, plaident leur cause auprès d'une cour californienne, dans un document déposé le 7 juillet dernier. Ils assurent que ChatGPT et LLaMA ont été « entrainés » à l'aide des contenus de leurs ouvrages respectifs, sans qu'aucune autorisation n'ait été donnée, ni compensation versée par les entreprises, rapporte Gizmodo.

Les agents conversationnels que sont ChatGPT et LLaMA sont mis au point à l'aide d'une grande quantité de textes, qui leur permet de s'améliorer et de fournir des réponses plus pertinentes, mais aussi mieux tournées. Les écrits utilisés pour l'apprentissage automatique de ces outils sont publiquement accessibles, mais il semblerait que certains d'entre eux soient couverts par le copyright...

OpenAI comme Meta promettent que les développeurs n'ont pas eu recours à ce type de contenus protégés, mais les deux plaintes assurent que des sources illicites ont été mises à contribution : Library Genesis, Z-Library, Sci-Hub ou encore Bibliotik, autant de plateformes fâchées avec les éditeurs et ayants droit...

Pour appuyer sa plainte, Sarah Silverman fait état d'un interrogatoire adressé à ChatGPT, dans lequel il est demandé à l'agent conversationnel de résumer ou d'expliquer différentes parties de l'ouvrage, jusqu'à la dernière... Bien entendu, l'outil s'exécute à chaque fois.

Un cabinet spécialisé

Le 28 juin dernier, deux autres auteurs américains, Paul Tremblay et Mona Awad, portaient plainte contre OpenAI, à San Francisco. Ils accusaient eux aussi l'entreprise américaine d'avoir « alimenté et entrainé ChatGPT » avec leurs œuvres protégées par le droit d'auteur, « sans consentement, sans mention des sources et sans compensation ».

Leur plainte s'inscrivait dans une possible action collective, invitant d'autres écrivains ou artistes à les rejoindre. La proximité entre cette procédure et celle qu'ont ouverte Silverman, Golden et Kadrey laisse deviner une origine commune : deux avocats, Joseph Saveri et Matthew Butterick, à la tête de leur cabinet respectif.

Ils portent ensemble les deux plaintes et revendiquent, sur leur site, « des procédures contre ChatGPT et LLaMA, des plagiaires à la capacité industrielle qui vont à l'encontre des droits des auteurs de l'écrit. [L]'intelligence artificielle doit être équitable et éthique pour tous. »

Pour l'instant, les deux sociétés restent discrètes vis-à-vis de ces attaques en justice. En mai dernier, Sam Altman, PDG d'OpenAI, a laissé entendre que sa société travaillerait à un système permettant de rémunérer les créateurs dès lors qu'une intelligence artificielle « s'appuie sur [leur] style », selon ses propres termes.

Photographie : illustration, Alpha Photo, CC BY-NC 2.0