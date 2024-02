En juillet 2023, Sarah Silverman, Christopher Golden et Richard Kadrey portaient plainte contre OpenAI et Meta, à l'origine des outils ChatGPT et LLaMA, assurant que ces derniers ont été mis au point à l'aide des contenus de leurs ouvrages respectifs, sans qu'aucune autorisation n'ait été donnée, ni compensation versée par les entreprises.

Les larges modèles de langage, à la base des programmes comme ChatGPT et LLaMA, sont en effet « entrainés » à l'aide d'importants volumes de textes accessibles sur le web. Certains d'entre eux sont en accès libre et dans le domaine public, mais d'autres sont protégés par le droit d'auteur...

Le fair use dans la balance

Deux avocats, Joseph Saveri et Matthew Butterick, à la tête de leur cabinet respectif, plaident la cause des auteurs dans cette affaire. La plainte qu'ils défendent était assez large, puisqu'elle accusait OpenAI de violations du droit d'auteur, mais aussi de compétition déloyale, d'infractions au Digital Millennium Copyright Act ou encore de violation du copyright par procuration.

La juge Araceli Martínez-Olguín, chargée du cas, a déclaré, ce lundi 12 février, irrecevables plusieurs de ces revendications, ne conservant que l'accusation de violations du droit d'auteur. Elle laisse toutefois jusqu'au 13 mars prochain aux auteurs pour amender leur plainte, et éventuellement ajouter des pièces décisives pour leurs autres demandes, précise Bloomberg Law.

Si la décision de la juge Araceli Martínez-Olguín peut paraitre défavorable aux auteurs, elle leur permet de conserver le cœur de leur plainte, les violations du droit d'auteur. De son côté, OpenAI a d'ores et déjà reconnu qu'« il serait impossible d'entrainer les modèles d'IA leaders d'aujourd'hui sans utiliser de matériaux protégés par le droit d'auteur », dans un courrier envoyé en janvier dernier à la Chambre des Lords, au Royaume-Uni.

Ce qui ressemble à un aveu ne constitue pas pour autant une preuve définitive de la violation du copyright par OpenAI. La société défend en effet une interprétation juridique qui placerait l'entrainement des IA sous le régime du fair use. Ce dernier permet des exceptions au copyright dans certaines situations, notamment la recherche ou les buts pédagogiques.

Les développeurs d'IA devront encore prouver que ces usages des textes ne représentent pas un préjudice trop important pour les auteurs et la société, que d'autres alternatives n'étaient pas envisageables (comme le recours à des licences commerciales) et que les différents critères encadrants le fair use sont réunis.

Photographie : illustration, Focal Foto, CC BY-NC 2.0