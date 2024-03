Depuis plusieurs mois, les plaintes se succèdent, aux États-Unis, contre les sociétés qui développent des technologies basées sur les larges modèles de langage et l'intelligence artificielle. Leur point commun ? Ces procédures judiciaires sont portées par des auteurs de l'écrit ou des illustrateurs.

Sarah Andersen, George R.R. Martin, Michael Chabon, Jodi Picoult, John Grisham, Jonathan Franzen ou même l'Authors Guild, organisation américaine d'auteurs, font partie des plaignants, dans une succession d'affaires impliquant OpenAI, Microsoft, Meta, ou les trois à la fois.

200.000 livres utilisés

La même situation judiciaire se répète, mais cette fois à l'encontre d'une nouvelle société, Nvidia, qui a créé sa plateforme NeMo. Cette dernière se présente comme un canevas sur lequel les chercheurs et développeurs sont invités à tisser leur propre infrastructure et de larges modèles de langage. Une sorte d'établi et de boîte à outils, lesquels incluent l'intelligence artificielle.

Trois auteurs, Brian Keene, Abdi Nazemian et Stewart O'Nan, affirment que leurs ouvrages font partie du corpus de quelque 196.640 livres utilisé par Nvidia pour « entrainer » l'outil technologique derrière sa plateforme NeMo.

D'après la plainte déposée auprès d'une cour de San Francisco ce 8 mars, les écrivains assurent que la mise hors ligne de ce corpus, pour « infraction au copyright », prouve que son utilisation, sans leur autorisation ni versement d'une compensation, place Nvidia dans une position indéfendable. Les plaignants citent des œuvres de 2007, 2008 et 2019, d'après Reuters.

Leur plainte pourrait déboucher sur une action collective, si d'autres créateurs s'estiment lésés par le comportement de Nvidia.

Une question récurrente

Pour l'instant, la défense de Nvidia ne s'est pas exprimée. Mais il est probable que les avocats de la multinationale adopteront une position semblable à celles d'OpenAI, Microsoft et Meta. À savoir que l'infraction au copyright n'en est pas une, mais que ce contournement est bel et bien permis par le fair use, ou usage loyal.

Cette doctrine propre à la législation américaine offre une certaine latitude face au copyright, mais dans des situations bien précises, comme la recherche ou l'éducation. L'intérêt général constitue aussi un motif important pour son appréciation par la justice.

À LIRE - Traduire par l'IA, le risque d'“un appauvrissement sensible de la langue”

Face aux plaintes qui s'accumulent, les sociétés technologiques se tournent de plus en plus vers cet argument. En janvier 2024, OpenAI avait même admis que l'utilisation d'œuvres protégées par le copyright était indispensable au développement des larges modèles de langage, sans pour autant s'estimer coupable d'infraction ou de spoliation des auteurs.

Pour l'instant, aucun tribunal n'a tranché quant à l'application du fair use à ce type d'usage. Une décision évidemment très attendue, aux conséquences multiples...

Photographie : illustration, EdTech Stanford University School of Medicine, CC BY-NC-ND 2.0