Dans sa décision, le juge a estimé que les plaignants n’avaient pas apporté de preuves suffisantes montrant que l’usage de leurs ouvrages par Meta pourrait leur causer un préjudice financier. Parmi les titres cités figurent notamment le Prix Pulitzer La Brève et Merveilleuse Vie d’Oscar Wao de l’écrivain américain Junot Diaz ou The Bedwetter de sa compatriote Sarah Silverman.

Un avertissement pour les créateurs

Vince Chhabria a reconnu que dans la plupart des cas, il est effectivement illégal d'utiliser des œuvres protégées par le droit d’auteur pour entraîner des modèles d’intelligence artificielle sans obtenir l’autorisation ou rémunérer les titulaires des droits. Comme il l’a écrit : « En entraînant des modèles d’IA générative avec des œuvres protégées par le droit d’auteur, les entreprises créent quelque chose qui, bien souvent, va considérablement saper le marché de ces œuvres, et donc considérablement réduire l’incitation pour les êtres humains à créer des choses de manière traditionnelle. »

Toutefois, le magistrat a rappelé que son tribunal devait statuer sur la base des éléments concrets présentés par les parties. Dans ce dossier précis, les plaignants soutenaient que les agissements de Meta ne pouvaient être considérés comme relevant du « fair use » (usage raisonnable).

Pour rappel, le « fair use » correspond à une exception prévue par le droit américain, permettant, sous certaines conditions, l’utilisation d’œuvres protégées sans obtenir l’autorisation préalable de leurs titulaires. Cette exception s’applique notamment dans les domaines de l’enseignement, de la recherche ou de l’innovation technologique. Elle repose sur la section 107 du Copyright Act des États-Unis, adopté en 1976.

Ils affirmaient notamment que leurs créations étaient affectées par l’utilisation faite par Meta, car le modèle Llama serait capable de reproduire de courts extraits de leurs livres. Ils faisaient également valoir que l’utilisation de leurs ouvrages sans autorisation diminuait leur capacité à les monétiser via des licences pour l’entraînement d’IA.

Selon le juge, ces arguments sont « clairement voués à l’échec ». Il a considéré que Llama n’est pas en mesure de générer suffisamment de texte directement extrait des ouvrages concernés pour que cela soit significatif. De plus, il a estimé que les auteurs n’ont aucun droit exclusif sur le « marché des licences de leurs œuvres en tant que données d’entraînement pour IA ».

Meta défend de son côté le recours à l’IA en sources ouvertes, estimant que ces technologies « alimentent (…) la productivité et la créativité des individus et des entreprises ». Son porte-parole souligne que « l’usage raisonnable de contenus protégés par le droit d’auteur est un cadre légal essentiel à l’élaboration de cette technologie de transformation ». La formation des grands modèles de langage derrière l’IA générative nécessite en effet d’importantes quantités de données.

Le juge a néanmoins relevé qu’un autre angle d’attaque aurait pu donner l’avantage aux plaignants :

« L’argument selon lequel Meta aurait copié leurs livres pour créer un produit capable d’inonder le marché avec des œuvres similaires, entraînant ainsi une dilution du marché, aurait pu faire gagner les plaignants », a-t-il écrit. Mais selon lui, les auteurs « ont à peine effleuré cet argument et n’ont présenté aucune preuve permettant de montrer en quoi les productions de Llama pourraient diluer le marché ».

Et ainsi de préciser que « cette décision ne signifie pas que l’utilisation par Meta de contenus protégés par le droit d’auteur (…) est légale ». Il a également mis en garde contre les risques que représente l’intelligence artificielle pour l’économie du livre, en particulier si elle « rend possible la création d’un flot potentiellement continu d’œuvres concurrentes qui pourraient nuire » à ce secteur. « Nous sommes reconnaissants de la décision d’aujourd’hui », a malgré tout réagi un porte-parole de Meta, auprès de l’AFP.

Vague de procès contre l’IA

L’entreprise Anthropic, créatrice des IA Claude, a de son côté remporté une première victoire judiciaire face aux auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson, qui l'accusent, là-encore, de violer le droit d’auteur en entraînant ses modèles sur des livres protégés. Le juge William Alsup a estimé cette fois que l’achat légal et la numérisation d’ouvrages relevaient vien du « fair use », autorisant leur utilisation pour l'entraînement d'IA. Cependant, la partie du dossier portant sur l'usage massif de livres piratés reste à trancher.

Anthropic a utilisé, de son propre aveu, The Pile et Books3, bases de données contenant des œuvres piratées, ainsi que téléchargé des millions de livres via LibGen et PiLiMi.. Une décision sur d'éventuels dommages et intérêts est attendue. Malgré cela, Anthropic se félicite du jugement partiel en sa faveur, y voyant un signal en faveur de l’innovation.

Ces dossiers s’inscrit d’ailleurs dans la série d’une dizaine de procès très médiatisés, engagés contre les principaux acteurs du secteur de l’IA.

Douze plaintes visant OpenAI et Microsoft pour violation du droit d’auteur ont été regroupées devant un tribunal fédéral à New York. Parmi les plaignants figurent des écrivains célèbres comme John Grisham, Jonathan Franzen, George Saunders, George R.R. Martin, Ta-Nehisi Coates, Michael Chabon, Sarah Silverman, Junot Díaz, ou Jodi Picoult, ainsi que des médias comme le New York Times. Tous accusent les géants de la tech d’avoir utilisé leurs œuvres sans autorisation pour entraîner leurs IA.

Les organisations françaises du livre, dont le SNE, la SGDL et le SNAC, ont également assigné Meta en justice pour « contrefaçon » et « parasitisme économique », accusant le groupe d'avoir utilisé sans autorisation des volumes massifs d’œuvres protégées pour entraîner son IA Llama. Selon eux, Meta aurait eu recours à des bases comme Books3, contenant près de 200.000 livres piratés, dont des titres d’auteurs français. Meta admet l’utilisation partielle de ces bases mais conteste avoir besoin d’autorisation.

Cette action, présentée comme « exemplaire », s'inscrit dans une vague mondiale de procédures contre les géants de l'IA. Aux États-Unis, auteurs et médias multiplient les plaintes, s'appuyant sur des arguments similaires. En Europe, Meta pourrait invoquer l'exception de fouille de textes introduite en 2019, sous conditions strictes. Le procès sera examiné à Paris par la 3e chambre du tribunal judiciaire.

Photographie : Mark Zuckerberg, fondateur et PDG de Meta, en 2018 (Anthony Quintano, CC BY 2.0)

Par Hocine Bouhadjera

Contact : hb@actualitte.com