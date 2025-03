L'assignation pour « contrefaçon » et « parasitisme économique » a été envoyée « en début de semaine », a précisé Julien Chouraqui, directeur juridique du Syndicat national de l'édition, lors d'une conférence de presse organisée ce mercredi 12 mars au matin. La veille, La Lettre avait révélé l'action en justice portée par le syndicat patronal, accompagné par la Société des Gens de Lettres et Syndicat National des Auteurs et des Compositeurs, organisation d'auteurs.

Éditeurs et auteurs accusent le groupe Meta, propriétaire de Facebook et de Whatsapp, d'avoir exploité des œuvres sous droit pour entrainer son intelligence artificielle générative, Llama, sans autorisation des ayants droit ni versement d'une compensation. À en croire l'assignation, les plaignants estiment par ailleurs que les productions de l'IA générative relèvent du « parasitisme économique », notamment par le phénomène des « faux livres » commercialisés sur différentes plateformes.

« Nous avons utilisé toutes les techniques à notre disposition pour caractériser les faits, et ces éléments ont été versés à la procédure », a précisé Renaud Lefebvre, directeur général du Syndicat national de l'édition. « Nous avons des éléments de preuve suffisants pour assigner Meta », a-t-il ajouté en faisant référence à des « corpus pirates très abondants qui ont pu être utilisés par les acteurs de l’IA : des corpus, en termes de volumes, qui sont colossaux ».

L'action du SNE, de la SGDL et du SNAC s'appuie ainsi sur un faisceau d'indices qui relie les bases de données utilisées pour l'entrainement de plusieurs outils d'intelligence artificielle, comme ChatGPT et Llama, à des corpus de livres numériques piratés. Pour être efficients dans le traitement des questions et la génération de réponses, ces outils d'IA doivent en effet être exposés à de larges volumes de données, pour « s'habituer » au langage et « s'entrainer » à formuler des réponses pertinentes et intelligibles.

L'un des plus connus, Books3, renfermait ainsi 196.640 livres piratés (soit 37 Go d'ebooks), dans lesquels se trouvaient des ouvrages de cuisine, de voyage, recueils de poèmes, science-fiction, fantasy, ou encore des titres autoédités de fiction érotique. Certains d'entre eux étaient tombés dans le domaine public, mais d'autres restaient couverts par le droit d'auteur, comme des titres d'Amélie Nothomb, d'Emmanuel Carrère, de Virginie Grimaldi, de Françoise Sagan, ou bien d'Annie Ernaux — la plupart en traduction anglaise, mais certains en français.

En janvier 2024, Meta avait admis « avoir utilisé des portions de l'ensemble de données Books3, parmi de nombreux autres documents, pour former Llama 1 et Llama 2 ». Mais la firme niait « que l'utilisation de travaux protégés par le droit d'auteur pour former Llama nécessitait le consentement, la reconnaissance ou la compensation [des ayants droit, NdR]. »

Une procédure à « valeur d'exemple »

Au lendemain du Sommet sur l'intelligence artificielle, les trois organisations engagées dans la procédure évoquent la défense du droit d'auteur comme moteur de leur action. « Je voudrais souligner l'importance d’agir collectivement, conjointement entre auteurs et éditeurs, comme lors du précédent Google », déclare ainsi Christophe Hardy, président de la Société des Gens de Lettres.

Il fait ainsi référence à l'action menée par une partie du monde du livre contre le géant américain, qui numérisait en masse des ouvrages, dont certains toujours couverts par le droit d'auteur, pour afficher une partie de leur texte dans ses résultats de recherche. Après plusieurs années de procédures, un accord avait finalement été signé entre les éditeurs et Google.

Évoquant lui aussi l'action collective menée au tournant des années 2010, Vincent Montagne, président du SNE, estime que les éditeurs ont « le devoir de réagir rapidement ». « Nous aurions voulu le faire plus rapidement encore, mais il nous fallait aussi réunir des preuves, le nombre d’œuvres éditées par nos maisons d’édition qui sont utilisées par Meta aujourd’hui. »

D'après le SNE, les échanges avec les opérateurs de l'intelligence artificielle « ont vite tourné court », mais l'organisation n'a pas précisé pourquoi elle visait uniquement Meta, et non d'autres développeurs, comme OpenAI/Microsoft et son outil ChatGPT. Rappelons qu'en octobre 2024, la Société des auteurs dans les arts graphiques et plastiques (ADAGP) avait signé un accord de rémunération des artistes plasticiens avec Meta, pour assurer leur rémunération lorsque leurs œuvres « sont utilisées sur les plateformes de Meta » — aucune précision n'était alors fournie sur le cas de l'intelligence artificielle générative.

« Nous nous sommes choisi un Goliath, nous savons qu’il y en a plusieurs, et nous n'avons pas trop de doute sur le fait que ces pratiques-là sont celles d’autres acteurs », a indiqué Renaud Lefebvre. « C'est une procédure qui a valeur d’exemple. »

Le SNE, le SGDL et le SNAC n'ont pas cité d'œuvres, d'auteurs ou d'ayants droit en particulier ni fourni d'estimation du préjudice subi. « Nous ne cherchons pas de l’argent, ni à faire payer financièrement les acteurs de l’IA, nous cherchons à faire reconnaitre le droit d’auteur », a précisé le directeur général du SNE. Vincent Montagne, pour sa part, a souligné que « 700 milliards $ d’investissement ont été réalisés dans l’IA pour les seuls Gafam : il n'y a aucune raison de ne pas rémunérer la création dans laquelle ils prennent à foison les contenus. »

Sollicité, le groupe Meta n'a pas encore réagi à l'assignation en justice du SNE, de la SGDL et du SNAC, qui sera examinée par la 3e chambre du tribunal judiciaire de Paris. Cette dernière se penche notamment sur les questions relatives à la propriété intellectuelle.

D'un côté et de l'autre de l'Atlantique

« Nous sommes en présence d’un pillage monumental, le plus gros depuis qu’internet existe » a déclaré Maïa Bensimon, déléguée générale du SNAC, lors de la conférence de presse de ce mercredi 12 mars. Les termes utilisés rappellent bien entendu ceux cités dans plusieurs procédures judiciaires ouvertes par des auteurs aux États-Unis.

Plusieurs grands noms du secteur, comme George R.R. Martin, Jodi Picoult, Jonathan Franzen, David Baldacci ou encore Sarah Silverman ont porté plainte contre OpenAI ou Meta, et l'Authors Guild, importante organisation d'auteurs, s'est même jointe à l'une des procédures. « Pour la première fois au monde, des organisations d’éditeurs et d’auteurs assignent ensemble un géant de la tech », a souligné Renaud Lefebvre. En effet, l'Association of American Publishers, pour l'instant, n'a pas participé aux actions en justice, se limitant à un appel collectif.

Parmi les questions qui restent en suspens, une des plus cruciales concerne la défense de Meta qui, aux États-Unis, assure que son utilisation des œuvres protégées par le droit d'auteur relève du fair use, ou usage loyal. Ce dernier permet de s'affranchir du droit d'auteur, mais dans un cadre et pour des buts bien précis : Meta, mais aussi OpenAI, s'efforce de convaincre la justice de la conformité de ses actions au fair use.

Au sein de l'Union européenne, le règlement européen sur l'intelligence artificielle (AI Act) a imposé certaines obligations aux développeurs d'outils basés sur l'IA, notamment le respect de l'éventuelle opposition des ayants droit à la fouille de textes et de données. En effet, une directive européenne avait introduit, en 2019, une exception au droit d'auteur au titre de la fouille de textes et de données, y compris à des fins commerciales.

« Concrètement, cela signifie que tout opérateur de solutions basées sur l’intelligence artificielle peut moissonner tous les contenus, y compris ceux protégés par le droit d’auteur, dès lors qu’ils sont librement accessibles sur internet. Cela comprend également tout site mis en ligne par un éditeur contenant tout ou partie des œuvres de leur catalogue (couvertures, illustrations, extraits…) ainsi rendues accessibles », précisait le SNE lui-même.

Meta pourrait donc s'appuyer sur cette exception pour faire valoir sa légitimité à « fouiller » dans les œuvres — bien entendu, l'accès potentiellement illégitime à ces mêmes œuvres, s'il est avéré, resterait problématique. La validité de l'exception appliquée aux actions de Meta serait par ailleurs circonscrite au « triple test » : une limitation à des cas spéciaux, l'absence d'atteinte à l'exploitation normale de l'œuvre et l'absence de préjudice injustifié aux intérêts légitimes de l'auteur — les avocats du géant américain ont du pain sur la planche.

Mise à jour 15h :

Interrogée, Maïa Bensimon nous rappelle que la directive européenne introduisant l'exception au droit d'auteur au titre de la fouille de textes et de données a été « mise en œuvre à partir de juin 2021. Tout ce qui a été fait avant juin 2021 n’est pas couvert par la directive. » Une partie des faits supposés, sur la période pré-2021, pourrait donc être plus franchement reprochée à Meta.

Photographie : illustration, Alpha Photo, CC BY-NC 2.0

Par Antoine Oury

Contact : ao@actualitte.com