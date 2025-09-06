Il s’agit d’un véritable tournant dans le bras de fer juridique entre les créateurs de contenus et les entreprises d’IA. L’affaire fait figure d’exemple pour une industrie technologique habituée à puiser dans les données en ligne sans toujours se soucier des droits — une habitude qui, cette fois, présente une facture salée et retentissante.

Le conflit prend racine dans une pratique pour le moins controversée d’Anthropic. La jeune pousse californienne, fondée par d’anciens d’OpenAI, a admis avoir collecté un véritable trésor de guerre de textes piratés sur internet afin d’entraîner ses modèles d’IA. En tout, plus de 7 millions de livres numérisés issus de bibliothèques pirates ont été aspirés par Anthropic, sans autorisation ni rémunération des ayants droit.

Des millions de livres piratés pour entraîner l’IA

Parmi eux figuraient environ 200 000 ouvrages du corpus Books3, une base de données pirate bien connue, constituée initialement par des chercheurs pour alimenter des IA concurrentes. La moisson s’est ensuite poursuivie sur d’autres sites de piratage : pas moins de 5 millions de copies issues de Library Genesis (LibGen), célèbre repaire de livres piratés, et 2 millions de plus via Pirate Library Mirror.

Aux yeux des écrivains, ces agissements s’apparentaient à un pillage à grande échelle de leur travail. D’ailleurs, l’un des plaignants, l’auteure Andrea Bartz, a découvert que son propre roman figurait dans la collecte — une anecdote qui illustre le caractère concret de ce « butin » numérique. Trois auteurs américains — Andrea Bartz donc, accompagnée des écrivains Charles Graeber et Kirk Wallace Johnson — ont initié en 2024 un recours collectif contre Anthropic au nom de tous les auteurs affectés par ce siphonnage de livres.

Ils accusaient la société, soutenue financièrement par des géants comme Google et Amazon, d’avoir bâti l’intelligence de Claude sur des fondations piratées, sans se soucier ni de la loi ni de la juste rémunération des créateurs.

Fair use ou violation ? Débat tranché… en deux temps

Face à ces accusations, Anthropic s’est défendue en invoquant le fair use, cette doctrine du droit d’auteur américain qui tolère certains usages transformatifs de contenus protégés. En clair, entraîner une IA sur des textes existants pourrait, selon la startup, relever de l’utilisation équitable — un argument que d’autres entreprises tech brandissent également lorsqu’elles puisent dans des œuvres pour nourrir leurs modèles.

Et de fait, un juge fédéral de San Francisco, William Alsup, a partiellement donné raison à Anthropic en juin 2025 : selon lui, le simple fait de faire ingérer des romans à un algorithme ne constitue pas en soi une violation du copyright. Cette conclusion a soulagé les partisans d’une lecture large du fair use, ravis de voir la justice reconnaître un certain droit à l’expérimentation technologique.

Mais le diable se cachait dans les détails. Car le même juge Alsup a simultanément fustigé la manière dont Anthropic s’était procuré sa bibliothèque clandestine. Le problème majeur tenait dans la constitution d’une gigantesque « bibliothèque centrale » de plus de 7 millions de livres piratés : stocker ainsi des copies illégales, sans assurance qu’elles soient réellement nécessaires à l’entraînement, revenait à outrepasser le fair use.

En somme, même si l’usage éducatif par l’IA pouvait être toléré, l’acquisition et la conservation massive d’œuvres piratées, elle, portait atteinte aux droits des auteurs. Cette nuance juridique a ouvert la voie à un procès sur le terrain de la « piraterie » pure et simple, menaçant Anthropic de conséquences financières cataclysmiques.

Un règlement à l’amiable pour éviter la catastrophe

La perspective d’un procès en décembre 2025 faisait frémir la startup. Les experts agitaient des chiffres astronomiques : en cas de défaite, Anthropic risquait des dommages et intérêts pouvant atteindre des centaines de milliards de dollars — de quoi mettre l’entreprise à genoux, sinon purement et simplement la couler.

« On envisageait sérieusement des dommages de plusieurs milliards, assez pour potentiellement étrangler Anthropic ou la mettre en faillite », résume William Long, analyste juridique chez Wolters Kluwer. Consciente du danger, la société a préféré négocier la paix plutôt que livrer bataille jusqu’au bout.

Le compromis financier annoncé début septembre 2025 est colossal, mais il permet à Anthropic de refermer ce chapitre épineux sans reconnaître officiellement la moindre faute. Chaque œuvre concernée donnera droit à environ 3 000 $ de compensation pour son auteur.

Avec un inventaire provisoire d’environ 500 000 livres piratés identifiés dans la « bibliothèque » d’Anthropic, on arrive bien au total de 1,5 milliard de dollars. Et si d’aventure l’inventaire final révélait d’autres titres manquants, la note grimperait d’autant — Anthropic s’est engagée à allonger 3 000 $ supplémentaires par œuvre ajoutée à la liste.

Par ailleurs, l’entreprise devra détruire toutes les copies des fichiers piratés en sa possession, histoire de purger les archives et d’empêcher toute utilisation future des textes obtenus illégalement. On notera qu’en dépit du montant faramineux, Anthropic continue de nier toute responsabilité et présente le chèque géant comme un moyen de « passer à autre chose » tout en restant focalisée sur sa mission d’IA « sécuritaire et bénéfique ».

Les auteurs, eux, crient victoire — et il y a dans leur soulagement comme une pointe d’ironie. Voir une entreprise high-tech, valorisée à coups de milliards, devoir dédommager des romanciers à hauteur de 1,5 milliard de dollars ressemble presque au dénouement d’une fable moderne. Du jamais vu, estime l’un des avocats des plaignants, qui salue « le premier cas du genre à l’ère de l’IA ».

Auteurs et éditeurs enfin réunis

Mary Rasenberger, directrice de l’Authors Guild (le principal syndicat d’auteurs outre-Atlantique), voit dans cet accord « une étape vitale pour reconnaître que les entreprises d’IA ne peuvent pas simplement piller le travail des auteurs pour bâtir leurs modèles ». La sentence est claire : le temps du Far West numérique, où l’on pouvait se servir librement dans les œuvres en ligne, pourrait toucher à sa fin.

« L’Association of American Publishers (AAP) approuve l’accord transactionnel proposé dans l’affaire Bartz v. Anthropic, en vertu duquel Anthropic versera au moins 1,5 milliard de dollars pour régler les réclamations en contrefaçon de droits d’auteur liées à sa piraterie massive de livres, et détruira les œuvres qu’elle a téléchargées ou récupérées via les bases piratées LibGen ou PiLiMi », estime sa présidente Maria A. Pallante.

« L’accord proposé envoie un message clair et essentiel à toutes les entreprises d’intelligence artificielle : copier des livres issus de bibliothèques fantômes ou d’autres sources pirates pour en faire les fondations de leur activité entraîne de graves conséquences », ajoute-t-elle.

Un précédent qui ébranle l’écosystème

Cet arrangement historique ne concerne pas qu’Anthropic. Il jette une lumière crue sur l’ensemble de l’écosystème éditorial et technologique. D’autres acteurs majeurs sont déjà dans le collimateur des écrivains et éditeurs. OpenAI, le créateur de ChatGPT, fait l’objet d’une plainte similaire déposée en 2023 par l’Authors Guild au nom d’un groupe d’écrivains de premier plan.

Meta Platforms (la maison mère de Facebook) et Microsoft sont également visés pour l’utilisation présumée d’œuvres protégées dans l’entraînement de leurs IA. Plus récemment, Apple s’est à son tour retrouvé accusé d’avoir copié des livres sans autorisation pour améliorer ses systèmes d’IA.

Et la fronde ne s’arrête pas aux textes : dans le monde de l’art visuel, des artistes ont poursuivi en justice des générateurs d’images comme Stable Diffusion pour usage illégal de leurs illustrations, tandis que de grands labels de musique (tels Universal Music) reprochent à Anthropic d’avoir ingéré des paroles de chansons protégées afin d’entraîner son chatbot.

Les répercussions pour la tech

Elles sont vastes, autant le dire tout de suite. Sur le plan juridique, le règlement d’Anthropic crée un précédent de fait : il suggère que les entreprises d’IA pourraient devoir mettre la main à la poche et indemniser systématiquement les créateurs dont elles exploitent le travail.

Certes, la question de fond — à savoir dans quelle mesure l’utilisation de données protégées pour entraîner une IA relève ou non du fair use — reste ouverte. D’ailleurs, un autre juge californien, saisi d’un litige contre Meta, a estimé après l’affaire Anthropic que l’entraînement d’IA sans autorisation pourrait être illégal « dans de nombreux cas de figure ».

Le débat risque de se poursuivre, voire de monter jusqu’à la Cour suprême ou d’appeler une intervention du législateur pour clarifier la loi à l’ère des IA. En attendant, la régulation s’esquisse par des coups de semonce judiciaires : et celui qu’Anthropic vient d’essuyer donnera à réfléchir à plus d’une startup.

Entre soupirs et valises de billets

Du côté de l’industrie du livre, l’heure est à la fois au soulagement et à la réflexion. Soulagement, car ce règlement inédit prouve que les auteurs ne sont pas impuissants face aux géants de l’IA — il établit qu’entraîner un modèle n’exonère pas de respecter les droits d’auteur, en particulier lorsque les sources proviennent de sites illégaux. Mais réflexion aussi, car il va falloir imaginer la suite.

Cet argent versé aux auteurs (environ 3000 $ par livre piraté) représente certes une compensation bienvenue, mais il ne réglera pas tout.

L’émergence des IA génératives oblige désormais éditeurs et auteurs à repenser la valeur de leurs catalogues dans un monde où un modèle peut « lire » des milliers de romans en quelques heures. Va-t-on vers des partenariats entre éditeurs et entreprises d’IA, avec des licences négociées pour l’utilisation des œuvres dans l’entraînement des modèles ? Ou vers de nouvelles lois instaurant, par exemple, une rémunération obligatoire dès qu’une œuvre sert de matière première à une IA ?

Crédits illustration :

Par Nicolas Gary

Contact : ng@actualitte.com