Depuis quelques années, une question capitale agite juristes, auteurs, éditeurs et technologues : jusqu’où les entreprises développant des intelligences artificielles peuvent-elles exploiter des œuvres protégées sans compensation ? Cette interrogation n’est plus théorique : elle se joue aujourd’hui dans plusieurs tribunaux américains et prend une acuité particulière avec l’arrivée de Gemini, le produit d’intelligence artificielle générative de Google.

Action coordonnée des éditeurs contre Gemini

L’affaire, portée devant la cour fédérale du district nord de Californie, accuse Google d’avoir « copié des millions de livres pour construire et entraîner son produit commercial d’IA générative, Gemini ». Les éditeurs demandent à être reconnus officiellement comme représentants de toute une catégorie de parties intéressées — les propriétaires de droits — dont les œuvres auraient été utilisées de la même manière sans accord ni rémunération.

Dans leur plainte, Cengage et Hachette identifient dix œuvres représentatives prétendument exploitées par Google sans permission, parmi lesquelles Principles of Economics de M. Gregory Mankiw, Innocent de Scott Turow ou encore The Fifth Season de N.K. Jemisin. Cette démarche vise à « fournir un niveau d’expertise et de preuves d’une importance capitale pour la poursuite de la lutte visant à tenir les entreprises d’IA responsables en vertu de la Copyright Act », selon le communiqué de l’AAP.

Maria A. Pallante, présidente et directrice générale de l’AAP, a souligné que Google et d’autres entreprises technologiques auraient jusque-là ignoré les règles fondamentales de droit d’auteur, en se prétendant partiellement exemptées de l’obligation d’obtenir des licences. Elle appelle à « sortir de ces premières années de développement de l’IA sans règles claires pour revenir à des partenariats symbiotiques que le droit d’auteur a toujours encouragés ».

Fair use et grandes technologies

Pour comprendre l’enjeu de cette intervention, il faut replacer l’affaire dans un tableau juridique beaucoup plus large. Aux États-Unis, la doctrine du fair use (usage loyal) permet, dans certains cas, l’usage limité d’œuvres protégées sans licence. Cette doctrine est au cœur d’un débat intense sur la légalité de l’entraînement des modèles d’IA sur des œuvres soumises au droit d’auteur.

Plusieurs tribunaux fédéraux ont rendu, en 2025, des décisions qui semblent parfois contradictoires ou, du moins, nuancées. Dans au moins deux affaires jugées dans le même district que celle opposant les éditeurs à Google, les juges ont estimé que la copie d’œuvres protégées pour entraîner des IA pouvait constituer un fair use, en se fondant sur le caractère « hautement transformationnel » de l’usage : autrement dit, les modèles auraient une finalité différente des œuvres originales, ce qui pèse en faveur de la défense.

Pourtant, ces décisions ont laissé ouverte une zone de tension majeure : dans l’affaire Anthropic v. Bartz, le juge a jugé que la constitution d’une bibliothèque interne de copies de livres obtenues par des voies illicites (par exemple via des sites de livres piratés) ne pouvait être couverte par le fair use et devait être considérée comme une violation de droit d’auteur.

Ainsi, même lorsque l’usage de livres pour entraîner des modèles d’IA est jugé « transformateur », il n’est pas automatiquement légitime si la source des données est elle-même obtenue de manière non autorisée. Cette distinction jurisprudentielle complexifie considérablement la stratégie des géants de la technologie et ouvre la voie à des revendications plus étendues de la part de détenteurs de droits.

Une bataille d’ampleur mondiale

Si les États-Unis concentrent aujourd’hui une intense activité judiciaire, ce débat ne se limite pas à ce territoire. En Europe, des procès comme Like Company v. Google devant la Cour de justice de l’Union européenne (CJEU) interrogent la reproduction et la communication d’extraits substantiels de contenus protégés par des chatbots comme Gemini sans autorisation préalable. Cette affaire européenne pourrait imposer des normes strictes aux opérateurs d’IA sur le vieux continent également.

Au niveau politique, des initiatives législatives telles que le Generative AI Copyright Disclosure Act aux États-Unis proposent de contraindre les entreprises à déclarer les œuvres protégées utilisées pour entraîner leurs IA, ce qui reflète une volonté croissante de transparence envers les titulaires de droits.

Des procès multiples : IA péril en la demeure

L’affaire contre Google s’inscrit dans un mouvement plus vaste : des dizaines de procès similaires ont été déposés contre des entreprises d’IA pour avoir, selon les plaignants, utilisé sans licence des textes, des images ou des œuvres musicales pour entraîner leurs modèles. Certains de ces litiges concernent directement des secteurs créatifs variés, comme des auteurs de livres, des compositeurs ou des artistes visuels.

Par exemple, une action collective a été intentée contre Apple pour son système Apple Intelligence, accusé d’avoir incorporé des ouvrages protégés sans autorisation dans ses données d’entraînement.

Ces multiples fronts judiciaires révèlent une même préoccupation : le fair use tel qu’interprété aujourd’hui ne constitue pas une réponse juridique stabilisée et sûre pour les détenteurs de droits dans le contexte nouveau de l’IA. Les juristes estiment que ces débats pourraient, à terme, redéfinir la frontière entre innovation technologique et respect des droits de propriété intellectuelle.

Quid des éditeurs, auteurs et... des technologies ?

Pour les éditeurs, l’intervention directe dans l’affaire Google représente une étape stratégique : elle affirme que les maisons d’édition ne sont pas de simples témoins, mais des acteurs à part entière de ce débat. Elles entendent non seulement défendre leurs propres intérêts, mais également clarifier des principes que les tribunaux auront à trancher.

Leurs préoccupations regroupent la reconnaissance des droits de propriété, la protection des revenus issus de la création intellectuelle, et la possibilité de négocier des licences équitables avec des entreprises technologiques.

Du côté des technologues, l’enjeu est tout aussi crucial : l’accès libre à des corpus massifs de données a été un moteur central de la progression des modèles génératifs. Restreindre cet accès ou en faire un objet de compensation pourrait redessiner les contours économiques de l’intelligence artificielle, privilégiant peut-être des plateformes capables de payer pour des licences au détriment d’acteurs plus petits.

Au cœur de cette bataille, la question essentielle reste : comment concilier le besoin de données pour entraîner les systèmes d’IA avec la protection des droits de ceux qui créent ces données ? Les réponses ne sont pas univoques ni définitives. Les tribunaux américains ont montré que fair use pouvait protéger certains usages, mais qu’il n’était pas une panacée face à l’usage massif d’œuvres sans licence.

