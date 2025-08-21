Une affaire appelée à faire jurisprudence. Depuis novembre 2024, l’agence de presse indienne ANI engage un bras de fer avec OpenAI. Cette dernière accuse la société américaine à l’origine de Chat GPT d’avoir utilisé, sans autorisation, ses dépêches, y compris celles réservées à ses abonnés, pour entraîner son modèle d’intelligence artificielle générative.

L’affaire, portée devant la Haute Cour de Delhi, pourrait bien faire date, car elle interroge le fondement même de l’apprentissage des intelligences artificielles. L’enjeu est de savoir si cette pratique, appelée text and data mining, relève d’une exception juridique ou constitue une violation du droit d’auteur.

Quatre questions décisives

À ce sujet, la Cour de Delhi a formulé, le 19 novembre 2024, quatre questions clés : le stockage des données d’ANI pour entraîner ChatGPT constitue-t-il une violation du droit d’auteur ? La génération de réponses par l’IA à partir de ces contenus relève-t-elle d’une infraction ? L’usage de ces dépêches peut-il être justifié au titre de l’exception de fair dealing prévue à l’article 52 ? Les tribunaux indiens sont-ils compétents, alors que les serveurs d’OpenAI sont situés aux États-Unis ?

L’agence de presse a demandé d’interdire à OpenAI toute utilisation de ses dépêches, et de restreindre l’accès de ChatGPT à ses contenus, y compris ceux qui sont repris par ses médias partenaires. De son côté, OpenAI affirme avoir retiré aninews.in de ses bases de données depuis octobre 2024.

Une exception pour Chat GPT ?

Pour éclairer la décision de la Cour, deux experts juridiques ont été nommés : Arul Scaria et l’avocat Adarsh Ramanujan. Tous deux ont exposé leurs arguments lors des audiences des 21 février et 10 mars. Ces derniers estiment que l’agence de presse doit d’abord prouver que ses contenus bénéficient d’une protection par le droit d’auteur, et qu’elle en détient la propriété légitime.

Si les spécialistes tombent d’accord sur le fait que les actes d’Open AI touchent au droit de reproduction, leur analyse de l’applicabilité des exceptions légales aux différentes étapes de l’entraînement d’une intelligence artificielle diverge fortement.

D’un côté, Arul Scaria soutient une approche souple et relativement techno-optimiste. Selon lui, l’entraînement de l’IA, qu’il compare à l’apprentissage humain, relève d’un usage non expressif et devrait, à ce titre, entrer dans le champ de l’exception prévue pour la recherche ou l’usage personnel.

Il plaide ainsi pour une interprétation étendue des exemptions, qui inclurait également les usages commerciaux des systèmes d’intelligence artificielle.

La question clé de la tokenisation

À l’opposé, l’avocat Adarsh Ramanujan défend une lecture stricte du droit d’auteur. Selon lui, l’entraînement d’une IA repose sur trois étapes : la collecte, la tokenisation, c’est à dire le découpage d’un texte en éléments analysables par une IA pour qu’elle puisse « comprendre » le langage, et l’entraînement.

Seule la tokenisation, assure-t-il, pourrait éventuellement relever d’un usage non expressif. Les deux autres étapes impliquent une reproduction réelle des œuvres, ce qui requiert l’accord préalable des ayants droit.

De son côté, l’avocat d’ANI a repris l’analyse proposée par Adarsh Ramanujan. Mais pour lui, chacune de ces phases constitue une violation du droit d’auteur — la tokenisation des données relevant d’une adaptation de l’œuvre. À ces atteintes s’ajouteraient aussi celles constatées lors de la génération des résultats.

En Inde, Chat GPT à prix cassé

Ce bras de fer judiciaire, dont l’issue sera connue dans les prochains mois, se déroule dans un contexte économique particulier. Le 19 août, OpenAI a lancé en Inde ChatGPT Go, un abonnement à bas prix — 4 euros par mois — soit six fois moins que son offre standard. Cette version, la moins chère existant sur le marché, permet davantage de requêtes, d’analyses de fichiers, et propose une meilleure mémoire de session.

Selon Nick Turley, vice-président d’OpenAI, cette formule répond à une forte demande locale, le marché étant en pleine expansion. Et pour cause, il a annoncé que l’Inde était le deuxième marché mondial de l’entreprise, après les États-Unis, rendant d’autant plus cruciale la question du droit d’auteur.

L’Europe en quête de transparence

Du côté de l’Hexagone, et plus largement au sein de l’Union européenne, les lignes commencent à bouger. Face aux inquiétudes des auteurs et éditeurs sur l’utilisation massive de leurs œuvres sans autorisation explicite, la Commission européenne a mis en place un modèle standardisé, rendu obligatoire par le règlement sur l’intelligence artificielle (AI Act), entré en vigueur le 2 août 2025.

Ce document, que chaque fournisseur d’IA générale doit rendre public, détaille les sources de données utilisées pour l’entraînement des modèles : contenus publics, corpus privés, sites web explorés automatiquement, mais aussi interactions utilisateurs. Une mesure prise dans le but d’apporter de la transparence, permettre aux ayants droit d’exercer leurs droits et, le cas échéant, de demander réparation.

Par Louella Boulland

