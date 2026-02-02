Nouveau Monde Editions affirme que plus de 200 livres de son catalogue ont été exploités sans accord dans le cadre de l’entraînement du modèle de Mistral AI. Son fondateur, Yannick Dehée, indique avoir demandé à la start-up d’indemniser les auteurs et ayants droit concernés.

L’éditeur précise avoir contacté directement Mistral AI et rappelle que l’entreprise bénéficie de financements publics. Il souligne également que certains de ses ouvrages traduits ont déjà été utilisés sans autorisation par des sociétés d’IA aux États-Unis, donnant lieu à des accords amiables assortis de compensations financières élevées.

Un porte-parole de Mistral AI réfute en bloc : « Les modèles sont entraînés, testés, validés sur un ensemble diversifié de données couvrant plusieurs langues et régions géographiques. » Selon l'entreprise, ces éléments proviennent de sources publiques, de contenus sous licence et de données générées en interne – et qu’en outre, aucun accord n’a été signé avec Nouveau Monde Editions.

Des soupçons liés à l’usage de bases de données pirates

Yannick Dehée met en doute la version de Mistral AI et s’interroge sur une possible utilisation de données issues de Library Genesis, une base de données pirate recensant des millions d’ouvrages protégés. Ces interrogations font écho à une enquête de Mediapart publiée en décembre 2025 : le directeur scientifique de Mistral AI y évoquait l’utilisation massive de livres provenant de cette plateforme pour entraîner des modèles d’IA.

Ces soupçons sont renforcés par une autre investigation de Mediapart portant sur les activités passées de Guillaume Lample, cofondateur et directeur scientifique de Mistral AI, lorsqu’il travaillait chez Meta en 2022. Des documents judiciaires américains indiquent qu’il aurait supervisé le téléchargement d’environ 70 téraoctets de données depuis Library Genesis, via un protocole Torrent, dans un contexte de course technologique face à OpenAI.

Des pratiques connues en interne qui étaient discutées au sein des équipes de recherche. Meta a toutefois indiqué ne pas avoir utilisé ces données pour la première version de son modèle LLaMA, publiée en février 2023, cosignée notamment par Guillaume Lample avant son départ de l’entreprise.

Un contexte judiciaire déjà tendu autour de l’IA

L’action de Nouveau Monde Editions intervient alors que les éditeurs et auteurs français ont déjà engagé des procédures similaires contre d’autres acteurs de l’IA. En mars 2025, le Syndicat national de l’édition (SNE), la Société des Gens de Lettres (SGDL) et le Syndicat national des auteurs et des compositeurs (SNAC) ont assigné Meta en justice pour contrefaçon et parasitisme économique, lui reprochant l’utilisation d’œuvres protégées pour entraîner son modèle Llama sans autorisation.

Les plaignants estiment que Meta s’est appuyé sur des corpus issus de bases de données pirates pour développer ses modèles d’intelligence artificielle. Elles demandent la reconnaissance de ces usages illicites, des compensations financières et la cessation de l’exploitation des œuvres concernées, afin de faire respecter le droit d’auteur dans l’entraînement des IA.

Des risques financiers et réglementaires pour Mistral AI

D'après Les Numériques, l’affaire arrive également dans un contexte réglementaire renforcé : depuis août 2025, le règlement européen sur l’intelligence artificielle impose aux fournisseurs de modèles d’IA à usage général de publier un résumé détaillé de leurs données d’entraînement, un document que Mistral AI n’a pas encore rendu public.

En France, une proposition de loi relative à l’instauration d’une présomption d’exploitation des contenus culturels par les fournisseurs d’intelligence artificielle a jailli voilà quelques semaines.

« Cette proposition de loi vise à présumer devant le juge qu’une œuvre protégée par le droit d’auteur a pu être utilisée par une Intelligence artificielle en particulier pour son entraînement, et ce sur la base d’indices rendant vraisemblable cette utilisation. Il s’agit d’une présomption dite “réfragable”, le fournisseur d’IA ayant la faculté de démontrer qu’il n’a pas procédé à un tel usage », rappelle le SNE, dans un récent communiqué.

Et d’oublier allégrement que les conditions de la présomption de culpabilité vont à peu près à l’encontre du droit français : « Ce serait donc aux opérateurs de prouver qu’ils n’ont pas pillé les œuvres et non plus aux titulaires de droits de prouver que leur création a été utilisée », pointe le SNE.

Dans une analyse juridique où aucun ouvrage n’a été piraté, ActuaLitté montrait clairement que ni le droit français ni le droit européen ne permettaient un tel outil. « Ce déséquilibre est aggravé par l’atteinte portée au principe d’égalité des armes : à une preuve quasi impossible imposée au défendeur répond une simple exigence d’“indice vraisemblable” pour le demandeur. Une telle asymétrie est incompatible avec un procès équitable, dès lors qu’elle prive l’une des parties de la possibilité réelle de faire valoir ses moyens », écrivions-nous, pour mémoire…

En l’absence d’accord amiable, le différend entre Nouveau Monde Editions et Mistral AI pourrait déboucher sur une procédure judiciaire. Au-delà du risque financier, Yannick Dehée estime que l’impact principal pour Mistral AI serait réputationnel, susceptible de fragiliser ses relations avec des partenaires français et européens.

