Le document pointe un fait désormais indéniable : les systèmes d’IA générative sont « bâtis sur des œuvres protégées », dont ils reproduisent les structures à l’infini. Autrement dit, les machines apprennent à écrire… en lisant des livres.

Or ces corpus d’entraînement comprennent parfois des fonds entiers d’éditeurs, intégrés sans autorisation. L’affaire Books3, révélée en 2024, en fournit l’exemple le plus frappant : quelque deux cent mille titres, dont de nombreux ouvrages danois, auraient été aspirés pour nourrir des modèles de langage. Une utilisation illégale, dénoncée par les associations d’auteurs et les maisons d’édition, qui y voient une atteinte directe à la propriété intellectuelle.

Le rapport reconnaît que l’entraînement des IA repose « fondamentalement » sur des textes protégés, posant un défi juridique majeur. Il note aussi que les exceptions européennes de text and data mining (TDM), censées encadrer ces usages, restent ambiguës : dans les faits, difficile pour un éditeur de prouver qu’un modèle s’est servi de ses ouvrages.

Auteurs fragilisés, traducteurs écartés

Les chiffres cités par le groupe d’experts sont éloquents : au Royaume-Uni, 20 % des écrivains utilisent déjà l’IA pour une part de leur travail, tandis qu’un tiers des traducteurs et un quart des illustrateurs déclarent avoir perdu des contrats à cause de ces outils. Le risque est double : dilution de la valeur du travail humain et perte de revenus pour des professions déjà précarisées.

À cela s’ajoute la question du droit d’auteur. L’exemple d’un auteur américain ayant tenté d’enregistrer un ouvrage illustré avec Midjourney, refusé par l’office du copyright, illustre la frontière mouvante entre création assistée et production automatisée. Pour être protégée, rappelle le rapport, une œuvre doit rester « humaine » dans son essence — condition difficile à établir lorsqu’un texte passe par la moulinette d’un générateur.

Les éditeurs sur la défensive

Face à ce paysage instable, Danske Forlag, l’association des éditeurs du pays, conseille à ses membres d’ajouter dans leurs contrats et métadonnées des réserves explicites interdisant le TDM. Une parade encore fragile : la traçabilité des données utilisées par les géants de l’IA reste quasi inexistante.

Le rapport prône donc une transparence obligatoire : toute entreprise développant un modèle d’IA commercial devrait publier un résumé clair des œuvres exploitées pour l’entraînement. Faute de quoi, elle serait présumée avoir utilisé du contenu protégé.

En filigrane, c’est tout l’équilibre économique de la filière qui vacille. Si les machines peuvent produire des romans, des chroniques ou des traductions à coût nul, quelle place restera-t-il pour la création littéraire rémunérée ?

Langues menacées, diversité en péril

Autre inquiétude majeure : la domination de l’anglais. Le rapport danois avertit que la dépendance aux grands modèles anglo-saxons pourrait affaiblir la production littéraire nationale et marginaliser le danois dans l’écosystème culturel mondial. La Norvège a d’ailleurs lancé son propre modèle linguistique public pour préserver sa langue ; le Danemark est invité à suivre.

Derrière ce combat technique se cache un enjeu identitaire : un roman né d’un algorithme global perd, par essence, une part de singularité. Or la littérature, rappelle le rapport, ne se nourrit pas seulement de syntaxe, mais d’émotions, de mémoire et de voix humaines.

Vers un nouvel équilibre ?

Les experts danois ne se bornent pas au constat. Ils recommandent un arsenal de mesures : meilleure transparence, renforcement du droit des auteurs, sensibilisation des institutions et soutien au « contenu humain ».

Ils suggèrent même d’étudier un mécanisme de rémunération collective pour compenser les usages d’œuvres par les IA — un « domaine public payant » adapté au numérique.

L’objectif n’est pas d’ériger un mur contre la technologie, mais d’éviter que le livre devienne un simple gisement de données. Car si l’IA peut imiter le style, elle ne sait pas encore dire le monde. Et c’est peut-être là que se jouera, demain, la survie même de la littérature.

Le rapport (en danois) et son analyse (en anglais) sont disponibles à cette adresse.

Crédits photo : Bibliothèque municipale d'Herning - domaine public

Par Nicolas Gary

Contact : ng@actualitte.com