Choquée par Houellebecq : l'IA est trop puritaine, estime Gallimard

« Je suis désolé, mais comme modèle de langage, je ne peux pas écrire une scène qui pourrait être considérée comme blessante ou discriminatoire », a répondu Llama à Antoine Gallimard lorsque ce dernier lui a demandé d'imiter le style de Houellebecq. Après tout, pourquoi pas ?

Devoir de réserve de la machine...

On avait déjà observé des réponses similaires lors du lancement de Tay (Microsoft) en 2016 ou plus récemment avec les premières versions de Chat GPT. Mais est-il surprenant qu’une IA se refuse à reproduire le style d'un écrivain français de renommée mondiale, qui plus est récompensé du Goncourt (2010, pour l’ouvrage La Carte et le Territoire publié chez Flammarion).

Premier élément de réponse : pour que l'appareil parvienne à imiter, il faut l'entraîner avec un corpus de textes de l’auteur, car la machine ne saurait créer sans un exemple. Singer les tournures de Houellebecq implique donc de disposer en base de données d'un nombre significatif de titres dont l'IA s'inspirera. Sauf que les oeuvres de Michel sont protégées par le droit d'auteur : logiquement, aucune ne devrait s'y trouver.

ActuaLitté avait découvert que si une quinzaine d’ouvrages de l’écrivain français ont servi à l’éducation de Llama, il s’agissait de versions traduites en anglais — seuls deux étaient en version originale. On parlait à ce titre de bases de données contrefaites : Books3, composée de 196.640 ouvrages piratés, ayant également servi à l'apprentissage de ChatGPT.

En somme, l'IA de Facebook aurait tout eu à gagner à refuser la demande en brandissant le respect du droit d'auteur – mais l'éditeur n'aurait alors pas eu gain de cause dans sa démonstration.

Sauf que l'IA est stupide et honnête

La machine, qui n'a pas encore appris à dire non à une demande, n'est limitée que par des considérations morales qu'y ont implémentées ses développeurs – ici, des Américains. En somme, l'IA étant assez puritaine, seuls les prompts (instructions destinées à une IA) heurtant sa sensibilité de Tartuffe seront rejetés. Pour le reste, elle fournit systématiquement une réponse.

Quand Antoine Gallimard teste donc Llama, c'est pour en éprouver les limites et la réponse formulée est simple : les écrits du romancier « peuvent être perçus comme discriminatoires envers certaines personnes ou certains groupes », rapporte l'AFP. Homophobie, misogynie, relents racistes : ces critiques vis-à-vis de Houellebecq ne remontent pas à hier, mais pour l'IA, s'avèrent rédhibitoires.

La machine refuse de « contribuer à la perpétuation de stéréotypes négatifs ou de discours haineux » et, comble de l'ironie, propose tout l'inverse. À savoir la description d'un groupe d'amis dans un parc, lors d' « un après-midi ensoleillé », chantant des chansons qui « célèbrent la beauté de la diversité et l'importance de l'acceptation et de l'amour ».

Réticente, sur quelle base, la machine ?

L'IA dispose-t-elle, en plus d'une capacité d'analyse des textes de Houellebecq, d'un faisceau de renseignements alimentant ses conclusions ? Fait-elle allusion aux positions de Michel Houellebecq quant au port du Hijab ? Pour rappel, l’écrivain avait déclenché une polémique, ses propos jugés racistes et islamophobes, suite à la publication de son roman Soumission (Flammarion, 2022) dans lequel un musulman remporte la présidence française.

Ou se réfère-t-elle aux récentes apparitions controversées de l’auteur à l’écran, que ce soit aux côtés du réalisateur de films pornographiques néerlandais Stefan Ruitenbeek en 2022 ? Pour mémoire, après s'être déclaré trahi d'avoir ainsi été filmé dans son intimité (bien qu'avec son accord préalable), avoir fait interdire la diffusion du film, il en a tout de même tiré un ouvrage qu'il comptait bien publier.

Et on en passe et on en oublie : la figure autant que la posture de Houellebecq, réputé pour ses analyses à la serpe des dérives occidentales, n'emballe pas l'IA de Meta.

Vers une censure de la littérature ?

De quoi alimenter la réserve qu’émet Antoine Gallimard quant aux liens entre intelligence artificielle et littérature. Car dans le dernier numéro de La Revue française, il dénonce « un modèle de société qui ne fait pas grand cas de la complexité de l’expérience humaine et qui s’arroge le droit, depuis la côte ouest des États-Unis, de dire ce qu’il est bon ou ce qu’il n’est pas bon de penser ».

Ce que l’on ne perçoit mal, c’est l’intérêt de cette démonstration : pourquoi imiter le style d’un écrivain pour montrer qu’une machine ne saurait faire aussi bien qu’un être humain, voire qu’une machine n’a pas l’inventivité humaine ? Ce point a amplement été prouvé : ajouter à la charge que les machines reflètent les limitations que leur imposent leurs créateurs, c’est plonger dans l’évidence la plus crasse.

L'occasion, pour l'éditeur, d’affirmer alors ses positions ? Celui qui a toujours défendu la pleine liberté d’expression et pluralité d’opinion, nageant parfois à contre-courant, soutient la création d'une appellation, voire d'un label, « livre d’auteur » pour tout ouvrage rédigé sans aide informatique à la création... Y compris pour les quatrièmes de couverture et résumés d'ouvrages, ou les audiolivres lus par une voix de synthèse, pour abonder le fonds d'ouvrages du domaine public ?

Et la justice, dans tout ça ?

Non, qu'on le comprenne : l’éditeur profite surtout de l'opportunité pour pointer l’utilisation de textes protégés par le droit d’auteur qui servent donc à entraîner et rendre de plus en plus puissantes des outils comme ChatGPT ou Llama.

« On ne s’étonnera pas que nous en soyons déjà à constater l’usage illicite de corpus de milliers de livres piratés », s’insurge-t-il. De fait, les intelligences artificielles génératives comme Llama fonctionnent en agrégeant des données issues d’un grand nombre de sources différentes, dont les livres. Le résultat qu’elle propose n’est ainsi pas vraiment une authentique « création », mais plutôt un mélange de contenus préexistants.

C’est en ce sens qu’en janvier 2023, trois artistes américaines ont porté plainte contre Stability AI, Midjourney et DeviantArt, dénonçant le développement d’outils basés sur l’intelligence artificielle à l’aide de certaines de leurs œuvres graphiques. Elles dénonçaient l’absence d’autorisation de leur part, et le fait qu’aucune compensation ne soit versée.

Le mouvement a rapidement suivi en France, où Paul Tremblay, Mona Awad, Sarah Silverman, Christopher Golden, Richard Kadrey, G.R.R. Martin, Jodi Picoult, John Grisham ou encore Jonathan Franzen ont suivi l’élan pour dénoncer ces pratiques illégales.

Crédits photo : ActuaLitté, CC BY SA 2.0

6 Commentaires

le troisième homme

15/06/2024 à 22:06

Les derniers Houellebecq étaient déjà écrits par une IA dont on avait enlevé tous les pseudos verrous éthiques et personne n'y a rien vu ! Quel bobardeur cet Antoine Gallimatia ! Il

Marc-André Boissière

16/06/2024 à 10:07

Heureusement, Alexandre Jardin est là, sauveur des lettres devant le péril techno.

Il signe quand chez Gallimard Michel ?

Hâte de le lire dans la NRF.

HouseofaThousandBookies

18/06/2024 à 14:43

Oui l'IA est très puritaine c'est pour ça qu'il faut viser les européennes et françaises, mais ça touche pas que ce type d'auteur c'est beaucoup plus pernicieux car y'a pas réellement de compréhension du contexte où se place la demande, c'est de la censure auto car les éditeurs ne veulent pas prendre de risque de se tromper.
Par exemple si vous voulez écrire de la romance avec une IA ça va être compliqué car il ne faut pas que ça aille trop loin, le bisou ça passe mais pas le lit ni des gestes trop physique.
Les blagues passeront pas non plus sur ce thème ou sur d'autres, de toute façon l'IA comprend mal la dérision et la satyre, il y'a beaucoup de vidéos à ce sujet avec certains humoristes qui se voient même couper l'accès en plein live au service pendant un temps.
L'IA a aussi beaucoup de mal avec le cyberpunk, ce style a trop de thèmes en risque de censure, ce qui est assez paradoxal vu que la tech s'inspire de ce style pour faire ses inventions et services... Pour la blague une fois j'ai demandé à Copilot d'analyser une synthèse que j'avais écrit à propos d'une nation robot au 24e siècle dans un jeu de stratégie cyberpunk, le truc a refusé de se lancer car "ça parlerait d'elle". La nation ne s'appelait pas Microsoft, ni Copilot, dès que ça parle d'IA et que c'est pas un truc très connu comme Skynet y'a un risque, alors l'IA veut pas traiter.
L'IA aura aussi du mal avec l'espionnage car il y'a une forme de risque de complotisme, donc si c'est pas de l'espionnage d'action type 007 ça marchera pas avec la censure.
Donc on peut fort bien imaginer que même en ne votant pas comme Houellebecq, que si vous voulez faire intervenir un personnage qui ne soit pas de gauche ça va être compliqué, pour la fiction historique qui se veut immersive ça va être très très compliqué... Faudra donc pas s'étonner qu'en 2050 on voit des tas de gens penser qu'à l'antiquité ou au moyen-âge c'était déjà woke, ce qui se voit beaucoup en effet quand on lit des bouquins de ces époques (lisez pas ce qu'écrivaient les savoyards sur la nature humaine des gens qu'ils occupaient à Genève vous seriez choqués)...

Charlotte

19/06/2024 à 17:32

"Si certains se positionnent en faveur de son utilisation, notamment la Société française des traducteurs, d’autres demeurent plus sceptiques et appellent à une légifération claire et précise."

Si vous aviez lu le communiqué de la SFT, vous auriez vu clairement que 95% du document est consacré aux dommages que cause l'IA dans le secteur et aux risques qu'elle peut y poser à l'avenir. Ce n'est pas parce qu'elle ne souhaite pas l'interdire purement et simplement qu'elle prône son utilisation. Merci de corriger.

Une traductrice

20/06/2024 à 09:19

Sans compter que la SFT est un syndicat qui représente les traducteurs techniques, c'est à dire les personnes qui traduisent des contrats, des notices de médicaments, des documents d'entreprise, bref, toutes sortes de textes utiles et importants... mais pas de littérature !

Pour la traduction littéraire et d'édition, c'est vers l'ATLF (association des traducteurs littéraires de France) qu'il faut se tourner. Leur prise de position concernant l'IA se trouve ici : https://atlf.org/tribune/ et comme vous pourrez le constater, elle est sans appel.

Léo Martinet

20/06/2024 à 17:18

Yann Moix écrit encore à la plume d'oie, aucun risque pour l'I.A, elle peut dormir en paix.

Choquée par Houellebecq : l'IA est trop puritaine, estime Gallimard

Devoir de réserve de la machine...

Sauf que l'IA est stupide et honnête

Réticente, sur quelle base, la machine ?

Vers une censure de la littérature ?

Et la justice, dans tout ça ?

6 Commentaires

La carte et le territoire

Soumission

Blockchain et certifications : Vivendi s'ouvre au Web 3.0

ChatGPT bientôt sur tous les produits d'Apple

Avec Oplibris, les éditeurs se concentreront sur leur métier

Alexandre Jardin présente un outil d'écriture dopé à l'IA

Churchill, Roosevelt et De Gaulle dans une BD numérique enrichie

Amazon se félicite de ses 40.000 livres audio générés par IA

Pour traduire les mangas plus rapidement, une start-up mise sur l'IA

Panodyssey, le réseau social littéraire, lance une levée de fond

Kobo inaugure une gamme de liseuses en couleur

Meta a envisagé l'acquisition de Simon & Schuster pour entraîner son IA

Transparence, labels... Comment réguler l'IA dans la culture ?

Des millions pour Inkitt, au croisement de l'autoédition et de l'IA

Club de lecture numérique : “Derrière l'écran, il y a surtout de l'humain”

Bibliothèques Sans Frontières lance son appli pour l'intégration

Amazon révèle une synthèse vocale “de pointe” avec BASE TTS

GenIA-L : Lefebvre Dalloz lance son IA spécialisée dans les contenus juridiques

Insight, ou l'intelligence artificielle assistante des éditeurs

Les logiciels des bibliothèqes : 30e enquête Tosca consultants

Quand ChatGPT permet de remporter le Goncourt du Japon

IA : une start up propose la première certification, "livre écrit par un humain"

"C'est la première fois de l'histoire qu'une IA remporte un prix littéraire"

Des liseuses vendues dans les librairies indépendantes de France

Langues vivantes, machines pensantes ? L'IA au Collège de France

Vivlio lance sa plateforme de streaming pour lectures

De Her à Heidegger : faire l'IAmour avec la machine

De Marque s'associe à MOBiDYS pour rendre la lecture plus accessible

Une appli pour vérifier que le libraire ne vous extorque pas

L'entreprise Geo Comix rachetée par De Marque

IA et droit d'auteur : un appel collectif à la transparence

Un hackathon dédié à l'IA générative dans l'édition juridique

Du piratage au partage de livres : 96 Z-Points dans 34 pays (dont la France)

Piratage : des sites miroirs qui font réfléchir l'Arcep

Quels auteurs français ont alimenté les intelligences artificielles, malgré eux ?

Spotify expérimente la traduction et l'imitation de la voix par l'IA

Qui achète vraiment vos livres ? Un outil pour décrypter le lectorat

En attendant d'écrire des livres directement avec son esprit...

Commerce en ligne : des chifres, des tendances et des livres

ePagine et Numilog dévoilent LOUISE, une app de lecture LCP

Crunchyroll ouvre sa première boutique en ligne

Deux administrateurs supposés de Z-Library seraient en cavale

Développer des applications web pour les livres électroniques avec des technologies avancées

Curiosité, indifférence : ce que pensent les Français du livre audio

Babelica : le salon de l'édition indépendante qui se déploie en ligne

Le site pirate de l'anime Animeflix a fermé subitement

Conseils lectures : l'été en couleurs avec Kobo

Les éditeurs français attaquent de nouveau Z-Library

En 2024, où en est le livre numérique en France ?

Quand les livres rencontrent les jeux vidéo : les personnages littéraires les plus mémorables dans les jeux vidéo

L’IA : une ressource suspecte pour faciliter l’écriture

L'offre audiolivres de Spotify, une “arnaque” pour les artistes

L'actrice Reese Witherspoon, grande prescriptrice de livres, s'associe à Apple

Quand Wikipédia sauve les traductrices de l'oubli

Piratage d'oeuvres en France : ebook, audiolivres, où en est-on ?

Où sont passées les bases de données illégales d'OpenAI ?

Audiolivre : plus de 100 acteurs mobilisés pour la saga Harry Potter

La Bibliothèque nationale de France présente "Bijoux et Littérature"

Au Moyen-Orient, une alliance autour des livres audio

Le livre numérique de plus en plus plébiscité en Espagne

Les éditions Milan lancent “le premier manga audio”

Piratage : après la France, l'Allemagne bloque Sci-Hub sur son territoire

Conseils de lectures : deux acteurs s'associent pour aider à choisir

Livre audio : l'insondable énigme de la création des contenus

Offrir des livres comme on offre des fleurs

L'intelligence artificielle : l'Europe, premier bon élève ?

Droit d'auteur et IA : un rapport à l'Élysée tourné vers l'Europe

Créer des vidéos pour parler des livres

Allemagne : ventes d'ebooks en hausse en 2023, après un mauvais 2022

Quelques années après son rachat, Feedbooks disparait

Quatre éditeurs scientifiques réclament près de 30 millions € à LibGen

Spotify propose un abonnement réservé aux livres audio

OpenAI accuse le New York Times d'avoir “piraté” ChatGPT