Pornographie, islamophobie, drogue : les polémiques ne manquent pas quand on évoque Houellebecq. Cette, c'est une machine qui la déclenche, par le biais d'Antoine Gallimard qui publie Le livre et l’IA : un pacte faustien ?. Pour illustrer sa réticence, il relate son expérience avec Llama, IA de Meta, qui a refusé d'écrire « à la manière de Michel Houellebecq », car trop “offensive” - blessante, injurieuse, grossière...
Le 15/06/2024 à 13:23 par Louella Boulland
6 Réactions | 326 Partages
Publié le :
15/06/2024 à 13:23
6
Commentaires
326
Partages
« Je suis désolé, mais comme modèle de langage, je ne peux pas écrire une scène qui pourrait être considérée comme blessante ou discriminatoire », a répondu Llama à Antoine Gallimard lorsque ce dernier lui a demandé d'imiter le style de Houellebecq. Après tout, pourquoi pas ?
On avait déjà observé des réponses similaires lors du lancement de Tay (Microsoft) en 2016 ou plus récemment avec les premières versions de Chat GPT. Mais est-il surprenant qu’une IA se refuse à reproduire le style d'un écrivain français de renommée mondiale, qui plus est récompensé du Goncourt (2010, pour l’ouvrage La Carte et le Territoire publié chez Flammarion).
Premier élément de réponse : pour que l'appareil parvienne à imiter, il faut l'entraîner avec un corpus de textes de l’auteur, car la machine ne saurait créer sans un exemple. Singer les tournures de Houellebecq implique donc de disposer en base de données d'un nombre significatif de titres dont l'IA s'inspirera. Sauf que les oeuvres de Michel sont protégées par le droit d'auteur : logiquement, aucune ne devrait s'y trouver.
ActuaLitté avait découvert que si une quinzaine d’ouvrages de l’écrivain français ont servi à l’éducation de Llama, il s’agissait de versions traduites en anglais — seuls deux étaient en version originale. On parlait à ce titre de bases de données contrefaites : Books3, composée de 196.640 ouvrages piratés, ayant également servi à l'apprentissage de ChatGPT.
En somme, l'IA de Facebook aurait tout eu à gagner à refuser la demande en brandissant le respect du droit d'auteur – mais l'éditeur n'aurait alors pas eu gain de cause dans sa démonstration.
La machine, qui n'a pas encore appris à dire non à une demande, n'est limitée que par des considérations morales qu'y ont implémentées ses développeurs – ici, des Américains. En somme, l'IA étant assez puritaine, seuls les prompts (instructions destinées à une IA) heurtant sa sensibilité de Tartuffe seront rejetés. Pour le reste, elle fournit systématiquement une réponse.
Quand Antoine Gallimard teste donc Llama, c'est pour en éprouver les limites et la réponse formulée est simple : les écrits du romancier « peuvent être perçus comme discriminatoires envers certaines personnes ou certains groupes », rapporte l'AFP. Homophobie, misogynie, relents racistes : ces critiques vis-à-vis de Houellebecq ne remontent pas à hier, mais pour l'IA, s'avèrent rédhibitoires.
La machine refuse de « contribuer à la perpétuation de stéréotypes négatifs ou de discours haineux » et, comble de l'ironie, propose tout l'inverse. À savoir la description d'un groupe d'amis dans un parc, lors d' « un après-midi ensoleillé », chantant des chansons qui « célèbrent la beauté de la diversité et l'importance de l'acceptation et de l'amour ».
L'IA dispose-t-elle, en plus d'une capacité d'analyse des textes de Houellebecq, d'un faisceau de renseignements alimentant ses conclusions ? Fait-elle allusion aux positions de Michel Houellebecq quant au port du Hijab ? Pour rappel, l’écrivain avait déclenché une polémique, ses propos jugés racistes et islamophobes, suite à la publication de son roman Soumission (Flammarion, 2022) dans lequel un musulman remporte la présidence française.
Ou se réfère-t-elle aux récentes apparitions controversées de l’auteur à l’écran, que ce soit aux côtés du réalisateur de films pornographiques néerlandais Stefan Ruitenbeek en 2022 ? Pour mémoire, après s'être déclaré trahi d'avoir ainsi été filmé dans son intimité (bien qu'avec son accord préalable), avoir fait interdire la diffusion du film, il en a tout de même tiré un ouvrage qu'il comptait bien publier.
Et on en passe et on en oublie : la figure autant que la posture de Houellebecq, réputé pour ses analyses à la serpe des dérives occidentales, n'emballe pas l'IA de Meta.
De quoi alimenter la réserve qu’émet Antoine Gallimard quant aux liens entre intelligence artificielle et littérature. Car dans le dernier numéro de La Revue française, il dénonce « un modèle de société qui ne fait pas grand cas de la complexité de l’expérience humaine et qui s’arroge le droit, depuis la côte ouest des États-Unis, de dire ce qu’il est bon ou ce qu’il n’est pas bon de penser ».
À LIRE – USA : face à l'IA, le ministère de la Justice du côté des auteurs
Ce que l’on ne perçoit mal, c’est l’intérêt de cette démonstration : pourquoi imiter le style d’un écrivain pour montrer qu’une machine ne saurait faire aussi bien qu’un être humain, voire qu’une machine n’a pas l’inventivité humaine ? Ce point a amplement été prouvé : ajouter à la charge que les machines reflètent les limitations que leur imposent leurs créateurs, c’est plonger dans l’évidence la plus crasse.
L'occasion, pour l'éditeur, d’affirmer alors ses positions ? Celui qui a toujours défendu la pleine liberté d’expression et pluralité d’opinion, nageant parfois à contre-courant, soutient la création d'une appellation, voire d'un label, « livre d’auteur » pour tout ouvrage rédigé sans aide informatique à la création... Y compris pour les quatrièmes de couverture et résumés d'ouvrages, ou les audiolivres lus par une voix de synthèse, pour abonder le fonds d'ouvrages du domaine public ?
Non, qu'on le comprenne : l’éditeur profite surtout de l'opportunité pour pointer l’utilisation de textes protégés par le droit d’auteur qui servent donc à entraîner et rendre de plus en plus puissantes des outils comme ChatGPT ou Llama.
« On ne s’étonnera pas que nous en soyons déjà à constater l’usage illicite de corpus de milliers de livres piratés », s’insurge-t-il. De fait, les intelligences artificielles génératives comme Llama fonctionnent en agrégeant des données issues d’un grand nombre de sources différentes, dont les livres. Le résultat qu’elle propose n’est ainsi pas vraiment une authentique « création », mais plutôt un mélange de contenus préexistants.
C’est en ce sens qu’en janvier 2023, trois artistes américaines ont porté plainte contre Stability AI, Midjourney et DeviantArt, dénonçant le développement d’outils basés sur l’intelligence artificielle à l’aide de certaines de leurs œuvres graphiques. Elles dénonçaient l’absence d’autorisation de leur part, et le fait qu’aucune compensation ne soit versée.
Le mouvement a rapidement suivi en France, où Paul Tremblay, Mona Awad, Sarah Silverman, Christopher Golden, Richard Kadrey, G.R.R. Martin, Jodi Picoult, John Grisham ou encore Jonathan Franzen ont suivi l’élan pour dénoncer ces pratiques illégales.
Crédits photo : ActuaLitté, CC BY SA 2.0
Paru le 08/06/2016
490 pages
Flammarion
9,00 €
Paru le 04/01/2017
314 pages
J'ai lu
8,40 €
6 Commentaires
le troisième homme
15/06/2024 à 22:06
Les derniers Houellebecq étaient déjà écrits par une IA dont on avait enlevé tous les pseudos verrous éthiques et personne n'y a rien vu ! Quel bobardeur cet Antoine Gallimatia ! Il
Marc-André Boissière
16/06/2024 à 10:07
Heureusement, Alexandre Jardin est là, sauveur des lettres devant le péril techno.
Il signe quand chez Gallimard Michel ?
Hâte de le lire dans la NRF.
HouseofaThousandBookies
18/06/2024 à 14:43
Oui l'IA est très puritaine c'est pour ça qu'il faut viser les européennes et françaises, mais ça touche pas que ce type d'auteur c'est beaucoup plus pernicieux car y'a pas réellement de compréhension du contexte où se place la demande, c'est de la censure auto car les éditeurs ne veulent pas prendre de risque de se tromper.
Par exemple si vous voulez écrire de la romance avec une IA ça va être compliqué car il ne faut pas que ça aille trop loin, le bisou ça passe mais pas le lit ni des gestes trop physique.
Les blagues passeront pas non plus sur ce thème ou sur d'autres, de toute façon l'IA comprend mal la dérision et la satyre, il y'a beaucoup de vidéos à ce sujet avec certains humoristes qui se voient même couper l'accès en plein live au service pendant un temps.
L'IA a aussi beaucoup de mal avec le cyberpunk, ce style a trop de thèmes en risque de censure, ce qui est assez paradoxal vu que la tech s'inspire de ce style pour faire ses inventions et services... Pour la blague une fois j'ai demandé à Copilot d'analyser une synthèse que j'avais écrit à propos d'une nation robot au 24e siècle dans un jeu de stratégie cyberpunk, le truc a refusé de se lancer car "ça parlerait d'elle". La nation ne s'appelait pas Microsoft, ni Copilot, dès que ça parle d'IA et que c'est pas un truc très connu comme Skynet y'a un risque, alors l'IA veut pas traiter.
L'IA aura aussi du mal avec l'espionnage car il y'a une forme de risque de complotisme, donc si c'est pas de l'espionnage d'action type 007 ça marchera pas avec la censure.
Donc on peut fort bien imaginer que même en ne votant pas comme Houellebecq, que si vous voulez faire intervenir un personnage qui ne soit pas de gauche ça va être compliqué, pour la fiction historique qui se veut immersive ça va être très très compliqué... Faudra donc pas s'étonner qu'en 2050 on voit des tas de gens penser qu'à l'antiquité ou au moyen-âge c'était déjà woke, ce qui se voit beaucoup en effet quand on lit des bouquins de ces époques (lisez pas ce qu'écrivaient les savoyards sur la nature humaine des gens qu'ils occupaient à Genève vous seriez choqués)...
Charlotte
19/06/2024 à 17:32
"Si certains se positionnent en faveur de son utilisation, notamment la Société française des traducteurs, d’autres demeurent plus sceptiques et appellent à une légifération claire et précise."
Si vous aviez lu le communiqué de la SFT, vous auriez vu clairement que 95% du document est consacré aux dommages que cause l'IA dans le secteur et aux risques qu'elle peut y poser à l'avenir. Ce n'est pas parce qu'elle ne souhaite pas l'interdire purement et simplement qu'elle prône son utilisation. Merci de corriger.
Une traductrice
20/06/2024 à 09:19
Sans compter que la SFT est un syndicat qui représente les traducteurs techniques, c'est à dire les personnes qui traduisent des contrats, des notices de médicaments, des documents d'entreprise, bref, toutes sortes de textes utiles et importants... mais pas de littérature !
Pour la traduction littéraire et d'édition, c'est vers l'ATLF (association des traducteurs littéraires de France) qu'il faut se tourner. Leur prise de position concernant l'IA se trouve ici : https://atlf.org/tribune/ et comme vous pourrez le constater, elle est sans appel.
Léo Martinet
20/06/2024 à 17:18
Yann Moix écrit encore à la plume d'oie, aucun risque pour l'I.A, elle peut dormir en paix.