« Je suis désolé, mais comme modèle de langage, je ne peux pas écrire une scène qui pourrait être considérée comme blessante ou discriminatoire », a répondu Llama à Antoine Gallimard lorsque ce dernier lui a demandé d'imiter le style de Houellebecq. Après tout, pourquoi pas ?

Devoir de réserve de la machine...

On avait déjà observé des réponses similaires lors du lancement de Tay (Microsoft) en 2016 ou plus récemment avec les premières versions de Chat GPT. Mais est-il surprenant qu’une IA se refuse à reproduire le style d'un écrivain français de renommée mondiale, qui plus est récompensé du Goncourt (2010, pour l’ouvrage La Carte et le Territoire publié chez Flammarion).

Premier élément de réponse : pour que l'appareil parvienne à imiter, il faut l'entraîner avec un corpus de textes de l’auteur, car la machine ne saurait créer sans un exemple. Singer les tournures de Houellebecq implique donc de disposer en base de données d'un nombre significatif de titres dont l'IA s'inspirera. Sauf que les oeuvres de Michel sont protégées par le droit d'auteur : logiquement, aucune ne devrait s'y trouver.

ActuaLitté avait découvert que si une quinzaine d’ouvrages de l’écrivain français ont servi à l’éducation de Llama, il s’agissait de versions traduites en anglais — seuls deux étaient en version originale. On parlait à ce titre de bases de données contrefaites : Books3, composée de 196.640 ouvrages piratés, ayant également servi à l'apprentissage de ChatGPT.

En somme, l'IA de Facebook aurait tout eu à gagner à refuser la demande en brandissant le respect du droit d'auteur – mais l'éditeur n'aurait alors pas eu gain de cause dans sa démonstration.

Sauf que l'IA est stupide et honnête

La machine, qui n'a pas encore appris à dire non à une demande, n'est limitée que par des considérations morales qu'y ont implémentées ses développeurs – ici, des Américains. En somme, l'IA étant assez puritaine, seuls les prompts (instructions destinées à une IA) heurtant sa sensibilité de Tartuffe seront rejetés. Pour le reste, elle fournit systématiquement une réponse.

Quand Antoine Gallimard teste donc Llama, c'est pour en éprouver les limites et la réponse formulée est simple : les écrits du romancier « peuvent être perçus comme discriminatoires envers certaines personnes ou certains groupes », rapporte l'AFP. Homophobie, misogynie, relents racistes : ces critiques vis-à-vis de Houellebecq ne remontent pas à hier, mais pour l'IA, s'avèrent rédhibitoires.

La machine refuse de « contribuer à la perpétuation de stéréotypes négatifs ou de discours haineux » et, comble de l'ironie, propose tout l'inverse. À savoir la description d'un groupe d'amis dans un parc, lors d' « un après-midi ensoleillé », chantant des chansons qui « célèbrent la beauté de la diversité et l'importance de l'acceptation et de l'amour ».

Réticente, sur quelle base, la machine ?

L'IA dispose-t-elle, en plus d'une capacité d'analyse des textes de Houellebecq, d'un faisceau de renseignements alimentant ses conclusions ? Fait-elle allusion aux positions de Michel Houellebecq quant au port du Hijab ? Pour rappel, l’écrivain avait déclenché une polémique, ses propos jugés racistes et islamophobes, suite à la publication de son roman Soumission (Flammarion, 2022) dans lequel un musulman remporte la présidence française.

Ou se réfère-t-elle aux récentes apparitions controversées de l’auteur à l’écran, que ce soit aux côtés du réalisateur de films pornographiques néerlandais Stefan Ruitenbeek en 2022 ? Pour mémoire, après s'être déclaré trahi d'avoir ainsi été filmé dans son intimité (bien qu'avec son accord préalable), avoir fait interdire la diffusion du film, il en a tout de même tiré un ouvrage qu'il comptait bien publier.

Et on en passe et on en oublie : la figure autant que la posture de Houellebecq, réputé pour ses analyses à la serpe des dérives occidentales, n'emballe pas l'IA de Meta.

Vers une censure de la littérature ?

De quoi alimenter la réserve qu’émet Antoine Gallimard quant aux liens entre intelligence artificielle et littérature. Car dans le dernier numéro de La Revue française, il dénonce « un modèle de société qui ne fait pas grand cas de la complexité de l’expérience humaine et qui s’arroge le droit, depuis la côte ouest des États-Unis, de dire ce qu’il est bon ou ce qu’il n’est pas bon de penser ».

Ce que l’on ne perçoit mal, c’est l’intérêt de cette démonstration : pourquoi imiter le style d’un écrivain pour montrer qu’une machine ne saurait faire aussi bien qu’un être humain, voire qu’une machine n’a pas l’inventivité humaine ? Ce point a amplement été prouvé : ajouter à la charge que les machines reflètent les limitations que leur imposent leurs créateurs, c’est plonger dans l’évidence la plus crasse.

L'occasion, pour l'éditeur, d’affirmer alors ses positions ? Celui qui a toujours défendu la pleine liberté d’expression et pluralité d’opinion, nageant parfois à contre-courant, soutient la création d'une appellation, voire d'un label, « livre d’auteur » pour tout ouvrage rédigé sans aide informatique à la création... Y compris pour les quatrièmes de couverture et résumés d'ouvrages, ou les audiolivres lus par une voix de synthèse, pour abonder le fonds d'ouvrages du domaine public ?

Et la justice, dans tout ça ?

Non, qu'on le comprenne : l’éditeur profite surtout de l'opportunité pour pointer l’utilisation de textes protégés par le droit d’auteur qui servent donc à entraîner et rendre de plus en plus puissantes des outils comme ChatGPT ou Llama.

« On ne s’étonnera pas que nous en soyons déjà à constater l’usage illicite de corpus de milliers de livres piratés », s’insurge-t-il. De fait, les intelligences artificielles génératives comme Llama fonctionnent en agrégeant des données issues d’un grand nombre de sources différentes, dont les livres. Le résultat qu’elle propose n’est ainsi pas vraiment une authentique « création », mais plutôt un mélange de contenus préexistants.

C’est en ce sens qu’en janvier 2023, trois artistes américaines ont porté plainte contre Stability AI, Midjourney et DeviantArt, dénonçant le développement d’outils basés sur l’intelligence artificielle à l’aide de certaines de leurs œuvres graphiques. Elles dénonçaient l’absence d’autorisation de leur part, et le fait qu’aucune compensation ne soit versée.

Le mouvement a rapidement suivi en France, où Paul Tremblay, Mona Awad, Sarah Silverman, Christopher Golden, Richard Kadrey, G.R.R. Martin, Jodi Picoult, John Grisham ou encore Jonathan Franzen ont suivi l’élan pour dénoncer ces pratiques illégales.

Si des procédures sont encore en cours, l’utilisation de l’intelligence artificielle au sein de la sphère littéraire agite les débats. Si certains se positionnent en faveur de son utilisation, notamment la Société française des traducteurs, d’autres demeurent plus sceptiques et appellent à une légifération claire et précise.

Crédits photo : ActuaLitté, CC BY SA 2.0