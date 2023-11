« Si nous voulons que tout demeure tel que c’est, il faut que tout change », écrivait l’auteur italien dans Il Gattopardo. En matière d’immobilisme, le secteur du livre fait parfois peur, tant il illustre parfaitement cette doctrine. À commencer par oublier que les mots ont un sens — ou bien a-t-on retenu parfaitement le précepte de Confucius : « Lorsque les mots perdent leur sens, les gens perdent leur liberté. »

Boileau n’écrivait finalement pas autre chose : « Ce qui se conçoit bien s’énonce clairement. Et les mots pour le dire viennent [n’oubliez pas la diérèse pour l'alexandrin, crénom ! NdR] aisément. »

L'IA, mais liée à quoi ?

Dans un récent entretien mené par le Bureau international de l’édition française (BIEF), Virginie Clayssen est ainsi sollicitée sur la brûlante question de l’Intelligence artificielle. L’ancienne présidente de la commission numérique du SNE, qui fit du terme « liseuse » pour désigner un lecteur ebook, un véritable combat linguistique, y démontre que, comme toujours, l’industrie du livre a un train d’avance.

Avec justesse, elle rappelle ainsi que l’expression d’intelligence artificielle est apparue en 1956 (la paternité reviendrait à John McCarthy du MIT) et que le principe a déjà « son histoire ».

Et comme on vit dans le futur (antérieur ?), quand on bosse au SNE, Virginie Clayssen affirme que l’on n’a pas attendu « la sortie de Chat GPT » pour réfléchir au concept : les Assises du livre numérique, dès 2017, en firent une des thématiques. Sauf qu’à l’époque aucune application comme celles qui font fureur de nos jours n’existait : on brassait des idées, voire du vent, quand on se heurte aujourd’hui au concret, accessible au grand public. Et de pointer :

« Dans l’édition, comme dans bien d’autres secteurs, les outils utilisés par les différents métiers sont nombreux à s’appuyer déjà sur l’intelligence artificielle. Le plus emblématique est certainement l’OCR (Optical Character Recognition, "reconnaissance optique de caractères"). Cette technologie logicielle identifie électroniquement le texte (manuscrit ou imprimé) à l’intérieur d’un fichier image ou d’un document physique, tel qu’un document scanné, et le convertit en une forme de texte lisible par une machine, qui peut être utilisée pour le traitement des données, et a également permis le développement d’une offre de livres numériques. »

De fait, Google, via la solution Captcha, se servait même des internautes pour numériser des livres en masse. En sollicitant les surfeurs pour qu’ils identifient des lettres biscornues, l’entreprise améliorait les capacités de ses machines en la matière. C’était en 2008, et clairement, l’édition française n’aimait pas cela du tout – l’édition américaine non plus, un vaste procès, dont Google sortira finalement vainqueur au terme de 10 années de procédure en témoigne.

L’histoire écrite par les vainqueurs, ou « le dernier qui parle a raison », voici bien deux notions instructives. Voilà quelques années, Virginie Clayssen procédait de la même manière, quand le livre numérique réalisait ses premiers pas. Et d’affirmer avec aplomb, que le numérique l’édition n’avait pas à y entrer : elle y était depuis longtemps. Pour preuve, on utilisait des logiciels de PAO depuis bien longtemps. Et que le livre numérique, pas d’inquiétude : on fait déjà des PDF qu’on envoie aux imprimeurs.

Mais le ver se tapit plus profondément dans la pomme :

« Des outils basés sur l’IA ont notamment été mobilisés par la société FeniXX, pour le projet de numérisation des livres indisponibles du XXe siècle. Elle a fait appel à la société Pythagoria pour automatiser la production de métadonnées (obtention via l’OCR des données de description des livres, notamment leur titre, auteur(s), éditeur, nombre de pages, quatrième de couverture) de dizaines de milliers de livres numérisés durant le projet. »

ReLIRE, pour étayer le propos, c’est le pompon : quand Google numérisait des ouvrages, sous droit, le SNE s’étranglait. Quand le SNE obtint en août 2009 du ministre de la Culture, Frédéric Mitterrand, un crédit de 7 millions € par an pour numériser un corpus de 500.000 ouvrages du XXe siècle sans demander l’accord des auteurs (premiers concernés, a priori – mais a posteriori non, en fait), là, on jubilait ? Le tout pour éviter le monopole de Google Books, cerise sur le gâteau en matière d’argument.

Ou bien, dans la perspective de construire un modèle de langage (le véritable principe de fonctionnement d’une IA) français, tout aussi illégalement que ce qui est aujourd’hui dénoncé ? Car, rappelons-le avec une délectation non feinte : ReLIRE, le projet de numérisation des œuvres indisponibles, fut bloqué par la Cour de Justice de l’Union européenne en juillet 2016. Motif : illégal, tout simplement.

La France, terre de Beaumarchais et du droit d’auteur, recalée comme un bachelier aux oraux de rattrapage… pour avoir violé le droit d’auteur. Le summum de la contrefaçon, légalisé par le législateur français, et que le SNE défendait corps et âme, sous prétexte que l’on n’avait pas le temps, puisque le projet était patrimonial, de solliciter l’accord préalable des auteurs.

Brigitte Lahaie, dont les livres furent introduits de force dans ReLIRE...

De fait, ils pouvaient toujours demander le retrait de leurs bouquins… à condition d’être informés que cette machine à broyer les droits sur les œuvres de l’esprit était en branle. On leur faisait l’aumône d’un opt-out, et ils demandaient de la brioche en plus ? Oui, oui : pour démontrer que l’industrie du livre puise dans les ressources de l’IA depuis un bail, ReLIRE (pour Registre des Livres Indisponibles en Réédition Électronique) est brandi en exemple. « Et voilà pourquoi votre fille est muette. »

Ne rions pas trop fort toutefois : le ministère de la Culture, gêné aux entournures, n’a jamais avoué le coût de cette blague. Ce sont plusieurs dizaines de millions d’euros qui furent engloutis — jusqu’à ce million injecté dans une campagne de publicité en ligne —, sans que le projet n’ait de business plan…

L'entretien avec Virginie Clayssen s'achève sur ses maux (pun intended) : « Pour affronter les défis de notre temps, n’allons-nous pas avoir besoin de toutes les intelligences ? ».

Que n’avons-nous pas fait appel à ces intelligences plus tôt ?

