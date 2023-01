En novembre, NBE éditions publiait le premier « méta-livre », disponible en librairie. En parallèle de la version papier, une collection de NFT a été conçue par l’Intelligence artificielle de la startup Selas AI. Chacun révèle une bribe de l’œuvre, ou la rencontre de l'édition avec un Web 4.0.

Deux ans auparavant, Google Play Books dévoilait sa solution de lecture automatisée : des narrateurs de synthèse, pour façonner des livres audio sans recourir à des comédiennes ni comédiens. Ce décembre 2022, le programme a été généralisé, en version beta : les éditeurs de créer gratuitement la version audio des oeuvres publiées.

Si de nombreuses entreprises de la tech, comme TikTok, s'appuient déjà sur les capacités, de plus en plus perfectionnées, quid du monde de l’édition et de l'enrichissement de son offre d'audiobooks ? Les grandes maisons et plateformes misent sur des lecteurs célèbres, comme Spotify : en 2020, la plateforme partageait une version audio du premier tome de la série littéraire Harry Potter, lu par l’acteur Daniel Radcliffe lui-même.

Pour Audible, filiale d'Amazon, le réalisateur de films et dramaturge Sam Mendes a adapté trois œuvres de Charles Dickens, en commençant par Olivier Twist. La série est enregistrée dans les studios londoniens, à quelques pas du quartier décrit par Dickens dans le roman. Plus grand distributeur et créateur de titres audio au monde, Audible ne distribue actuellement que des audiobooks racontés par des humains.

Une question se pose alors : qu'apporte Denis Podalydès, narrateur de chair et de sang, dans l'exercice de la lecture ?

IA et baisse des coûts

Dans l'audiolivre, les projets éditoriaux réclament un certain investissement. Selon Mark Piesing, l’utilisation de la voix artificielle peut réduire les coûts, pour une fiction de longueur standard, de 2500 $ à 400 $. Ainsi, les technologies de synthèse vocale (TTS) apporteraient également une démocratisation de la production de titres audio. En revanche, ce dernier confesse que les voix artificielles s'améliorent, mais demeurent encore inégales suivant les langues.

Taylan Kamis, co-fondateur et PDG de DeepZen, entreprise à qui l'on attribue le premier livre audio généré par l’IA au monde en 2021, explique : « Plus de 100 millions d’ouvrages imprimés dans le monde et 20 à 25 millions de livres électroniques, mais seulement un demi-million d’oeuvres audio, dont 90 % en anglais et la moitié produite au cours des quatre à cinq dernières années. »

Et d’ajouter : « Le coût et le temps nécessaires à la production d’une oeuvre audio constituent le principal écueil, en particulier lorsqu’il s’agit de marchés non anglophones. Pour un éditeur, l’opportunité est vaste. » Aujourd’hui, les modèles informatiques tels que WaveNet, DeepMind et Tacotron engendrent des réseaux de neurones qui imitent le fonctionnement du cerveau humain pour améliorer en permanence la vitesse et la précision de leurs IA.

Chaque start-up s’appuie sur des modèles différents, comme base sur laquelle construire leurs propres applications, leur permettant de se démarquer dans ce marché de l’avenir. DeepZen souhaite par exemple « capturer l’émotion » pour sa technologie de synthèse vocale.

Ce qui devrait se dessiner, c’est une production de masse, à bas prix, générée par l’intelligence artificielle, et en parallèle, des productions à voix humaine de haute qualité, et plus coûteuses. De plus, un ouvrage que l’on écoute pour ses informations nécessitera moins d’inflexion de la voix que la prose d'un Louis Ferdinand Céline.

Selon Mark Piesing, « les attitudes des éditeurs continueront d’évoluer au fur et à mesure que la technologie se perfectionnera et que la génération Z grandira. Au cours des cinq prochaines années, la demande croissante de contenu audio, le coût de production de livres audio à voix artificielle et le désir de démocratisation briseront l'opposition ».

