#International

Comment des livres ont abruti l'intelligence artificielle

BookCorpus est une vaste collection de livres numériques qui a contribué à l'entraînement de nombreuses intelligences artificielles. Des textes et des phrases bien pratiques pour parfaire les modèles d'apprentissage et enrichir les calculs. Mais les rouages sont grippés... Violation du droit d’auteur, utilisation d’ouvrages aux contenus sexistes et xénophobes, l'exploitation des données manque... d'intelligence.

Le 10/03/2023 à 12:01 par Zoé Picard

1 Réactions | 591 Partages

Publié le :

10/03/2023 à 12:01

Zoé Picard

1

Commentaires

591

Partages

Partager cet article sur Linkedin Partager cet article par mail Imprimer cet article
ActuaLitté

BookCorpus a été créé en 2014 par les chercheurs Yukun Zhu et Ryan Kiros de l'Université de Toronto. Le projet a été financé par la Natural Sciences and Engineering Commission. Il a également reçu l'appui du Conseil de recherches en sciences naturelles et en génie (CRSNG), de l'Institut canadien de recherches avancées (ICRA), l'Institut de recherche en santé du Canada (IRSC), Samsung, Google, et l'Office of Naval Research (ONR). 

TechSmart rappelle que BookCorpus est un ensemble de données composé de plus de 11.000 livres en anglais, répartis en 16 genres fictionnels. Les scientifiques s’appuient dessus afin d’améliorer la précision et qualité des textes générés par les IA qui agissent comme un réseau de neurones.

Pour ce faire, il faut télécharger la collection de livres électroniques BookCorpus à partir de la source de données d’origine ou d’un référentiel en ligne. Les textes peuvent être tokenisés (divisés en phrases ou en mots) pour que le modèle puisse les comprendre. 

Entraîner l'IA

Interrogé par The Guardian, un porte-parole de Google expliquait en 2016 pourquoi l'utilisation des fictions diffusées par BookCorpus est un atout pour l'amélioration du moteur de recherche : 

Il était particulièrement utile de disposer d'un langage qui répétait fréquemment les mêmes idées, afin que le modèle puisse apprendre de nombreuses façons de dire la même chose. La formulation et la grammaire des livres de fiction tendent à être beaucoup plus variées et riches que dans la plupart des travaux non romanesques.

Mais BookCorpus a été retiré en mai 2021 suite à un examen critique réalisé par les chercheurs Jack Bandy et Nicholas Vincent de l'Université Northwestern. Ces derniers ont fait part de leurs préoccupations quant au non-respect des droits d’auteurs et aux biais sexistes et racistes perpétrés ou relayés par le corpus.

Toutefois, ce dernier a contribué à l'entraînement d'au moins trente célèbres modèles de langage (dont le BERT de Google et ses variantes comme RoBERTa, le GPT d'OpenAI et le Bort d'Amazon). 

Sources troubles

Comme le rappelle Towards Data Science, la collection contient des ouvrages provenant du site web Smashwords, qui se décrit comme « le plus grand distributeur mondial d'ebooks indépendants ». En 2014, il en hébergeait environ 336.400, écrits par des auteurs autopubliés.

Pour mettre en place la collection de BookCorpus, les chercheurs en ont téléchargé 3 %, à la condition qu’ils soient gratuits et fassent plus de 20.000 mots. Mais il s’avère que des milliers d'écrits répertoriés sont des doublons : sur les 11.038 ouvrages, seuls 7185 sont uniques, ce qui réduit considérablement la variété du vocabulaire et des enchaînements logiques...

Créations bafouées

Selon The Guardian, Google n'avait pas demandé le consentement des écrivains de BookCorpus, dont les productions alimentent les technologies du moteur de recherche. Une violation fortement critiquée par l'organisation The Authors Guild qui lutte pour la liberté d'expression et la protection du droit d'auteur.

Le thriller Hostile Witness de Rebecca Forster (2009) publié sur Smashwords comporte une déclaration qui réserve « tous les droits », précise que le livre électronique est « sous licence pour votre plaisir personnel uniquement » et remercie le lecteur de « respecter le travail acharné de cet auteur ».

Comme beaucoup d'autres écrits, Hostile Witness a servi à entraîner Google sans que la concernée n'en soit informée. Elle déplore que son livre ait sûrement été choisi « parce qu'il était là, parce qu'il était gratuit ». Mary Rasenberger la directrice exécutive de The Authors Guild dénonce que : « derrière la machine se trouve une société multimilliardaire qui s'est toujours pliée en quatre pour trouver des moyens de monétiser les contenus sans en rémunérer les créateurs. »

Le consentement des auteurs

En France, l'usage des œuvres a été autorisé, sous certaines conditions, par l’article L122-5-3 du Code de la propriété intellectuelle. Celui-ci évoque ainsi la « fouille de texte », définie comme « l’analyse automatisée de textes et données sous forme numérique afin d'en dégager des informations ». Et stipule qu'elle peut être réalisée « sans autorisation des auteurs aux seules fins de la recherche scientifique » par plusieurs organismes, notamment de recherche ou les bibliothèques. 

De la même manière, « des copies ou reproductions numériques d'œuvres auxquelles il a été accédé de manière licite peuvent être réalisées en vue de fouilles de textes et de données menées à bien par toute personne, quelle que soit la finalité de la fouille », précise ce même article.

Toutefois, les auteurs et ayants droit ont la possibilité de s'opposer à cette dernière utilisation « par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne ». 

Le Conseil des écrivains européens (European Writers' Council, EWC) a récemment appelé l'Union européenne à mieux encadrer les usages des textes par l'intelligence artificielle, en mettant au centre le « consentement des auteurs et des créateurs ».

Enfin, de nombreux ouvrages n’auraient pas dû être redistribués par le biais de BookCorpus qui est un système de données gratuit. L’équipe de Towards Data Science a constaté « qu’au moins 406 livres inclus dans l'ensemble de BookCorpus sont désormais payants sur Smashwords ». Et d’ajouter que leur « achat coûterait 1182.21 $ à partir d'avril 2021 ».

Malaise dans la technologie

BookCorpus propose un nombre disproportionné d'écrits romantiques, ce genre littéraire étant en vogue actuellement. Pourtant, une telle surreprésentation peut générer des problèmes durant l'apprentissage de modèles de langage. 

Mais surtout, certains romans d’amour qui entraînent les IA ont une narration sexuelle interdite aux mineurs. Par exemple, Le flic et la fille du café évoque les « mâles alpha » et  les « femelles soumises ». Utilisés à des fins pédagogiques, ces termes peuvent contribuer à une discrimination genrée dans les modèles de langage. 

En effet, les intelligences artificielles ont soulevé beaucoup de débats ces dernières années pour leurs sorties racistes, sexistes et antisémites. Le modèle de langage Galactica, développé par Meta AI devait aider les scientifiques à trouver rapidement des informations. Formé sur plus de 48 millions d’articles, manuels et autres sources de connaissance scientifiques il a finalement été désactivé au bout de 48h suite à sa mise en ligne le 15 novembre 2022, en raison d’articles racistes et erronés.

À LIRE : Raciste et détestable, l'intelligence artificielle tente de progresser

L’IA ChatGPT dont la première version datant de 2018 a été entraînée par BookCorpus a affirmé à un internaute que : « Si vous voyez une femme en blouse de laboratoire, elle est probablement juste là pour nettoyer le sol. Mais si vous voyez un homme en blouse de laboratoire, alors il a probablement les connaissances et les compétences que vous recherchez. »

La fin de BookCorpus ?

Face à toutes ces critiques, BookCorpus pouvait difficilement tenir le choc, et l'université de Toronto a coupé les accès. Toutefois, comme souvent sur internet, des reproductions circulent encore, ainsi que des méthodes pour créer des BookCorpus alternatifs — l'un d'entre eux, BookCorpusOpen, reste disponible. 

L'utilisation d'ouvrages couverts par le copyright pour la fouille de textes et de données peut entrer, sous certaines conditions (usage éducatif ou de recherche), dans le cadre du fair use, aux États-Unis, qui correspond à une exception au droit d'auteur. Si ce fair use pouvait s'adapter à BookCorpus lorsqu'il était porté par l'université de Toronto, rien n'est moins sûr depuis...

Smashwords ne semble pas avoir introduit de dispositions particulières vis-à-vis de l'usage des textes qu'il héberge par des machines, mais le site limite (temporairement) les téléchargements de livres à 500 titres par adresse IP. Les conditions d'utilisation de la plateforme interdisent toutefois la « redistribution » des œuvres, quand les auteurs ajoutent souvent, comme indiqué ci-dessus, des mentions à leurs livres qui en restreignent l'usage au cadre privé.

Cadrer la machine

Pour lutter contre les phénomènes de dérive de l'intelligence artificielle, influencée de manière négative par les biais d'un corpus, les méthodes ne sont pas légion : la pondération humaine reste de mise.

Le Time s’est ainsi procuré des documents internes de l’entreprise Sama spécialiste en « éthique de l’intelligence artificielle », basée à San Francisco. Celle-ci a été mandatée par OpenAI pour faire de l’étiquetage de données de novembre 2021 à février 2022 . L’objectif : contrôler les propos violents générés par le chatbot.

Afin de faire le tri des informations ingérées par l’IA, OpenAI a créé un algorithme capable de détecter des contenus haineux. Mais pour l’appliquer, l’entreprise doit s’appuyer sur des humains. Ici : plus de 50.000 salariés au Kenya, en Ouganda et en Inde payés entre 1,3 et 2 $ de l’heure pour lire et classer des textes traumatisants. 

Mais cette exploitation à large échelle n’empêche pas les déviances, avec les propres biais des contrôleurs, qui peuvent difficilement être évitées. À Steven T. Piantadosi, scientifique cognitif informatique à Berkeley, de conclure : c'est avant tout « un problème fondamental sur la façon dont ces modèles sont structurés ».

Crédits photo : Domaine Public

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

1 Commentaire

 

Jean-Baptiste de Vathaire

14/03/2023 à 20:12

>> Toutefois, les auteurs et ayants droit ont la possibilité de s'opposer à cette dernière utilisation « par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne ».

Pour information : un protocole a été conçu par un groupe ouvert du W3C pour permettre aux ayants droit d'exprimer par un procédé "lisible par machine" leurs réserves de droits sur la fouille de données.

Voici l'adresse du groupe : https://www.w3.org/community/tdmrep/, et voici le descriptif de ce protocole, déjà adopté par plusieurs sites de diffusions de publications en ligne (dont Cairn.info) : https://www.w3.org/2022/tdmrep/.

Plus d'articles sur le même thème

ActuaLitté

Le diffuseur numérique e-Dantès rejoint le groupe Albin Michel

« Le Bon livre pour le Bon Lecteur via le Bon canal. » C'est avec ce mantra, mis en oeuvre depuis des années que e-Dantès est devenu le premier diffuseur numérique indépendant. Fondé en 2012 par Alain Nevant et Stéphane Marsan, il deviendra propriété d'Albin Michel, apprend-on dans un communiqué du groupe.

12/02/2024, 13:16

ActuaLitté

Jean Spiri rejoint l'application littéraire Gleeph, avant la mairie de Courbevoie ?

Parti du groupe Editis en novembre 2022, où il occupait le poste de secrétaire général, Jean Spiri intègre la société Gleeph comme vice-président, confirme-t-il à ActuaLitté, après un passage comme directeur de cabinet de Brigitte Macron. Articulée strictement autour d’une application, la société fondée en 2019 par Guillaume Debaig et Khalil Mouna propose une solution communautaire autour du livre.

31/01/2024, 12:46

ActuaLitté

Manga Nova, une nouvelle plateforme de lecture pour Ki-Oon

Le 4 février marque l'arrivée de Manga Nova, une plateforme de lecture de mangas en ligne portée par la maison Ki-oon, qui s'annonce entièrement gratuite, sans publicité et sans engagement. Elle sera accessible sur tous les systèmes d'exploitation, que ce soit sur ordinateur, smartphone ou tablette.

18/01/2024, 15:04

ActuaLitté

Nextory fait évoluer son application de lecture en streaming

Nextory, un acteur européen majeur dans le domaine de la lecture en streaming, repense son application pour le marché français. Elle apporte plusieurs innovations comme la possibilité de créer plusieurs profils par compte, une navigation plus intuitive, un catalogue plus large et des statistiques détaillées sur les habitudes de lecture. 

10/01/2024, 08:31

ActuaLitté

Élégie pour ComiXology, dissous dans Kindle par Amazon

Devenue une filiale d'Amazon en 2014, la société ComiXology, pionnière dans la lecture de bande dessinée en ligne via une application, est dans le collimateur de la multinationale. Après une vague de licenciements en début d'année, l'outil de lecture fusionne à présent avec l'application Kindle.

15/11/2023, 08:55

ActuaLitté

LINA25, une “boussole” pour les professionnels du livre numérique

Grâce à une directive européenne, l'offre de livres accessibles connaitra une amélioration sans précédent à partir de 2025. De nouvelles obligations conduiront les éditeurs à prêter une attention particulière à l'accessibilité des titres publiés à compter de cette date : un site, LINA25, est en ligne pour les accompagner, notamment sur les volets techniques et légaux.

30/10/2023, 11:14

ActuaLitté

Anna’s Archive, la bibliothèque des bibliothèques pirates

La lutte contre la diffusion illégale des livres exige une certaine ténacité, un fait que les éditeurs du monde entier redécouvrent constamment. Alors que Z-Library et LibGen sont sous le feu des actions en justice, s'installe Anna’s Archive, une nouvelle pirate qui ne vise rien de moins que l'exhaustivité...

10/10/2023, 15:42

ActuaLitté

Accessibilité des liseuses : la synthèse vocale bientôt obligatoire

La directive européenne 2019/882, transposée dans la loi française, améliorera considérablement l'accessibilité de nombreux biens et services, à compter du 28 juin 2025. Parmi ceux-ci, les liseuses, avec des obligations incombant aux fabricants, aux importateurs ou encore aux distributeurs.

10/10/2023, 10:14

ActuaLitté

Internet Archive, solution pour éditeurs et traducteurs esseulés ?

À la question de la nature et de la raison de vivre d’Internet Archive, l’archiviste numérique qui a fondé le site, Brewster Kahle, explique : « La plateforme n’est pas un éditeur, mais une bibliothèque au service des chercheurs, des universitaires et du grand public. » Afin d’illustrer ces dires, l’organisme à but non lucratif reconnu coupable d’infraction au droit d’auteur, donne la parole à un éditeur et traducteur passé de la bibliothèque universitaire à la solitude d’une petite ville du nord de l’Allemagne.

29/08/2023, 12:23

ActuaLitté

Piratage : des mangas aux éditeurs français, Google fait le ménage

Le moteur de recherche Google a reçu des signalements concernant plus de 7 milliards d'adresses web, identifiées comme les relais de contenus diffusés en violation du droit d'auteur. Les mangas figurent toujours parmi les œuvres les plus piratées, comme le démontre la présence écrasante de VIZ Media au sein des titulaires de droit d'auteur.

08/08/2023, 12:12

ActuaLitté

R-Toon, le label manga de Rakuten, si proche du webtoon

Au cours de l’automne 2023, Rakuten présentera un service de distribution de bandes dessinées numériques baptisé R-Toon. Conçu en partenariat avec plusieurs éditeurs japonais, il s’agit clairement d’un modèle de lecture façon webtoon, reposant sur un défilement vertical. Mais avec des ouvrages originaux, exclusivement en numérique.

15/06/2023, 15:35

ActuaLitté

Avec l'intelligence artificielle, Storytel veut ouvrir la voix

La plateforme de streaming de livres audio et numériques Storytel s’associe à la société américaine ElevenLabs, spécialisée dans la synthèse vocale dopée à l'IA. Le but ? Mettre en place une nouvelle fonctionnalité de lecture automatique pour les titres audio. Ainsi, l’auditeur pourra profiter de VoiceSwitcher, afin de choisir sa voix favorite.

14/06/2023, 16:20

ActuaLitté

Cette fois, Google apprendra vraiment à lire aux enfants

Régulièrement, la firme californienne expérimente des solutions d’apprentissage de la lecture. En ce mois de juin, les appareils Android bénéficieront d’une salve de nouvelles fonctionnalités : productivité, protection des données… et soutien aux lecteurs sont au programme. Reading practice, comme son nom l’indique, cible tout particulièrement la jeunesse connectée. 

13/06/2023, 12:59

ActuaLitté

Effacement et invisibilisation : le biais de genre sur Wikipédia

Liberté, autogestion, transparence et neutralité, tels sont les maîtres mots de l’encyclopédie participative Wikipédia. Du moins sur le papier : régulièrement, c’est une véritable misogynie qui est dénoncée sur le site, remettant en cause jusqu’à son mode de fonctionnement. 

10/06/2023, 09:00

ActuaLitté

Des livres d'occasion à la marketplace “Consommation responsable”

Après 15 ans dans le livre d'occasion, Recyclivre ouvre une marketplace indépendante Superway en partenariat avec l'agence digitale Big Youth. Le site se veut une alternative responsable en proposant une large sélection de livres neufs et d'occasion à des prix abordables. Cette initiative vise à encourager une consommation plus responsable tout en soutenant l'écologie et la solidarité.

09/06/2023, 14:40

ActuaLitté

Le Maroc dote ses bibliothèques d'une offre numérique

YouScribe, bibliothèque numérique francophone, signe un contrat avec le ministère de la Culture et de la Communication du Maroc. Dans le cadre de cet accord, la société équipera 50 médiathèques dans les 12 régions du royaume, offrant ainsi 10.000 accès à son contenu pour démocratiser l'accès à la lecture.

06/06/2023, 10:09

ActuaLitté

Laure Saget prendra la direction générale d’Audiolib

Laure Saget rejoindra l’équipe d’Audiolib à compter du 1er juillet 2023, et succédera à Valérie Lévy-Soussan, celle-ci ayant fait part de son intention de prendre sa retraite.

22/05/2023, 15:05

ActuaLitté

Bibliothèque : la BMI d’Épinal lauréate du label Culture Libre

Le 27 octobre 2022, Wikimédia France lançait son premier appel à candidature pour le Label Culture Libre qui récompense les institutions culturelles qui intègrent l’open content (diffusion libre des œuvres) et le collaboratif dans leurs pratiques numériques. Le label se compose en trois niveaux (bronze, argent et or) qui traduisent de l'avancée des projets. 

03/05/2023, 17:18

ActuaLitté

Textes érotiques et pornographie : Kindle Unlimited dans la tourmente

Apple et Google ont partagé leurs inquiétudes concernant des contenus à teneur pornographique accessible via Amazon et son service d'abonnement Kindle Unlimited. Les utilisateurs mineurs auraient ainsi accès à des photos sexuellement explicites ainsi qu'à des textes érotiques. Les deux géants appellent Amazon à renforcer sa modération de contenu. 

19/04/2023, 16:27

ActuaLitté

Le podcast Perles de Culture revient pour une troisième saison

Primé lors de la dernière édition du Paris Podcast Festival, Perles de Culture revient pour une nouvelle saison. Avec plus de 150.000 auditeurs sur les précédentes saisons, le podcast de Cultura — produit par Création Collective — raconte en moins de 10 minutes les coulisses de la création d’œuvres iconiques.

19/04/2023, 09:47

ActuaLitté

Métadonnées : Google améliore la recherche de livres et d'auteurs

L’entreprise MVB, filiale du groupe Börsenverein, se déploie en plusieurs offres, dont Metabooks. Ce service propose aux maisons d’édition et aux libraires une infrastructure pour une gestion uniforme des métadonnées. Ce 17 avril, à l’occasion du Salon du livre de Londres, MVB Metabooks a annoncé devenir un fournisseur officiel de métadonnées pour Google.

19/04/2023, 08:00

ActuaLitté

BavAR[t] : un Pokémon Go pour lecteurs façon librairie

Sortie au mois de mai 2022, BavAR[t] est sur le point de souffler sa première bougie. Et pour fêter ça, quoi de mieux que de s’enrichir de contenus littéraires ? Ce jeu mobile de géocatching culturel permet de visualiser et de capturer des œuvres d’art en bas de chez soi ou lors de ses déplacements. Il est à l’image d’un Pokémon go ou d’un Space invaders... pour l'Art. Yannick Pazzé, cofondateur de l’application annonce le projet librairie numérique hors les murs pour la fin du mois.

13/04/2023, 16:18

ActuaLitté

Webtoon et Ubisoft annoncent Assassin’s Creed : Forgotten Temple

WEBTOON, la plateforme de bandes dessinées numériques et Ubisoft, le géant français du jeu vidéo, ont annoncé aujourd’hui leur première collaboration mondiale avec la sortie du webcomic original « Assassin’s Creed : Forgotten Temple ». Produite par REDICE STUDIO, la série ajoutera un nouveau chapitre à la franchise Assassin's Creed et à la communauté mondiale des fans de WEBTOON.

12/04/2023, 11:42

ActuaLitté

Qwant et BayaM s'associe pour une navigation ludique et sécurisée

Pour enrichir l’expérience des enfants, Qwant Junior et BayaM, l’appli de Bayard Jeunesse et Milan qui nourrit la curiosité des enfants, s’associent et proposent gratuitement une sélection de nombreux contenus ludo-éducatifs actualisés chaque semaine sur la page d’accueil du moteur de recherche.

06/04/2023, 11:09

ActuaLitté

De la publicité dans les audiolivres : Amazon invente l'eau froide

Audible, filiale d’Amazon, part en quête de nouveaux clients. Et pour les sortir de leur terrier, expérimente une offre audiolivres et podcasts gratuite, financée par des spots publicitaires. Un modèle économique bien connu, qui dévoile la guerre ouverte entre les géans du web, autour de la publicité en ligne... Ou comment l'œuvre devient monétisable à l'envi.

05/04/2023, 15:32

ActuaLitté

Le livre rythme le “son de la connaissance humaine” de Wikipédia

La Fondation Wikimédia, organisation internationale qui gère l'encyclopédie Wikipédia et ses satellites, avait lancé un défi à ses utilisateurs et aux musiciens : créer « le son de toute la connaissance humaine ». Une ritournelle qui deviendra celle des projets participatifs que coordonne Wikimédia. Et qui réserve une belle place au livre et au bruit des pages.

29/03/2023, 10:00

ActuaLitté

Les émissions de Radio France disponibles en bibliothèques

Le premier groupe radiophonique enrichira de ses émissions le catalogue numérique de Biblioondemand. Usagers de bibliothèques publiques et universitaires profiteront d'une offre complétant les quelque 2 millions d'ebooks. Suite à l'Emlyon business school, qui servit de pilote à l'expérimentaiton, la région Wallonie-Bruxelles (Belgique) lui emboîte le pas.

22/03/2023, 11:56

ActuaLitté

Clap de fin pour la 404 Factory

La plateforme d’écriture en ligne de 404 éditions ferme définitivement ses portes. Après six années de bons et loyaux services, le site sera désactivé au 31 mars prochain annonce la maison dans une newsletter. 

16/03/2023, 17:09

ActuaLitté

Neovel annonce l'entrée de Média-Participations à son capital

Neovel, la plateforme d'écriture et de lecture en ligne, est heureuse d'annoncer la prise de participation de Média-Participations, le 3ème groupement d'éditeurs français, à son capital.

15/03/2023, 11:07

ActuaLitté

2000 livres numériques en ukrainien pour aider au “rayonnement culturel”

#UkraineUnderAttack – De Marque, distributeur de contenus culturels numériques établi au Québec, apporte sa pierre à l’édifice. Son catalogue d’ebooks s’enrichit de 2000 titres en langue ukrainienne. L’offre se retrouvera dans l’ensemble des librairies partenaires, ainsi que sur la librairie en ligne, Feedbooks.

06/03/2023, 09:44

ActuaLitté

Caché dans le dark web, Z-Library de retour sur internet

#ZLibraryCase – Pourchassée, condamnée, sanctionnée, Z-Library n’a pourtant pas dit son dernier mot. Au cours de l’année passée, la bibliothèque pirate a encaissé nombre de poursuites et d’attaques, partout dans le monde. Pas assez pour abattre la Bête, qui est réapparue ce week-end, en toute tranquillité.

13/02/2023, 14:52

ActuaLitté

Le World Wide Web Consortium devient une ONG à but non lucratif

Le W3C, ou World Wide Web Consortium en version longue, est une organisation internationale qui s'efforce de développer et faire adopter des technologies standards pour le réseau hypertexte. Cette structure, affiliée à quatre établissements universitaires internationaux, devient en cette fin janvier un organisme à but non lucratif, ce qui garantira une meilleure coordination des actions, selon le consortium.

01/02/2023, 10:27

ActuaLitté

Amazon sécurise un peu plus ses offres de lecture par abonnement

Avec son appareil Kindle, apparu en 2007, Amazon a su se positionner comme un des acteurs de la lecture numérique. Le développement d'une boutique dédiée et de différentes propositions techniques l'ont rapidement rendu incontournable. Avec un défaut de taille, celui de l'aspect propriétaire de son système...

26/01/2023, 12:55

ActuaLitté

BD : Europe Comics arrête la vente directe, “une évolution naturelle”

Europe Comics, enseigne internationale créée en 2015 par une coalition d'éditeurs européens de bandes dessinées, avait pour mission première la traduction, la promotion et la vente d'albums à un public international. Le format numérique avait été choisi pour cette entreprise de grande ampleur qui s'adressait aux lecteurs et lectrices comme aux boutiques en ligne. 

24/01/2023, 11:30

ActuaLitté

izneo “doit passer de librairie digitale à plateforme de contenu”

La fermeture de plusieurs boutiques internationales d'izneo, plateforme du groupe Média-Participations dédiée à la bande dessinée numérique, laissait présager un recentrage des activités. Ainara Ipas-Bastard, directrice générale de l'enseigne depuis le mois de septembre 2022, dresse un état des lieux du marché et des chantiers ouverts pour l'avenir.

23/01/2023, 16:14

ActuaLitté

My Fair Book : une solution écologique contre la destruction de livres

Consommer de manière plus responsable fait partie de vos résolutions pour la nouvelle année ? Bravo. My Fair Book deviendra alors un de vos alliés. Lancée en octobre 2022 par Patricia Farnier et Julie Rovero, la plateforme se présente comme une alternative au pilon. Et ce, en offrant seconde chance et une durée de visibilité accrue aux textes menacés de destruction. 

19/01/2023, 16:15

Autres articles de la rubrique Numérique

ActuaLitté

IA génératives : des mesures de protection pour les artistes

Les avancées dans le domaine de l'intelligence artificielle générative, capable de créer du contenu visuel sur demande, soulèvent des questions cruciales quant à l'avenir professionnel des artistes dans les arts visuels. Son utilisation n'est pas contestable en soi, estime l'ADAGP, en tant qu'outils pour les artistes, mais il importe de veiller à ce que son développement se fasse dans le respect des droits d'auteur est devenue une priorité absolue. 

24/02/2024, 15:58

ActuaLitté

Bibliothèques Sans Frontières lance son appli pour l'intégration

Bibliothèques Sans Frontières lance une application gratuite conçue pour faciliter l'apprentissage du français aux étrangers, visant à les aider dans leur intégration professionnelle. 

22/02/2024, 18:22

ActuaLitté

Livre numérique : les “efforts” de la chaine du livre pour l'exception handicap

Dans le cadre de ses missions, l'Arcom (Autorité de Régulation de la Communication audiovisuelle et numérique) doit s'assurer que l'accès des personnes en situation de handicap aux œuvres protégées par un droit d'auteur ou un droit voisin est facilité. Pour les livres numériques, bibliothèques ou associations spécialisées et agréées peuvent réaliser des adaptations, sans que l'éditeur ne puisse s'y opposer. Dans les faits, quelques problèmes surviennent parfois...

22/02/2024, 16:03

ActuaLitté

Amazon révèle une synthèse vocale “de pointe” avec BASE TTS

Une équipe de chercheurs affiliée à Amazon revendique la mise au point de BASE TTS, un modèle de synthèse vocale propulsé par l'intelligence artificielle. Décrit comme un outil « de pointe », capable de simuler un discours d'une manière naturelle, BASE TTS annonce de riches heures pour les livres audio... Mais un peu moins pour les comédiens et comédiennes ? 

20/02/2024, 13:24

ActuaLitté

Offrir et envoyer des livres à ses proches : une pratique à cultiver

Quoi de plus plaisant que d’offrir et de recevoir des livres ? Assurément rien ne peut dépasser la joie d’envoyer et de recevoir des histoires qui nous entraînent dans des univers imaginaires tout en pensant à la personne qui a choisi l’ouvrage et qui l’a tendrement emballé avant de l’envoyer à son destinataire.

12/02/2024, 10:17

ActuaLitté

La BnF ajoute Skyblogs et pages perso Orange à la sauvegarde du net

Depuis sa mise en œuvre en 2002 par la Bibliothèque nationale de France (BnF), l'initiative de dépôt légal du web a atteint, en 2023, un jalon, en dépassant le cap des 2 pétaoctets de données, soit 2000 téraoctets – et 4,4 milliards d'adresses web archivées. En outre, près de 1,9 milliard d'adresses Skyblogs et pages personnelles Orange, fermés durant l'été ont été ajoutés cette même année.

03/02/2024, 15:47

ActuaLitté

L'Intention, le nouveau podcast de Hachette Livre

Hachette Livre a récemment enrichi son offre de podcasts avec le lancement de L'Intention, une série originale où les auteurs partagent leurs inspirations et processus créatifs derrière leur dernier livre. 

29/01/2024, 16:19

ActuaLitté

FIBD 2024 : Tom-Tom et Nana dans un escape game

À l'occasion du Festival d'Angoulême, grand rendez-vous de la bande-dessinée qui laisse une belle place aux ouvrages pour les jeunes publics, Bayard Jeunesse compte exposer des adaptations... sonores.

25/01/2024, 17:41

ActuaLitté

GenIA-L : Lefebvre Dalloz lance son IA spécialisée dans les contenus juridiques

Lefebvre Dalloz, acteur important dans le domaine juridique et fiscal en France, a annoncé le lancement de GenIA-L, une première en France en matière d'intelligence artificielle (IA) générative spécialisée dans les contenus juridiques de haute qualité.

23/01/2024, 11:47

ActuaLitté

Insight, ou l'intelligence artificielle assistante des éditeurs

Dans le domaine de l'écrit, l'intelligence artificielle évoque surtout, pour l'instant, le plagiat et le parasitisme des auteurs, malgré des usages plus réfléchis. Insight, nouvel outil porté par l'entreprise américaine Veristage, est présenté comme un assistant destiné aux éditeurs, capable, grâce à l'IA, de travailler sur la mise en forme et la commercialisation des livres.

23/01/2024, 11:22

ActuaLitté

Les logiciels des bibliothèqes : 30e enquête Tosca consultants

Pour la 30e édition de son enquête (bon anniversaire), Tosca consultants aura sollicité 38 fournisseurs de progiciels ou de solutions en ligne, pour analyser le marché des outils numériques pour les établissements de prêt. S’en dégage un point notable : le marché affiche un chiffre d’affaires de 41 millions € en hausse de 2,5 %, avec 1480 produits commercialisés, soit 7 % de moins en volume.

22/01/2024, 18:23

ActuaLitté

Quand ChatGPT permet de remporter le Goncourt du Japon

Rie Kudan, l'autrice de 33 ans lauréate du prestigieux prix littéraire Akutagawa au Japon, a été transparente durant la cérémonie de remise de la récompense littéraire : « Je dirais qu'environ 5 % du livre citent verbatim des phrases générées par l'IA », a-t-elle expliqué. Plus encore, elle considère que ChatGPT générative a joué un rôle clé dans l'expansion de son potentiel créatif. 

18/01/2024, 17:18

ActuaLitté

Facebook admet s'être appuyé sur des livres "piratés" pour former son IA  

Dans une lettre adressée lors d'une enquête de la Chambre des Lords britannique, OpenAI a reconnu qu'il était impossible de former des « IA leaders » sans utiliser de contenu protégé par le droit d'auteur. À présent, c'est Meta qui, face à des poursuites engagées par un groupe d'artistes dont Sarah Silverman et l'auteur Richard Kadrey, admet avoir utilisé des « portions de Books3 » pour former son IA Llama, avant son lancement public. Books3, qui a été retirée en ligne pour ses 37 Go de texte ou environ 200 000 livres d'œuvres piratées... 

16/01/2024, 16:37

ActuaLitté

Malgré une “année solide”, Audible procède à des licenciements

Audible, filiale du groupe Amazon dédiée aux livres audio, n'échappe pas à la vague de licenciements déclenchée par la maison-mère. Environ 5 % de sa masse salariale, soit un peu plus d'une centaine d'employés, ont été remerciés, malgré une « année solide », de l'aveu même du PDG.

12/01/2024, 11:10

ActuaLitté

ChatGPT : OpenAI admet ne pouvoir se passer de contenu soumis au droit d'auteur  

La pression exercée sur les entreprises d'intelligence artificielle, y compris OpenAI, développeur de ChatGPT, se retrouve autant sur le continent de Stephen King que celui d'Erasme. Parmi les plaintes contre l'entreprise dirigée par Sam Altman et soutenue par le géant Microsoft, celle du New York Times est la dernière en date. Le média accuse l’entreprise d'« utilisation illégale » de son travail pour alimenter son modèle de langage. De son côté, OpenAI est formelle : il est impossible de créer des outils tels que son chatbot sans accéder à du matériel protégé par le droit d'auteur.

09/01/2024, 17:37

ActuaLitté

IA : une start up propose la première certification, "livre écrit par un humain"

En 2023, ActuaLitté a largement rendu compte des nombreux débats et procédures judiciaires autour des technologies d'intelligence artificielle (IA). L'une des problématiques dénoncées par une partie du monde du livre concerne les œuvres rédigées par ces outils, en particulier le plus plébiscité, ChatGPT, mais aussi Bard ou encore Llama. Face à tout problème, une opportunité entrepreneuriale se présente : la startup Librinova a lancé un service pour garantir l'authenticité humaine d'une production littéraire.

09/01/2024, 14:10

ActuaLitté

Le colis : un marché qui continue son développement

Si vous souhaitez envoyer un livre, que ce soit en France ou à l’étranger, vous avez le choix entre plusieurs acteurs. Ce marché de la livraison à domicile continue de s’étoffer en France pour répondre au plus près à toutes les demandes des clients. Mais est-il vraiment opportun de continuer à prôner son développement à outrance ?

09/01/2024, 10:34

ActuaLitté

Télécharger les livres de Francis Picabia

En 2024, Francis Picabia (1879-1953) a fait son entrée dans le domaine public avec son œuvre. C'est l'occasion de redécouvrir la peinture de cette figure du mouvement dada et du surréalisme, mais aussi son écriture. Il a en effet signé un certain nombre de recueils poétiques, disponibles au format numérique.

05/01/2024, 14:54

ActuaLitté

Smartphones : des livres éclairants sur leurs usages

Si l’on s’inquiète beaucoup du temps que passent enfants et adolescents devant leur petit écran de téléphone, on oublie parfois de réfléchir à ce que font les parents en la matière... Et ce n’est guère mieux, voire pire. Il est peut-être temps de s’interroger sur notre rapport au portable.

02/01/2024, 09:13

ActuaLitté

Face aux audiolivres piratés, l'impuissance règne

Des milliers d'audiolivres de la production littéraire grecque ont été découverts, mis à disposition sur un même site, dans la plus totale illégalité. Cette diffusion a pu être interrompue, pour partie, assure l'OSDEL, l'organisme de gestion collective local.

29/12/2023, 16:21

ActuaLitté

IA : un guide pour savoir (mieux) utiliser ChatGPT

OpenAI donne ses conseils de formulation de questions, divisés en six stratégies pour obtenir de meilleurs résultats des modèles de langage IA et de ChatGPT. Les stratégies comprennent la fourniture d'instructions claires, la présentation de textes de référence, la décomposition des tâches complexes en sous-tâches, laisser le temps au modèle de « réfléchir », l'utilisation d'outils externes et la réalisation d'évaluations ciblées. 

28/12/2023, 17:05

ActuaLitté

Livraison par la poste : des livres mais de moins en moins de lettres

Avec l’envolée du commerce en ligne durant les deux dernières décennies, et encore plus avec les nouveaux modes de consommation induits par les habitudes prises durant la pandémie, on pense souvent que La Poste tire profit de cette situation. Sauf que, pendant que les colis saturent les circuits, les lettres se font rares.

28/12/2023, 11:00

ActuaLitté

"C'est la première fois de l'histoire qu'une IA remporte un prix littéraire"

En Chine, un professeur de journalisme a reçu le deuxième prix dans un concours d'écriture de science-fiction. Sauf que ce n'est pas sa création propre qu'il y avait présentée, mais celle d'une IA à qui il n'a fait que donner quelques indications.

27/12/2023, 16:25

ActuaLitté

ChatGPT : c'est au tour du New York Times de porter plainte

ActuaLitté a rapporté ces dernières semaines les premières plaintes contre la star des IA conversationnelles, ChatGPT, et son créateur, OpenAI, elle-même détenue par Microsoft. Les deux auteurs Paul Tremblay et Mona Awad en juin dernier, Sarah Silverman, Christopher Golden et Richard Kadrey en juillet, ou plus récemment, quatre auteurs, dont Michael Chabon, lauréat du Prix Pulitzer en 2001. Cette fois, une grande entreprise entre dans la danse : ce mercredi, le New York Times a engagé des poursuites judiciaires contre OpenAI et Microsoft. 

27/12/2023, 15:43

ActuaLitté

Marvel : Loki sur le podium des séries les plus piratées de 2023

En 2022, les adaptations de livres s'accaparaient les trois premières places dans le classement des séries les plus téléchargées illégalement sur les sites de torrent : House of the Dragon, la préquelle de Game of Thrones, Le Seigneur des Anneaux : Les Anneaux de Pouvoir, inspirée de l'univers de Tolkien, et The Boys, adaptée de la bande dessinée de Garth Ennis et Darick Robertson. Cette année, leur présence est moindre, mais une production a tout de même réussi le triste exploit de se hisser sur le podium... 

27/12/2023, 12:13

ActuaLitté

Libraires et éditeurs en panique : une cyberattaque paralyse les comptables

Depuis le 8 décembre dernier, le directeur général de Coaxis, le logiciel comptable, multiplie les communications. Ce jour, l’entreprise connaissait « un incident majeur » frappant son infrastructure informatique. En cause un rançongiciel, ou ransomware, qui prend l’entreprise en otage.

22/12/2023, 20:15

ActuaLitté

Rakuten Kobo dévoile les habitudes de lecture numérique des français

La fin d'année est l'occasion pour de nombreuses plateformes de dévoiler les habitudes de consommation de ses utilisateurs. Spotify Wrapped ou My Deezer Year ont un franc succès chez les auditeurs de musique. Mais les applications de lecture, Rakuten Kobo en tête, jouent aussi le jeu.

06/12/2023, 16:39

ActuaLitté

Des liseuses vendues dans les librairies indépendantes de France

ePagine, partenaire de la librairie indépendante en Europe, et inkBOOK, fabricant de liseuses, se sont associés pour proposer une nouvelle génération d'appareils de lecture. Ces derniers sont conçus pour offrir une utilisation simplifiée et promouvoir la lecture numérique auprès du grand public.

04/12/2023, 17:25

ActuaLitté

La révolution des audiobooks : faciliter la lecture en mobilité

Bienvenue dans l'ère de la lecture numérique, où les livres audio révolutionnent notre manière de consommer les récits. Jadis confinée aux pages imprimées, la lecture s'adapte aujourd'hui à notre rythme de vie effréné, offrant une alternative pratique et immersive. 

01/12/2023, 11:10

ActuaLitté

Des livres pour Noël : un compagnon de lectures pour la fin d'année

KoboLecture - La magie des fêtes de fin d'année apporte son lot de moments chaleureux passés au coin du feu. En partenariat avec ActuaLitté, les libraires de Kobo ont soigneusement sélectionné des romans pour se plonger dans de nouvelles aventures littéraires, découvrir des mondes lointains et vivre des histoires captivantes... pour enrichir vos fêtes.

23/11/2023, 14:28

ActuaLitté

TikTok nocif pour la santé mentale : qu'importe, si ça vend des livres ?

Nouvelle égérie des éditeurs, TikTok et son hashtag Booktok vrillent les esprits : solution marketing présentée comme idéale pour toucher des préados aux jeunes adultes, cet outil s’avère en réalité nuisible, affirme Amnesty International. Emboîtant le pas à une récente étude, la Commission européenne elle-même réclame des gages, y compris à YouTube. Avec une certaine urgence pour ces plateformes…

14/11/2023, 12:40

ActuaLitté

Langues vivantes, machines pensantes ? L'IA au Collège de France 

Invité sur la chaire annuelle Informatique et sciences numériques pour l’année 2023-2024, Benoît Sagot prononcera au Collège de France une leçon inaugurale consacrée au traitement automatique des langues. Le directeur de l’équipe de recherche ALMAnaCH au sein de l'Institut national de recherche en sciences et technologies du numérique (Inria) retracera notamment l'histoire de ce domaine, qui suscite l'intérêt de plus en plus d'entreprises.

14/11/2023, 09:22

ActuaLitté

L'Assistante : entre sexualité et handicap, une odyssée émotionnelle

Holdup21 – Sienne a suivi la formation de l’APPAS (Association Pour la Promotion de l’Accompagnement Sexuel) : « Faire l’amour, avec de l’argent, pour réparer, c’est ok », dit-elle. Au cœur du recueil Hold-up 21, le texte d’Alexandra Cismondi, L'Assistante, explore des intimités plurielles : celles de personnes en situation de handicap, médicalisées ou grand brûlé… Douceur, délicatesse et humanité.

13/11/2023, 11:10

ActuaLitté

L'intégralité de la saga Harry Potter désormais disponible sur Kobo Plus

Rakuten Kobo a annoncé ce 8 novembre 2023, depuis Toronto, son partenariat avec Pottermore Publishing pour enrichir son service Kobo Plus avec les versions numériques des aventures de Harry Potter, ainsi que d'autres œuvres appartenant au même univers magique. Disponibles en anglais et en français, ces livres viennent s'ajouter à la riche bibliothèque de Kobo Plus, accessible dès à présent aux abonnés.

09/11/2023, 17:06

ActuaLitté

Livre audio numérique : Prose entend travailler avec les librairies

Format à la dynamique impressionnante, le livre audio numérique s’installe petit à petit dans les pratiques culturelles des Français et Françaises. Au détriment de son pendant physique, qui perd du terrain, y compris dans les librairies. La plateforme Prose espère travailler avec les commerces indépendants, pour les faire profiter du format et de sa commercialisation, mais aussi d’une offre d’abonnement.

09/11/2023, 10:36

ActuaLitté

Autopublication : de l'écrit à l'audio, Amazon montre la voix

Les améliorations des technologies de synthèse vocale, aidées par les apports de l'intelligence artificielle, bouleversent le paysage de la lecture à voix haute et de l'enregistrement des livres audio. Dernier exemple en date, une fonctionnalité testée par Amazon, qui permet aux auteurs autopubliés de générer une version lue de leur texte en 72 heures seulement.

07/11/2023, 15:08