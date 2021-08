Comme le nom du projet l'indique, l'Open Library souhaite automatiser la « lecture » des textes présents au sein de la bibliothèque Internet Archive, pour extraire le « génome » de chaque titre, autrement dit son matériel génétique, ce qui le rend unique.

L'équipe derrière l'« Open Book Genome Project » se pose une question simple : comment caractériser de la manière la plus précise possible un livre ? Titre, auteur, date de parution font bien entendu partie des métadonnées de base, mais ces éléments seuls ne permettent pas de saisir la nature d'un ouvrage. Elles constituent en quelque sorte sa carte d'identité, mais sa personnalité intime reste inconnue.

Pour analyser précisément un ouvrage, une lecture reste indispensable, pour en extraire les thématiques, les sujets abordés, les lieux ou encore les personnages cités dans le texte. Or, tout lecteur sait que, malheureusement, il est impossible de lire tous les livres de la planète...

Sauf peut-être si le lecteur est une entité technologique : la première partie du projet Open Book Genome Project s'appuie ainsi sur la technologie, par l'intermédiaire d'un robot qui « lira » tous les livres de la bibliothèque Internet Archive. Soit 32 millions d'ouvrages, tout de même. Cette machine définira quelques critères de classification, à partir de son analyse.

La seconde partie du projet fera cette fois appel aux humains, en leur proposant de classer de manière plus fine les ouvrages déjà repérés par le robot.

BIBLIOTHEQUE: automatiser le désherbage ?

« Nous espérons que le projet Open Book Genome aidera à rendre les données autour des livres plus accessibles et plus utiles au public : ceci, afin d'améliorer les recommandations, les comparaisons entre livres, pour produire des résumés plus complets, diriger le public vers le bon livre, mettre en avant les citations et les sources mentionnées dans les livres, et bien plus encore », souligne Michael E. Karpeles, responsable des programmes pour Open Library.

