Face aux plateformes dantesques comme Z-Library (12 millions de livres) et (80 millions d'articles scientifiques), les éditeurs se livrent à un jeu du chat et de la souris quelque peu répétitif. D'autant plus qu'un accès bloqué dans un pays fait souvent émerger des dizaines de sites miroirs, ces reproductions à l'identique de la plateforme visée.

En juillet 2022, le projet Pirate Library Mirror s'appuyait justement sur cette pratique. « Ce projet contribuera à la préservation et la libération des connaissances humaines. Nous apportons notre petite et modeste contribution, sur les traces des grands venus avant nous », annonçait l'équipe, ne dissimulant guère ses intentions.

Anna’s Archive, catalogage parallèle

Peu de temps après, le même groupe ouvrait Anna's Archive, un site qui propose tout simplement un immense catalogue commun de sites pirates. À son inauguration, deux principales sources, Z-Library et LibGen, se trouvaient complétées par des fichiers torrent, qui permettent de télécharger facilement des données.

L'objectif de l'équipe derrière Anna's Archive est justement de garantir une ressource miroir, capable de prendre le relais si des mastodontes du piratage sont visés par la justice et les autorités de tel ou tel pays.

20 millions de livres sont d'ores et déjà référencés, et plus de 100 millions d'articles scientifiques. Mais ce n'est pas tout : Anna's Archive a récemment siphonné les ressources du site WorldCat, catalogue commun des bibliothèques du monde entier, pour en extraire les métadonnées. Ces dernières permettent d'identifier les documents, de constituer des catalogues et d'échanger des fiches bibliographiques. Un véritable trésor informatique, très convoité, notamment par les sociétés qui fournissent des services aux bibliothèques...

Anna's Archive ne mettra pas seulement ces métadonnées à disposition : elle les utilisera pour « créer une liste des livres qu'il nous reste à archiver », explique l'équipe à Torrent Freak.

Sur les épaules des géants

La plateforme s'appuie sur ce réseau de sites miroirs et de ressources décentralisées pour protéger ses collections, qu'elle estime équivalentes à 5 % des livres publiés dans le monde entier.

« Nous travaillons avec nos partenaires pour rendre nos collections accessibles à tous, facilement et librement. Nous pensons que toute personne a le droit de consulter le savoir commun de l'humanité. Et pas au détriment des auteurs », garantit l'équipe, qui renvoie vers l'ouvrage Contre le monopole intellectuel, des universitaires américains Michele Boldrin et David K. Levine (distribué en accès libre).

Présenté comme un moteur de recherche, Anna's Archive se place « sur les épaules des géants », afin d'étendre l'influence des réservoirs pirates du monde entier.

Particulièrement véloce, Anna's Archive s'est déjà mis au diapason de l'intelligence artificielle, en proposant aussi des jeux de données pour les grands modèles de langage, cette technologie au cœur des outils basés sur l'IA. De quoi nourrir les applications de passionnés ou de sociétés commerciales, telles OpenAI et Meta, et agacer les ayants droit et les auteurs, qui tentent d'encadrer les usages des œuvres...

Photographie : illustration, Andrew Smith, CC BY-SA 2.0