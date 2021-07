Comment le Projet Gutenberg débute-t-il ?

Alors étudiant à l’Université de l’Illinois (États-Unis), Michael Hart se voit attribuer quelques centaines de milliers d’heures de « temps machine » (ce qui correspond à quelques millions de dollars) dans le laboratoire informatique (Materials Research Lab) de son université.

Le 4 juillet 1971, jour de la fête nationale, il saisit « The United States Declaration of Independence » sur le clavier de son terminal. En caractères majuscules, puisque les caractères minuscules n’existent pas encore. Le texte électronique représente 5 Ko (kilo-octets). Puis il diffuse un message aux 100 usagers du réseau pré-internet pour indiquer où le fichier est stocké, suite à quoi ce fichier est téléchargé par six personnes. Le Projet Gutenberg est né.

Dans la foulée, Michael Hart décide de se consacrer à la recherche d’œuvres littéraires disponibles en bibliothèque, à la numérisation de celles-ci (saisie sur un clavier page après page) et au stockage des textes électroniques. Peu après, il définit la mission du Projet Gutenberg, à savoir mettre gratuitement à la disposition de tous, par voie électronique, le plus grand nombre possible d’œuvres littéraires.

D’abord considéré comme complètement irréaliste, ce projet prend son envol en 1991 avec l’apparition du web, ce qui va faciliter la circulation des textes électroniques et le recrutement des volontaires.

Michael Hart explique en août 1998 dans un entretien par courriel : « Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier. Le seul point commun est que nous diffusons les mêmes œuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les établissements d’enseignement. »

Au lieu d’être un ensemble de pages brochées ou reliées, le livre devient un texte électronique en continu au format ASCII, avec des lettres capitales pour les termes en italique, en gras et soulignés de la version imprimée. Le format ASCII (American Standard Code for Information Interchange) est le format le plus simple et le plus répandu et il peut être lu sur tout ordinateur, toute plateforme et tout logiciel. Il sera plus tard remplacé par l’Unicode, qui peut prendre en compte toutes les langues de la planète.

La plateforme Distributed Proofreaders

Le Projet Gutenberg trouve un nouveau souffle avec la création de la plateforme Distributed Proofreaders pour partager la relecture des livres numérisés entre des milliers de volontaires. Conçu en octobre 2000 par Charles Franks pour aider à la numérisation des livres du domaine public, Distributed Proofreaders devient rapidement la principale source du Projet Gutenberg.

L’idée est de permettre la relecture partagée de livres scannés à partir d’une version imprimée puis convertis au format texte par un logiciel OCR (Optical Character Recognition), fiable à 99 % dans le meilleur des cas, ce qui représente donc quelques erreurs par page. Les fichiers obtenus sont fragmentés en pages pouvant être relues par des correcteurs différents. Le scan de la page imprimée et le fichier OCR apparaissent en vis-à-vis à l’écran. Les volontaires n’ont aucun quota à respecter. À titre indicatif, il est suggéré de relire une page par jour. Les livres sont tous relus deux fois de bout en bout par des volontaires différents.

Distributed Proofreaders est officiellement affilié au Projet Gutenberg en 2002, puis devient une entité séparée avec la Distributed Proofreaders Foundation en mai 2006. Distributed Proofreaders compte 10.000 titres numérisés et relus en décembre 2006, 20.000 titres en avril 2011 et plus de 40.000 titres en juin 2021.

La philosophie du Projet Gutenberg

La structure administrative et financière du Projet Gutenberg se limite au strict minimum, avec une devise qui tient en trois mots : « Less is more » (Le plus est le moins).

Le but est d’assurer la pérennité du projet indépendamment des crédits, des coupures de crédits et des priorités culturelles, financières et politiques du moment. Pas de pression possible donc par le pouvoir et par l’argent. Et respect à l’égard des volontaires, qui sont assurés de voir leur travail utilisé pendant des décennies, si ce n’est pour plusieurs générations. Le suivi régulier du projet est assuré grâce à une lettre d’information hebdomadaire et mensuelle, des forums de discussion, des wikis et des blogs.

En juillet 2011, quarante ans après les débuts du Projet Gutenberg et peu avant son décès, Michael Hart se définit toujours comme un fou de travail dédiant toute sa vie à son projet, qu’il voit comme étant à l’origine d’une révolution néo-industrielle. Il se définit aussi comme altruiste, pragmatique et visionnaire. Après avoir été traité de toqué pendant des années, il force maintenant le respect.

Michael Hart précise souvent dans ses écrits que, si Gutenberg a permis à chacun d’avoir ses propres livres (jusque-là réservés à une élite) pour un coût relativement modique, le Projet Gutenberg permet à chacun d’avoir une bibliothèque gratuite (jusque-là réservée à une collectivité) sur un support qu’on peut glisser dans sa poche ou porter en pendentif autour du cou. Les collections du Projet Gutenberg ont la taille d’une bibliothèque publique de quartier, mais cette fois disponible sur le web, téléchargeable par tous et indéfiniment reproductible.

Au fil des ans, sous la houlette de Greg Newby, son PDG, la mission du Projet Gutenberg reste la même, à savoir produire et diffuser des livres numériques gratuits de qualité, et favoriser ainsi la lecture et la culture pour tous dans le monde entier.

[Une Histoire du Projet Gutenberg est disponible dans les collections du Projet Gutenberg.]

Gravure : atelier d'impression, domaine public