PORTRAIT – Bientôt au cœur d'un tonitruant procès intenté par quatre grands groupes d'édition américains, la plateforme Internet Archive célèbre, en 2021, ses 25 ans. Depuis 1996, elle abrite des sauvegardes du web mondial, mais aussi des exemplaires numériques de films, enregistrements audio, jeux vidéo, journaux ou encore livres. Portrait du bâtisseur de cette bibliothèque d'Alexandrie, Brewster Kahle.
Pour faire apparaitre les lettres sur le papier, le typographe doit soigneusement aligner des caractères en relief, à l'envers, dans un composteur, répéter l'opération selon la longueur du texte, organiser la page, avant d'appliquer l'encre sur les formes et, enfin, de presser celles-ci contre une feuille. Ce processus, long, complexe, minutieux, est celui de la page imprimée depuis des siècles.
Il constitue aussi un des passe-temps de Brewster Kahle, que l'on cataloguerait plutôt dans l'étagère des gourous technologiques, adeptes de la table rase en matière de transmission des savoirs et de la connaissance. L'Américain Kahle est en effet le cocréateur de l'organisation à but non lucratif Internet Archive, fondée en 1996, devenue la « bibliothèque de l'internet ».
Cette gigantesque plateforme conserve aujourd'hui 150 milliards de pages web, et des millions de films, enregistrements audio, documents divers et logiciels, pour la plupart dans le domaine public. Bien moins connue que Wikipédia, l'encyclopédie participative, Internet Archive s'est pourtant donnée une mission au moins aussi ambitieuse : « Offrir un accès universel à la connaissance », « seul objectif » que revendique Kahle.
Les études de Kahle, elles, étaient sans conteste tournées vers les nouvelles technologies. Au prestigieux Massachusetts Institute of Technology, il se spécialise dans l'intelligence artificielle et le traitement rapide d'importants volumes de données. À 23 ans, il participe à la création de la société de son aîné, déjà diplômé, Danny Hillis. Il travaille ainsi sur la mise en réseau de plusieurs processeurs, créant un « superordinateur » capable de calculs inimaginables.
La contribution de Kahle dans ce projet annonce déjà Internet Archive : le programme qu'il crée « fouille » une base de données de cours du Dow Jones, récupérés dans des journaux et des magazines. À quelques décennies de la fouille de textes et de données, sa création a du potentiel mais les limitations technologiques en freinent le développement.
Passionné, Brewster Kahle créera lui-même la déviation qui permettra d'éviter cet obstacle. À l'orée des années 1990, inspiré par la mise en réseau des ordinateurs au sein du Massachusetts Institute of Technology - un proto-internet au sein de l'institut -, il invente la technologie WAIS. L'acronyme de Wide-Area Information Server : pour faire simple, un logiciel capable de rechercher dans de larges bases de données, puis de proposer des résultats, par ordre de pertinence.
En 1992, alors que le web s'enrichit, mais doit se structurer et s'ordonner pour être consulté, WAIS représente une promesse intéressante. Cette année-là, Brewster Kahle cocrée avec son camarade d'université, Bruce Gilliat, WAIS Inc., et vend des services, principalement aux éditeurs de presse, pour améliorer la structuration des sites web et la mise en ligne des données. Les sites du Wall Street Journal, du New York Times ou encore de journaux locaux de San Francisco s'appuient alors sur sa technologie.
(illustration, drosen7900, CC BY-NC-ND 2.0)
Quelques années plus tard, en 1995, le fournisseur d'accès à internet AOL (America Online) jette son dévolu sur WAIS Inc., pour un montant de 13 millions $. La somme est inespérée, mais la montée en puissance des moteurs de recherche et la future obsession du web pour les données vont bientôt donner une autre dimension à la carrière du jeune technicien...
Quand internet et ses architectes de l'époque pensent vers l'avant, Brewster Kahle adopte une démarche quasi-patrimoniale. En 1996, à nouveau avec Bruce Gilliat, il cofonde Internet Archive, une organisation à but non lucratif qui se donne pour mission d'enregistrer et de cataloguer chaque page internet publique. Parallèlement à cette entité, les deux amis créent Alexa, avec un but lucratif cette fois : vendre un accès payant à des pages indisponibles.
Internet Archive et Alexa, deux facettes d'une même pièce, joignent le patrimonial au lucratif, mais Alexa prend rapidement le dessus, du moins en termes de notoriété et de succès. Pensée comme un catalogue, la société qui tire son nom d'une référence à la Bibliothèque d'Alexandrie devient rapidement un moteur de recherche, qui s'appuie sur l'historique des usagers pour proposer les pages les plus pertinentes à ses utilisateurs.
En 1998, quand le moteur de recherche Alexa s'ouvre au grand public, la société de Kahle et Gilliat compte 32 employés, qui travaillent depuis des bureaux installés dans l'immeuble 37, au sein du Parc Presidio de San Francisco. Alexa stocke alors des kilo-octets de métadonnées, entre les informations sur les sites, les historiques de navigations des utilisateurs ou encore les liens entre les pages web, et se finance grâce à la publicité.
Preuve du potentiel d'Alexa — et de l'effervescence liée à la bulle Internet de la fin des années 1990 —, la société est rachetée un an plus tard, en 1999, pour une somme de 250 millions $. La signature aux côtés de Kahle et Gilliat sur le contrat n'est autre que celle de Jeff Bezos, créateur d'une société qui monte, Amazon.com.
Sous leurs airs lunaires, Kahle et Gilliat avaient prévu ce genre de dénouement : « Nous voulons l'intégrer dans l'infrastructure d'internet », expliquait le premier quelques mois avant la vente. « Un des moyens d'y parvenir serait de vendre Alexa à un navigateur, à un moteur de recherche ou un fournisseur d'accès à internet, et tous représentent une possibilité. »
La précédente société des deux hommes, WAIS Inc., s'était retrouvée diluée dans AOL : cette fois, Kahle et Gilliat prennent leur précaution, et parviennent à convaincre Bezos de laisser une certaine autonomie à Alexa. Si l'acquisition a permis à Bezos « d'économiser 250 millions $ dans le seul matériel » tout en lui permettant de collecter des données, Kahle et Gilliat s'en sortent bien, eux aussi.
Outre la somme de la cession à Amazon, les deux hommes parviennent à inclure dans le contrat une clause qui prévoit la cession des données collectées par Alexa à Internet Archive. Pendant 5 ans, les sauvegardes de pages web disparues s'amoncellent, créant ainsi les fondations de la « bibliothèque de l'internet ». Et, petit bénéfice lié au pactole, Kahle ajoute la navigation à la liste de ses hobbys, aux côtés de la typographie.
Dès 1996 et la création d'Internet Archive, Brewster Kahle entame une course contre la montre, doublée d'un travail de Sisyphe. Dans un manifeste sobrement intitulé « Un projet à long terme pour sauvegarder internet devrait ouvrir la voie à de nouveaux services », il annonce le projet derrière Alexa, mais, surtout, Internet Archive. « Les premiers manuscrits de la Bibliothèque d'Alexandrie ont brûlé, les premiers ouvrages imprimés ont disparu, les premiers films ont été recyclés pour leur teneur en argent », énumère-t-il, en assurant que ce cycle de la disparition ne doit pas s'étendre au médium le plus récent, à savoir Internet.
Alexa vendu à Amazon, Brewster Kahle se consacre entièrement à Internet Archive (IA), en devenant également le principal représentant. La plateforme poursuit son inlassable sauvegarde du web mondial, où une page web dispose d'une durée de vie de 77 jours en moyenne, selon Kahle. À cette époque, Internet Archive peine toutefois à transformer l'essai, et différentes pistes sont évoquées, notamment celle d'un moteur de recherche qui apporterait une réponse directe à la question précise d'un utilisateur.
En 2001, enregistrer le web mondial ne suffit plus à Kahle : avec Gilliat, il créé Wayback Machine, un service d'Internet Archive exclusivement dédié à la consultation de pages web supprimées ou modifiées. Pour lui, ces sauvegardes sont un enjeu crucial. « Le web est la ressource n° 1 pour les gens. C'est ainsi que les étudiants apprennent, que les affaires se font. Si nous ne disposons pas de la mémoire du web, alors nous vivons dans un monde à la Orwell, que nous aurons nous-mêmes créé », assure-t-il en 2002. L'année suivante, Internet Archive se dotera de son outil, Heritrix, pour s'affranchir d'Alexa.
Internet Archive en 1998, capturée par Wayback Machine
Parallèlement, Kahle commence à militer pour qu'Internet Archive puisse enregistrer et proposer au public un autre type d'artefacts : des programmes radiophoniques, des émissions de télévision et, même, des livres du domaine public. Après tout, les pages web collectées depuis quelques années commencent à inclure de tels contenus les rendant accessibles au public.
20 ans plus tard, Internet Archive est devenu un véritable marché aux puces du web et de la culture mondiale, avec 32 millions de livres, 7 millions de vidéo, 13 millions de fichiers audio, 3 millions d'images ou encore 726.000 logiciels.
Sorti des projets à but lucratif — il concède avoir obtenu « suffisamment d'argent » avec ses précédentes entreprises —, Brewster Kahle a d'emblée inscrit la mission d'Internet Archive dans l'intérêt général. Encore aujourd'hui, la plateforme se présente sans publicité, et ne nécessite d'aucune inscription pour consulter ses contenus, à la manière de l'encyclopédie Wikipédia.
Comment expliquer sa longévité, dans un web justement si volatile ? Kahle parvient, dès 2007, à faire reconnaitre un statut de « bibliothèque » à sa plateforme par l'État de Californie, qui abrite le siège d'Internet Archive, à San Francisco. Le site peut alors recevoir des subventions fédérales pour poursuivre ses activités, mais accède surtout à une forme de respectabilité.
Plusieurs bibliothèques américaines, publiques ou universitaires, se rapprochent d'Internet Archive, principalement pour son infrastructure web et ses capacités de stockage. Des collectionneurs privés font de même, comme Rick Prelinger, réalisateur, écrivain et à la tête d'une collection de 60.000 films publicitaires de toutes les époques, qui préside encore aujourd'hui le comité directeur d'Internet Archive.
Le fonctionnement d'Internet Archive est assuré par les dons des utilisateurs, mais surtout par le soutien philanthropique dont elle bénéficie. Assez discrète sur ses financeurs, la société sans but lucratif aurait bénéficié des millions des fondations américaines Andrew W. Mellon, Hewlett, Knight ou encore Arnold Ventures. Elle réunit près de 170 employés en 2018, avec un siège toujours installé à San Francisco.
Entrepreneur dans sa jeunesse, Brewster Kahle a finalement laissé la place à son obsession dès 1996. Ce faisant, il est devenu une sorte d'« ultra archiviste », qui ne lit lui-même pas vraiment sur écran et se déclare viscéralement opposé à l'idée de jeter un livre. En 2011, il présente ainsi aux journalistes ses dernières acquisitions : des containers reconvertis, capables de contenir 40.000 livres chacun. « L'idée est de pouvoir collecter un exemplaire de chaque livre publié. Nous n'y arriverons pas, mais c'est notre objectif », s'amuse-t-il.
« En fait, avec le temps, il est devenu plus visionnaire, plus évangéliste », indique Pamela Samuelson, professeure en droit à l'université de Berkeley, qui a connu Kahle au début des années 1990. « Je l'imagine très bien à 85 ans, encore en train de dire : “On peut faire ceci, on peut faire cela” ». L'étiquette d'évangéliste semble plus ou moins convenir à l'intéressé, qui prenait plaisir à évoquer son « arche de Noé » pour les livres, capable de les sauver d'un océan d'oubli ou d'une destruction bien plus concrète.
Dix ans plus tard, les containers ne sont plus vraiment évoqués. En 2012, il avait fondé l'Internet Archive Federal Credit Union, un organisme de crédit destiné à aider les employés qui ne pouvaient pas prétendre aux logements de San Francisco et à leurs loyers prohibitifs. En 2015, son essai se heurte à un mur. D'une génération antérieure à celle des Mark Zuckerberg et autre Jack Dorsey, Brewster Kahle n'a d'excentrique que ses projets, finalement. Seul détail croustillant : au siège d'Internet Archive, dans une ancienne église de la Science chrétienne, Kahle s'est constitué une armée en terre cuite, tel Qin Shi Huang, le premier empereur de Chine, à l'effigie des employés d'Internet Archive restés plus de 3 ans à ses côtés...
L'armée en terre cuite de Kahle, au siège d'Internet Archive (leiris202, CC BY-NC 2.0)
« Nous faisons des choses que les bibliothécaires aimeraient pouvoir faire eux-mêmes », déclare Brewster Kahle à propos du fonctionnement d'Internet Archive. Si elle reste moins connue que Facebook, Uber ou AirBnB, et génère moins d'argent, Internet Archive a apporté sa part de « disruption ».
Alors que certains États se désengagent financièrement de la numérisation du patrimoine ou que des établissements patrimoniaux placent leurs collections numérisées derrière des restrictions d'accès ou d'usage, Internet Archive proclame en effet la primauté de l'accès du public au patrimoine. Lawrence Lessig, pointure internationale du droit en matière de propriété intellectuelle et de défense du domaine public, désigne d'ailleurs Kahle comme son « héros ».
Toute personne ayant fait des recherches sur des sujets anciens, nécessitant la consultation de documents patrimoniaux, aura sans doute eu recours à Internet Archive. La plateforme s'avère plus simple d'accès que HathiTrust, plus tournée vers les bibliothèques universitaires, et bien moins commerciale que Google Books. À ce titre, Kahle s'était opposé en 2009 à un projet qui aurait permis à Google de numériser et commercialiser des œuvres indisponibles du XXe siècle, ou de « privatiser nos bibliothèques », comme le dénonçait-il alors.
Si Kahle a fait d'Internet Archive un lieu sans publicité ni restriction d'accès, il semble aussi paradoxal qu'une initiative privée, même sans but lucratif, prenne peu à peu le relais des États dans la gestion du patrimoine et du domaine public.
D'autant plus que l'horizon de la plateforme ne se limite pas au domaine public. Même si cela n'est pas vraiment avoué par son cofondateur, Internet Archive s'appuie sur une sorte de zone grise de la législation du copyright : des contenus peuvent en effet y être déposés par les utilisateurs, débouchant sur la présence d'œuvres protégées, qu'il est assez simple de découvrir.
Un des scanners d'Internet Archive (illustration, Scott Beale, CC BY-NC-ND 2.0)
La disruption pourrait ainsi s'étendre à la législation sur le copyright elle-même et sur les usages en matière de patrimoine numérique. En mars 2020, incitée par la pandémie, Internet Archive ouvre une « bibliothèque d'urgence » qui donne accès à des ouvrages numériques sous droit, gratuitement, aux utilisateurs inscrits. Elle embrasse alors pleinement son statut de bibliothèque, mais des éditeurs américains crient au piratage.
« Sans aucune licence ni paiement aux éditeurs et aux auteurs, [Internet Archive] scanne des ouvrages imprimés, stocke de manière illégale ces numérisations sur ses serveurs et distribue des exemplaires de ces copies par l'intermédiaire de sites publics », affirment quatre éditeurs dans une plainte commune qui ramène la plateforme à un site pirate. La bibliothèque d'urgence aura été la goutte d'eau : la plateforme était déjà dans le viseur de l'édition depuis quelques années, dans cette fameuse zone grise.
Le procès doit se dérouler en novembre prochain, et Brewster Kahle sait qu'il peut compter sur les bibliothécaires pour défendre les pratiques de sa plateforme. Outre les quelque 400 bibliothèques partenaires et les employés d'Internet Archive venus de ce milieu, toute une profession devrait se mobiliser, considérant qu'Internet Archive vient apporter des solutions techniques concrètes aux difficultés liées au prêt des livres numériques par les établissements.
Ebooks trop chers, trop protégés, titres manquant dans l'offre commerciale... Les bibliothécaires se plaignent depuis des années de l'immobilisme des éditeurs dans ce domaine. Le procès d'Internet Archive et les convictions de l'ultra archiviste pourraient bien les aider à changer la donne.
Photographie : Brewster Kahle en 2009 (d'après un photographie de Joi Ito, CC BY 2.0)
Commenter cet article