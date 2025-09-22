À la croisée du web sémantique, du scraping et de l’intelligence artificielle, cette démarche obstinée interroge la manière dont on peut aujourd’hui cartographier la littérature. Ou le récit d'une obsession personnelle à documenter la réception contemporaine des romans.

Psy : Pouvez-vous me parler de votre obsession de cartographier la littérature contemporaine, de dépasser Wikipédia ?

Moi : Depuis plus de dix ans, je collecte compulsivement des informations sur les auteurs de romans. Aujourd’hui encore, je consacre près de trente heures par semaine à cette veille, bénévolement. Ma compagne me voit sans cesse devant mon ordinateur, à imaginer de nouvelles médiations… Mais surtout à saisir, corriger, recoder.

Cette obsession pourrait sembler anecdotique. Mais elle traduit une conviction plus profonde : la littérature contemporaine mérite d’être documentée autrement que par les seuls canaux encyclopédiques. Il s’agit de construire un espace parallèle, militant, qui rende compte de la diversité des voix et des sensibilités qui s’expriment sur le web littéraire.

La veille comme matière brute

Psy : Et que cherchez-vous exactement dans ces centaines de chroniques que vous compilez ?

Moi : Le bruit. Les voix multiples. Les échos subjectifs qui échappent aux grandes plateformes.

Depuis plus de dix ans, je structure le web littéraire : billets de blogs, critiques de presse, podcasts, vidéos. Ce n’est pas une matière neutre ni académique : elle est traversée par des enthousiasmes, des agacements, des intuitions fulgurantes. Mon obsession s’est construite là : capter ces signaux et les relier entre eux pour dessiner un paysage de la littérature contemporaine.

Structurer pour relier

Psy : Vous ne vous contentez pas d’accumuler. Vous avez besoin de mettre de l’ordre, n’est-ce pas ?

Moi : Exactement. Je n’empile pas, je relie. C’est plus fort que moi.

Très vite, j’ai compris qu’archiver pour archiver était vain. Alors j’ai plongé dans les données structurées, les schémas, le web sémantique. Pas pour faire joli, mais pour que chaque information puisse en appeler une autre : un auteur vers son éditeur, un livre vers les émotions qu’il déclenche.

À cela s’ajoute le travail en coulisses : le scraping patient des chroniques et des métadonnées, et le tagging contrôlé par SpaCy pour identifier les entités, filtrer les négations, extraire les thématiques. Ce n’est pas de la magie noire, mais de la mécanique documentaire, minutieuse et répétée. Corriger un modèle, ajuster un mot-clé, reprendre une règle grammaticale… chaque détail compte pour que les liaisons entre données soient justes.

C’est ainsi qu’ont émergé les notices auteurs sur Bibliosurf. Ce ne sont pas de simples fiches biographiques : elles mêlent identité, bibliographie, réception et médiation. On y trouve le nom, les pseudonymes, les dates, mais aussi les identifiants qui relient ces données à d’autres bases, comme ceux de la Bibliothèque nationale de France ou le VIAF [fichier d'autorité international virtuel, Virtual International Authority File, utilisé pour structurer et relier les notices d'autorité, NdR]. Ce qui m’importe surtout, c’est ce qui circule autour de l’auteur : les chroniques de blogs, les extraits de presse, les podcasts, les vidéos. Bref, la matière vivante du web littéraire.

Ces notices ne disent pas seulement qui est un auteur, mais comment il est reçu. Elles mettent en avant les thèmes récurrents de son œuvre, les genres qu’il traverse, les émotions qu’il suscite. Elles révèlent ce que disent les lecteurs ordinaires, pas seulement les critiques consacrés. Elles cartographient aussi : un auteur est relié à des villes, à d’autres auteurs proches par leurs tonalités ou par leurs réceptions.

Au cœur de cette obsession, il y a l’idée que chaque notice pourrait devenir un point d’entrée dans un vaste graphe : une cartographie dynamique de ce qui se dit sur le web littéraire. Une notice n’est donc jamais figée. Elle évolue : un nouveau roman sort, des chroniques tombent, et il faut corriger, ajuster, relier. J’y consacre mes soirées, mes week-ends. Corriger, corriger encore — code, données, liens — pour que la notice reste vivante.

L’IA comme levier de synthèse

Psy : N’avez-vous pas peur que les machines prennent le dessus sur votre obsession ?

Moi : Non. L’IA ne fait qu’amplifier ma manie : condenser, rapprocher, donner forme. Mais c’est toujours moi qui décide.

Depuis deux ans, je teste l’intelligence artificielle générative, avec ses forces et ses limites. Résumer des chroniques, fabriquer une FAQ, étiqueter par intensité émotionnelle : voilà ce qu’elle sait faire. Mais l’IA ne crée rien de neuf, elle synthétise. Et je veille, après moult tests, à ce qu’elle le fasse le plus fidèlement possible au contenu repéré sur le web. Ma vigilance est constante : un résumé mal tourné, une interprétation trop rapide, et c’est le travail de veille qui est trahi. Cette obsession m’oblige à vérifier, ajuster, corriger, pour préserver la diversité des voix et refuser leur uniformisation.

Vers un Wikipédia bis de la littérature ?

Psy : Alors finalement, que cherchez-vous à construire ? Une encyclopédie parallèle ?

Moi : Pas une encyclopédie. Un complément. Une utopie documentaire née d’une obsession personnelle.

Wikipédia restera encyclopédique, neutre, universel. Moi, je cherche autre chose : un espace subjectif, partiel, enraciné dans la réception contemporaine. Un outil de médiation, pas d’exhaustivité. Ce que je fabrique, ce n’est pas la vérité, mais une cartographie des sensibilités, des émotions, des réceptions.

On peut appeler cela une compulsion. Moi j’y vois un geste militant : transformer une manie personnelle en ressource collective. Donner à voir un autre visage de la littérature, celui que dessinent les voix anonymes du web, celles qui écrivent au présent. Wikipédia écrit l’histoire. Mon obsession, c’est de montrer comment cette histoire se vit, se lit et se ressent au quotidien — quitte à passer des heures à scraper, taguer, corriger, recoder. Car c’est dans ce travail obstiné que se construit une autre manière de transmettre la littérature.

L’obsession malgré tout

Psy : Mais dites-moi, avec tout ce travail, quel est l’impact réel ? Vous attirez des milliers de visiteurs chaque jour ?

Moi : Non. L’impact reste limité, avec environ 50.000 visiteurs mensuels. Bibliosurf n’est pas un géant du web. La plupart des internautes viennent chercher une chronique ou un résumé, et repartent aussitôt. Parfois je me demande si toutes ces heures de scraping, de tagging et de corrections ont un vrai écho.

Psy : Et cela ne vous décourage pas ? Vous pourriez utiliser votre temps libre à vos proches… Peut-être même, reconnaître que certaines ambitions technologiques dépassent vos moyens.

Moi : Certes, je ne suis pas un ingénieur de la Silicon Valley. Mes compétences techniques sont artisanales, acquises sur le tas, limitées. Mais c’est précisément ce qui me pousse à continuer : transformer ces outils imparfaits en quelque chose de singulier, qui ne ressemble à aucun autre site littéraire. Et puis j’ai toujours eu en vue de partager ce travail : par des formations, des publications sur le web, ou des articles comme celui-ci. L’obsession ne se vit pas seulement devant un écran, elle se transmet.

L’impact en termes de visiteurs n’est pas ma mesure principale. Ce qui me tient, c’est l’obsession elle-même : bâtir patiemment une carte, corriger sans cesse, relier encore et encore. Un psy y verrait peut-être une compulsion. Moi, j’y vois une fidélité : à la littérature, à ceux qui la lisent et la commentent, et à l’idée qu’un travail obstiné, même modeste, peut ouvrir d’autres chemins.

Ce que m’ont appris dix ans de veille littéraire

Le web littéraire est un écosystème vivant : chroniques de blog, critiques de presse, podcasts et booktubes constituent une matière mouvante, très différente des bases encyclopédiques.

La documentation n’est pas l’archivage : scraper, structurer, relier et taguer, c’est transformer un flux dispersé en une cartographie lisible.

L’IA est un outil de synthèse, pas de vérité : elle peut condenser et rapprocher, mais elle doit toujours être contrôlée pour éviter les dérives et l’uniformisation.

La médiation peut être inventive : FAQ, cartographies d’émotions, notices auteurs enrichies sont autant de façons d’accompagner les lecteurs autrement.

La valeur n’est pas seulement dans le trafic : un site artisanal peut avoir peu de visiteurs, mais une forte valeur pédagogique et collective, surtout lorsqu’il s’accompagne d’une volonté de partage (formations, publications, échanges).

Illustration : ActuaLitté, CC BY SA 2.0 (image générée par IA)

Par Bernard Strainchamps

Contact : bs@bibliosurf.com