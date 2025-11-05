Au commencement, il y avait un rêve. Celui d’un web où les machines comprendraient enfin ce que les humains publient. Un web sémantique, propre et bien rangé, où chaque ressource serait identifiée, décrite et reliée à d’autres selon des vocabulaires partagés. Tim Berners-Lee l’avait promis : un réseau de sens, pas seulement de liens.

Puis vint Schema.org (2011), né de l’alliance entre Google, Bing, Yahoo! et Yandex. Un projet séduisant : simplifier le RDF, rendre la structuration accessible.

Quinze ans plus tard, la bibliothèque est bien là — mais son catalogue s’arrête souvent à la note moyenne et au nombre d’avis. Le web sémantique a survécu, mais sous forme d’étoiles.

Du sens au signal

À l’origine, Schema.org devait permettre à chacun de décrire précisément ses contenus : un livre, son auteur, son éditeur, les critiques associées, les adaptations, les relations entre œuvres. En théorie, un graphe riche et lisible par les machines.

En pratique, Google n’en a retenu que la partie la plus visible.

Les développeurs ont vite compris le message : inutile de baliser vos relations sémantiques, ce qui compte, c’est l’affichage enrichi — ces petits bonus visuels dans les résultats de recherche qui attirent le clic.

Résultat : le web sémantique s’est transformé en web commerçant. On ne structure plus pour relier, on structure pour séduire.

J’ai voulu décrire sur mon site la relation entre un auteur, un éditeur et son œuvre.

Google m’a répondu :

« D’accord, mais combien d’étoiles ? »

La grande illusion du « bien balisé »

Schema.org n’est pas un standard normatif. Il n’existe aucune recommandation W3C intitulée « Schema.org ». Chacun peut y piocher les propriétés qu’il veut.

Et Google, lui, ne lit qu’un sous-ensemble — et change les règles sans prévenir.

Les outils de validation, comme le test des résultats enrichis ou la Search Console, entretiennent l’illusion d’un code propre : coche verte, tout va bien. En réalité, ils ne vérifient que les balises qui intéressent Google, pas la cohérence du graphe.

C’est un peu comme si on validait un catalogue de bibliothèque parce que les cotes sont correctes, sans se demander si les livres existent vraiment.

Pendant ce temps, les @graph, sameAs, Person, CreativeWork ou BookEdition dorment dans le code, invisibles pour les moteurs, ignorés des utilisateurs. Le vocabulaire existe, mais le dialogue est à sens unique.

Le bibliothécaire face à Googlebot

Sur Bibliosurf, je continue pourtant à croire à ce rêve.

Je décris les romans avec précision : type Book, author, publisher, workExample, review, aggregateRating.

Je relie les auteurs à leurs identifiants ISNI, les livres à leurs pages ARK à la BnF, les prix littéraires, les émotions, les classements.

Chaque page forme un petit graphe cohérent, prêt à être relié à d’autres.

Mais Google n’en retient qu’un fragment : quelques étoiles, un résumé, parfois une FAQ. Le reste part on ne sait où. Peut-être alimente-t-il discrètement le Knowledge Graph global, sans jamais faire retour vers le site d’origine.

Le web sémantique devait relier les savoirs. Il relie désormais les sites à Google.

Quand le graphe devient gadget

L’histoire de Schema.org ressemble à celle d’un langage détourné. Pensé pour la connaissance partagée, il est devenu un protocole d’obéissance douce.

Chaque mise à jour de Google entraîne sa vague de corrections : ajoutez reviewRating, retirez offers, ne multipliez pas les FAQPage… Et chacun s’exécute, comme on mettrait de l’ordre dans ses fiches pour plaire au bibliothécaire en chef.

Les graphes sont devenus des gadgets, et les snippets des trophées. On ne relie plus des œuvres : on calibre des extraits. On ne construit plus de sens : on optimise la visibilité.

Le réseau de la connaissance, devenu produit d’appel dans les SERP, a perdu une partie de sa beauté initiale : celle d’un langage de médiation, ouvert et patient.

Le web sémantique, réinventé par la transition bibliographique

Heureusement, pendant ce temps, les institutions culturelles continuent à produire de vrais graphes : data.bnf.fr, Wikidata, OpenAlex, Europeana. Là, les relations entre entités ont encore un sens. Là, on fait de la documentation, pas du décor.

Pourtant, le mouvement de transition bibliographique engagé dans les bibliothèques rappelle que ce rêve n’est pas mort.

Décrire le monde avec rigueur, relier les œuvres, les personnes, les concepts : c’est précisément ce que fait la bibliothéconomie depuis des siècles.

Alors que Schema.org sert trop souvent à alimenter les vitrines du web marchand, les bibliothèques, elles, ont les moyens d’en restaurer la logique de sens — celle des graphes vivants, interopérables, publics.

Elles peuvent encore inventer ce monde où les métadonnées ne sont pas des signaux marketing, mais des chemins de lecture.

Le web sémantique n’a pas disparu.

Il attend simplement que les bibliothèques s’en emparent pleinement.

Crédits illustration : eommina CC 0

Par Bernard Strainchamps

Contact : bs@bibliosurf.com