L’annonce a été détaillée sur le site de Microsoft Advertising, et s’inscrit dans une stratégie plus large visant à structurer l’économie des contenus à l’ère de l’IA.

Une nouvelle économie des contenus

Concrètement, le Publisher Content Marketplace fonctionne comme une plateforme d’intermédiation. Les éditeurs y déposent des contenus et définissent les conditions de licence, qu’il s’agisse des usages autorisés ou des modalités de rémunération. De leur côté, les entreprises développant des systèmes d’IA peuvent parcourir ce catalogue et sélectionner les contenus qu’elles souhaitent utiliser pour ancrer, c’est-à-dire étayer, certaines réponses générées par leurs modèles.

Microsoft met en avant une rémunération fondée sur la valeur livrée ainsi que des outils de reporting permettant de mesurer les usages. Plusieurs grands noms de la presse et du magazine participent à cette phase initiale, parmi lesquels Associated Press, Business Insider, Condé Nast, Hearst, USA TODAY ou Vox Media.

Pour comprendre les enjeux pour le livre, il faut distinguer deux usages souvent confondus. D’un côté, l’ancrage, ou grounding, consiste pour une IA à aller chercher un contenu précis afin d’appuyer une réponse à une question donnée. Cet usage peut théoriquement être mesuré et rémunéré à la requête ou à l’accès.

De l’autre côté, l’entraînement, ou training, renvoie à l’intégration d’un corpus dans le processus d’apprentissage du modèle. Dans ce cas, le contenu contribue à façonner les capacités générales de l’IA, son style, ses connaissances et ses structures narratives. L’Authors Guild a rappelé que les droits liés à l’entraînement ne sont pas automatiquement inclus dans les contrats d’édition traditionnels et qu’ils nécessitent un accord spécifique des auteurs.

Un modèle mal taillé pour le format long ?

Le PCM, dans sa configuration actuelle, semble particulièrement adapté aux contenus d’actualité. Les articles récents, fréquemment mis à jour, se prêtent bien à un usage d’ancrage dans des réponses sur des sujets en évolution rapide. Le modèle économique proposé, fondé sur la mesure de l’usage, correspond à des contenus courts, modulaires, citables. Le livre, en revanche, repose sur une logique différente. Il s’agit d’œuvres longues, construites, souvent conçues pour durer dans le temps.

Leur valeur ne se résume pas à un paragraphe extrait pour illustrer une réponse. Cette différence structurelle nourrit la crainte qu’un marché pensé pour la presse ne sous-valorise les essais, les ouvrages académiques ou les livres de référence au profit de contenus plus immédiatement exploitables.

À cette différence de nature s’ajoute une complexité juridique. Là où de nombreux groupes de presse détiennent des droits relativement homogènes sur leurs publications, l’édition de livres repose sur une mosaïque contractuelle. Droits d’auteur, cessions partielles, clauses de réversion, territoires distincts et droits dérivés compliquent toute initiative collective.

L’exemple de l’accord conclu entre HarperCollins et Microsoft illustre très concrètement ces difficultés contractuelles. Dans ce dossier, l’éditeur n’a pas pu se contenter d’exploiter les contrats existants : il a dû proposer aux auteurs concernés un dispositif d’opt-in, c’est-à-dire une adhésion volontaire, afin d’obtenir leur accord spécifique pour la licence d’entraînement de certains titres par Microsoft. Les auteurs devaient accepter explicitement que leur ouvrage soit utilisé dans le cadre de l’entraînement d’un modèle d’IA, moyennant une rémunération forfaitaire, avec un partage annoncé entre éditeur et auteur.

Dans de nombreux cas, les clauses des contrats d’édition classiques stipulent que les droits non expressément cédés restent la propriété de l’auteur. Or l’entraînement d’une IA ne correspond ni à un format d’exploitation traditionnel, ni à une simple adaptation, ni à une diffusion. Il s’agit d’un usage nouveau, technologiquement distinct, qui ne s’insère pas automatiquement dans les catégories contractuelles existantes.

L’Authors Guild avait d’ailleurs critiqué certains aspects de ces accords, estimant que les droits liés à l’entraînement devaient être négociés séparément et ne pouvaient être assimilés à une extension ordinaire des droits d’exploitation.

La valeur du livre

La question de la valorisation reste également ouverte. Le chiffre de 5000 $ par titre, souvent évoqué à propos de l’accord HarperCollins, est devenu un point de référence dans les discussions professionnelles. Il s’agit toutefois d’un modèle forfaitaire lié à une licence d’entraînement, et non d’un système indexé sur l’usage comme celui mis en avant par PCM.

La difficulté, pour le livre, est de déterminer comment mesurer la valeur d’un contenu lorsque celui-ci n’est pas explicitement cité mais intégré dans les capacités générales d’un modèle. Cette problématique est encore plus aiguë pour la fiction, dont l’apport aux systèmes d’IA se situe largement dans l’apprentissage des structures narratives et des styles, donc dans une zone moins visible et plus difficile à quantifier.

Le contexte juridique international ajoute une dimension supplémentaire. Plusieurs affaires judiciaires aux États-Unis, largement relayées par ActuaLitté, ont porté sur l’utilisation d’œuvres protégées dans l’entraînement de modèles d’IA et sur l’interprétation du fair use. Les décisions sont scrutées de près par les éditeurs et les auteurs, car elles pourraient redéfinir l’équilibre entre usage technologique et protection des droits. Dans ce paysage mouvant, la création de plateformes structurées comme PCM apparaît aussi comme une tentative de sécurisation juridique.

Parallèlement, d’autres initiatives émergent. Le standard Really Simple Licensing, ou RSL, vise à rendre les conditions de licence lisibles par machine, à la manière d’un protocole technique permettant d’indiquer si un contenu peut être indexé, entraîné ou exploité sous certaines conditions.

Pour l'instant, au cas par cas

Le Copyright Office américain a rendu publique, en mai 2025, une version de prépublication de la troisième partie de son rapport consacré au droit d’auteur et à l’intelligence artificielle, spécifiquement dédiée à l’entraînement des modèles sur des œuvres protégées. Toutefois, la version définitive du rapport n’a pas encore été publiée à ce stade, ce qui maintient une certaine incertitude quant aux conclusions finales et à leur portée juridique.

La prépublication estime que l’entraînement d’une IA sur des œuvres protégées constitue en principe un acte de reproduction relevant du droit d’auteur. Elle refuse toute réponse générale et indique que la légalité dépendra d’une analyse au cas par cas au regard du fair use.

Le caractère « transformateur » de l’entraînement ne suffit pas à lui seul à le rendre licite, surtout si un impact économique sur les ayants droit est démontré. L’effet sur les marchés existants ou potentiels de licences sera un critère déterminant dans l’appréciation juridique.

Pour l’édition, l’enjeu dépasse la création d’un nouveau revenu : si les assistants IA deviennent centraux dans la découverte, la visibilité des livres dépendra de leur intégration technique et juridique dans ces écosystèmes. Les catalogues bien structurés et juridiquement clarifiés seront favorisés, les autres risquant la marginalisation.

Plusieurs scénarios sont possibles, entre adaptation des plateformes, nouvelles plateformes ou intervention des régulateurs. Dans tous les cas, les éditeurs doivent clarifier leurs droits et définir une stratégie, car le livre sera concerné par cette nouvelle économie.

