Ces réunions, qui ont rassemblé des cadres, des avocats et des ingénieurs presque chaque jour de mars à avril de l'année dernière, ont exploré diverses stratégies pour enrichir la base de données d'entraînement de l'IA de Meta, LLaMA.



Selon ces enregistrements divulgués par un employé de l'entreprise dirigée par Mark Zuckerberg, l'achat de Simon & Schuster a été sérieusement envisagé, avec une proposition de payer jusqu'à 10 dollars par livre pour acquérir les droits de licence des nouveautés.

Simon & Schuster, un pilier de l'édition anglophone et membre du prestigieux Big Five, aux côtés de maisons comme Penguin Random House et HarperCollins, a dans son catalogue des auteurs renommés tels que Stephen King.

La maison a été mise en vente par sa société mère, Paramount Global, en 2020, et après l'échec d'une fusion avec Penguin Random House, bloquée par les tribunaux américains, elle a été cédée à la firme de capital-investissement KKR en août 2023. Le fonds d'investissement a finalisé l'achat de Simon & Schuster pour 1,62 milliard de dollars.

Selon Maria A Pallante, présidente de l'Association of American Publishers, « que Meta ait cherché à acheter l'une des maisons d'édition les plus importantes de l'histoire américaine pour ingérer son vénérable catalogue au profit de l'IA est déconcertant, même pour la Big Tech. » Et de poser la question : « Meta avait-il l'intention de piétiner la mission principale de Simon & Schuster, et ses partenariats contractuels avec les auteurs, par la force pure ? »

Ressources épuisées ?

Ahmad Al-Dahle, vice-président de l'IA générative chez Meta, explique de son côté que son entreprise avait déjà exploité presque tous les textes en anglais disponibles sur internet pour l'entraînement de ses modèles d'IA, ce qui la poussait à rechercher de nouvelles sources.

OpenAI a de con sôté conclu en France un accord avec Le Monde, permettant d'utiliser légalement le contenu du journal pour entraîner ses modèles d'IA et enrichir ChatGPT. L'entreprise sous giron Microsoft a également signé des accords avec d'autres médias tels que l'Associated Press et Axel Springer, s'engageant à créer des modèles de revenus avantageux pour les éditeurs. Le Monde utilisera les technologies d'OpenAI pour de nouveaux projets, tout en s'assurant que les références à ses articles soient correctement attribuées.

En novembre 2023, une plainte pour violation de droits d'auteur intentée contre Meta et OpenAI par l'humoriste Sarah Silverman et d'autres auteurs, a été partiellement rejetée par le juge fédéral californien Vince Chhabria, qui a remis en question l'idée que les productions des modèles d'IA imitent les œuvres des auteurs.

Dans une réponse à cette action en justice, Meta avait admis avoir utilisé des « portions de Books3 » pour entraîner son IA Llama avant son lancement public. L'ensemble de 37 Go de textes ou environ 200.000 livres piratés a été retiré.

IA : un rapport “équilibré” remis à Emmanuel Macron

Meta, se référant à la doctrine américaine de « l'usage équitable », avait par ailleurs nié toute violation des droits d'auteur. Parallèlement, OpenAI a signalé qu'il serait impossible de développer des IA de pointe sans recourir à du contenu protégé par le droit d'auteur.

Photographie : logo de Simon & Schuster (illustration, ActuaLitté, CC BY SA 2.0)