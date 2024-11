La législation de l'Union européenne cherchait à répondre à quatre grands objectifs, dont la mise en place de garanties relatives à l’intelligence artificielle à usage général, la limitation de l’utilisation des systèmes d’identification biométrique, l'interdiction de manipuler des utilisateurs ou encore le droit des consommateurs à porter plainte et à obtenir des explications sur ces outils.

L'industrie de l'édition et les industries culturelles et créatives, plus largement, suivent avec attention les développements concernant les systèmes d’IA à usage général : s'ils sont généralement considérés comme moins risqués que des programmes d’identification biométrique, par exemple, leur comportement vis-à-vis du droit d'auteur est scruté.

En effet, un certain nombre de ces programmes, qui nécessitent d'être « entrainés » avec d'importants volumes de données, ont pu se baser sur des œuvres protégées par le droit d'auteur, sans l'aval des ayants droit. Aux États-Unis, plusieurs procès, intentés à OpenAI, Microsoft ou encore Meta, assurent que ces entreprises et les développeurs ont sciemment utilisé des contenus piratés pour améliorer les performances de leurs programmes.

Dans l'Union européenne, l'AI Act entend imposer des obligations de transparence aux fournisseurs et développeurs sur ces mêmes données d'entrainement. Les titulaires de droits seraient ainsi les seuls habilités à autoriser les approches de text-and-data mining (fouille de textes et de données) nécessaires à l'amélioration des IA grâce à des œuvres protégées par le droit d'auteur.

Une ébauche pour les bonnes pratiques

La Commission européenne a publié, ce 14 novembre, un premier jet du code de bonnes pratiques pour les systèmes d'IA à usage général, élaboré par des experts indépendants et des groupes de travail thématiques. Ce document découle ainsi du premier cycle de rédaction, qui sera suivi par trois autres, jusqu'en avril 2025.

Ce premier jet présente différentes mesures relatives au respect du droit d'auteur pour les systèmes d’IA à usage général. Les développeurs devront ainsi élaborer et mettre en œuvre une politique interne de respect du droit d'auteur, pour s'assurer de processus conformes avec la réglementation européenne. Ils assumeront également un devoir de diligence vis-à-vis des tiers fournisseurs de corpus de données, afin de s'assurer que les sources sont licites et respectueuses du droit d'auteur.

Ce devoir de diligence s'appliquera en amont, mais aussi en aval, afin d'« atténuer le risque qu'un système ou une application en aval, dans lequel un modèle d'IA à usage général est intégré, génère des résultats portant atteinte au droit d'auteur ».

Afin de respecter le cadre de l'exception au titre de la fouille de textes et de données, les signataires du code de bonnes pratiques respecteront les protocoles d'exclusion. À ce titre, ils sont vivement encouragés à dialoguer avec les organisations représentatives des ayants droit, afin de « développer des standards interopérables et lisibles par les machines », ces derniers assurant un meilleur respect des exclusions à la fouille de textes et de données. Bien sûr, les signataires excluront les sites pirates de leurs fournisseurs.

En matière de transparence, les sites web devront afficher toutes les mesures mises en œuvre pour se conformer au droit européen, et proposer un mode de contact fiable et rapide, pour faire état d'une réclamation. Enfin, les informations relatives aux données utilisées à des fins d'entrainement devront être communicables au Bureau européen de l'IA, à sa demande.

Le document est accessible ci-dessous ou à cette adresse.

Photographie : drapeaux devant la Commission européenne (illustration, LIBER Europe, CC BY 2.0)

