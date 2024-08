À chaque outil technologique ses usages, plus ou moins inspirés. Comme à la grande époque des premières années de Wikipédia, l'émergence de ChatGPT, outil conversationnel basé sur l'intelligence artificielle, a ainsi fait naitre une nouvelle forme de triche chez les étudiants.

Faire rédiger un texte par l'IA générative ne serait plus si rare, si bien que certains professeurs, à en croire les témoignages recueillis par L'ADN, renoncent tout simplement à confier des devoirs à la maison. « J'essaie de faire plus d'évaluations qui demandent de la créativité, ou des évaluations orales », admet ainsi un professeur en sciences biologiques dans un institut universitaire suisse.

Dans les faits, les professeurs ne sont pas dupes. Parmi les indices qui ne trompent pas, les professionnels citent des niveaux de langue bien trop soutenus, des textes très longs, mais redondants, ou encore des phrases vagues ou des citations qui ne renvoient à aucune source... « Si j'ai un doute, il suffit de leur demander de m'expliquer ce qu'ils ont écrit. En général, je constate qu’ils ne comprennent pas les phrases qu'ils ont utilisées », témoigne par ailleurs une professeure d'anglais.

Face à ces nouveaux usages, OpenAI, l'entreprise à l'origine du développement de ChatGPT, avait développé une solution permettant de déterminer, avec un taux de certitude de 99,9 %, si l'outil était le véritable auteur d'un texte.

Évoqué pour la première fois par le Wall Street Journal, ce filigrane modifiait légèrement le modèle de prédiction des mots, afin de faire apparaitre un schéma identifiable dans le texte complet. Cette méthode résistait, d'après le WSJ, à la paraphrase par l'utilisateur, et son inclusion dans ChatGPT ne rendait pas ses résultats moins pertinents. À l'aide de l'outil adéquat, il aurait ainsi été possible de retrouver ce filigrane dans une production écrite.

Après l'article du WSJ, OpenAI a mis à jour une publication remontant au mois de mai dernier, portant sur le suivi des sources utilisées par ChatGPT pour générer ses réponses aux requêtes. « Nos équipes ont développé un filigrane textuel que nous étudions encore, parallèlement à nos recherches sur des alternatives », indique la société sur son blog.

Auprès de TechCrunch, un porte-parole confirme que le filigrane était prêt, mais a été écarté au profit de nouvelles recherches, dont les métadonnées du texte produit. « Le filigrane textuel que nous développons est prometteur, technologiquement, mais comporte des risques importants que nous mesurons, comme le contournement par des acteurs malintentionnés et un impact important sur certains usagers, notamment non anglophones », ajoute-t-il.

Plus prosaïquement, OpenAI craindrait un détournement de 30 % de ses utilisateurs, si un tel outil de détection était mis en place, selon les informations du Wall Street Journal.

OpenAI ne travaille pas sur un filigrane de détection ou sur d'autres méthodes d'identification simplement pour assister les professeurs dans leur recherche des tricheurs... Des contraintes légales, au sein de l'Union européenne, pèsent en effet sur les fournisseurs et les déployeurs de certains systèmes d’IA.

L'IA Act, publié au Journal officiel de l'Union européenne le 1er août dernier, souligne ainsi cette nécessaire méthode d'identification, au sein de son article 50.

Les fournisseurs de systèmes d’IA, y compris de systèmes d’IA à usage général, qui génèrent des contenus de synthèse de type audio, image, vidéo ou texte, veillent à ce que les sorties des systèmes d’IA soient marquées dans un format lisible par machine et identifiables comme ayant été générées ou manipulées par une IA. Les fournisseurs veillent à ce que leurs solutions techniques soient aussi efficaces, interopérables, solides et fiables que la technologie le permet, compte tenu des spécificités et des limites des différents types de contenus, des coûts de mise en œuvre et de l’état de la technique généralement reconnu, comme cela peut ressortir des normes techniques pertinentes.

– Article 50 de l'IA Act européen