La Commission d'enrichissement de la langue française, placée auprès du Premier ministre, a pour mission « de favoriser l’enrichissement de la langue française, de développer son utilisation, notamment dans la vie économique, les travaux scientifiques et les activités techniques et juridiques, d’améliorer sa diffusion en proposant des termes et expressions nouveaux pouvant servir de référence, de contribuer au rayonnement de la francophonie et de promouvoir le plurilinguisme », d'après son décret de création.

L'organe n'a pas pris de vacances cet été, avec la publication de plusieurs listes, consacrées à la biologie, à l'urbanisme ou encore à la médecine. Autant de domaines techniques, pas toujours aussi médiatisés que celui qui a récemment préoccupé la commission...

Tout un vocabulaire à générer

Une longue liste est publiée au Journal officiel de ce 6 septembre, riche de plus d'une vingtaine de termes et d'expressions, avec leurs définitions. Tous et toutes tournent autour de l'intelligence artificielle, un domaine de recherche en plein essor. La succession de découvertes, de nouvelles solutions, mais aussi de régulations amène à l'utilisation régulière d'anglicismes : les alternatives existent désormais.

Parmi les technologies les plus évoquées et les plus spectaculaires, celles capables de générer du texte, des images, voire des vidéos : ces « generative models » ou « foundation models » peuvent être désignés comme des « modèles génératifs ». Leur principale fonction, quant à elle, se résume à la « génération automatique » d'image, de texte, d'audio... À adapter selon le contenu produit, évidemment.

Pour parvenir à générer ces contenus, tout en répondant aux requêtes des utilisateurs, les IA s'appuient sur des LLM, ou « large language model ». La Commission d'enrichissement adopte l'expression « grand modèle de langage », ou GML, pour désigner ce « modèle génératif qui, à partir de grands volumes de données textuelles, calcule des probabilités des enchaînements de jetons textuels en vue de la génération automatique de texte ou de code informatique ».

Quant aux « prompts », les consignes fournies par les utilisateurs aux modèles génératifs, il est possible de les remplacer, en français, par des « instructions génératives » ou, plus simplement, des « instructions ». Le terme « invite », pour sa part, est déconseillé par la commission.

La liste complète des termes est accessible ci-dessous, ou à cette adresse, avec les définitions associées.

Photographie : illustration, Ecole polytechnique, CC BY-SA 2.0