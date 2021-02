La technologie d’abord au service de la politique

La Traduction automatique (TA) est un logiciel capable de traduire des mots, phrases ou textes d’une langue source (LS) à une langue cible (LC) à l’aide de l’Intelligence Artificielle (IA). Aujourd’hui, on peut utiliser la TA sur des sites gratuits, du moment où on a accès à internet. On peut aussi se servir de logiciels de Traduction Assistée par Ordinateur (TAO), qui eux utilisent des systèmes de mémoire sans IA. Le succès de cet outil, encore à ses balbutiements, n’a pourtant pas été évident lorsqu’il a été créé par Georges Artsrouni.

Il est l’inventeur des trois premières machines de traduction créées entre 1932 et 1937. Ces appareils étaient mécaniques et fonctionnaient grâce à une « mémoire » entièrement dispensée par l’homme sur des bobines de carton sur lesquelles il notait les mots dans les langues cibles choisies.

Ces dispositifs sont le point de départ des recherches d’A.D. Booth qui veut les perfectionner en y ajoutant le principe de la calculatrice numérique. Son initiative se concrétise en 1954 aux avec l’expérience Georgetown-IBM lorsque leur machine traduit plus de quarante phrases de l’anglais au russe. Cette réussite encourage l’engagement de grands investisseurs, comme le gouvernement américain. L’US Air Force et la NASA s’allient avec la première entreprise spécialisée dans la traduction automatique, SYSTRAN, fondée en 1968. Leur objectif est de dépasser les frontières linguistiques dans le contexte de la Guerre en créant un logiciel de traduction du russe vers l’anglais.

Un intérêt d’abord politique bien qu’il s’élargisse à des domaines plus pratiques comme celui de la météo avec le projet canadien TAUM-Météo. D’autres sociétés se sont établies depuis et des pays s’engagent dans ces recherches, comme la France depuis 1959 avec l’aide du CNRS, dans l’espoir de diversifier les utilisations de cette technique.

Deux forces vives

À l’origine il existe deux modèles de Traduction Assistée par Ordinateur (TAO). Le premier est la traduction par transfert ou « systèmes d’expert ». Il s’agit pour le logiciel de passer de la langue source à la langue cible en utilisant un ensemble de règles et en se focalisant sur l’image syntaxique et sémantique du texte de langue source. C’est une traduction qu’on pourrait qualifier de « calque », car elle ne s’attarde pas sur le sens, mais sur la grammaire en découpant la phrase par mot. Dans le cadre d’un travail sur le vocabulaire, cette technique est idéale, car elle repose sur l’établissement de dictionnaires et de grammaires, appelés « bags of words » fournis par l’homme.

Au contraire si on veut travailler sur des phrases complexes ou un texte entier, la TAO statistique est conseillée. Cette technique est issue des recherches sur la reconnaissance vocale et repose sur un système de « mémoire informatique » dans laquelle l’homme intègre des corpus de textes bilingues ou parallèles déjà traduit pour servir de modèle de traduction. Le logiciel analyse des segments de phrases, les compare au corpus, ou au sous-corpus pour plus de précision, et soumettra son choix en fonction de la fréquence des traductions observées.

On trouve dans ces deux modèles des limites frappantes : le manque d’autonomie de la TAO par transfert et les nombreux contresens avec la TAO statistique. C’est face à ces difficultés que l’Intelligence Artificielle (IA) a été introduite pour créer la Traduction automatique « neuronale ». L’IA prend ici la forme d’un logiciel et se caractérise par sa faculté d’apprentissage en autonomie tout en reproduisant des comportements humains, notre raisonnement par exemple.

Ainsi, ajouter une capacité d’apprentissage à la traduction par transfert, sémantiquement et syntaxiquement la plus solide, permet de dépasser les limites de la relation entre structure et syntaxe qui bloquait la machine. Il existe plusieurs types de TA à neurones artificiels comme le CNN (Convolutional Neural Network) qui traite des séquences ou le SAT (Self-Attentional Transformers) capable de s’attarder sur plusieurs séquences d’un document pour étudier la récurrence des mots et leurs relations. On peut calculer le niveau de confiance de ces algorithmes dans la TA neuronale grâce à des tests d’apprentissage réalisés par des experts, ingénieurs de l’IA et linguistes.

Perfectionner, encore et sans cesse

Pour entraîner un modèle, il faut s’appuyer sur des données d’apprentissage sûres, comme des corpus, et comparer leurs résultats. Si ces derniers dépassent un seuil d’erreur acceptable et choisi à l’avance, alors il est utilisable de manière fiable. De plus, on peut choisir le niveau de granularité de la TA neuronale choisie c’est-à-dire son échelle d’analyse : par mots, par phrases ou selon le document entier.

“Plutôt que concurrencer la machine, ils ont décidé d’en faire leur alliée”

L’introduction de l’IA prouve que la traduction automatique est aujourd’hui un secteur concurrentiel et vivant. Investir dans ces techniques, c’est tenter d’abolir la barrière de la langue et rendre universelle quantité d’informations jusque-là insondables. Dans le monde de l’édition, la TA est devenue un outil de travail fiable pour les traducteurs de textes spécialisés, comme les textes de droit et d’économie, ou techniques, comme les manuels et les modes d’emploi. « Au lieu de traduire en partant de zéro, on le passe sous traduction automatique puis on en fait une révision/post-édition », précise Alicja Poirson, élève en master Industrie de la langue et traduction spécialisée à l’Université de Paris.

Le travail de la machine permet d’accélérer celui de l’homme. Le traducteur se doit tout de même de comprendre le sens et le contexte de ce qu’il traduit en effectuant des recherches préalables, comme dans le cadre de toutes ses activités. L’étape de post-édition permet d’éliminer les lourdeurs ou les faux-sens, qui sont les deux défauts principaux de la traduction automatique. L’état actuel des logiciels de traduction est d’une fiabilité telle que la relecture, même si elle est humaine, suffit. C’est ce qu’ont prouvé Quantmetry et DeepL en traduisant grâce à des outils de TA neuronale l’ouvrage technique de 800 pages « Deep Learning » d’Ian Goodfellow, Yoshua Bengio et Aaron Courville en 2018.

“Il y a un rapport intime à la langue, et c’est là que l’informatique pêche.”

Néanmoins, toute IA se nourrit de ce que l’homme, en premier, crée pour le copier ou le comparer. Est-il pertinent de l’utiliser dans le domaine de la littérature, où les mots ont autant de valeur que leur son et leur contexte ? La traduction automatique est incapable, à cette heure, de travailler sur l’image sonore d’un mot ou d’adapter ses choix de traduction en fonction d’un public. Cette incapacité à pour conséquence qu’il est encore tôt pour parler de concurrence entre la traduction automatique et les traducteurs littéraires.

Les limites de la machine

« La subjectivité du traducteur est essentielle », confirme Dorothée Zumstein, traductrice et autrice, car il s’agit de « trouver une voix » pour rendre le style de l’écrivain. Leur travail actuel est de retranscrire des manuscrits d’une langue étrangère à une langue maternelle en s’adaptant à un contexte temporel, historique et éditorial. Des repères que la machine, en littérature, ne peut encore traiter.

La traduction automatique peut tout de même trouver sa place dans l’édition et la littérature, mais du côté des auteurs. À la manière des surréalistes qui utilisaient l’inconscient et l’abstrait pour créer du sens et de la poésie, la TA est un moyen de « créer des accidents heureux dans l’intervention avec l’humain, avec la vie » pense Dorothée Zumstein. C’est l’imperfection de la machine qui la limite dans son travail premier, mais c’est ce qui inspire également des auteurs comme les Oulipiens car cela « met l’humain face à l’inattendu, à l’aléatoire ».

L’IA est indéniablement intégrée à notre société et aux évolutions qui l’affectent, alors les créateurs s’en servent dans les arts, comme c’est déjà le cas lors de la biennale Experimenta à Grenoble.

par Liza Todorovic

Article publié dans le cadre des travaux du master de Villetaneuse, Métiers du livre

illustration : Comfreak, CC 0 ; kiquebg CC 0 ;