Dans nos sociétés qui prônent le libre-échange, la traduction automatique est une des ambitions internationales à l’établissement d’une nouvelle Babel. Cette technique soulève des interrogations éthiques et économiques, car elle est liée à l’Intelligence artificielle, mais concilier l’humain et l’informatique a toujours fait frémir tout en inspirant largement. L’attrait autour de cette question augmente et nourrit des polémiques, notamment dans les professions liées aux langues. Alors, la traduction automatique au sein de l’édition, ça donne quoi ?
Le 18/02/2021 à 18:28 par Auteur invité
4 Réactions | 32 Partages
Publié le :
18/02/2021 à 18:28
4
Commentaires
32
Partages
La Traduction automatique (TA) est un logiciel capable de traduire des mots, phrases ou textes d’une langue source (LS) à une langue cible (LC) à l’aide de l’Intelligence Artificielle (IA). Aujourd’hui, on peut utiliser la TA sur des sites gratuits, du moment où on a accès à internet. On peut aussi se servir de logiciels de Traduction Assistée par Ordinateur (TAO), qui eux utilisent des systèmes de mémoire sans IA. Le succès de cet outil, encore à ses balbutiements, n’a pourtant pas été évident lorsqu’il a été créé par Georges Artsrouni.
Il est l’inventeur des trois premières machines de traduction créées entre 1932 et 1937. Ces appareils étaient mécaniques et fonctionnaient grâce à une « mémoire » entièrement dispensée par l’homme sur des bobines de carton sur lesquelles il notait les mots dans les langues cibles choisies.
Ces dispositifs sont le point de départ des recherches d’A.D. Booth qui veut les perfectionner en y ajoutant le principe de la calculatrice numérique. Son initiative se concrétise en 1954 avec l’expérience Georgetown-IBM lorsque leur machine traduit plus de quarante phrases de l’anglais au russe. Cette réussite encourage l’engagement de grands investisseurs, comme le gouvernement américain. L’US Air Force et la NASA s’allient avec la première entreprise spécialisée dans la traduction automatique, SYSTRAN, fondée en 1968. Leur objectif est de dépasser les frontières linguistiques dans le contexte de la Guerre en créant un logiciel de traduction du russe vers l’anglais.
Un intérêt d’abord politique bien qu’il s’élargisse à des domaines plus pratiques comme celui de la météo avec le projet canadien TAUM-Météo. D’autres sociétés se sont établies depuis et des pays s’engagent dans ces recherches, comme la France depuis 1959 avec l’aide du CNRS, dans l’espoir de diversifier les utilisations de cette technique.
À l’origine il existe deux modèles de Traduction Assistée par Ordinateur (TAO). Le premier est la traduction par transfert ou « systèmes d’expert ». Il s’agit pour le logiciel de passer de la langue source à la langue cible en utilisant un ensemble de règles et en se focalisant sur l’image syntaxique et sémantique du texte de langue source. C’est une traduction qu’on pourrait qualifier de « calque », car elle ne s’attarde pas sur le sens, mais sur la grammaire en découpant la phrase par mots. Dans le cadre d’un travail sur le vocabulaire, cette technique est idéale, car elle repose sur l’établissement de dictionnaires et de grammaires, appelés « bags of words » fournis par l’homme.
Au contraire si on veut travailler sur des phrases complexes ou un texte entier, la TAO statistique est conseillée. Cette technique est issue des recherches sur la reconnaissance vocale et repose sur un système de « mémoire informatique » dans laquelle l’homme intègre des corpus de textes bilingues ou parallèles déjà traduits pour servir de modèle de traduction. Le logiciel analyse des segments de phrases, les compare au corpus, ou au sous-corpus pour plus de précision, et soumettra son choix en fonction de la fréquence des traductions observées.
On trouve dans ces deux modèles des limites frappantes : le manque d’autonomie de la TAO par transfert et les nombreux contresens avec la TAO statistique. C’est face à ces difficultés que l’Intelligence Artificielle (IA) a été introduite pour créer la Traduction automatique « neuronale ». L’IA prend ici la forme d’un logiciel et se caractérise par sa faculté d’apprentissage en autonomie tout en reproduisant des comportements humains, notre raisonnement par exemple.
Ainsi, ajouter une capacité d’apprentissage à la traduction par transfert, sémantiquement et syntaxiquement la plus solide, permet de dépasser les limites de la relation entre structure et syntaxe qui bloquait la machine. Il existe plusieurs types de TA à neurones artificiels comme le CNN (Convolutional Neural Network) qui traite des séquences ou le SAT (Self-Attentional Transformers) capable de s’attarder sur plusieurs séquences d’un document pour étudier la récurrence des mots et leurs relations. On peut calculer le niveau de confiance de ces algorithmes dans la TA neuronale grâce à des tests d’apprentissage réalisés par des experts, ingénieurs de l’IA et linguistes.
Pour entraîner un modèle, il faut s’appuyer sur des données d’apprentissage sûres, comme des corpus, et comparer leurs résultats. Si ces derniers dépassent un seuil d’erreur acceptable et choisi à l’avance, alors il est utilisable de manière fiable. De plus, on peut choisir le niveau de granularité de la TA neuronale choisie c’est-à-dire son échelle d’analyse : par mots, par phrases ou selon le document entier.
“Plutôt que concurrencer la machine, ils ont décidé d’en faire leur alliée”
L’introduction de l’IA prouve que la traduction automatique est aujourd’hui un secteur concurrentiel et vivant. Investir dans ces techniques, c’est tenter d’abolir la barrière de la langue et rendre universelle quantité d’informations jusque-là insondables. Dans le monde de l’édition, la TA est devenue un outil de travail fiable pour les traducteurs de textes spécialisés, comme les textes de droit et d’économie, ou techniques, comme les manuels et les modes d’emploi. « Au lieu de traduire en partant de zéro, on le passe sous traduction automatique puis on en fait une révision/post-édition », précise Alicja Poirson, élève en master Industrie de la langue et traduction spécialisée à l’Université de Paris.
Le travail de la machine permet d’accélérer celui de l’homme. Le traducteur se doit tout de même de comprendre le sens et le contexte de ce qu’il traduit en effectuant des recherches préalables, comme dans le cadre de toutes ses activités. L’étape de post-édition permet d’éliminer les lourdeurs ou les faux-sens, qui sont les deux défauts principaux de la traduction automatique. L’état actuel des logiciels de traduction est d’une fiabilité telle que la relecture, même si elle est humaine, suffit. C’est ce qu’ont prouvé Quantmetry et DeepL en traduisant grâce à des outils de TA neuronale l’ouvrage technique de 800 pages Deep Learning de Ian Goodfellow, Yoshua Bengio et Aaron Courville en 2018.
“Il y a un rapport intime à la langue, et c’est là que l’informatique pèche.”
Néanmoins, toute IA se nourrit de ce que l’homme, en premier, crée pour le copier ou le comparer. Est-il pertinent de l’utiliser dans le domaine de la littérature, où les mots ont autant de valeur que leur son et leur contexte ? La traduction automatique est incapable, à cette heure, de travailler sur l’image sonore d’un mot ou d’adapter ses choix de traduction en fonction d’un public. Cette incapacité a pour conséquence qu’il est encore tôt pour parler de concurrence entre la traduction automatique et les traducteurs littéraires.
« La subjectivité du traducteur est essentielle », confirme Dorothée Zumstein, traductrice et autrice, car il s’agit de « trouver une voix » pour rendre le style de l’écrivain. Leur travail actuel est de retranscrire des manuscrits d’une langue étrangère à une langue maternelle en s’adaptant à un contexte temporel, historique et éditorial. Des repères que la machine, en littérature, ne peut encore traiter.
La traduction automatique peut tout de même trouver sa place dans l’édition et la littérature, mais du côté des auteurs. À la manière des surréalistes qui utilisaient l’inconscient et l’abstrait pour créer du sens et de la poésie, la TA est un moyen de « créer des accidents heureux dans l’intervention avec l’humain, avec la vie » pense Dorothée Zumstein. C’est l’imperfection de la machine qui la limite dans son travail premier, mais c’est ce qui inspire également des auteurs comme les Oulipiens car cela « met l’humain face à l’inattendu, à l’aléatoire ».
L’IA est indéniablement intégrée à notre société et aux évolutions qui l’affectent, alors les créateurs s’en servent dans les arts, comme c’est déjà le cas lors de la biennale Experimenta à Grenoble.
par Liza Todorovic
Article publié dans le cadre des travaux du master de Villetaneuse, Métiers du livre
illustration : Comfreak, CC 0 ; kiquebg CC 0 ;
4 Commentaires
Sandra Todorovic
18/02/2021 à 19:57
Article pertinent et intéressant.
LOL
19/02/2021 à 09:27
Il ne s'agit pas d'IA stricto sensu, mais plus de « Machine Learning », c'est-à-dire la capacité d'une machine à apprendre par agrégat d'une somme considérable de connaissances. C'est ce qui fonctionne le mieux aujourd'hui comme « IA », car cela reproduit à la fois un comportement humain (l'expérience) et cela le fait sur une somme considérable de données que l'homme n'est pas capable d'ingurgiter. Donc on joue sur le meilleur des deux tableaux et c'est intelligent !
Mais cela ne fonctionne que sur du connu : il est frappant que l'exemple proposé soit celui d'un livre technique, qui ne requiert dans l'absolu aucune finesse de traduction, plutôt que sur une œuvre littéraire qui demande justement une fibre humaine.
Je ne dis pas que la machine n'y arrivera pas un jour. Encore que...
Maelili
19/02/2021 à 11:25
Merci pour cet article très intéressant et qui permet de bien comprendre les enjeux actuels de la traduction automatique !
Kevin Dinant
24/02/2021 à 07:28
Cet article est intéressant, malgré quelques confusions: la TAO n'est pas un système de de traduction automatique, mais juste une aide. On parle donc de TA statistique et de TA par transfert, pas TAO.
Quant à l'utilisation de la TA dans les domaines non littéraires, les choses ne sont pas aussi simples qu'il y paraît et tous les textes ne s'y prêtent pas. Parfois, la post-édition est plus longue qu'une traduction. Parfois, le style est au moins aussi important que le fond, comme en littérature. Seul un ou une professionnelle de la traduction saura aiguiller le client vers la bonne solution.
N'hésitez pas à contact la SFT (Société française des traducteurs, syndicat national des métiers de la traduction et de l'interprétation) pour un éclairage sur ces sujets