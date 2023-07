Si les sources manquent parfois pour certaines langues, comme celle des Étrusques pas encore déchiffrée, l’ancien akkadien est l’une des mieux attestées du monde antique : entre des centaines de milliers et plus d’un million de textes de cette langue sémitique primitive nous sont parvenus, dont la plupart sont aujourd’hui conservés dans les musées et les universités du monde.

Difficile akkadien

Une richesse de documents pour appréhender la vie, la politique et les croyances de la Mésopotamie et ses empires de Sumer, d’Akkad, de Babylone et assyrien, mais une insuffisance de moyen humain pour tous les étudier.

La traduction de l’akkadien est un processus en deux étapes. D’abord, il faut translittérer les signes cunéiformes, soit les réécrire en utilisant la phonétique à consonance similaire de la langue cible. Les chercheurs prennent ensuite leur translittération du texte et le traduit dans une langue moderne.

En outre, l’akkadien est « polyvalent » : ses signes cunéiformes peuvent avoir plusieurs lectures différentes selon la façon dont chacun fonctionne dans une phrase...

Face à cette problématique, une équipe multidisciplinaire d’archéologues et d’informaticiens a développé une IA capable de traduire l’akkadien presque instantanément. Le modèle de traduction automatique pour le cunéiforme akkadien s’appuie sur la même technique que celle de Google Traduction, à base de réseau de neurones artificiels. Les résultats ont été publiés dans la revue scientifique, PNAS Nexus, et leurs recherches sur GitHub à Akkademia.

L’équipe de chercheurs a formé le modèle d’IA grâce à un corpus de textes cunéiformes déjà bien étudié et richement annoté. Tout d’abord, il a appris à traduire l’akkadien à partir des translittérations des textes originaux. Il a également appris à traduire directement les symboles cunéiformes. Plus justement, il a traduit les glyphes Unicode des textes qui ont été générés par un autre outil, qui produit automatiquement l’Unicode par l’entremise d’une image d’une tablette.

Tablette en basalte rapportant la vente de champs, provenance inconnue, v. 2600-2500 av. J.-C. Oriental Institute de Chicago. Daderot (CC0)

Le modèle d’IA a ensuite appris à déterminer comment identifier les nuances des différents genres de l’échantillon — par exemple entre les œuvres littéraires et les lettres administratives — ainsi que la façon de prendre en compte les évolutions dans l’écriture cunéiforme au cours des millénaires. Il a encore été testé à l’aide d’Understudy 4 (BLEU4), un algorithme utilisé pour évaluer un texte traduit automatiquement.

Dans son test de translittération en anglais, le modèle d’IA a obtenu 37,47. Dans son test cunéiforme-anglais, 36,52. Deux scores supérieurs dans la fourchette d’une traduction de « haute qualité ». Là où l’équipe de chercheurs a été surprise : le modèle a reproduit les nuances du genre de chaque phrase. Bien que ce ne soit pas l’un de leurs objectifs, ils notent dans l’étude que cela peut ouvrir des possibilités d’utilisations au-delà d’une simple traduction, nous apprend Big Think.

Une langue morte, mais préservée

La langue akkadienne était d’abord celle parlée dans l’Empire du même nom, fondée vers 2300 av. J.-C. grâce aux victoires de son instigateur, Sargon le Grand. Au fil du temps, l’akkadien s’est fractionné en dialectes assyriens et babyloniens, avant d’être totalement remplacé par l’araméen au début du premier millénaire avant notre ère. L’akkadien n’a laissé aucune langue vivante dont elle serait issue.

Dans sa forme écrite, l’akkadien s’est avéré plus durable : ce système utilisait un stylet en roseau pour imprimer des glyphes en forme de coin (cunéiforme signifie « en forme de coin » en latin) dans des tablettes d’argile humides, avant de les cuire. Après que l’araméen ait supplanté l’akkadien comme langue commune de la région, les érudits ont continué à se servir du cunéiforme akkadien jusqu’au premier siècle de notre ère.

Cette pratique de graver sur de l’argile ou la pierre est la raison principale de la survie de ces centaines de milliers de sources, malgré les millénaires. Le linguiste Steven Roger Fischer, résume : « Ironiquement, des conflagrations destructrices ont préservé certaines des plus grandes bibliothèques de l’ancienne Mésopotamie — parce qu’elles étaient faites d’argile. En revanche, toutes les bibliothèques de papyrus de l’Égypte ancienne ont brûlé ou se sont effondrées, bien que de nombreux codex individuels subsistent. »

Tablettes d'argile de taille, format et mise en page variés, Ägyptisches Museu de Leipzig. Einsamer Schütze (CC BY-SA 3.0)

Crédits photo : Inscription sur roche du roi perse achéménide Darius Ier (521-486 av. J.-C.) à Ganjnameh (Iran). (Simorg ; CC BY-SA 3.0)