La plupart des systèmes d’écriture utilisés aujourd’hui sont vieux de centaines, voire de milliers d’années. En revanche, le texte numérique est relativement nouveau. Nouveau, mais très important : aujourd’hui, une très grande part des interactions humaines a lieu sur Internet.

Pour faciliter au maximum ces interactions, un standard informatique relatif au codage du texte écrit a été mis en place : Unicode. Il vise à donner à tout caractère, de n’importe quel système d’écriture, un nom et un identifiant numérique ; et ce, quels que soient le logiciel ou la plateforme informatique utilisée. On retrouve par exemple, des points de code U+0530 à U+058F, l’alphabet arménien ; ou encore, des points U+0A80 à U+0AFF, l’alphabet gujarātī, une langue indienne parlée entre autres au Gujarat, un État de l’ouest de l’Inde.

D’après une étude d’Erica Machulak, parue dans l’édition d’hiver 2018 du magazine Humanities, c’est grâce à la Script Encoding Initiative (SEI), du département de linguistique de Berkeley, que plus de 100 écritures différentes ont pu être intégrées à la norme Unicode. C’est Deborah Anderson, à la tête du département, qui apporte l’expertise linguistique, et participe à constituer la liste de ces systèmes d’écriture.

Parmi les différents alphabets, on retrouve, dans les ajouts récents, le japonais archaïque (hiragana et Katakana), publié en 2019, ou encore les lettres laotiennes utilisées pour écrire le Pali.

Emojis, un développement à double tranchant

La norme Unicode constitue donc aujourd’hui le fondement de la représentation des langues et des symboles dans les principaux systèmes d’exploitation. Et l’un de ses champs d’action les plus utilisés reste... l’emoji. Le petit pictogramme, que l’on retrouve quasi systématiquement dans les textos et les messages privés, ne facilite pas vraiment la tâche des développeurs du Consortium Unicode.

« Le problème avec les emoji, c’est qu’ils sont extrêmement populaires », résume Deborah Anderson. Puisque le monde entier appelle régulièrement à la mise en place de nouveaux pictogrammes, les salariés du standard informatique passent moins de temps à travailler sur d’autres alphabets ou écritures...

Pourtant, les conséquences du développement des emojis sont à double tranchant. Certes, leur déploiement est chronophage, mais en ce qui concerne les alphabets à hiéroglyphes, tels ceux mayas ou égyptiens, ils ont pu, grâce à à ces pictogrammes, entrer dans la norme Unicode. Ainsi, un souverain maya qui souhaiterait envoyer aujourd’hui un SMS en hiéroglyphes, devrait s’en tenir à l’usage des emojis.

Pour autant, le progrès ne s’arrête jamais : le déchiffrage de l’alphabet maya, long et fastidieux, semble arriver à son terme. On préfigure alors l’arrivée de la langue ancestrale des peuples amérindiens... directement sur nos téléphones.

Un décryptage long et fastidieux

Le système d'écriture maya est considéré par les archéologues comme le plus perfectionné des systèmes de la Méso-Amérique. On compte aujourd'hui plus de 800 signes individuels, appelés glyphes, se lisant de gauche à droite et de haut en bas, via des colonnes.

Les hiéroglyphes mayas sont d'ailleurs logosyllabiques : les signes peuvent indiquer des mots, des syllabes et même, parfois, les deux à la fois. Ce n'est donc pas un système alphabétique. Les peuples amérindiens pouvaient donc, grâce à cela, désigner n'importe quel concept - un nombre, un membre de la royauté, un dieu, un objet...

Savoir écrire restait pourtant une compétence réservée à une élite restreinte, qui possédait le privilège d'entrer en communication directe avec les dieux. Si l'on ajoute à cela le fait que les signes ont évolué sur une période de 2 500 ans, on ne peut que comprendre comment les hiéroglyphes mayas narguent complètement les linguistes depuis des siècles.

Le décryptage est très compliqué : il nécessite une entente entre les chercheurs, difficile, par exemple, pendant la Guerre Froide. Si les premiers efforts européens visant à créer une norme mondiale pour l'écriture des langues mayas ont permis de préserver de grandes œuvres littéraires, comme le Popol Vuh et le Chilam Balam, de nombreuses tentatives ont été entachées par la rivalité diplomatique.

Aujourd'hui, selon Carlos Pallán Gayol, archéologue et épigraphiste à l'université de Bonn, les épigraphistes découvrent de nouveaux signes tous les mois environ. Ils auraient même décodé environ 85 % des hiéroglyphes mayas.

"Que ce dialecte soit aussi universel que possible"

L'intégration d'une écriture dans la norme Unicode prend au minimum deux ans : chaque détail, chaque retouche doit être approuvée. Il faut un véritable consensus mondial sur le nom de l'écriture, les détails de ses caractères... C'est donc avec Deborah Anderson que Carlos Pallán Gayol collabore, pour faire entrer ce système d'écriture très complexe dans la norme Unicode. Le projet Unicode Maya Hieroglyph Project, lancé dès 2018, est régulièrement mis à jour.

« Ce que vous voyez ici, c'est littéralement la tour de Babel : c'est un pur chaos » explique-t-il à Humanities. Mais le rendu final en vaudra la peine : cette entrée dans la norme Unicode réunira plus de 2500 ans de traditions et de dialectes, dans un seul clavier. Les chercheurs du monde entier - Chine, Mexique, Allemagne - pourront utiliser la base de données en temps réel, et ne plus être confrontés à des difficultés diplomatiques. De plus, selon Pallán, tout cela démocratisera l'accès à une histoire et des traditions relativement peu connues du grand public.

« C'est l'une des principales raisons qui ont attiré des universitaires comme moi à collaborer avec Unicode […] Nous voulons que [ce dialecte] soit aussi universel que possible, aussi libre d'accès que possible. En substance, en démocratiser l'accès » explique-t-il.

L'arrivée de ces hiéroglyphes et d'une nouvelle génération de textos ne devrait plus se faire attendre : selon Thomas Phinney, typographe, « Nous pourrions voir une proposition formelle d'Unicode en 2022. » La plage Unicode U+15500-U+159FF aurait déjà été, provisoirement, accordée au maya classique.

