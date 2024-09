Pour la première fois, il est possible d'exploiter précisément la machine linguistique de Pāṇini, qui comprend 4000 règles détaillées dans l'Aṣṭādhyāyī (Le livre en huit chapitres), rédigée vers 500 avant J.-C. Un système conçu pour transformer la base et le suffixe d'un mot en structures grammaticalement correctes, via un processus séquentiel.

Dit autrement, il prend la racine d'un mot (sa base) et un suffixe (une terminaison ajoutée) et les combine selon des règles spécifiques pour former des mots complets qui sont corrects d'un point de vue grammatical. Ce processus se fait étape par étape, où chaque étape suit des règles précises pour s'assurer que le mot final est formé correctement. C'est comme suivre une recette de cuisine où chaque instruction doit être réalisée dans un certain ordre pour obtenir le plat souhaité.

Changement de perspective

La trouvaille du Rishi Rajpopat permet désormais de 'dériver' n'importe quel mot en sanskrit, facilitant la construction de millions de mots corrects sur le plan grammatical. Le principal défi jusqu'ici résidait dans les 'conflits de règles', où plusieurs règles de Pāṇini pouvaient s'appliquer simultanément, et d'obliger les érudits à choisir sans certitude de correction. Des conflits qui affectaient des millions de mots, dont les formes de mantra et guru.

Pour régler ces conflits, Pāṇini avait proposé une méta-règle, 1.4.2 vipratiṣedhe paraṁ kāryam' mal interprétée depuis des siècles, conduisant souvent à des erreurs grammaticales. Les tentatives de résolution par l'ajout de méta-règles supplémentaires se sont avérées des contresens, selon Rishi Rajpopat. Il a démontré, dans sa thèse publiée le 15 décembre 2022, que l'approche originale de Pāṇini était en réalité « auto-suffisante » : « Pāṇini avait un esprit extraordinaire et il a construit une machine sans équivalent dans l'histoire humaine. Il ne s'attendait pas à ce que nous ajoutions de nouvelles idées à ses règles. Plus nous tripotons la grammaire de Pāṇini, plus elle nous échappe », explique-t-il sur le blog l'Université de Cambridge.

Traditionnellement, il était admis que lorsqu'il y avait un conflit entre deux règles grammaticales de Pāṇini de même importance, la règle qui apparaissait plus tard dans l'ordre des règles devait être appliquée. Rishi Rajpopat, de son côté, soutient que Pāṇini préconisait plutôt de choisir la règle applicable à la partie droite d'un mot lorsqu'un conflit survient entre les règles s'appliquant aux côtés gauche et droit du mot.

En adoptant cette nouvelle interprétation, le chercheur a démontré que l'approche de Pāṇini permet de produire des mots corrects grammaticalement avec très peu d'exceptions. Par exemple, dans la phrase en sanskrit signifiant Les Dieux sont satisfaits par les mantras, un conflit apparaît pour former le mot "mantraiḥ" à partir de "mantra + bhis". En suivant la règle du côté droit "bhis", on obtient la forme correcte "mantraiḥ". De même, dans Le savoir est donné par le guru, pour former "guruṇā" à partir de "guru + ā", en choisissant la règle du côté droit "ā", on parvient à la forme correcte "guruṇā".

Cette avancée marque un moment significatif dans l'étude du sanskrit, mais pas seulement. Rishi Rajpopat propose : « Les informaticiens qui travaillent sur le traitement du langage naturel ont abandonné les approches basées sur les règles il y a plus de 50 ans. Donc, enseigner aux ordinateurs comment combiner l'intention de l'orateur avec la grammaire basée sur les règles de Pāṇini pour produire la parole humaine serait un jalon majeur dans l'histoire de l'interaction humaine avec les machines, ainsi que dans l'histoire intellectuelle de l'Inde. »

Pour Vincenzo Vergiani, professeur de sanskrit à l'Université de Cambridge, son étudiant « a trouvé une solution extrêmement élégante à un problème qui a perplexe les érudits pendant des siècles. Cette découverte va révolutionner l'étude du sanskrit à un moment où l'intérêt pour cette langue est en hausse. »

Partie du Manuscrit sur ôles de l'Astadhyayi en sanskrit, copié en écriture Grantha. Tamil Nadu, XIXe siècle. Collection de l'École française d'Extrême-Orient à Pondychéry. Ms Sarah Welch (CC BY-SA 4.0)

Eurêka !

Rishi Rajpopat, né dans une banlieue de Mumbai en 1995, a exploré cette problématique pendant son doctorat au St John’s College et à la faculté d'études asiatiques et du Moyen-Orient de Cambridge. Tandis que Rishi Rajpopat rencontrait des difficultés dans ses recherches, le professeur Vincenzo Vergiani lui partagea un conseil précieux : « Si la solution vous semble trop complexe, il y a de fortes chances que vous fassiez fausse route. » « Six mois plus tard, j'ai eu un moment eurêka », assure celui qui fut alors son étudiant.

Il développe : « J'étais presque prêt à abandonner, je n'allais nulle part. Alors j'ai fermé les livres pendant un mois et j'ai simplement profité de l'été, en nageant, faisant du vélo, cuisinant, priant et méditant. Puis, à contrecœur, je suis retourné au travail, et, en quelques minutes, en tournant les pages, ces motifs ont commencé à émerger, et tout a commencé à avoir du sens. À ce moment-là, je me suis dit, dans un étonnement total : pendant plus de deux millénaires, la clé de la grammaire de Pāṇini était juste devant les yeux de tout le monde mais cachée à l'esprit de tous ! »

S'il restait encore beaucoup de travail à abattre, il avait trouvé la plus grande partie du casse-tête : « Au cours des semaines suivantes, j'étais tellement excité, je ne pouvais pas dormir et je passais des heures à la bibliothèque, y compris au milieu de la nuit, pour vérifier ce que j'avais trouvé et résoudre les problèmes connexes. Ce travail a pris deux ans et demi de plus. »

Le sanskrit, langue indo-européenne d'Asie du Sud, sert non seulement de langue sacrée pour l'hindouisme mais a aussi véhiculé d'importantes œuvres scientifiques, philosophiques, poétiques et littéraires en Inde à travers les siècles. Aujourd'hui, environ 25.000 personnes en Inde parlent encore le sanskrit.

« Une partie de la sagesse la plus ancienne de l'Inde a été produite en sanskrit et nous ne comprenons toujours pas pleinement ce que nos ancêtres ont réalisé », conclut Rishi Rajpopat.

Deux pages du Rupavatara, une grammaire du logicien indien Dharmakirti (VIIe siècle) basée sur celle de Panini. Manuscrit du XVIIe siècle en écorce de bouleau, Cachemire. Wellcome Collection gallery (CC BY 4.0)

Crédits photo : Pāṇini. Jameela P. (CC BY-SA 4.0)