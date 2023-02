Cachées parmi les quelque 85.000 manuscrits conservés par la Bibliothèque nationale, 11.000 pièces de théâtre, dont 1300 datent du siècle d’or, période de rayonnement de la culture espagnole. Ces livres et manuscrits ont été sélectionnés pour un programme de retranscription numérique à l’aide d’un logiciel nommé Transkribus. Parmi ces documents se trouvait un texte dont l’auteur était inconnu.

Des preuves suggèrent à présent que la pièce n’a été écrite par nul autre que le Shakespeare espagnol, Lope de Vega.

Les universitaires et les bibliothécaires n’avaient aucune idée du trésor caché dans les documents voués à être transcrits par le programme. L’œuvre a tout d’abord été transposée par le logiciel Transkribus, qui convertit la calligraphie ancienne en texte numérique. Puis, un second logiciel, appelé Stylo, qui analyse et compare les textes obtenus à des bases de données, a le premier émis l'hypothèse que le document était l’œuvre de Lope de Vega et datait de 1628.

Entre l'homme et la machine

La transcription contenait malgré tout quelques erreurs. Deux chercheurs, Alvaro Cuellar et German Vega Garcia Luengo, ont donc fait analyser le manuscrit par la plateforme ETSO. Ils ont développé et formé cette dernière à partir des éléments caractéristiques de la littérature espagnole de l’âge d’or.

ETSO est allée dans le sens d'une attribution de la pièce à Lope de Vega, en s'appuyant sur l’ensemble des données. Pour interpréter et reconnaître le style d’un auteur, l’IA, sur instruction des deux chercheurs, relève les 500 mots les plus employés dans chaque texte. Aucune des autres pièces de théâtre n’a été reliée au dramaturge espagnol.

Mais les scientifiques ne se sont pas contentés des résultats offerts par les logiciels, ils ont aussi fait appel aux ressources philologiques et en particulier à l’étude de la versification. Cela consiste à étudier comment Lope de Vega utilisait habituellement la métrique dans ses œuvres. Ils ont en outre fait confiance à l’orthoépie, qui traduit la manière dont le dramaturge prononçait les mots et utilisait par exemple les diphtongues.

Enfin, ils ont mis le manuscrit à l’épreuve de l’étude des échos lopescos, c’est-à-dire de la coïncidence tant dans les idées, les thèmes et les motifs que dans le lexique spécifique entre l’œuvre étudiée et celle d’autre texte du dramaturge. Tous ces tests semblent confirmer ce que soulignaient les premières expérimentations de l’IA : l’œuvre s'insère parfaitement dans le répertoire théâtral de Lope de Vega.

La Laura française est une pièce remarquable, avec une force dramatique à attendre d'un Lope de Vega mature. - Bibliothèque Nationale d'Espagne

L’intrigue de cette comédie se déroule en France et tourne autour d’une protagoniste, Laura, fille du duc de Bretagne et mariée au comte Arnaldo. Le Dauphin de France et héritier du trône tombe amoureux d’elle et commence à la courtiser. Cependant Laura résiste aux avances du prince et aux soupçons de son mari…

Cuellar et Vega estiment que la pièce a été écrite vers 1630, soit cinq ans avant la mort de Lope de Vega. La BNE avait acheté le document à un duc en 1882.

Lope de Vega est considéré comme le deuxième auteur le plus important d’Espagne après Miguel de Cervantes. Connu pour son écriture prolifique, il a publié au total plus de 3000 sonnets, 3 romans et environ 500 pièces de théâtre. La maison d’édition espagnole Gredos publiera le texte dans les mois à venir.

Crédits photo : BNE