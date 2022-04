Une équipe d'Accenture s'est attelée à mettre au point, en 10 semaines, une solution d'IA facilitant l'extraction de renseignements sur les victimes de la persécution nazie à partir de documents tirés des archives Arolsen. Cet outi augmente la précision de ces compilations, comme d'augmenter par 40 la vitesse du processus, pour une moyenne de 160 actes traités par heure, explique l'entreprise.

Pour ce faire, les employés d'Accenture ont repris une solution d'IA déjà existante, qui s'appuie sur la reconnaissance optique de caractères et la technologie d'apprentissage automatique. En pratique, chaque pièce conservée dans les archives est examinée, et ces éléments, comme le nom de famille ou la date de naissance sont insérés dans une base de données. L'outil permet notamment de récupérer des archives particulièrement difficiles et fastidieuses à consulter pour l'homme, comme des listes de prisonniers et de transferts avec des dizaines de rangées, ou encore des registres de camps de concentration.

Des données consultables en ligne

Néanmoins, la surveillance humaine du processus reste importante, que ce soit pour garantir l'exactitude de la retranscription, mais également pour améliorer l'IA. En corrigeant les informations, les bénévoles éduquent la machine – en pointant des caractères ou des abréviations qui lui sont dans un premier temps inconnus. Un peu comme on le retrouve dans les lettres Captcha à valider. Pour soutenir ce projet, les Archives Arolsen s'appuient sur un modèle de production participative, #everynamecounts.

« Nous sommes submergés par le nombre de bénévoles qui soutiennent la numérisation de nos archives », relève Floriane Azoulay, directrice des Archives Arolsen. « Notre collaboration avec l'équipe d'Accenture se démarque. C'est fantastique qu'il existe désormais une solution numérique pour capturer plus rapidement le contenu des archives, ce qui permet de rendre les informations les plus importantes sur le sort des victimes de la persécution nazie consultables dans nos archives en ligne. »

Exemple de document traité par la solution d'IA Accenture dans le cadre du projet #everynamecounts des archives Arolsen. Archives Arolsen

Depuis qu'Accenture a mis en place la solution d'IA en décembre 2021, l'outil a classé plus de 160.000 noms de victimes de persécutions nazies, extrait des données de plus de 18.000 documents, et regroupé plus de 60.000 pièces dans des groupes pour améliorer l'identification et l'analyse. Plus de 950 personnes d'Accenture se sont portées volontaires pour le projet à ce jour.

A LIRE:Des textes antiques fragmentaires enfin révélés grâce à l'IA

Les archives Arolsen conservent la plus grande collection de documents au monde sur la persécution nazie - 110 millions d'archives et d'objets numériques, dont une partie s'inscrit dans le programme Mémoire du monde de l'UNESCO - pour garder vivante la mémoire des crimes du régime terroriste allemand.

Une partie essentielle du travail des Archives est de rendre ces éléments accessibles à tous ceux qui souhaitent rechercher des traces de victimes et de survivants de l'Holocauste, de la persécution des minorités et du travail forcé.

Crédits : Arolsen Archives