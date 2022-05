Mayanl Kejriwal est directeur de recherche à l’institut des sciences de l’information de la Viterbi School of Engineering de l'Université de Californie, aux États-Unis. Il s’est inspiré de travaux en cours sur les préjugés sexistes et de ses propres travaux sur le traitement du langage pour mener à bien ses expériences. Plutôt que de s’intéresser aux aspects qualitatifs de la représentation féminine dans la littérature et les médias, ses recherches se sont orientées vers la collecte de données quantitatives grâce à une série d’algorithmes automatiques déjà existants.

En se basant sur le corpus de 3000 livres faisant partie du Projet Gutenberg, en anglais et dans le domaine public, Kejriwal et son collègue Akarsh Nagaraj, ingénieur en apprentissage automatique chez Meta, ont pu mener cette étude sur plusieurs genres tels que l’aventure, la science-fiction, le mystère ou encore la romance sous forme variée allant du roman à la nouvelle en passant par la poésie.

Pour réaliser cette étude, ils ont utilisé la reconnaissance d’entités nommées (NER) pour extraire des caractères spécifiques au genre en examinant des éléments tels que les pronoms féminins et masculins. Ils ont également pris en compte le nombre de personnages féminins faisant figure de personnages principaux. Et les résultats sont sans appel...

« Les préjugés sexistes sont bien réels, et quand on voit quatre fois moins de femmes dans la littérature, cela a un impact subliminal sur les personnes qui consomment ces biens culturels », a déclaré Kejriwal. « Nous avons quantitativement révélé une manière indirecte dont les préjugés persistent dans la culture. » Et de poursuivre : « Les livres sont une fenêtre sur le passé, et l’écriture de ces auteurs nous donne un aperçu de la façon dont les gens perçoivent le monde et comment il a changé. »

D'importantes disparités

Les chercheurs ont rencontré des difficultés avec les pronoms qui ne correspondaient pas à un genre binaire. L’IA n’a pas été en mesure de déterminer s’« ils » faisaient référence à un pluriel ou à un « individu non dichotomique ». Pour autant, les résultats de l’étude ont permis d’établir un cadre de travail sans précédent afin de se pencher sur de tels soucis d’inégalités.

Kejriwal nuance : « Lorsque nous avons publié l’article sur l’ensemble des données, les examinateurs ont critiqué le fait que nous ignorions les genres non dichotomiques. Nous étions d’accord avec eux, d’une certaine manière. Nous pensons que ces genres ne sont pas vraiment représentés, et nous ne pourrons pas trouver beaucoup [d’individus transgenres ou d’individus non dichotomiques]. »

Outre les statistiques sur les personnages masculins et féminins, les chercheurs ont également examiné le langage associé aux personnages sexospécifiques. Nagaraj a déclaré : « Même avec des attributions erronées, les mots associés aux femmes étaient des adjectifs comme “faible”, “aimable”, “joli” et parfois “stupide”. Pour les personnages masculins, les mots les décrivant comprenaient “autorité”, “pouvoir”, “force” et “politique”. »

Kejriwal a ajouté : « Notre étude nous montre que le monde réel est complexe, mais qu’il y a des avantages à ce que tous les différents groupes de notre société participent à la production culturelle. Cela permet d'obtenir une vision plus réaliste de la société. »

Kejriwal espère que l’étude servira à souligner l’importance de la recherche interdisciplinaire, c’est-à-dire l’utilisation de la technologie de l’IA pour mettre en évidence les problèmes sociaux urgents et les inégalités qui peuvent être résolus. Les parties prenantes ayant une formation spécialisée, y compris les informaticiens, peuvent proposer des outils pour traiter les données et répondre aux questions, et les décideurs politiques peuvent utiliser ces données pour mettre en œuvre des changements.

Crédits photo : illustration ; Priscilla Du Preez / Unsplash