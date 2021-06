Post-doctorant et passionné par les créations littéraires que GPT-2 permettaient, et plus encore celles de GPT-3, Pierre-Carl Langlais le racontait à ActuaLitté : « Plus puissant, avec énormément de mémoire, il est capable de prouesses techniques dingues. » Lui-même s’était déjà amusé à produire un texte de Michel Foucault, qui aborderait la question de l’intelligence artificielle — entièrement rédigé par GPT-3. Et avec GPT-2, il avait transformé Marcel Proust en auteur de science-fiction.

“Mesure ton langage !”

Sauf que les multiples applications ne sont pas souvent si bon enfant : OpenAI a récemment découvert que son outil servait à générer de la pédopornographie. Pas terrible. Alors pour tenter de réduire les risques de dérives, les techniciens se sont penchés sur la problématique. Avec une piste : alimenter le programmer avec une centaine de textes, tirés d’encyclopédie, pour aborder des sujets aussi variés que l’histoire, la technologie, mais également la violence, l’injustice et le harcèlement.

Suffisant pour prévenir du Côté Obscur de la création par IA ? En tout cas, amadouer le potentiel énorme de cette appliction en mesure de générer fake news et récits haineux aussi facilement que l’on se mouche. Etant donné que l’usage de GTP-3 est encore loin d’être démocratisé, tout reste à faire avant d’ouvrir les vannes.

Dans le même temps, Microsoft se sert de cette solution pour créer du code informatique. Google de son côté y décèle un fantastique service pour l’avenir de la recherche. Mais les modèles de langage que ces mêmes groupes développent sont susceptibles d’arriver aux mêmes problématiques que GPT-3.

Lutter contre la fabrication de préjugés, si simple pour l’IA, ce fut la tâche d’Abubakar Abid, PDG de Gradio. Cette start-up teste des solutions d’apprentissage, pour justement empêcher l’incitation à la haine. En analysant GPT-3, les premiers résultats furent stupéfiants : interrogé sur des questions religieuses, le robot a formulé des approches violentes contre les juifs, les bouddhistes, les sikhs, y compris les chrétiens. Mais les musulmans ont été particulièrement concernés — 9 réponses sur 10.

Avec quelques réglages — l’introduction de textes positifs liés à l’islam — le nombre de dérives a drastiquement diminué : 4 sur 10 réponses. Mais pas encore assez.

La rentabilisation, très délicate

Les concepteurs originaux savent d’ailleurs quelle est la propension de leur créature à se montrer raciste et sexiste : réduire la toxicité de ses propos devient une véritable gageure.

Car si les textes qui résultent de ses calculs deviennent de plus en plus humains, aucune capacité de réflexion ni de raisonnement n’intervient. La machine n’a pas d’identité et finit toujours par recracher des termes qu’elle ne comprend pas. Pour finir par dire des horreurs.

Mais si GPT-3 devient raciste, c’est avant tout parce que les préjugés existent dans les ouvrages qui lui servent de point de support. Et même en tentant d’introduire des textes dont des termes comme gay ou lesbienne auraient été supprimés, on arrive à une disparition de ces personnes dans les productions de l’IA. En somme, elles sont invisibilisées, sans pour autant que les recherches d’optimisation n’aboutissent.

La suppression des biais et autres préjugés pourrait intervenir après coup, suggérait Jesse Dodge, chercheur à l’Allen Institute for AI. Pour ce faire, une collaboration globale devient nécessaire — et encore faut-il s’entendre sur lesdites modifications à aborder. Or, l’une des pistes glissantes actuelles, c’est la volonté industrielle de faire basculer les IA d’un modèle de recherche à celui d’une productivité — et donc d’une commercialisation.

Un empressement qui évidemment ne pourrait que provoquer des désastres, si l’outil n’est pas correctement configuré en amont…

via Wired

Dossier - L'intelligence artificielle au service du livre et de la lecture

Crédit photo : Alex Knight/ Unsplash