SHS Web of Conferences (Jan 2022)
L’analyse du discours et l’intelligence artificielle pour réaliser une écriture inclusive : le projet EMIMIC
Abstract
Cet article présente le projet E-MIMIC, une application qui vise à éliminer les préjugés et la non-inclusion dans les textes administratifs rédigés dans les pays européens, à commencer par ceux qui sont rédigés dans les langues romanes. Il présente une méthodologie conçue à partir de critères discursifs inspirés de l’analyse du discours française et utilisés pour étiqueter un corpus de documents institutionnels, qui sont utilisés pour l’apprentissage profond des réseaux neuronaux. Des architectures de modélisation profonde du langage sont exploitées pour identifier automatiquement les extraits de texte non inclusifs, suggérer des formes alternatives et produire des reformulations inclusives. Une évaluation préliminaire menée sur un ensemble de données de référence pour la langue italienne montre des résultats prometteurs, qui poussent à finaliser l’application et à la réaliser également pour d’autres langues, tel le français.