SHS Web of Conferences (Jul 2014)
Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse
Abstract
Nous nous intéressons à la notion de prise en charge énonciative et modale au travers de la mise en place d’un système d’annotation automatique de textes. Le système s’appuie sur un ensemble de règles heuristiques couplant ressources sémantiques et analyse syntaxique robuste. Il permet le repérage et l’annotation de segments textuels. Ces segments résultent de la recherche de la portée sémantique de divers indices lexicaux et grammaticaux de prise en charge énonciative et modale (verbes modaux, temps verbaux, constructions de type conditionnelles, etc.) dans une phrase. Une des difficultés réside dans le fait que de nombreux indices peuvent être présents simultanément dans une phrase, complexifiant ainsi l'interprétation de la portée de chaque indice. Nous présentons dans cet article la méthodologie sur laquelle le système repose, son évaluation sur un corpus de dépêches de presse ainsi que son utilisation au sein d’un système de recherche d’information. L’évaluation du système, en plus d’apporter un regard sur son efficience, permet d’envisager un retour réflexif sur le développement du système d’annotation. Au sein d’un système de Recherche d’Information, le système permet à des journalistes de construire des chronologies en intégrant des filtres relatifs à la modalité épistémique et / ou à une distanciation énonciative (de type discours rapporté).