SHS Web of Conferences (Jan 2024)

Annotation de la cohérence dans un corpus de textes d’élèves d’école et collège

  • Bras Myriam,
  • Vieu Laure

DOI
https://doi.org/10.1051/shsconf/202418603001
Journal volume & issue
Vol. 186
p. 03001

Abstract

Read online

Cet article traite de la question de la cohérence dans des productions écrites d’élèves d’école et collège. Le corpus analysé est issu du corpus RESOLCO, il est constitué de 36 textes d’élèves d’école primaire et de collège (CE2, 6ème et 3ème) produits selon une même consigne d’écriture, une tâche-problème demandant aux élèves la production d’un texte narratif impliquant la résolution d’anaphores de divers types. Il a été annoté dans le cadre du projet ECalm avec l’objectif d’analyser la cohérence à partir de l’identification de relations entre segments de texte. Le schéma d’annotation est basé sur la Segmented Discourse Representation Theory qui définit de façon formelle ce qu’est une représentation de discours cohérente. L’article présente la méthodologie de segmentation des textes en Unités de Discours Élémentaires et d’annotation en Relations de Discours et en problèmes de cohérence (incohérences locales, impossibilités d’inférer une Relation de Discours, ou impossibilités d’attacher la représentation d’un segment au reste de la représentation), réalisant une extension originale de la SDRT. L’analyse des annotations met en évidence une tendance à la baisse de ces trois types d’indicateurs, traduisant une progression de la cohérence du CE2 à la 3ème, avec un palier significatif entre le CE2 et la 6ème, à corréler avec un saut majeur de compétences rédactionnelles entre la fin du cycle 2 et la fin du cycle 3. La théorie, mise à l’épreuve ici pour la première fois sur des textes d’apprenants, se trouve ainsi validée empiriquement dans sa version étendue.

Keywords