SHS Web of Conferences (Jan 2016)
Les écrits d’élèves : un corpus de référence pour le français contemporain
Abstract
La situation d’apprentissage de l’écriture et les difficultés qu’elle révèle mettent au jour des zones de la langue qui apparaissent caractéristiques et délicates à maîtriser chez les scripteurs débutants. Ce constat nous a conduits à constituer une base de données d’écrits d’élèves en vue d’explorer systématiquement les différentes composantes du français qui résistent ou qui évoluent dans le processus d’acquisition de l’écriture. Notre communication retrace, dans un premier temps, les problèmes spécifiques posés par ce type de corpus, en particulier pour ce qui concerne le protocole de transcription et d’annotation. Les écarts à la norme des apprentis scripteurs doivent en effet faire l’objet d’annotations spécifiques pour que les éléments verbaux soient lemmatisés correctement. Dans une deuxième partie, nous exposons deux types d’investigations menées dans ce corpus à propos de la ponctuation blanche : i) les espaces et blancs de textes ; ii ) la segmentation de mots. Il s’agit de montrer comment le corpus que nous constituons, à travers les conventions d’annotation qui ont été construites, permet de repérer des éléments caractéristiques de la manière dont les élèves délimitent et ponctuent leurs écrits, mais aussi d’observer comment cette ponctuation blanche évolue pour en extraire des indications propres à accompagner ou renouveler les apprentissages induits.