SHS Web of Conferences (Jan 2024)
Rendre « vilisible » l’écriture scolaire. Choix de transcription et d’annotation pour une mise en corpus
Abstract
Cet article expose les bases théoriques et méthodologiques du corpus E-CALM. Ce corpus a été construit pour répondre à la nécessité de documenter les compétences scripturales des élèves en France à différents niveaux de la scolarité. E-CALM constitue un réservoir de données textuelles exploitables par la recherche et par la formation des enseignants. Les choix de traitement des manuscrits recueillis ont permis de faire émerger les traces de l’écriture des élèves et de leurs interactions avec les enseignants corrigeant et commentant les copies. Explorer avec des outils informatiques un grand corpus d’écrits scolaires permet de confirmer des connaissances déjà acquises mais aussi de faire apparaitre des éléments nouveaux, invisibles à l’observation de données de faibles tailles et qu’un grand corpus tel qu’E-CALM (plus d’un million de mots) permet de révéler. Une fois produite, l’analyse linguistique conduit à des avancées didactiques : en faisant émerger des éléments discriminants des textes, corrélés à des variables didactiques et sociologiques, elle permet de proposer des protocoles d’enseignement ajustés aux contextes d’apprentissage.
Keywords