SHS Web of Conferences (Jan 2020)

Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit

  • Wang Ilaine,
  • Antoine Jean-Yves,
  • Abouda Lotfi,
  • Waszczuk Jakub,
  • Pelletier Aurore,
  • Halftermeyer Anaïs

DOI
https://doi.org/10.1051/shsconf/20207811004
Journal volume & issue
Vol. 78
p. 11004

Abstract

Read online

Cet article présente les principaux résultats de la partie syntaxique du projet Temporal@ODIL, une initiative visant la construction d’un corpus de français parlé spontané annoté en temporalité. Nous présentons ici ODIL_Syntax, corpus arboré en constituants sur lequel s’appuie l’annotation temporelle et qui est diffusé librement sous licence Creative Commons. ODIL_Syntax a été créé à l’aide de Contemplata, une plateforme Web d’annotation développée spécifiquement dans le cadre du projet, diffusée elle aussi librement et qui présente l’intérêt de permettre une annotation semi-automatique utilisant un analyseur syntaxique. L’article décrit la procédure d’annotation avec cet outil, nos choix d’annotation ainsi que le corpus produit, en s’intéressant en particulier à une comparaison avec le corpus équivalent FTB (French Treebank) développé pour l’écrit.