SHS Web of Conferences (Jul 2014)
Unités discursives de base et leur périphérie gauche dans LOCAS-F, un corpus oral multigenres annoté
Abstract
Cette contribution vise à présenter le corpus LOCAS-F (Louvain Corpus of Annotated Speech - French), développé à Louvain-la-Neuve (Belgique) depuis 2011 et annoté au niveau discursif. Au coeur de l’annotation se trouve l’unité discursive de base résultant de la corrélation entre unités prosodiques et unités syntaxiques (voir notamment Lacheret-Dujour et Victorri, 2002). Partant du postulat que la syntaxe et la prosodie fournissent chacune des signaux pour la délimitation d’unités dans le flux de parole, nous proposons que l’unité discursive soit définie par la coïncidence entre frontières syntaxique et prosodique. Le premier volet de cette contribution vise à présenter notre définition de ces unités, ainsi que notre méthode de segmentation, qui mêle une annotation syntaxique et une annotation prosodique, réalisées de manière totalement indépendante. Nous présentons ensuite l’ensemble du corpus LOCAS-F et ses différentes composantes, en nous attardant sur la distribution des unités discursives de base au sein des différents genres constituant notre corpus et justifions leur usage par rapport à la distribution des unités syntaxiques et des unités prosodiques seules. Nous poursuivons en effet l’hypothèse (en section 2) selon laquelle seule la combinaison de ces deux types d’unités permet de définir des unités pertinentes pour l’analyse du discours, remplissant une fonction cognitive dans la planification et l’interprétation de celui-ci. Enfin, nous présentons une étude exploitant le corpus annoté en nous concentrant sur les amorces des unités discursives. La périphérie gauche constitue le point d’ancrage du message et est le lieu, selon nous, où les locuteurs peuvent signaler la macro-structure de leur discours. Afin d’étudier les stratégies discursives à l’œuvre dans notre corpus, nous établissons dès lors une analyse distributionnelle des types formels observés et, sur un échantillon du corpus, nous comparons les différentes fonctions que ces éléments situés en périphérie gauche peuvent revêtir.