SHS Web of Conferences (Jan 2016)

Codage en chaîne ou en première mention de la coréférence : approcher la structure des chaînes de référence par comparaison des deux annotations

  • Antoine Jean-Yves,
  • Lefeuvre Anaïs,
  • Schang Emmanuel

DOI
https://doi.org/10.1051/shsconf/20162702001
Journal volume & issue
Vol. 27
p. 02001

Abstract

Read online

Cet article présente une étude expérimentale portant sur les chaînes de référence en français oral spontané. Elle a été menée le corpus de dialogue oral annoté en coféférence ANCOR et a porté sur la comparaison des résultats distributionnels obtenus sur les deux types d’annotation présentes dans le corpus : d’une part, une annotation en chaîne, qui repose sur l’identification des liens entre expressions linguistiques (nominales ou pronominales) qui ont un même référent. Et d’autre part, une annotation en première mention, où les liens sont faits entre la première mention d’une entité et les expressions suivantes qui ont le même référent. Nos résultats expérimentaux nous ont permis de retrouver certaines hypothèse de la littérature, concernent avant tout les capacités de certains types de mentions (définis, démonstratifs, pronoms etc…) à ancrer (ou non) les chaînes de référence. D’autres résultats plus originaux ont également été obtenus, qui concernent la configuration globale des chaînes appréhendées en termes de configurations de transition (ou non) entre définis et indéfinis, ou entre groupes nominaux et pronoms. Enfin, notre étude a montré que les heuristiques que l’on peut tirer sur l’accord en gere ou en nombre dans les chaînes de référence ne sont pas impactées par le type d’annotation retenu.