SHS Web of Conferences (Jul 2014)

Construction d'un lexique flexionnel phonétisé libre du français

  • Bonami Olivier,
  • Caron Gauthier,
  • Plancq Clément

DOI
https://doi.org/10.1051/shsconf/20140801223
Journal volume & issue
Vol. 8
pp. 2583 – 2596

Abstract

Read online

Cette proposition de communication décrit la ressource Flexique, un lexique flexionnel phonétisé du français standard, distribué sous licence libre. La construction de Flexique a été motivée par les besoins de l’étude quantitative du système flexionnel du français, et comble un manque dans l’ensemble des ressources disponibles, qui sont soit difficiles d’accès, soit incomplètes, soit onéreuses. Flexique a été construit à partir de la ressource Lexique (New Pallier, Ferrand et Matos 2001), une base de données lexicale de 150 000 mots combinant des informations phonétiques, lexicales, morphosyntaxiques et fréquentielles. Les objectifs de Flexique étant partiellement différents de ceux de Lexique, la structure a été refondée et une organisation par lexèmea été adoptée. De plus et surtout, les transcriptions phonétiques ont été entièrement reprises, ce qui a impliqué la construction d’une interface de correction semi-guidée, la correction manuelle d’environ 65 000 formes clé, l’inférence automatique d’environ 300 000 formes supplémentaires à l’aide de fléchisseurs par règles, et la validation semi-automatique des résultats par examen des propriétés structurelles du lexique résultant. L’article décrit les principales caractéristiques de Flexique, détaille les conventions de transcription et la méthode de construction de la ressource, et présente quelques applications préliminaires à l’étude instrumentée de l’organisation des paradigmes de flexion.