Lexique (Dec 2023)

Typage sémantique des noms dans la ressource morphologique Démonette

  • Mathilde Huguin,
  • Lucie Barque,
  • Pauline Haas,
  • Delphine Tribout

DOI
https://doi.org/10.54563/lexique.1086
Journal volume & issue
no. 33

Abstract

Read online

Cet article décrit la méthodologie mise en place pour effectuer l’annotation sémantique d’une partie des noms de la base de données morphologiques Démonette-2. Nous y présentons d’abord le jeu d’étiquettes sémantiques sélectionné pour effectuer cette annotation. Ce jeu d’étiquettes est une adaptation révisée des Unique Beginners de Wordnet et chaque étiquette est accompagnée d’une définition et de tests linguistiques permettant l’attribution d’une étiquette à un nom. Nous détaillons ensuite les deux méthodes utilisées pour annoter les lexèmes nominaux. La première méthode, automatique, a consisté à apparier les étiquettes présentes dans les bases de données morphologiques alimentant Démonette‑2 avec le jeu d’étiquettes révisé. La seconde méthode a consisté à annoter manuellement un sous-ensemble de noms. Nous donnons enfin un bilan quantitatif de notre annotation en présentant notamment la distribution des noms monosémiques / polysémiques et les étiquettes sémantiques les plus fréquentes. Ce premier travail d’annotation sémantique fournit un ensemble de 58 099 noms disposant d’une ou plusieurs étiquettes sémantiques. Cet ensemble de noms offre déjà de multiples possibilités d’analyses, impossibles sans accès à une large base de données annotées sémantiquement et morphologiquement, comme l’étude de procédés concurrents ou encore l’examen de la polyfonctionnalité des affixes.