Lexique (Dec 2023)

Phonolette: a grapheme-to-phoneme converter for French

  • Basilio Calderone,
  • Nabil Hathout,
  • Olivier Bonami

DOI
https://doi.org/10.54563/lexique.1129
Journal volume & issue
no. 33

Abstract

Read online

L’article présente Phonolette, un phonologiseur du français, capable de prédire une transcription phonologique d’un mot à partir de sa représentation orthographique. Phonolette est basé sur une architecture LSTM bidirectionnelle. Le protocole d’apprentissage de Phonolette combine les formes orthographiques du lexique GLÀFF et les transcriptions phonologiques de Flexique. Deux jeux de données ont été utilisés : l’intersection des entrées de GLÀFF et de Flexique ; la même intersection, mais en conservant seulement les formes qui ont une graphotactique française. Les résultats obtenus sont prometteurs. La précision est de 97,82 % sur le jeu complet et de 98,11 % sur le jeu réduit.