Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave (Feb 2017)

Zgoščena predstavitev slovarjev izgovarjav s končnimi super pretvorniki

  • Žiga Golob,
  • Boštjan Vesnicer,
  • Jerneja Žganec Gros,
  • Mario Žganec,
  • Simon Dobrišek

DOI
https://doi.org/10.4312/slo2.0.2016.1.79-96
Journal volume & issue
Vol. 4, no. 1

Abstract

Read online

Računalniški modeli končnih pretvornikov omogočajo zgoščeno predstavitev slovarjev izgovarjav, ki jih uporabljajo tako sintetizatorji govora kot tudi razpoznavalniki govora. V članku je predstavljen nov tip končnih pretvornikov, t. i. končni super pretvorniki, s katerimi lahko slovarje izgovarjav predstavimo z manjšim številom stanj in prehodov kot z uporabo običajnih minimalnih determinističnih končnih pretvornikov. Predstavljen je učinkovit postopek gradnje končnih super pretvornikov, ki ohranjajo svojo determinističnost, poleg besed iz danega slovarja izgovarjav pa lahko sprejmejo in pretvorijo tudi nekatere druge besede, ki niso bile zastopane v izvirnem slovarju. Oddani izhodni fonetični prepisi za določene sprejete izvenslovarske besede so sicer lahko napačni, vendar se izkaže, da je napaka pri pretvorbi primerljiva z napakami, ki jih dosegajo trenutno najboljše metode za samodejno grafemsko-fonemsko pretvorbo besed za slovenski jezik. Za preizkus in preverjanje predlaganega postopka gradnje končnih super pretvornikov je bil uporabljen slovar izgovarjav SI-PRON za slovenski jezik, ki vsebuje več kot milijon različnih slovarskih vnosov. Rezultati poskusov so med drugim podali presenetljivo ugotovitev, da se velikost končnih pretvornikov z naraščanjem obsega slovarja prek določenega števila besed prične zmanjševati, kar pripisujemo predvsem velikemu številu pregibnih oblik besed v slovenščini.

Keywords