Eesti Rakenduslingvistika Ühingu Aastaraamat (May 2009)

Eesti keele püsiühendid arvutilingvistikas: miks ja kuidas

  • Heiki-Jaan Kaalep,
  • Kadri Muischnek

DOI
https://doi.org/10.5128/ERYa5.10
Journal volume & issue
Vol. 0, no. 5
pp. 157 – 172

Abstract

Read online

Artikkel räägib püsiühendite automaattöötlusest arvutilingvistikas. Püsiühendi all mõeldakse siin kahe või enama sõna(vormi) ühendit, mida mingi tähenduse väljendamiseks on tavaks koos kasutada; selle definitsiooni alla mahuvad nii idiomaatilised kui ka kollokatiivsed ühendid. Arvutilingvistikas on püsiühendid probleemiks, sest nad komplitseerivad teksti alt-üles analüüsimudelit, mille järgi lause struktuuri ja tähenduse ehituskiviks on üksiksõna. Artikkel annab ülevaate püsiühendite automaattöötluse kolmest etapist – püsiühendite tuvastamisest, nende leksikoni koostamisest ja püsiühendite märgendamisest tekstis. Nende ülesannete lahendamiseks on arvutilingvistikas välja töötatud tüüpilised meetodid, kuid need meetodid on eesti keele kui vaba sõnajärjega morfoloogiliselt keeruka keele analüüsil rakendatavad ainult teatud reservatsioonide ja modifikatsioonidega. Artiklis analüüsitaksegi eesti keele “erivajadusi” selles vallas.DOI: http://dx.doi.org/10.5128/ERYa5.10

Keywords