Eesti Rakenduslingvistika Ühingu Aastaraamat (May 2010)

Kesksete lausekomponentide järjestus õppijakeeles: arvutianalüüsi katse

  • Erika Matsak,
  • Helena Metslang

DOI
https://doi.org/10.5128/ERYa6.11
Journal volume & issue
Vol. 0, no. 6
pp. 175 – 193

Abstract

Read online

Artikkel käsitleb eesti keele lihtlause sõnajärje arvutianalüüsi katset, mille eesmärgiks on õppijakeele sõnajärje vealeidja loomine. Katse käigus koostati eesti keele sagedaste sõnajärjetüüpide mallid, mis kirjeldasid lihtlause ja mõne lihtsama liitlausetüübi verbi, tuumargumentide ning nende järge mõjutavate moodustajate või sõnade järge (põhiliselt subjekt, objekt, predikaat, adverbiaal lause algul või seotud laiendina, üldlaiend). Mallid leiti Tartu Ülikooli kirjakeele korpuse põhjal. Saadud mallide katvust hinnati kirjakeele ja õppijakeele korpuste peal spetsiaalselt loodud programmi abil. Artiklis kirjeldatav programm, mis on kasutatav koos mallide koguga, analüüsib õppijakeelt, märkides küsitavaks laused, mis ühelegi mallile ei vasta. Artikkel tutvustab mallide kogu loomise protsessi ja tekstilausete sõnajärge hindavat programmi. Antakse ka ülevaade programmi efektiivsusest õppijakeele tekstide analüüsil ning vealeidja edasise arendamise vajadustest. Õppijakeele analüüsil kasutati Tallinna Ülikooli eesti vahekeele korpust, mis koondab ligi 740 000 sõne mahus eesti keele õppijate loovkirjutisi ja harjutusi.DOI: http://dx.doi.org/10.5128/ERYa6.11

Keywords