Lähivõrdlusi (Oct 2021)

Eesti keele A2–C1-taseme kirjalike tekstide võrdlev automaatanalüüs

  • Kais Allkivi-Metsoja

DOI
https://doi.org/10.5128/LV31.01
Journal volume & issue
no. 31
pp. 13 – 59

Abstract

Read online

Tänaseni puudub ülevaade eesti keele kui sihtkeele õppijate tekstiloomest eri keeleoskustasemetel, mis põhineks tekstide automaatanalüüsi andmete statistilisel töötlusel. Eesmärk on kindlaks teha, millised arvuliselt mõõdetavad tunnused iseloomustavad A2–C1-taseme eksamite loovkirjutiste leksikaalset keerukust ning sõnaliikide ja -vormide kasutust, olles seejuures keeleoskustasemete piiritlemisel nii statistiliselt kui ka sisuliselt olulised. Esile tulevad järjestikuseid tasemeid (A2–B1, B1–B2, B2–C1) läbivalt ja osaliselt eristavad tunnused. Ühed neist muutuvad lineaarselt kasvavas või kahanevas suunas, teiste tunnuste lõikes ei ole muutused aga samasuunalised ja seostuvad pigem kirjutamisülesande (teksti liik, teema) kui keelekasutuse kasvava keerukusega. Uurimuse tulemused pakuvad uudseid teadmisi keeleõppe seisukohalt ja aitavad edaspidi arendada keeleoskustaseme automaathindajat, tuues välja usaldusväärsemad tunnused tasemete prognoosimiseks. *** Written Estonian at the levels A2–C1: Comparative automated analysis To achieve the communicative purposes of the language proficiency levels defined in the Common European Framework of Reference for Languages (CEFR), a learner needs to acquire lexical and grammatical tools specific to the target language (L2). Yet there is little empirical evidence on language-specific features that mark the development from one level to another. This study aims to determine which linguistic features distinguish A2–C1-level written use of Estonian as L2 and how, i.e., which levels differ significantly and what is the direction of change.

Keywords