Linguistica (Dec 2013)

Na sledi anonimnemu avtorju: afera volilcev v trenirkah

  • Ana Zwitter Vitez

DOI
https://doi.org/10.4312/linguistica.53.1.91-101
Journal volume & issue
Vol. 53, no. 1

Abstract

Read online

V zadnjih desetletjih je ugotavljanje avtorstva besedil doživelo velik razmah, saj prinaša izrazito aplikativne rezultate na področju prava (plagiatorstvo), kriminologije (grozilna pisma), literarnih študij (psevdonimi) in tržnih analiz (strategije oglaševanja). V prispevku analiziramo besedilo, imenovano "Volivci v trenirkah", in ga primerjamo s 75 besedili 21 znanih avtorjev. Analiza temelji na metodi podpornih vektorjev (SVM), ki omogočajo določanje razlik in podobnosti med primerjanimi besedili na podlagi značilk besedišča in berljivosti. Rezultati kažejo, da so specifike enega izmed opazovanih avtorjev precej podobne besedilu neznanega izvora glede na raznolikost besedišča, Brunetovo formulo in relativno frekvenco hapaksov v besedilu. V sklepu poudarimo pomembnost povezovanja korpusnega jezikoslovja in strojnega učenja, s katerim lahko obe področji doživita nov razmah in izkoristita izjemno moč tega interdisciplinarnega pristopa.