Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave (Dec 2014)

Nenavaden par: pogostost besede v korpusu in pri uporabniških poizvedbah

  • Lars Trap-Jensen,
  • Henrik Lorentzen,
  • Nicolai H. Sørensen

DOI
https://doi.org/10.4312/slo2.0.2014.2.94-113
Journal volume & issue
Vol. 2, no. 2

Abstract

Read online

rispevek se osredotoča na preučitev razmerja med dnevniki iskanj uporabnikov po spletnem slovarju in korpusno pogostostjo besed. Študijo so spodbudila razmišljanja, ki so se porajala pri rednem slovarskem delu in jih lahko strnemo v vprašanje: kako ohranjati na korpusu temelječ slovar aktualen? Bi morala biti naslednja beseda, ki jo uvrstimo v slovar, tista, ki sledi zadnji uslovarjeni besedi na frekvenčnem seznamu besed iz korpusa? Ali bi morala biti to beseda, ki jo uporabniki najpogosteje neuspešno iščejo v slovarju? Da bi prišli do ustreznih kriterijev, so avtorji analizirali dnevnike iskanj uporabnikov danskega slovarja v obdobju od 2009 do 2012 in seznam najpogosteje iskanih besed primerjali z njihovo pogostostjo v korpusu. S proučitvijo iskalnih navad uporabnikov so avtorji želeli priti do odgovorov na sledeča vprašanja: Ali so v slovarju besede, ki jih uporabniki nikoli ne iščejo? Če je odgovor da, ali lahko na podlagi njihove pogostosti v korpusu opazimo kakšne smiselne vzorce – gre za besede iste besedne vrste, so besede zelo pogoste ali zelo redke, se pojavljajo v določenem frekvenčnem območju? Ugotovitev prispevka je, da je pogostost v korpusu dober kriterij za 20.000 najpogostejših iztočnic, medtem ko je treba pri manj pogostih besedah dodati še druge metode, med katerimi je tudi pregled iskanj uporabnikov, nadvse pomembna pa je tudi presoja leksikografov.

Keywords