Nenavaden par: pogostost besede v korpusu in pri uporabniških poizvedbah

Lars Trap-Jensen; Henrik Lorentzen; Nicolai H. Sørensen

doi:10.4312/slo2.0.2014.2.94-113

Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave (Dec 2014)

Nenavaden par: pogostost besede v korpusu in pri uporabniških poizvedbah

Lars Trap-Jensen,
Henrik Lorentzen,
Nicolai H. Sørensen

Affiliations

Lars Trap-Jensen: Society for Danish Language and Literature
Henrik Lorentzen: Society for Danish Language and Literature
Nicolai H. Sørensen: Society for Danish Language and Literature

DOI: https://doi.org/10.4312/slo2.0.2014.2.94-113
Journal volume & issue: Vol. 2, no. 2

Abstract

Read online

rispevek se osredotoča na preučitev razmerja med dnevniki iskanj uporabnikov po spletnem slovarju in korpusno pogostostjo besed. Študijo so spodbudila razmišljanja, ki so se porajala pri rednem slovarskem delu in jih lahko strnemo v vprašanje: kako ohranjati na korpusu temelječ slovar aktualen? Bi morala biti naslednja beseda, ki jo uvrstimo v slovar, tista, ki sledi zadnji uslovarjeni besedi na frekvenčnem seznamu besed iz korpusa? Ali bi morala biti to beseda, ki jo uporabniki najpogosteje neuspešno iščejo v slovarju? Da bi prišli do ustreznih kriterijev, so avtorji analizirali dnevnike iskanj uporabnikov danskega slovarja v obdobju od 2009 do 2012 in seznam najpogosteje iskanih besed primerjali z njihovo pogostostjo v korpusu. S proučitvijo iskalnih navad uporabnikov so avtorji želeli priti do odgovorov na sledeča vprašanja: Ali so v slovarju besede, ki jih uporabniki nikoli ne iščejo? Če je odgovor da, ali lahko na podlagi njihove pogostosti v korpusu opazimo kakšne smiselne vzorce – gre za besede iste besedne vrste, so besede zelo pogoste ali zelo redke, se pojavljajo v določenem frekvenčnem območju? Ugotovitev prispevka je, da je pogostost v korpusu dober kriterij za 20.000 najpogostejših iztočnic, medtem ko je treba pri manj pogostih besedah dodati še druge metode, med katerimi je tudi pregled iskanj uporabnikov, nadvse pomembna pa je tudi presoja leksikografov.

Published in Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave

ISSN: 2335-2736 (Online)
Publisher: University of Ljubljana Press (Založba Univerze v Ljubljani)
Country of publisher: Slovenia
LCC subjects: Language and Literature: Philology. Linguistics
Website: https://journals.uni-lj.si/slovenscina2

About the journal

Abstract

Keywords