Jezikoslovni zapiski (Sep 2022)

Korpus šolskih besedil slovenskega jezika: zasnova in gradnja

  • Nina Ledinek,
  • Mateja Jemec Tomazin,
  • Mitja Trojar,
  • Andrej Perdih,
  • Janoš Ježovnik,
  • Miro Romih,
  • Tomaž Erjavec

DOI
https://doi.org/10.3986/JZ.28.1.07
Journal volume & issue
Vol. 28, no. 1
pp. 123 – 137

Abstract

Read online

V prispevku je predstavljen Korpus šolskih besedil slovenskega jezika, specializirani pisni korpus slovenščine v obsegu približno 1,8 milijona pojavnic. Korpus je bil zasnovan v okviru projekta Franček, Jezikovna svetovalnica za učitelje slovenščine in Šolski slovar slovenskega jezika, in sicer kot gradivska osnova za oblikovanje Šolskega slovarja slovenskega jezika, prvega znanstveno utemeljenega pedagoškega slovarja za slovenski jezik. Prispevek obravnava besedilnotipsko sestavo in obseg korpusa, osvetljuje tehnične postopke predpriprave besedil in njihovega jezikoslovnega označevanja ter predstavlja nabor korpusnih metapodatkov, hkrati pa pojasnjuje, v katerih formatih in pod katerimi licencami je Korpus šolskih besedil slovenskega jezika na voljo. Članek opozarja tudi na pravne vidike pridobivanja besedil.

Keywords