Rasprave Instituta za Hrvatski Jezik i Jezikoslovlje (Jan 2016)

Das Regensburger diachrone Korpus der kroatischen Sprache – CroDi

  • Björn Hansen,
  • Sanja Perić Gavrančić,
  • Marijana Horvat,
  • Ernst Hansack,
  • Veronika Wald

Journal volume & issue
Vol. 42, no. 1
pp. 1 – 19

Abstract

Read online

In dem Artikel wird das Projekt zum Aufbau eines diachronen Korpus der kroatischen Sprache CroDi am Institut für Slavistik der Universität Regensburg in Zusammenarbeit mit dem Institut für die kroatische Sprache und Linguistik in Zagreb vorgestellt. Beschrieben werden die Zielsetzung und die Prinzipien für die Erstellung des Korpus, das methodische Vorgehen bei der Ausarbeitung der Einträge und die bisherigen Resultate. Die Idee zur Erstellung eines diachronen Korpus der kroatischen Sprache entstand im Rahmen von zwei DFG-Projekten (2008-2016) zum Thema „Korpuslinguistik und diachrone Syntax“. In Regensburg existieren bereits ein „Russisches diachrones Korpus“ (RRudi) und ein „Polnisches diachrones Korpus“ (PolDi), weitere Korpora sind im Aufbau. Die mit diesen Korpora gewonnenen Erfahrungen sind in das „Diachrone Korpus der kroatischen Sprache“ eingeflossen. Die Prinzipien für die Erstellung und Bearbeitung der Korpora hat im wesentlichen Roland Meyer in seinem Artikel „The construction and application of diachronic Slavonic corpora in linguistic research“ (2012) festgelegt. Modell und Vorbild war dabei vor allem das „Helsinki Corpus of English Texts“. Das kroatische Korpus enthält bisher Texte des 16.-19.Jh. in allen Ausprägungen des Kroatischen (Štokavisch, Čakavisch und Kajkavisch). Neben den bedeutenden Vertretern der kroatischen Literatur dieser Zeit sind auch weniger bekannte Autoren und anonyme Texte vertreten. Die Texte sind zum Teil von Hand annotiert. Die Prinzipien dazu wurden von Roland Meyer, Björn Hansen und Veronika Wald festgelegt und werden ausführlich dargestellt. Durch die Aufnahme in das Korpus werden die enthaltenen Texte international zugänglich, was weitere komparatistische Untersuchungen ermöglicht.

Keywords