Acta Baltico-Slavica (Dec 2024)
Dwa północnokresowizmy substratowe: ‘cybaty’ i ‘kaliwo’ w zasobach systemu Odkrywka (badania z wykorzystaniem modelu językowego GPT-4)
Abstract
Autorzy przeprowadzili badanie 2 północnokresowizmów substratowych: cybaty i kaliwo, penetrując gigantyczne zbiory zdigitalizowane systemu Odkrywka w przedziale czasowym 1500–1939 i używając eksperymentalnie sztucznej inteligencji do odsiania zbędnych wskazań. Udowodnili, że zastosowanie SI umożliwia błyskawiczne wykrycie zadanych znaczeń, co stanowi przełom w odnajdywaniu w zasobach elektronicznych kalk semantycznych, częstych w polszczyźnie kresowej. Autorzy wyekscerpowali 43 wystąpienia przymiotnika cybaty i 86 wystąpień rzeczownika kaliwo, czyli kilkakrotnie więcej niż inni badacze. Odkryli także liczne przykłady sprzed 1939 roku, których dotąd brakowało. Użycie systemu Odkrywka pozwoliło podać precyzyjne lokalizacje źródeł poświadczeń, ustalić daty pierwszych wystąpień badanych leksemów w każdym ze znaczeń, wykryć kilka niepoświadczonych wcześniej znaczeń, a także umożliwiło pełniejszy ogląd zasięgów terytorialnych jednostek i stwierdzenie niemal zerowej obecności badanych wyrazów w zbiorach powojennych, po odłączeniu kresów północno wschodnich od Polski. Analiza pozyskanych przykładów pozwala podać w wątpliwość hipotezy o litewskiej genezie jednostek cybaty i kaliwo.
Keywords