Knygotyra (Dec 2023)

Skaitmeninių metodų taikymas praeities kelionių tyrimuose

  • Rimvydas Laužikas

DOI
https://doi.org/10.15388/Knygotyra.2023.81.6
Journal volume & issue
Vol. 81

Abstract

Read online

Pastaraisiais dešimtmečiais vykstantis masyvus rašytinių istorijos šaltinių skaitmeninimas, jų tekstų optinis atpažinimas (OCR) bei pateikimas internete sukuria naujas istorinio tyrimo galimybes ir iššūkius. Šiame straipsnyje pristatomas skaitmeninės humanitarikos tyrimo modelis yra grindžiamas informacijos organizavimo paradigmos ir skaitmeninėmis technologijomis grįstų metodų taikymu praeities kelionių tyrimuose. Tyrimo modelis buvo sukurtas ir testuotas naudojant projekto „Homo viator: kelionių erdvė ir keliautojų potyriai ankstyvosios modernybės Lietuvoje“ medžiagą. Pagrindinė tyrimo problema yra susijusi su tuo, kad vienas svarbių praeities kelionių pažinimo šaltinių yra egodokumentai (laiškai, dienoraščiai, atsiminimai ir kt.), kuriuose greta kitų konkretaus asmens gyvenime svarbių įvykių aprašomos ir kelionės. Tačiau kelionių aprašymai sudaro tik nedidelę konkretaus egodokumento teksto dalį ir yra netolygiai pasiskirstę skirtinguose egodokumentuose. Todėl, atsižvelgiant į egodokumentų ir jų rinkinių teksto apimtis bei įvairiomis kalbomis publikuotų egodokumentų skaičių, jų – kaip šaltinių – tyrimai tik vienu (kelionių) aspektu reikalauja didelių žmogiškųjų ir laiko resursų. Panašią probleminę situaciją turime ir su kitais senųjų kelionių pažinimo šaltiniais: skaitmeniniu pavidalu (įskaitant OCR) publikuotų dokumentų yra daug, jų tekstai didelės apimties, o teksto fragmentai, susiję su kelionėmis, šalių aprašymais, senųjų kelionių maršrutais, kelionių ir mobilumo infrastruktūra, keliautojų potyriais, yra santykinai nedideli ir išsibarstę visame šaltinio tekste. Straipsnyje aprašomą tyrimo modelį sudaro du žingsniai: (i) šaltinių tekstyno su optiškai atpažintu turiniu (OCR) surinkimas; (ii) empirinių duomenų rinkimas taikant žodynu grįstos kompiuterizuotos kokybinės teksto analizės metodą, realizuojant jį su MaxQDA programa. Tekstyno surinkimas yra atliekamas taikant bendruosius mokslinių publikacijų paieškos internete principus bei metodus. Į tekstyną atrenkami autentiški, publikuoti, tyrimui reikalingi šaltiniai (laiškai, dienoraščiai, atsiminimai ir kt.) bei mokslinės publikacijos apie juos, tokiu būdu suformuojant du tekstyno – šaltinių ir literatūros – blokus. Literatūros (mokslinių publikacijų apie šaltinius) blokas naudojamas kaip papildoma medžiaga tikslesnei šaltinių tekstyno atrankai ir interpretavimui. Norint taikyti žodynu grįstos kompiuterizuotos kokybinės teksto analizės metodą svarbiausias elementas yra kokybiškas žodynas, tiksliai apibūdinantis tyrimui aktualius konceptus (kategorijas). Atsižvelgiant į šaltinių specifiką (šaltiniuose ir jų vertimuose vartojamas kalbas) buvo sukurtas daugiakalbis lietuvių–lenkų–anglų–rusų–vokiečių kalbų žodynas. Žodyno struktūrą sudaro šeši su praeities kelionėmis susiję konceptai (kategorijos): (i) kelionė (bendras apibūdinimas), (ii) kelias ir jo infrastruktūra (tiltai, brastos ir kt.), (iii) transporto priemonės, (iv) sustojimo ir nakvynės vietos (miesteliai, kaimai, karčemos, pašto stotys ir kt.), (v) kelyje sutikti žmonės (smuklininkai, plėšikai, vedliai ir kt.), (vi) kelionių maistas. Kiekvienas konceptas yra apibūdinamas reikšminių žodžių ir frazių rinkiniu. Paskutiniame tyrimo etape buvo atliktas tyrimo modelio testavimas. Testavimo metu nustatyta, kad modelis leidžia spręsti paminėtas, projekto įgyvendinimo metu atsiradusias, problemas.

Keywords