Вісник Київського національного лінгвістичного університету. Серія: Філологія (Jun 2023)

Мультилінгвальний корпус і його програмне забезпечення для дослідження європеїстики

  • Алла Корольова

DOI
https://doi.org/10.32589/2311-0821.1.2023.286184
Journal volume & issue
Vol. 160, no. Том 26 №1
pp. 49 – 62

Abstract

Read online

У статті запропонована методика роботи із функціоналом комп’ютерних програм AntConc, WordSmith, WordList, MonoConc Pro, CATMA й KORP, які можна використовувати для дослідження текстів мультилінгвального корпусу за тематикою Європеїстики. Розглянуто різні дискусійні погляди зарубіжних учених – представників корпусної лінгвістики – щодо змісту поняття мультилінгвальний корпус. Сформульовано робоче визначення мультилінгвального зіставного корпусу, який належить до комбінованого типу тематично орієнтованих різномовних корпусів текстів, об’єднаних у підкорпуси, з їхнім перекладом іншими мовами (або з можливістю застосування комп’ютерних програм для виконання перекладу текстів). Визначено роль корпусної лінгвостатистики, якою оснащені проаналізовані комп’ютерні програми і яка дозволяє здійснювати обчислення частоти вживання слів чи колокацій, будувати діаграми частоти вживання слова / колокації в підкорпусах текстів тощо. Зроблено попередній висновок про те, що комп’ютерний інструментарій корпус-менеджерів AntConc, WordSmith, WordList, MonoConc Pro, CATMA й KORP надає змогу конструювати як окремі Key Word in Context (KWIC), так і конкордансні списки пошукових елементів за тематикою Європеїстики; розмежовувати відтінки того чи іншого контекстуального значення пошукових одиниць в їхній найбільш імовірній лівобічній та правобічній валентності в різних мовах; побачити результати статистичної обробки інформації з корпусних тегів; зберігати та роздруковувати результати; підтримувати різні формати текстових даних (txt, doc, rtf, html й ін.).

Keywords