Застосування сховищ даних для виявлення плагіату в текстових документах

Д. Галайко; Ю. Олійник

doi:10.20535/1560-8956.45.2024.313093

Adaptivni Sistemi Avtomatičnogo Upravlinnâ (Oct 2024)

Застосування сховищ даних для виявлення плагіату в текстових документах

Д. Галайко,
Ю. Олійник

Affiliations

Д. Галайко: КПІ ім. Ігоря Сікорського
Ю. Олійник: КПІ ім. Ігоря Сікорського

DOI: https://doi.org/10.20535/1560-8956.45.2024.313093
Journal volume & issue: Vol. 2, no. 45

Abstract

Read online

Робота присвячена застосуванню сховищ даних для виявлення плагіату в текстових документах, в результаті якої побудовано масштабовану програмну архітектуру. Підготовлено датасет з бакалаврських і магістерських робіт та виконано його попередню обробку, зокрема очищення, лематизацію, видалення стоп-слів, видалення підміни символів, заміни на синоніми. Створено тестовий набір даних для аналізу продуктивності рішення Проведено дослідження ефективності застосованих сховищ даних, виконано їх порівняльний аналіз та проведено декілька прогонів для уникнення стохастичної помилки. За результатами тестування моделей виокремлено DynamoDB як найефективніше сховище даних для задачі виявлення запозичень. Бібл. 14, іл. 8, табл. 3

Published in Adaptivni Sistemi Avtomatičnogo Upravlinnâ

ISSN: 1560-8956 (Print); 2522-9575 (Online)
Publisher: Igor Sikorsky Kyiv Polytechnic Institute
Country of publisher: Ukraine
LCC subjects: Technology: Technology (General): Industrial engineering. Management engineering: Automation
Website: http://asac.kpi.ua/

About the journal

Abstract

Keywords