Юрислингвистика (Apr 2023)

Способы автоматизации сравнительного анализа текстов при выявлении признаков плагиата в экспертизах по делам о нарушении авторских и смежных прав

  • Полина Белова

DOI
https://doi.org/10.14258/leglin(2023)2717
Journal volume & issue
no. 27(38)
pp. 94 – 98

Abstract

Read online

В рамках лингвистической экспертизы по делам о нарушении авторских и смежных прав в отношении речевых произведений перед экспертами все чаще ставится вопрос о сравнении нескольких текстов и поиске в них полнотекстовых, частичных и иных (лексических, грамматических, семантических и пр.) совпадений, а также об определении величины данных совпадений. Сравнение документов вручную, как правило, занимает много времени, особенно если материалами исследования выступают многостраничные тексты. В данной статье предложены возможные пути автоматизации и усовершенствования этой работы путем использования специальных онлайн-сервисов сравнения документов: Copyscape, Embedika Compare, Draftable Online, «Сравнить тексты», Copyleaks Text Compare Tool. Приведенный перечень инструментов для сравнения текстов составлен автором статьи исходя из опыта их использования в экспертной практике. Для каждого из сервисов в статье указаны его достоинства и недостатки, а также описаны алгоритм работы и особенности представления результатов сравнения. Одни инструменты обладают простым функционалом и отображают, сколько слов совпало, показывают процент уникальности сравниваемых текстов, другие имеют более продвинутую аналитику сравнения и помимо процента совпадений и количества одинаковых слов определяют типы сходств фрагментов текста, выделяя среди них идентичные (полнотекстовые), похожие (с минимальными изменениями) и перефразированные. Тем не менее, полученные результаты сравнения текстовых файлов все равно требуют от эксперта их проверки и проведения дальнейшего лингвистического исследования с интерпретацией установленных совпадений и определением их типа, особенно это касается лексических, грамматических, семантических, синтаксических совпадений.

Keywords