Юрислингвистика (Apr 2023)

Методика определения меры сходства между объектами речеведческих экспертиз

  • Сергей Красса

DOI
https://doi.org/10.14258/leglin(2023)2719
Journal volume & issue
no. 27(38)
pp. 106 – 110

Abstract

Read online

В статье описываются исследовательские процедуры с целью определения меры сходства между объектами речеведческих экспертиз. Предлагаемая методика основывается на сочетании квалитативных и квантитативных методов, а также применении компьютерного инструментария. Основной задачей данного исследования является описание способов получения максимально надежных результатов, которые могут быть проверены другим специалистом. Для проведения исследования выделяются три множества: исходный объект (спорный текст), объект, сопоставляемый с исходным, и объект-конструкт, включающий в себя характеристики, общие для исходного и сопоставляемого множеств. В качестве объектов могут быть протоколы допроса, тексты, проверяемые на наличие плагиата, наименования товарных знаков, газетные публикации, другие речевые продукты. Квалитативные процедуры предполагают выделение характеристик, описывающих объекты, тогда как квантитативные процедуры позволяют проводить нормализацию параметров, выявленных в объектах. Выделение характеристик проводится экспертным путем, с опорой на принятые в лингвистике классификации. Анализ текстов с идентичным содержанием проводится путем выделения тождественных фрагментов и подсчета их объемов. Анализ сходства словесных наименований проводится на базе фонетических, графических, семантических и ассоциативных параметров. Анализ текстов на возможное авторство проводится с помощью лексических, морфологических и синтаксических данных. На основе полученных численных показателей проводится вычисление коэффициентов сходства. Характеристики, которые предполагают ответ «да/нет», маркируются единицей при положительном ответе и нулем при отрицательном. Характеристики, имеющие числовое значение, сопоставляются с использованием коэффициентов корреляции и признаются идентичными при значении 0,7 и выше. Проведение цифровых аналитических процедур по возможности основывается на использовании компьютерных сервисов. Полученные числовые данные представляют собой коэффициенты Жаккара, Серенсена, Кульчинского и Отиаи, среди которых первый всегда ниже трех последующих, демонстрирующих относительную стабильность.

Keywords