Комплексные исследования детства (Apr 2023)
Идентификация авторства на основе векторизации лирики А. А. Ахматовой и М. И. Цветаевой психофизиологическими методами
Abstract
В целенаправленных диалоговых системах для более точного ответа, адресованного конкретному пользователю и учитывающего его особенности, может использоваться определитель авторства. В данной статье рассматривается возможность разграничения произведений двух авторов по результатам векторизации их текстов с помощью методов, которые успешно применяются для анализа в междисциплинарных исследованиях. Например, такой инструмент как 2B-PLS (Two-Block Projection to Latent Structure) продемонстрировал высокую эффективность в анализе результатов междисциплинарных исследований в нейролингвистике, психофизиологии и других областях наук. Для примера была взята лирика А. А. Ахматовой и М. И. Цветаевой, которая в наши дни служит объектом исследований множества ученых. Были выбраны 310 стихотворных текста, из которых 196 стихотворений относятся к творчеству А. А. Ахматовой, а 114 — М. И. Цветаевой. Анализируемые стихотворения датируются между 1907 и 1941 гг. в связи с датами жизни М. И. Цветаевой. Параметрами для анализа послужили результаты векторизации текстов: доли глаголов в тексте, имен собственных, имен прилагательных, наречий, уникальных слов в тексте, знаков препинания, служебных частей речи и знаменательных частей речи, средняя длина строк, количество строк, разнообразие знаков препинания. 2B-PLS анализ на основе указанных параметров показал однозначное разделение произведений двух поэтесс. Полученные результаты сопоставлены с исследованиями аспектов творчества А. А. Ахматовой и М. И. Цветаевой. Для лирики А. А. Ахматовой (по сравнению с лирикой М. И. Цветаевой) характерно более частое использование глаголов, прилагательных, наречий, служебных частей речи, знаменательных частей речи, а также больше строк и больше разнообразия знаков препинаний. Для лирики М. И. Цветаевой (по сравнению с лирикой А. А. Ахматовой) характерны более длинные строки и более разнообразный словарь, а также более частое использование знаков препинаний, имен существительных и собственных. Полученные результаты соотносятся с теоретическими исследованиями.
Keywords