Сучасний стан наукових досліджень та технологій в промисловості (Apr 2023)

ІМПЛЕМЕНТАЦІЯ ІНТЕЛЕКТУАЛЬНОЇ СИСТЕМИ АНАЛІЗУ ТОНАЛЬНОСТІ ТА КЛАСТЕРИЗАЦІЇ ПУБЛІКАЦІЙ У СОЦІАЛЬНІЙ МЕРЕЖІ TWITTER

  • Тарас Батюк ,
  • Дмитро Досин

Journal volume & issue
no. 1 (23)

Abstract

Read online

Завдяки інтенсивному розвитку соціальних мереж постійно зростає популярність обміну короткими текстовими повідомленнями, тональність яких може бути чутливим індикатором суспільних настроїв і важливих соціальних явищ, цікавих для соціологів, політиків, економістів і фахівців інших галузей. У зв’язку з цим завдання автоматизації опрацювання таких природномовних повідомлень має вагомий науковий і практичний інтерес. Об’єктом дослідження є тональність користувацьких публікацій у соціальній мережі Twitter. Завдяки широкій популярності цієї соціальної мережі та великій кількості повідомлень, лаконічних за своєю сутністю, можна зручно визначати настрій користувацьких публікацій та об’єднувати їх у кластери відповідно до заданих параметрів інтелектуальної системи. Предметом дослідження є методи й алгоритми аналізу тональності великих масивів повідомлень, що містять необхідні ключові слова та стосуються конкретної теми, визначення факторів та розподілів тональності повідомлень, з огляду на вхідний масив даних системи, поділ повідомлень на основні групи та надання оцінок у визначених межах кожній групі, поділ на кластери відповідно до отриманої точки пошуку та відображення отриманих результатів у потрібному форматі. Мета роботи – реалізація інтелектуальної системи аналізу тональності та кластеризації публікацій на основі рекурентної нейронної мережі довгої короткочасної пам’яті (LSTM) та алгоритму кластеризації k-means. У статті передбачається вирішити такі основні завдання: проаналізувати найбільш уживані та найновіші алгоритми, методи, підходи та засоби імплементації завдань аналізу тональності й кластеризації публікацій у соціальних мережах; розробити концептуальну структуру інтелектуальної системи аналізу тональності й кластеризації публікацій; сформувати функціональні завдання до ключових модулів створюваної інтелектуальної системи аналізу тональності й кластеризації публікацій у соціальній мережі Twitter; реалізувати інтелектуальну систему аналізу тональності й кластеризації публікацій на основі рекурентної нейронної мережі та алгоритму кластеризації k-means і експериментально її перевірити. У роботі застосовано методи: рекурентна нейронна мережа довгої короткочасної пам’яті; алгоритм кластеризації k-means. Здобуто такі результати: проаналізовано, спроєктовано й побудовано загальну структуру інтелектуальної системи аналізу тональності й кластеризації публікацій. Основним завданням створення системи насамперед було покращення рекурентної нейронної мережі довгої короткочасної пам’яті, що, завдяки вдосконаленому алгоритму, суттєво полегшує опрацювання повідомлення обробниками природної мови відповідно до текстових даних певного розміру. Також одночасно використано особливий алгоритм кластеризації, а саме k-means, завдяки чому вдалося змінити загальний підхід до кластеризації та створення фінальних кластерів, відповідно до здобутих результатів роботи рекурентної нейронної мережі. Висновки: унаслідок застосування комбінації LSTM нейронної мережі та алгоритму кластеризації k-means вдалося прискорити процес аналізу тональності й кластеризації публікацій у соціальній мережі Twitter на 10...15% порівняно з аналогічними згортковими нейронними мережами та ієрархічною кластеризацією.

Keywords