Науковий вісник НЛТУ України (Nov 2024)

Використання алгоритмів машинного навчання для автоматизації процесу модерації контенту в групових чатах месенджерів

  • О. В. Мокрицька,
  • Ю. М. Мочернюк

DOI
https://doi.org/10.36930/40340707
Journal volume & issue
Vol. 34, no. 7

Abstract

Read online

Проаналізовано особливості інтеграції методів машинного навчання ML (англ. Machine Learning) в автоматизовану систему модерації групових чатів Telegram для вдосконалення процесу управління широкомасштабними комунікаціями. З'ясовано, що проблема модерації великих групових чатів стає особливо нагальною через збільшення обсягу повідомлень і розмаїття контенту, що потребує ефективної системи їх фільтрації для забезпечення безпеки комунікаційного середовища. Застосовано розширені алгоритми вибору функцій класифікації, такі як оптимізація рою частинок PSO (англ. Particle Swarm Optimization), алгоритм рою салпів SSA (англ. Salp Swarm Algorithm) і оптимізація Сірого вовка GWO (англ. Gray Wolf Optimization), для автоматизації процесу виявлення найбільш релевантних характеристик повідомлень, що значно покращує процес модерації групових чатів. Досліджено особливості застосування методів класифікації, зокрема машин підтримки векторів SVM (англ. Support Vector Machines) та алгоритму найближчих сусідів kNN (англ. k-Nearest Neighbors), для ідентифікації неприйнятного або шкідливого контенту. Встановлено, що вибір класифікаційних функцій є критичним для зменшення розмірності даних і підвищення точності класифікації. Проведено порівняльний аналіз ефективності алгоритмів PSO, SSA і GWO в контексті модерації чатів. Показано, що алгоритм PSO демонструє високу ефективність завдяки швидкій адаптації до мінливого комунікаційного середовища, тоді як алгоритми SSA і GWO демонструють варіації у підходах до глобальної оптимізації вибору функцій класифікації. Розроблено систему класифікації, в якій комбінація алгоритмів PSO+SVM досягає найвищої точності, перевершуючи інші алгоритми за збалансованістю швидкості та точності класифікації. Наведено також результати для комбінацій алгоритмів SSA+kNN і алгоритмів GWO+kNN, які, хоча і показують високу ефективність, мають менш стабільні результати в різних умовах. Проведено оцінювання продуктивності зазначених алгоритмів за такими показниками, як точність, чутливість, специфічність, вивіреність і оцінка F1. Комплексний аналіз цих алгоритмів підтвердив, що впровадження вдосконалених алгоритмів вибору функцій класифікації значно покращує точність виявлення шкідливого контенту, зменшуючи кількість помилкових спрацьовувань і підвищуючи загальну ефективність процесу модерації. Дослідження відповідних алгоритмів щодо модерації вмісту також встановило потенційне застосування розробленої системи на інших платформах та у нових доменах для забезпечення масштабованого й адаптованого рішення та підтримки безпеки в онлайн-комунікаціях.

Keywords