Науковий вісник Ужгородського університету. Серія: Математика і інформатика (May 2021)
Використання мiр подiбностi в методах класифiкацiї
Abstract
Дане дослідження є розвитком напрямку застосування різних видів мір подібності в задачах інтелектуального аналізу даних. Майнінг даних - це процес видобутку неявної інформації з бази даних, якa характеризує приховані зв’язки та структури. Прогнозується, що цей вид аналізу стане надзвичайно затребуваним протягом наступного десятиліття. В роботі наведено огляд сучасних напрямків контрольованої класифікації. Найпопулярнішим прийомом класифікації об’єктів із числовими атрибутами вважається метод K-найближчих сусідів (KNN). Встановлено, що прогнозне значення мітки класу можна покращити, якщо використовувати зважений вплив кожного сусіда на результат. Таким чином, доцільно модифікувати метод KNN. При цьому, запропоновано ввести функцію, що характеризує схожість неміченого об’єкта із його найближчими сусідами у вигляді міри подібності. На її основі введено індикатори зваженого підрахунку голосів «сусідів» за певну мітку класу. Розроблено програмне забезпечення, що реалізує описаний підхід. Проведення практичних експериментів показало його ефективність при розв’язанні певних класів прикладних задач.
Keywords