Сучасний стан наукових досліджень та технологій в промисловості (Dec 2023)

Бінарна класифікація на основі поєднання теорії приблизних множин і дерев рішень

  • Dmytro Chernyshov,
  • Dmytro Sytnikov

Journal volume & issue
no. 4 (26)

Abstract

Read online

Предмет дослідження – підвищення точності та ефективності алгоритмів класифікації на основі дерев рішень за допомогою інтеграції принципів теорії приблизних множин (Rough Set), математичного підходу до апроксимації множин. Мета дослідження – розроблення гібридної моделі, яка об’єднує теорію приблизних множин з алгоритмами дерев рішень, тим самим вирішуючи вроджені обмеження цих алгоритмів у роботі з невизначеністю в даних. Ця інтеграція має суттєво покращити точність та ефективність бінарної класифікації на основі дерев рішень, роблячи їх більш стійкими до різних вхідних даних. Завдання статті передбачають глибоке вивчення можливих синергій між теорією приблизних множин та алгоритмами дерев рішень. З цією метою комплексно досліджено інтеграцію теорії приблизних множин у межах алгоритмів дерев рішень. Це потребує розроблення моделі, що використовує принципи та алгебраїчні інструменти теорії приблизних множин для більш ефективного відбору ознак у системах, основаних на деревах рішень. Модель застосовує теорію приблизних множин для ефективної роботи з невизначеністю та вагомістю, що дає змогу удосконалювати та розширювати процеси відбору ознак у системах дерев рішень. Проведено серію експериментів на різних наборах даних для демонстрації ефективності та практичності цього підходу. Ці набори даних обрані для подання спектра складностей та невизначеностей із забезпеченням ретельного оцінювання можливостей моделі. Методологія використовує передові алгебраїчні інструменти теорії приблизних множин, зокрема формулювання алгебраїчних виразів та розроблення нових правил і технік, для спрощення та підвищення точності процесів класифікації даних за допомогою систем дерев рішень. Знахідки дослідження є важливими, оскільки свідчать про те, що інтеграція теорії приблизних множин у алгоритми дерев рішень може забезпечити більш точні та ефективні результати класифікації. Така гібридна модель демонструє значні переваги в роботі з інформацією із вбудованою невизначеністю, що є загальним викликом у багатьох додаткових сценаріях. Ефективність інтегрованого підходу продемонстровано його успішним застосуванням у сферах кредитного скорингу та кібербезпеки, що вказує на його потенціал як універсального інструмента в галузі видобутку даних і машинного навчання. Висновки. З’ясовано, що інтеграція теорії приблизних множин може привести до більш точних та ефективних результатів класифікації. Покращуючи можливість дерев рішень, необхідно зважати на невизначеність і неточність інформації. Дослідження відкриває нові перспективи для надійного й ґрунтовного аналізу та інтерпретації даних у різних галузях – від охорони здоров’я до сфери фінансів тощо. Інтеграція теорії приблизних множин і дерев рішень є важливим кроком у розвитку більш удосконалених, ефективних і точних інструментів класифікації в епоху великих обсягів інформації.

Keywords