Науковий вісник НЛТУ України (Nov 2022)

Метод виявлення фіктивних підприємств на підставі Гаусового наївного класифікатора Байєса

  • Х. В. Ліп'яніна-Гончаренко,
  • М. П. Комар,
  • А. О. Саченко,
  • Т. В. Лендюк

DOI
https://doi.org/10.36930/40320513
Journal volume & issue
Vol. 32, no. 5

Abstract

Read online

Розроблено метод виявлення фіктивних підприємств на підставі машинного навчання за допомогою Гаусового наївного класифікатора Байєса, що є корисним для працівників державного сектору із запобігання економічним злочинам. Встановлено, що фіктивне підприємництво, як самостійний злочин, одночасно є своєрідним засобом вчинення цілої низки інших кримінальних правопорушень у сфері економіки. Це можуть бути суб'єкти господарювання, які мають ознаки фіктивності, а саме використання неправдивої інформації щодо засновників, адміністрації, місцезнаходження. Тому виявлення таких підприємств є актуальним питанням для будь-якої держави. Розслідування економічного злочину потребує багато часу для працівників правоохоронних органів і додаткових коштів. З огляду на це, розроблення інструменту розпізнавання фіктивного підприємства на підставі класичного методу машинного навчання є одним із перспективних напрямів зі швидкого виявлення економічних злочинів. Під час дослідження робіт у сфері діяльності фіктивних підприємств виявлено, що вони не описують саме виявлення фіктивних підприємств за допомогою інформаційних технологій. Тому потрібно розробити метод виявлення фіктивного підприємства на підставі машинного навчання за допомогою Гаусового наївного класифікатора Байєса, що надалі дасть змогу розробити програмне середовище для працівників державного сектору із запобігання економічних злочинів. У роботі визначено основні типи фіктивних підприємств, зокрема за призначенням та способом створення. На підставі цього запропоновано алгоритм виявлення фіктивного підприємства на підставі класичного методу машинного навчання, такого як Гаусовий наївний класифікатор Байєса, що уможливлює відстежування фіктивного підприємства. Для побудови методу використано дані 1100 компаній, що здійснювали економічну діяльність в Україні. Виконано розподіл ймовірності, за допомогою оцінки щільності ядра KDE (англ. Kernel Density Estimation). Побудовано діаграму кореляційної матриці, встановлено дуже малі коефіцієнти кореляції між більшістю ознак. Виведено гістограми відмінностей середніх значень і дисперсії вибірки для двох класів. Для машинного навчання моделі поєднано квантильний перетворювач і Гаусовий наївний класифікатор Байєса.

Keywords