Mokslas: Lietuvos Ateitis (Sep 2023)

Network intrusion detection using hybrid machine learning methods

  • Karina Čiurlienė,
  • Denisas Stankevičius

DOI
https://doi.org/10.3846/mla.2023.19385
Journal volume & issue
Vol. 15

Abstract

Read online

Network intrusion detection is a relevant cybersecurity research field. The growing number of intrusions requires more sophisticated methods to protect computer networks. Various machine learning algorithms are used to detect network intrusions and anomalies, but their accuracy is limited. In this research, we address the problem of improving network-level intrusion detection by applying hybrid machine-learning algorithms. The paper proposes three new hybrid machine learning methods and investigates their accuracy using two publicly available datasets CSE-CIC-IDS2018 and NSW-NB-15. In order to increase the accuracy of the classification models, hyperparameter optimization was performed. The iteration method and the Chi-square χ2 test were used to identify significant features of the data set. Analyzing the research results, it was found that the highest network anomaly recognition accuracy of 99.34% was achieved by applying a hybrid algorithm consisting of a decision tree, naive Bayesian, and multilayer perceptron algorithms. Achieved result is 3.13% higher than the best accuracy achieved by individual machine learning algorithms. In order to comprehensively evaluate the studied machine learning algorithms and their suitability for detecting intrusions in a computer network, the algorithms were ranked using the SCR, DR, FR ranking methods. Article in Lithuanian. Įsilaužimų aptikimas kompiuterių tinkluose taikant hibridinius mašininio mokymosi metodus Santrauka Viena iš aktualių kibernetinės saugos tyrimų krypčių – tai įsilaužimų arba anomalijų aptikimas kompiuterių tinkle. Įsilaužimų skaičius nuolat didėja, o taikomos įsilaužimo technikos ir metodai sudėtingėja, todėl siekiant apsaugoti kompiuterių tinklą, reikia taikyti vis sudėtingesnius apsaugos metodus. Tinklo įsilaužimams ir anomalijoms nustatyti taikomi įvairūs mašininio mokymosi algoritmai, tačiau jų tikslumas yra ribotas. Siekiama pagerinti tinklo anomalijų aptikimą, taikomi hibridiniai mašininio mokymosi algoritmai. Straipsnyje pasiūlyti trys nauji hibridiniai mašininio mokymosi algoritmai, ištirtas jų tikslumas naudojant du viešai prieinamus duomenų rinkinius, t. y. CSE-CIC-IDS2018 ir NSW-NB-15. Siekiant padidinti klasifikavimo modelių tikslumą, buvo atliktas hiperparametrų optimizavimas. Reikšmingiems duomenų rinkinio požymiams nustatyti taikytas iteracijų metodas ir Chi kvadrato χ2 testas. Analizuojant tyrimo rezultatus, nustatyta, kad aukščiausias tinklo anomalijų atpažinimo tikslumas 99,34 % buvo pasiektas taikant hibridinį algoritmą, sudarytą iš sprendimų medžio, naivaus Bajeso ir daugiasluoksnio perceptrono algoritmų rinkinio. Šis rezultatas yra 3,13 % geresnis, lyginant su geriausiu tikslumu, gautu taikant atskirus mašininio mokymosi algoritmus. Siekiant kompleksiškai įvertinti tirtus mašininio mokymosi algoritmus ir jų tinkamumą įsilaužimams kompiuterių tinkle aptikti, algoritmai buvo sureitinguoti taikant SCR, DR, FR reitingavimo metodus. Reikšminiai žodžiai: tinklo anomalijos, mašininis mokymasis, χ2 Chi kvadratu testas, hiperparametrai, hibridiniai algoritmai.

Keywords