Jurnal ELTIKOM: Jurnal Teknik Elektro, Teknologi Informasi dan Komputer (Dec 2018)

Analisis Klasterisasi Malware: Evaluasi Data Training Dalam Proses Klasifikasi Malware

  • Denar Regata Akbi,
  • Arini R Rosyadi

DOI
https://doi.org/10.31961/eltikom.v2i2.88
Journal volume & issue
Vol. 2, no. 2
pp. 58 – 66

Abstract

Read online

Data latih merupakan salah satu bagian penting pada proses klasifikasi. Terutama jika data tersebut digunakan untuk membuat sistem pendeteksi malware. Penelitian ini melakukan perbandingan data latih yang dihasilkan dari dua penelitian yang telah dilakukan sebelumnya, data yang digunakan pada kedua penelitian tersebut merupakan data malware android berdasarkan frekuensi system call sejumlah 600 data. Penelitian pertama melakukan klasifikasi dan menghasilkan 4 jenis malware, sedangkan penelitian kedua melakukan klastering dan menghasilkan 8 klaster. Dari kedua penelitian tersebut, peneliti melakukan evaluasi data latih dari masing - masing penelitian untuk mendapatkan hasil data latih yang lebih akurat, dengan menggunakan data uji sejumlah 50, peneliti melakukan evaluasi dan uji coba dengan menggunakan algoritme kNN. Hasil yang didapatkan, penggunaan data latih berdasarkan hasil klastering pada proses klasifikasi lebih direkomendasikan, hasil Error Prediction penelitian pertama: 0,995 sedangkan pada penelitian kedua: 0,998. Hasil Recall dan akurasi menggunakan metode cross validation, penelitian pertama, Recall: 0,665 akurasi: 0,66, penelitian kedua, Recall: 0,893 akurasi: 0,89, sedangkan Hasil Recall dan akurasi menggunakan metode precentage split, penelitian pertama, Recall: 0,657 akurasi: 0,65, penelitian kedua, Recall: 0,798 akurasi: 0,79. Berdasarkan hasil pengujian, proses klastering yang menggunakan data frekuensi system call malware menghasilkan data latih yang lebih akurat dibandingkan dengan data latih yang dihasilkan dengan menggunakan suatu situs penamaan malware.

Keywords