Journal of Electrical Engineering and Computer (Oct 2024)

Deteksi Akun Kaggle Bot Menggunakan Linear Regression

  • Sudriyanto Sudriyanto,
  • Muhammad Ali Hafid,
  • Moch. Ade Kurniawan

DOI
https://doi.org/10.33650/jeecom.v6i2.9251
Journal volume & issue
Vol. 6, no. 2
pp. 449 – 459

Abstract

Read online

Penelitian ini mengkaji permasalahan pemalsuan akun pada platform Kaggle dengan fokus pada pengembangan model prediksi menggunakan metode Linear Regression untuk mendeteksi akun bot. Kaggle, sebagai platform terkemuka dalam bidang ilmu data, menghadapi tantangan serius terkait integritas data akibat praktik bot voting yang berdampak pada keaslian kompetisi dan dataset yang diunggah. Studi ini memanfaatkan dataset Kaggle Bot Account yang terdiri dari lebih dari satu juta entri, dengan variabel independen mencakup jumlah pengikut, interaksi dengan konten, dan aktivitas pengguna lainnya. Metode Linear Regression dipilih karena kemampuannya dalam memodelkan hubungan linear antar variabel, sementara evaluasi kinerja model dilakukan melalui confusion matrix. Hasil penelitian menunjukkan bahwa model mampu mengidentifikasi 318 akun palsu dari 143.771 data testing, dengan tingkat akurasi sebesar 0,9968 atau 99,68%. Meskipun demikian, terdapat beberapa kesalahan dalam prediksi akun palsu, yang mengindikasikan perlunya pengembangan lebih lanjut untuk meningkatkan ketepatan deteksi. Kesimpulan penelitian ini menegaskan potensi metode Linear Regression dalam mendukung integritas platform Kaggle dengan mengurangi dampak negatif akibat keberadaan akun palsu. Penelitian ini memberikan kontribusi signifikan dengan mengeksplorasi karakteristik unik Kaggle dan merekomendasikan penelitian lanjutan untuk mengembangkan metode deteksi yang lebih efektif di masa mendatang.