Journal of Applied Informatics and Computing (Nov 2024)
Model Pembelajaran Mesin untuk Deteksi Penipuan Kartu Kredit yang Dioptimalkan Menggunakan SMOTE-Tomek dan Rekayasa Fitur
Abstract
Dalam ekonomi digital saat ini, kartu kredit sangat penting dan baik penggunaan maupun pencurian kartu kredit telah meningkat secara signifikan dalam beberapa tahun terakhir. Penipuan kartu kredit dapat dikategorikan menggunakan model pembelajaran mesin menggunakan data dari riwayat transaksi yang mencurigakan. Namun data kredit sering tidak seimbang. Karena itu, model pembelajaran mesin bias terhadap kelas mayoritas yang mengakibatkan kinerja yang buruk pada kumpulan data klasifikasi kartu kredit Kaggle yang dapat diakses oleh masyarakat umum. Kami menyeimbangkan distribusi kelas dalam kumpulan data menggunakan strategi oversampling minoritas sintetis hibrida untuk mengatasi kesulitan ini. Temuan menunjukkan bahwa model pembelajaran mesin random forest yang dikombinasikan dengan teknik oversampling yang dikombinasikan dengan rekayasa fitur dan validasi silang menghasilkan hasil optimal yang lebih dari 99% untuk semua ukuran penilaian. Performanya lebih baik dibandingkan dengan tiga model lain, yaitu decision tree, gradien boosting, dan XGBoost. Dapat disimpulkan bahwa penggunaan rekayasa fitur, validasi silang, dan oversampling merupakan pendekatan yang berguna untuk menangani data kartu kredit yang tidak seimbang dan akhirnya membantu dalam pencegahan penipuan transaksi kartu kredit.
Keywords