Jurnal Teknologi Informasi dan Ilmu Komputer (Jul 2024)

Algoritma K-Nearest Neighbor pada Kasus Dataset Imbalanced untuk Klasifikasi Kinerja Karyawan Perusahaan

  • Fitri Nuraeni,
  • Dede Kurniadi,
  • Moch Haiqal Diazki

DOI
https://doi.org/10.25126/jtiik.938144
Journal volume & issue
Vol. 11, no. 3

Abstract

Read online

Perusahaan perlu menilai kinerja karyawan mereka untuk berbagai tujuan, termasuk promosi jabatan. Namun, data karyawan yang semakin rumit dapat membuat proses penilaian ini menjadi sulit. Penelitian ini bertujuan untuk membuat model machine learning yang dapat memprediksi apakah karyawan berpotensi untuk dipromosikan atau tidak. Penelitian ini menggunakan metode Machine Learning LifeCycle (MLLC) dan algoritma K-Nearest Neighbor. Untuk mengatasi masalah ketidakseimbangan label kelas dalam dataset, teknik SMOTE (Synthetic Minority Over-sampling Technique) digunakan. Hasil dari penelitian ini, model dibangun dengan melakukan pemisahan data menggunakan cross validation dan menggunakan nilai k=2 dalam implementasi algoritma K-Nearest Neighbor. Hasil evaluasi model menunjukkan kinerja yang sangat baik dengan nilai akurasi 94%, nilai presisi 90,8%, dan nilai recall 97,4%. Selain itu, evaluasi confusion matrix menunjukkan bahwa hanya 562 dari 9377 data testing yang tidak sesuai dengan hasil klasifikasi. Model ini juga memiliki kurva ROC yang baik yang hampir menyentuh sudut kiri atas dan nilai AUC sebesar 94,1% atau 0,94 yang termasuk ke dalam kategori excellent.

Keywords