Jurnal Teknologi Informasi dan Ilmu Komputer (Dec 2022)

Studi Komparasi Naive Bayes, K-Nearest Neighbor, dan Random Forest untuk Prediksi Calon Mahasiswa yang Diterima atau Mundur

  • Puteri Sejati,
  • Munawar Munawar,
  • Marzuki Pilliang,
  • Habibullah Akbar

DOI
https://doi.org/10.25126/jtiik.2022976737
Journal volume & issue
Vol. 9, no. 7

Abstract

Read online

Penelitian ini bertujuan untuk mendapatkan model prediksi terbaik dari data Penerimaan Mahasiswa Baru tahun 2014 hingga 2019 dengan membandingkan Naive Bayes, K-Nearest Neighbor, dan Random Forest. Penelitian ini menggunakan metode klasifikasi untuk memprediksi calon mahasiswa. Mereka diterima atau mundur. Dalam penelitian ini digunakan 19.603 data latih dan 4.901 data uji. Hasil penelitian menunjukkan bahwa algoritma Random Forest adalah yang terbaik dengan akurasi 73,61%, dibandingkan dengan K-Nearest Neighbor dengan akurasi 72,08%, dan Naive Bayes dengan akurasi 70,47%. Disimpulkan juga bahwa optimasi model dengan teknik Hyperparameter menghasilkan nilai akurasi yang lebih baik. Hasil penelitian ini dapat digunakan untuk mendukung bagian pemasaran dalam meminimalisir jumlah calon mahasiswa yang mengundurkan diri. Abstract This study aimed to obtain the best predictive model from New Student Admissions data for 2014 to 2019 by comparing Naive Bayes, K-Nearest Neighbor, and Random Forest. This study used the classification method to predict prospective students. They are accepted or withdrawn. In this study, 19,603 training data and 4,901 test data were used. The results showed that the Random Forest algorithm was the best with an accuracy of 73.61%, compared to K-Nearest Neighbor with an accuracy of 72.08%, and Naive Bayes with an accuracy of 70.47%. It is also concluded that optimizing the model with the Hyperparameter technique produces better accuracy values. This study's results can be used to support the marketing department in minimizing the number of withdrawn prospective students.