Jurnal Informatika (Oct 2022)
Klasifikasi Pemilihan Jurusan Sekolah Menengah Kejuruan Menggunakan Gradient Boosting Classifier
Abstract
Pemilihan jurusan merupakan faktor penting bagi calon siswa yang akan melanjutkan pendidikan di SMK. Siswa cenderung mengikuti pilihan orang tua atau temannya tanpa mempertimbangkan kurikulum sesuai minat dan kemampuannya. Akibatnya banyak siswa yang mengalami kesulitan mengikuti pelajaran, dan prestasi belajarnya menurun. Model RIASEC merupakan salah satu metode pendeteksian minat yang digunakan untuk mengetahui tipe kepribadian siswa. Penelitian ini bertujuan untuk membangun model untuk memprediksi pilihan jurusan di SMK Yadika 12 Depok. Penelitian ini membandingkan lima pengklasifikasi pada kumpulan data pemilihan jurusan di sekolah kejuruan. Proses selanjutnya melakukan tuning hyperparameter menggunakan GridsearchCV untuk mendapatkan parameter yang paling berpengaruh dari algoritma klasifikasi yang dipilih. Algoritma yang diimplementasikan adalah Multinomial Nave Bayes, Gaussian Nave Bayes, Bernoulli Naive Bayes, Gradient Boosting Classifier, Decision Tree Classifier, K Neighbors Classifier, dan Logistic Regression. Hasil pengujian menunjukkan bahwa Gradient Boosting Classifier dengan Hyperparameter Tuning menggunakan GridSearchCV memperoleh akurasi 72% dan class recall mencapai 76%. The selection of the majors remains a crucial factor for prospective students who will pursue their education at SMK. However, students tend to follow the choices of their parents or friends. They are not considering the curriculum according to their interests and abilities. As a result, many students have difficulties following the lesson, and their academic achievement decreases. The RIASEC model is one of the interest detection methods used to determine the student's personality type. This study aims to develop a model to predict the choice of majors at SMK Yadika 12 Depok. We compared five classifiers on the major's selection data sets at vocational schools. In addition, we performed hyperparameter tuning using GridsearchCV to obtain the most influential parameters from the selected classification algorithm. The algorithms implemented are Multinomial Naive Bayes, Gaussian Naive Bayes, Bernoulli Naive Bayes, Gradient Boosting Classifier, Decision Tree Classifier, K Neighbors Classifier, and Logistic Regression. The test results show that the Gradient Boosting Classifier with Hyperparameter Tuning using GridSearchCV maintains an accuracy of 72% and class recall reaches 76%.
Keywords