Indonesian Journal of Data and Science (Jul 2022)
Analisis performa metode klasifikasi Naïve Bayes Classifier pada Unbalanced Dataset
Abstract
Penelitian ini bertujuan menganalisis menganalisis performa metode Naïve Bayes Classifier pada berbagai variasi unbalanced dataset. Teknik klasifikasi yang digunakan yaitu dengan menggunakan pengukuran performa accuracy, precision, recall, dan f-measure dengan menggunakan metode Naïve Bayes Classifier. Dataset diambil dari Kaggle, dan dari tiap dataset memiliki data yang tidak seimbang atau unbalance, data inilah yang akan dihitung performanya menggunakan metode Naïve Bayes Classifier. Berdasarkan hasil pengujian menggunakan metode Naïve Bayes Classifier didapatkan pada dataset Glass yaitu accuracy sebesar 46%, precision sebesar 47%, recall sebesar 46% dan f-measure sebesar 43%, pada dataset Heart Disease yaitu accuracy sebesar 88%, precision sebesar 88%, recall sebesar 88% dan f-measure sebesar 88%, pada dataset Kidney Disease yaitu accuracy sebesar 100%, precision sebesar 100%, recall sebesar 100% dan f-measure sebesar 100%, pada dataset Liver Disease yaitu accuracy sebesar 78%, precision sebesar 82%, recall sebesar 78% dan f-measure sebesar 79%, pada dataset Diabetes yaitu accuracy sebesar 77%, precision sebesar 76%, recall sebesar 77% dan f-measure sebesar 76%, dan pada dataset Breast Cancer yaitu accuracy sebesar 94%, precision sebesar 94%, recall sebesar 94% dan f-measure sebesar 94%. Hasil penelitian ini menunjukkan metode Naive Bayes Classifier pada unbalanced dataset memperoleh nilai performa yang tidak menentu.
Keywords