Jurnal Teknologi Informasi dan Ilmu Komputer (Jul 2023)

Optimasi Algoritma Naive Bayes dengan Diskritisasi K-Means pada Diagnosis Penyakit Jantung

  • Nafa Fajriati,
  • Budi Prasetiyo

DOI
https://doi.org/10.25126/jtiik.20231036510
Journal volume & issue
Vol. 10, no. 3

Abstract

Read online

Penyakit jantung iskemik adalah salah satu jenis penyakit kardiovaskular dengan jumlah penderita yang besar dan menjadi penyebab utama kematian di dunia. Disamping itu, penyakit jantung juga menyebabkan kerugian ekonomi. Diagnosis penyakit jantung pada tahap awal dapat membantu mengurangi risiko kematian dan tingginya biaya perawatan akibat penyakit jantung. Diagnosis penyakit merupakan proses penting yang harus dilakukan secara akurat agar tidak terjadi kesalahan diagnosis. Data mining dapat diterapkan untuk meningkatkan akurasi dan mengurangi jumlah kesalahan diagnosis. Salah satu teknik data mining adalah klasifikasi. Naïve Bayes merupakan algoritma klasifikasi yang memiliki kemampuan yang cukup baik untuk membangun model pengklasifikasi. Pada penelitian ini, dilakukan klasifikasi penyakit jantung menggunakan algoritma Naïve Bayes. Dataset yang digunakan yaitu Cleveland heart disease dataset dari UCI Machine Learning Repository. Untuk meningkatkan akurasi klasifikasi menggunakan algoritma Naive Bayes, atribut kontinu pada dataset diubah menjadi atribut diskrit dengan diskritisasi K-means. Diskritisasi K-means mengubah nilai setiap atribut kontinu menjadi kategori-kategori diskrit berupa cluster sejumlah k yang terbentuk dari proses algoritma K-means. Hal tersebut dilakukan karena algoritma Naïve Bayes menunjukkan kemampuan klasifikasi yang lebih baik apabila menggunakan data masukan berupa diskrit dibanding kontinu. Hasil akurasi yang diperoleh dari algoritma Naïve Bayes tanpa menerapkan diskritisasi K-means pada Cleveland heart disease dataset adalah 86,89%, sedangkan hasil akurasi yang diperoleh dari algoritma Naïve Bayes dengan menerapkan diskritisasi K-means pada Cleveland heart disease dataset adalah 88,52%. Berdasarkan perbandingan akurasi yang dihasilkan, dapat diketahui adanya peningkatan akurasi sebesar 1,63%. Hal tersebut menunjukkan bahwa diskritisasi K-means berperan dalam mengoptimalkan kinerja algoritma Naïve Bayes sehingga menghasilkan akurasi yang lebih baik. Abstract Ischemic heart disease is a type of cardiovascular disease with a large number of sufferers and is the leading cause of death in the world. In addition, heart disease also causes economic losses. Diagnosing heart disease early can help reduce the risk of death and the high costs of treatment for heart disease. Diagnosis of the disease is an important process that must be carried out accurately to avoid misdiagnosis. Data mining can be applied to improve accuracy and reduce the number of misdiagnoses. One of the data mining techniques is classification. Naïve Bayes is a classification algorithm that has a fairly good ability to build a classifier model. In this study, heart disease was classified using the Naïve Bayes algorithm. The dataset used is the Cleveland heart disease dataset from the UCI Machine Learning Repository. To improve classification accuracy using the Naive Bayes algorithm, continuous attributes in the dataset are changed to discrete attributes using K-means discretization. K-means discretization changes the value of each continuous attribute into discrete categories in the form of k clusters formed from the K-means algorithm process. This is done because the Naïve Bayes algorithm shows a better classification ability when it uses discrete rather than continuous input data. The accuracy results obtained from the Naïve Bayes algorithm without applying the K-means discretization to the Cleveland heart disease dataset are 86.89%, while the accuracy results obtained from the Nave Bayes algorithm by applying the K-means discretization to the Cleveland heart disease dataset are 88.52%. . Based on the comparison of the resulting accuracy, it can be seen that there is an increase in accuracy of 1.63%. This shows that K-means discretization plays a role in optimizing the performance of the Naïve Bayes algorithm to produce better accuracy.