Jurnal Nasional Teknik Elektro dan Teknologi Informasi (May 2022)

Deteksi Dini Penyakit Diabetes Menggunakan Machine Learning dengan Algoritma Logistic Regression

  • Erlin,
  • Yulvia Nora Marlim,
  • Junadhi,
  • Laili Suryati,
  • Nova Agustina

DOI
https://doi.org/10.22146/jnteti.v11i2.3586
Journal volume & issue
Vol. 11, no. 2
pp. 88 – 96

Abstract

Read online

Diabetes menjadi salah satu penyakit yang mematikan di dunia, termasuk di Indonesia. Diabetes dapat menyebabkan komplikasi di banyak bagian tubuh dan secara keseluruhan dapat meningkatkan risiko kematian. Salah satu cara untuk mendeteksi penyakit diabetes adalah dengan memanfaatkan algoritma machine learning. Logistic regression merupakan model klasifikasi dalam machine learning yang banyak digunakan dalam analisis klinis. Pada makalah ini, dirancang model prediksi menggunakan logistic regression pada Python IDE untuk deteksi dini dengan memberikan prediksi seseorang terindikasi penyakit diabetes atau tidak berdasarkan data awal yang diberikan. Eksperimen dilakukan menggunakan dataset dari Pima Indians Diabetes Database yang terdiri atas 768 data pasien dengan delapan variabel independen dan satu variabel dependen. Exploratory data analysis dilakukan untuk mendapatkan wawasan maksimal dari dataset yang dimiliki menggunakan bantuan statistik dan mempresentasikannya melalui teknik visual. Beberapa variabel dataset memuat data yang tidak lengkap. Nilai data yang hilang digantikan dengan nilai median dari setiap variabel. Penanganan terhadap data yang tidak seimbang dilakukan menggunakan synthetic minority over-sampling technique (SMOTE) untuk meningkatkan kelas minoritas melalui sampel data sintesis. Model dievaluasi berdasarkan confusion matrix yang memperlihatkan kinerja yang cukup baik dengan nilai akurasi sebesar 77%, presisi 75%, recall 77% dan F1-score 76%. Selain itu, pada makalah ini juga digunakan teknik grid search sebagai hyperparameter tuning yang dapat meningkatkan kinerja dari model logistic regression. Kinerja model dasar dengan model sesudah dilakukan penerapan teknik grid search diuji dan dievaluasi. Hasil percobaan memperlihatkan bahwa model berbasis hyperparameter tuning mampu meningkatkan kinerja algoritma logistic regression untuk prediksi dengan nilai akurasi sebesar 82%, presisi 81%, recall 79%, dan F1-score 80%.

Keywords