Komputika (May 2025)

Comparison Of Lung Cancer Classification Using Decision Tree And Random Forest

  • Rabiatul Adawiyah,
  • Dwi Cahya Julia Kartikasari

DOI
https://doi.org/10.34010/kp5h2h96
Journal volume & issue
Vol. 14, no. 1

Abstract

Read online

Kanker paru-paru merupakan penyebab utama kematian akibat kanker di berbagai usia, dengan faktor risiko seperti merokok, polusi udara, dan penyakit kronis. Kanker paru-paru ditandai oleh pertumbuhan sel tidak terkendali di jaringan paru-paru, yang dapat menyebar ke organ lain melalui metastasis Klasifikasi berbasis machine learning dapat membantu dalam deteksi dini penyakit ini. Penelitian ini membandingkan metode Decision Tree dan Random Forest dalam klasifikasi kanker paru-paru menggunakan dataset dengan tujuh atribut dan 1010 baris data. Missing value ditangani dengan metode imputasi modus. Analisis feature importance dengan Random Forest menunjukkan bahwa fitur Coughing, Chronic Disease, Smoking, dan Shortness of Breath memiliki pengaruh tertinggi dalam klasifikasi. Hasil klasifikasi menunjukkan bahwa Decision Tree tanpa pemilihan fitur mencapai akurasi 64,85%, lebih tinggi dibandingkan Random Forest yang hanya mencapai 52,62%. Setelah dilakukan pemilihan fitur, akurasi Decision Tree menurun menjadi 55,94%, sementara Random Forest mengalami sedikit penurunan menjadi 52,47%. Hasil ini menunjukkan bahwa Decision Tree lebih efektif dalam menangkap pola data tanpa seleksi fitur, sedangkan Random Forest cenderung kurang optimal dengan dataset yang relatif kecil. Kata Kunci – Machine Learning; Klasifikasi; Feature Importance; Entropi; Gain.