Teknika (Nov 2017)

Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni

  • Femi Dwi Astuti

DOI
https://doi.org/10.34148/teknika.v6i1.58
Journal volume & issue
Vol. 6, no. 1

Abstract

Read online

Di wilayah Kecamatan Bantul, seorang warga disebut sebagai keluarga miskin berdasarkan beberapa aspek seperti aspek pangan, sandang, papan, penghasilan, kesehatan, pendidikan, kekayaan, air bersih, listrik maupun jumlah jiwa. Aspek-aspek tersebut akan digunakan sebagai atribut dalam proses clustering. Masing-masing atribut memiliki nilai yang akan diolah. Penelitian ini dikerjakan menggunakan seleksi atribut information gain sebelum proses clustering untuk melihat atribut mana yang sebenarnya berpengaruh dan tidak, sehingga hanya atribut yang berpengaruh saja yang akan digunakan, metode Fuzzy C-Means untuk clustering penduduk miskin dan Xie Beni untuk menentukan jumlah klaster terbaik. Hasil penelitian menunjukkan penggunaan information gain dengan threshold 0.0001 untuk clustering dengan menghilangkan atribut penghasilan memiliki hasil cluster yang sama dengan menggunakan atribut penghasilan. Pengujian terhadap 23, 500, 1000 dan 1313 untuk jumlah cluster 2, 3, 4, 5, 6 dan 7 menunjukkan bahwa nilai dari Xie-Beni Index terkecil adalah 5 dengan nilai 0,1343, sehingga cluster yang paling optimal adalah 5.

Keywords