Jurnal Teknologi Informasi dan Ilmu Komputer (Dec 2020)
Penerapan Algoritma Pillar Untuk Inisialisasi Titik Pusat K-Means Klaster Dinamis
Abstract
K-Means merupakan algoritma yang digunakan untuk melakukan pengklasteran data. Namun, k-means memiliki masalah dalam sensitivitas penentuan partisi awal jumlah klaster. Penelitian terkait menyatakan algoritma k-means tergantung pada penentuan titik pusat klaster awal. Pemilihan pusat klaster awal secara acak cenderung menghasilkan klaster yang berbeda. Sehingga untuk menentukan klaster terbaik harus dilakukan dengan memperhatikan nilai Sum Sequare Error yang terkecil. Untuk mengatasi permasalahan tersebut, penentuan klaster dilakukan dengan menggunakan algoritma pillar. Algoritma pillar menentukan titik pusat klaster dengan memilih data dengan nilai euclidean paling jauh dari titik pusat klaster. Namun pemilihan titik klaster tetap memperhatikan kemungkinan data outlier. Pengujian dilakukan dengan menetapkan satu buah klaster awal sebagai inisialisasi skaligus sebagai klaster pembanding untuk menentukan kualitas klaster berikutnya. Penelitian ini menggunakan data set ruspini dan iris. Untuk data ruspini terdiri dari 76 data set, sedangkan data iris terdiri dari 150 data set. Klaster Pillar memiliki nilai Sum Sequere Error, Variance Cluster, dan Davies yang lebih kecil dibandingkan klaster dinamis pada data set ruspini. Nilai tersebut secara berurutan untuk algoritma pillar adalah 0.28, 0.11, 7.30, 5.88. Untuk data set iris nilai Sum Square Error lebih tinggi dibandingkan dengan klaster dinamis yaitu 0.34. Sedangkan algoritma klaster dinamis memiliki nilai 0.32. Hal tersebut disebahkan penentuan data outlier pada iris data set yang tidak akurat. Ketidakakurantan tersebut berasal dari data yang bersifat multivariat, sehingga memungkinkan data outlier menjadi centroid awal klaster. Sehingga jika dilihat dari nilai validitas SSE, algoritma pillar k-means klaster dinamis masih kurang bekerja optimal dibandingkan dengan algoritma k-means klaster dinamis.