Jambura Journal of Mathematics (Jul 2019)

Penerapan Hierarchical Clustering Metode Agglomerative pada Data Runtun Waktu

  • Andrea Tri Rian Dani,
  • Sri Wahyuningsih,
  • Nanda Arista Rizki

DOI
https://doi.org/10.34312/jjom.v1i2.2354
Journal volume & issue
Vol. 1, no. 2
pp. 64 – 78

Abstract

Read online

Analisis cluster merupakan seperangkat metode yang digunakan untuk mengelompokkan objek ke dalam sebuah cluster berdasarkan informasi yang ditemukan pada data. Analisis cluster dapat diterapkan pada data runtun waktu, di mana terdapat prosedur dan algoritma pengelompokkan yang berbeda dibandingkan dengan pengelompokkan data cross-section. Banyak teknik pengelompokkan data runtun waktu yang dikembangkan di antaranya adalah penggunaan jarak pengukuran kemiripan yang sesuai dengan karakteristik data runtun waktu, pemilihan algoritma pengelompokkan yang optimal sampai dengan penentuan banyaknya cluster yang representatif. Tujuan dari penelitian adalah untuk memperoleh jarak pengukuran kemiripan terbaik, kemudian memperoleh algoritma pengelompokkan metode agglomerative yang optimal serta memperoleh jumlah cluster yang representatif. Pemilihan jarak pengukuran kemiripan terbaik dan algoritma yang optimal menggunakan koefisien korelasi cophenetic, sedangkan untuk penentuan jumlah cluster menggunakan koefisien silhouette. Data pada penelitian adalah data jumlah penduduk Kabupaten/Kota di Provinsi Kalimantan Timur dari Tahun 2005-2017. Berdasarkan hasil analisis, diperoleh jarak pengukuran kemiripan terbaik dalam mengelompokkan Kabupaten/Kota di Provinsi Kalimantan Timur adalah jarak autocorrelation based distance (ACF) dengan nilai koefisien korelasi cophenetic sebesar 0,99. Algoritma pengelompokkan yang optimal adalah algoritma average linkage, dikarenakan memiliki nilai koefisien korelasi cophenetic yang terbesar diantara algoritma pengelompokkan lainnya, dengan jumlah cluster yang representatif berdasarkan koefisien silhouette adalah 2 cluster.

Keywords