Düzce Üniversitesi Bilim ve Teknoloji Dergisi (Jul 2019)
Veri Madenciliğinde Kullanılan Kümeleme Algoritmalarının Karşılaştırılması Üzerine Bir İnceleme
Abstract
Günümüz dünyasında veri madenciliği, yaşanan olayların anlaşılabilmesi, yorumlanabilmesi ve geleceğe dair tahminlerin yapılabilmesi için büyük önem arz etmektedir. Bu nedenle, istatistik teknikleri her geçen gün değişmekte ve yenilenmektedir. Özellikle, günümüzde büyük verilerin anlaşılabilmesi amacıyla makine öğrenme teknikleri sıklıkla kullanılmaktadır. Bu çalışmada, literatürde yoğun olarak kullanılan k-ortalama kümeleme algoritması çeşitlerinden klasik, bulanık ve torbalı k-ortalamalar yöntemlerinin kümeleme performanslarının karşılaştırılması amaçlanmaktadır. Bu doğrultuda veri setine ulaşılabilen 132 ülke beşeri sermaye özellikleri doğrultusunda kümelenmiştir. Çalışmanın sonucunda, torbalı küme algoritmasının zaman açısından diğerlerinden daha yavaş olduğu ancak daha başarılı kümeleme yaptığı bulgusuna ulaşılmıştır. Benzer şekilde, bulanık k-ortalama algoritmasının klasik k-ortalamalara göre daha başarılı olduğu görülmüştür.
Keywords