Düzce Üniversitesi Bilim ve Teknoloji Dergisi (Aug 2018)

Gözetimsiz Makine Öğrenme Teknikleri ile Miktara Dayalı Negatif Birliktelik Kural Madenciliği

  • Tansel Dökeroğlu,
  • Zahraa Mohammed Malik Malık,
  • Shadi Al-shehabı

DOI
https://doi.org/10.29130/dubited.414657
Journal volume & issue
Vol. 6, no. 4
pp. 1119 – 1138

Abstract

Read online

Birliktelik kuralları, veri kümesindeki nesnelerin varlığının diğer nesnelerin varlığını nasıl etkilediğini tanımlanmaktadır. Bu kurallar, alış veriş sepeti analizinde, bir ürünün aynı işlemdeki diğer ürün üzerindeki etkisini incelemek için kullanılmaktadır. Pozitif ve negatif birliktelik kuralları olarak iki şekilde ifade edilebilirler. Pozitif birliktelik kuralı, bir ürün varlığının aynı işlemde diğer ürünü bulma olanağını arttırdığını gösterirken, negatif birliktelik kuralı, bir çeşidin bulunmasının, diğer ürünün aynı işlemde olabilme ihtimalini düşürdüğünü göstermektedir. Daha önceki işlemlerdeki sıklıkları araştırdığı için pozitif birliktelik kuralı madenciliği, negatif birliktelik kuralları madenciliğine göre daha kolaydır. Negatif birlikteki kuralı madenciliğinde daha önceki işlemler araştırıldığında, ilgisiz ürünler arasındaki ilgisizlik kurallarının madenciliği ile karşılaşılır. Bu kuralların çıkarımından kaçınmak için, mevcut negatif birliktelik kuralı, madencilik tekniklerine sağlanan önceden tanımlı alan bilgisine dayanır. Dolayısıyla bu bilgi, bulunan kuralların ilgili ürünlere ait olması için kullanılır. Bu çalışmada, satın alınan miktarlara dayalı veri kümesinden otomatik olarak bilgi alınması ile veri kümesindeki ürünler arasındaki negatif birliktelik kurallarını bulma kabiliyetine sahip yeni bir teknik önerilmektedir. Birliktelik kuralı madenciliği, gözetimsiz veri madencilik tekniği olduğundan, sağlanan veri kümesi etiketsiz verilerden oluşmaktadır. DBSCAN kümeleme yönteminin kullanımı, gerçek yaşam işlem veri tabanında test edildiğinde %0,21 destek ve %91,84 güven ortalama değerleri ile 4.086 şeklinde daha iyi negatif birliktelik kuralı sonucu göstermiştir. K-ortalama kümeleme yönteminin kullanımı ile çıkarılan alan bilgisine dayalı negatif birliktelik kuralları madenciliği sonucu, %0,19 destek ve %85,84 güven ortalama değerine sahip 1.780 iken, önerilen alan bilgisiz negatif birliktelik kuralı sonucu %0,12 destek ve %99,37 güven ortalama değerli 9.066 sonucunu vermiştir.

Keywords