Cukurova Medical Journal (Mar 2018)
Çarpık dağılımlı verilerde ROC eğrisi altında kalan alan tahmininde transformasyon etkili mi?
Abstract
Amaç: Hasta ve sağlıklı grupta ölçülen sayısal ölçümlü tanı testinin dağılımının çarpık olması halinde ROC eğrisi altında kalan alan tahmini için kullanılan yöntemleri karşılaştırmaktır.Gereç ve Yöntem: ROC eğrisi altında kalan alan tahmini parametrik ve parametrik olmayan yöntemler kullanılarak yapılabilmektedir. Parametrik yaklaşımlarda sayısal ölçümün hasta ve sağlıklı gruplarında normal dağılım gösterdiği veya dönüşüm teknikleri ile dağılımın normal dağılıma dönüştürülebileceği varsayılmaktadır. Parametrik olmayan yaklaşımlarda ise eğri altında kalan alan sıra istatistikleri kullanılarak hesaplanabildiği gibi, eğrinin çekirdek düzgünleştirme yöntemleri ile elde edilen olasılık yoğunluk fonksiyonu kullanılarak da hesaplanabilmektedir. Bu çalışmada parametrik ve parametrik olmayan yöntemler çarpık olarak üretilmiş veriler ve bir gerçek veri seti kullanılarak karşılaştırılmıştır. Bulgular: Simülasyon çalışmalarında, yöntemlerin gerçek alan değeri tahminleri gerçek alan değeri, örneklem büyüklüğü ve çarpıklık derecesine göre değişim göstermektedir. Normal dağılımdan üretilen çarpık verilerde Mann Whitney yöntemi en az hatayı yaparken, Gamma dağılımından üretilen çarpık verilerde ise normale dönüşüm sonrası Binormal modeli en az hatayı yapmıştır.Sonuç: Çarpık dağılımlı verilerde dönüşüm teknikleri ile parametrik yöntemler kullanılarak ROC eğrisi altında kalan alan değeri tahmin edilebilir. Çarpıklık derecesi fazla olan verilerde parametrik yöntemlerin alan tahmin değerleri gerçek değere daha yakın olduğundan çarpık dağılımlı verilere Box-Cox dönüşümünü uygulamak önerilir.
Keywords