Analytical and Numerical Methods in Mining Engineering (Feb 2018)
کاربرد برآوردگرهای مقاوم در تعیین دادههای خارج از ردیف؛ مطالعه موردی: دادههای ژئوشیمیایی منطقه شاه سلیمان علی در استان خراسان جنوبی
Abstract
شناسایی و تعدیل نمونههای خارج از ردیف چند متغیره اولین مرحله برای تحلیل آماری دادههای اکتشافی محسوب میشود. کاهش بُعد دادهها به یک بُعد توسط فاصلهی نمونه از مرکز دادهها و مقایسه آن با یک حد آستانه کلید این کار محسوب میشود. در برآوردگرهای مقاوم از ماتریسهای موقعیت و پراکندگی به جای ماتریسهای میانگین و واریانس- کواریانس برای محاسبه این فاصله استفاده میشود. بنابراین برای مقاوم بودن این فاصله زیر مجموعهی بهینه به جای کل دادهها برای محاسبهی این ماتریسها به کار میرود. چهار برآوردگر مقاوم MVE، MCD، S و SD در این مقاله معرفی گردیدهاند. سپس از این برآوردگرها برای تعیین نمونههای خارج از ردیف 146 نمونهی رسوبات آبراههای منطقه شاه سلیمان علی در استان خراسان حنوبی و برای نتایج آنالیز 18 عنصر استفاده شده است. نتایج محاسبات نشان داده است که روش کلاسیک فاصله ماهالانوبیتس 7 نمونه و برآوردگرهای مقاوم MVE، MCD، S و SD به ترتیب 23، 35، 20 و 34 نمونه را به عنوان دادهی پرت معرفی میکنند. همچنین آنالیز مولفههای اصلی در مد Q نشان داده است که نمونههای خارج از ردیف با بارهای منفی خود را در مولفهی دوم و سایر نمونهها تقریباً با بارهای مثبت بالا در مولفهی اول خود را نشان میدهند. تفکیک جامعهی نمونههای خارج از ردیف از سایر نمونهها نیز در نمودار پراکندگی بارهای مولفهی دوم نسبت به مولفهی سوم امکانپذیر است. استفاده از ماتریسهای موقعیت و پراکندگی به دست آمده از برآوردگرهای مقاوم در روشهای آمارهای چند متغیره یکی دیگر از کاربردهای پیشنهادی مهم برآوردگرهای مقاوم در تجزیه و تحلیل دادههای اکتشافی محسوب میشوند.