Analytical and Numerical Methods in Mining Engineering (Feb 2018)

کاربرد برآوردگرهای مقاوم در تعیین داده‌های خارج از ردیف؛ مطالعه موردی: داده‌های ژئوشیمیایی منطقه شاه سلیمان علی در استان خراسان جنوبی

  • حمید گرانیان,
  • زهرا خواجه میری

Journal volume & issue
Vol. 7, no. 14
pp. 73 – 85

Abstract

Read online

شناسایی و تعدیل نمونه‌های خارج از ردیف چند متغیره اولین مرحله برای تحلیل آماری داده‌های اکتشافی محسوب می‌شود. کاهش بُعد داده‌ها به یک بُعد توسط فاصله‌ی نمونه از مرکز داده‌ها و مقایسه آن با یک حد آستانه کلید این کار محسوب می‌شود. در برآوردگرهای مقاوم از ماتریس‌های موقعیت و پراکندگی به جای ماتریس‌های میانگین و واریانس- کواریانس برای محاسبه این فاصله استفاده می‌شود. بنابراین برای مقاوم بودن این فاصله زیر مجموعه‌ی بهینه به جای کل داده‌ها برای محاسبه‌ی این ماتریس‌ها به کار می­رود. چهار برآوردگر مقاوم MVE، MCD، S و SD در این مقاله معرفی گردیده‌اند. سپس از این برآوردگرها برای تعیین نمونه‌های خارج از ردیف 146 نمونه‌ی رسوبات آبراهه‌ای منطقه شاه سلیمان علی در استان خراسان حنوبی و برای نتایج آنالیز 18 عنصر استفاده شده است. نتایج محاسبات نشان داده است که روش کلاسیک فاصله ماهالانوبیتس 7 نمونه و برآوردگرهای مقاوم MVE، MCD، S و SD به ترتیب 23، 35، 20 و 34 نمونه را به عنوان داده‌ی پرت معرفی می‌کنند. همچنین آنالیز مولفه‌های اصلی در مد Q نشان داده است که نمونه‌های خارج از ردیف با بارهای منفی خود را در مولفه‌ی دوم و سایر نمونه‌ها تقریباً با بارهای مثبت بالا در مولفه‌ی اول خود را نشان می‌دهند. تفکیک جامعه‌ی نمونه‌های خارج از ردیف از سایر نمونه‌ها نیز در نمودار پراکندگی بارهای مولفه‌ی دوم نسبت به مولفه‌ی سوم امکانپذیر است. استفاده از ماتریس‌های موقعیت و پراکندگی به دست آمده از برآوردگرهای مقاوم در روش‌های آمارهای چند متغیره یکی دیگر از کاربردهای پیشنهادی مهم برآوردگرهای مقاوم در تجزیه و تحلیل داده‌های اکتشافی محسوب می‌شوند.

Keywords