Analytical and Numerical Methods in Mining Engineering (Aug 2015)
مقایسه روشهای مناسب جانهی مقادیر سانسور شده در داده های ژئوشیمیایی
Abstract
در این تحقیق به بررسی روشهای جانهی مقادیر سانسور شده در مجموعه دادههای چند متغیره ژئوشیمیایی پرداخته شده است. وجود مقادیر گمشده باعث محدودیت در استفاده از اغلب روشهای آماری همچون تحلیل مولفههای اصلی میشود. حذف نمونههای شامل دادههای گمشده باعث اریب شدن نتایج و از دست دادن اطلاعات میشود به همین دلیل در نظر گرفتن رویکردی مناسب در مواجهه با دادههای گمشده یک نیاز اساسی در تحلیل مجموعه دادههای ناکامل است. در این مقاله، با توجه به ماهیت ترکیبی دادههای ژئوشیمیایی، چند روش مناسب برای جانهی مقادیر گمشده که در چند سال اخیر ارائه شدهاند و به سادگی در محیط نرمافزار آماری Rقابل اجرا هستند، معرفی شدهاند. در نهایت با استفاده از یک مجموعه داده کامل مربوط به منطقه ظفرقند، این روشها با یکدیگر مقایسه شدهاند. نتایج نشان میدهند که استفاده از روشهای چند متغیره برای جانهی و به طور خاص روش ilr-EMنسبت به دیگر روشها ارجحیت دارند.
Keywords