پژوهشهای حفاظت آب و خاک (Dec 2018)
مقایسه مدلهای درخت تصمیم و یادگیری برپایه نمونه در برآورد هدایت هیدرولیکی اشباع خاک
Abstract
سابقه و هدف: هدایت هیدرولیکی اشباع خاک یکی از مهمترین خصوصیات هیدرولیکی خاک است که بر حرکت آب در خاک موثر است. شناخت این ویژگی میتواند به درک بسیاری از مشکلات زیست محیطی کمک کند. از طرفی اندازهگیری این ویژگی با روشهای مستقیم مزرعهای و آزمایشگاهی دشوار، زمانبر و هزینهبر است و استفاده از روشهای جایگزینی را میطلبد که بتوان با صرف وقت، هزینه و زمان کمتری آن را از روی دادههای زودیافت خاک تخمین زد. روشهای ناپارامتریک از جمله روشهای غیرمستقیم و نوین برآورد خصوصیات هیدرولیکی خاک از جمله هدایت هیدرولیکی اشباع میباشند. هدف از این پژوهش مقایسه روش درخت تصمیم و یک روش یادگیری برپایه نمونه ( IBk) که یک ردهبند با k همسایه نزدیک است در برآورد هدایت هیدرولیکی اشباع خاک، از روی خصوصیات زودیافت آن است. مواد و روشها: در این پژوهش، از مجموعه دادهای با اطلاعات خاکشناسی 151 نمونه خاک که از منطقهای در بجنورد گردآوری شده بود استفاده شد. خصوصیات زودیافت خاک شامل درصد شن، سیلت، رس، جرم مخصوص ظاهری، جرم مخصوص حقیقی، هدایت الکتریکی، درصد کربن آلی، درصد مواد خنثیشونده، رطوبت اشباع و اسیدیته بود. هدایت هیدرولیکی اشباع نمونهها با استفاده از دستگاه نفوذسنج گلف اندازهگیری شده بود. برای تعیین مهمترین پارامترها در پیشبینی و مدلسازی هدایت هیدرولیکی اشباع، از آزمون گاما استفاده شد. ترکیبات مختلف از پارامترهای موجود در بانک داده بر اساس مقدار گاما با یکدیگر مقایسه شدند و ترکیب بهینه برای مدلسازی معین شد. مدلسازی با استفاده از دو روش ناپارامتریک یعنی درخت تصمیم با بهرهگیری از الگوریتم M5P و روش یادگیری برپایه نمونه با بهرهگیری از الگوریتم IBk با استفاده از ترکیب بهینه پارامترها که کمترین مقدار گاما را داشت صورت گرفت. برای بهبود عملکرد IBk دو نوع تابع وزندهی فاصله استفاده شد. در آخر معیارهای ارزیابی مدلها شامل ضریب تعیین (R2)، جذر میانگین مربعات خطا (RMSE)، میانگین قدر مطلق خطا (MAE) و درصد میانگین قدر مطلق خطا (MAPE) محاسبه شدند. یافتهها: ترکیب بهینهای که از آزمون گاما به دست آمد برای مدلسازی هر دو روش استفاده شد. این ترکیب شامل پارامترهای درصد شن، سیلت، رس، درصد مواد خنثی شونده، هدایت الکتریکی و جرم مخصوص ظاهری خاک بود. مدل M5P، پارامتر جرم مخصوص ظاهری خاک را به عنوان مهمترین متغیر دستهبندیکننده انتخاب کرد و سه رابطه خطی برای برآورد هدایت هیدرولیکی اشباع با توجه به مقدار جرم مخصوص ظاهری ایجاد کرد. معیارهای ارزیابی نشان دادند که این مدل با جذر میانگین مربعات خطای 89/23 سانتیمتر بر روز و میانگین قدر مطلق خطای 50/20 درصد، دقت بالایی در پیشبینی هدایت هیدرولیکی اشباع نداشت. استفاده از دو نوع تابع وزندهی تاثیری بر بهبود نتایج مدل IBk نداشتند. مدل IBk نیز با جذر میانگین مربعات خطای 23/31 سانتیمتر بر روز و میانگین قدر مطلق خطای 24/23 درصد دقت بالایی نداشت. نتیجهگیری: برای برآورد هدایت هیدرولیکی اشباع، درخت تصمیم مدل مناسبتری نسبت به مدل یادگیری برپایه نمونه بود، همچنین این مدل اطلاعاتی از ساختار خاک تحت بررسی نیز به دست داد.
Keywords