پژوهش‌های حفاظت آب و خاک (Dec 2018)

مقایسه مدل‏های درخت تصمیم و یادگیری برپایه نمونه در برآورد هدایت هیدرولیکی اشباع خاک

  • مهنوش فرزادمهر,
  • مهدی دستورانی,
  • عباس خاشعی سیوکی

DOI
https://doi.org/10.22069/jwsc.2018.15150.3032
Journal volume & issue
Vol. 25, no. 5
pp. 167 – 184

Abstract

Read online

سابقه و هدف: هدایت هیدرولیکی اشباع خاک یکی از مهمترین خصوصیات هیدرولیکی خاک است که بر حرکت آب در خاک موثر است. شناخت این ویژگی می‏تواند به درک بسیاری از مشکلات زیست محیطی کمک کند. از طرفی اندازه‏گیری این ویژگی با روش‏های مستقیم مزرعه‏ای و آزمایشگاهی دشوار، زمانبر و هزینه‏بر است و استفاده از روش‏های جایگزینی را می‏طلبد که بتوان با صرف وقت، هزینه و زمان کمتری آن را از روی داده‏های زودیافت خاک تخمین زد. روش‏های ناپارامتریک از جمله روش‏های غیرمستقیم و نوین برآورد خصوصیات هیدرولیکی خاک از جمله هدایت هیدرولیکی اشباع می‏باشند. هدف از این پژوهش مقایسه روش درخت تصمیم و یک روش یادگیری برپایه نمونه ( IBk) که یک رده‏بند با k همسایه نزدیک است در برآورد هدایت هیدرولیکی اشباع خاک، از روی خصوصیات زودیافت آن است. مواد و روش‏ها: در این پژوهش، از مجموعه داده‏ای با اطلاعات خاک‏شناسی 151 نمونه خاک که از منطقه‏ای در بجنورد گردآوری شده بود استفاده شد. خصوصیات زودیافت خاک شامل درصد شن، سیلت، رس، جرم مخصوص ظاهری، جرم مخصوص حقیقی، هدایت الکتریکی، درصد کربن آلی، درصد مواد خنثی‏شونده، رطوبت اشباع و اسیدیته بود. هدایت هیدرولیکی اشباع نمونه‏ها با استفاده از دستگاه نفوذسنج گلف اندازه‏گیری شده بود. برای تعیین مهمترین پارامترها در پیش‏بینی و مدل‏سازی هدایت هیدرولیکی اشباع، از آزمون گاما استفاده شد. ترکیبات مختلف از پارامترهای موجود در بانک داده بر اساس مقدار گاما با یکدیگر مقایسه شدند و ترکیب بهینه برای مدل‏سازی معین شد. مدل‏سازی با استفاده از دو روش ناپارامتریک یعنی درخت تصمیم با بهره‏گیری از الگوریتم M5P و روش یادگیری برپایه نمونه با بهره‏گیری از الگوریتم IBk با استفاده از ترکیب بهینه پارامترها که کمترین مقدار گاما را داشت صورت گرفت. برای بهبود عملکرد IBk دو نوع تابع وزن‏دهی فاصله استفاده شد. در آخر معیارهای ارزیابی مدل‏ها شامل ضریب تعیین (R2)، جذر میانگین مربعات خطا (RMSE)، میانگین قدر مطلق خطا (MAE) و درصد میانگین قدر مطلق خطا (MAPE) محاسبه شدند. یافته‏ها: ترکیب بهینه‏ای که از آزمون گاما به دست آمد برای مدل‏سازی هر دو روش استفاده شد. این ترکیب شامل پارامترهای درصد شن، سیلت، رس، درصد مواد خنثی شونده، هدایت الکتریکی و جرم مخصوص ظاهری خاک بود. مدل M5P، پارامتر جرم مخصوص ظاهری خاک را به عنوان مهمترین متغیر دسته‏بندی‏کننده انتخاب کرد و سه رابطه خطی برای برآورد هدایت هیدرولیکی اشباع با توجه به مقدار جرم مخصوص ظاهری ایجاد کرد. معیارهای ارزیابی نشان دادند که این مدل با جذر میانگین مربعات خطای 89/23 سانتی‏متر بر روز و میانگین قدر مطلق خطای 50/20 درصد، دقت بالایی در پیش‏بینی هدایت هیدرولیکی اشباع نداشت. استفاده از دو نوع تابع وزن‏دهی تاثیری بر بهبود نتایج مدل IBk نداشتند. مدل IBk نیز با جذر میانگین مربعات خطای 23/31 سانتی‏متر بر روز و میانگین قدر مطلق خطای 24/23 درصد دقت بالایی نداشت. نتیجه‏گیری: برای برآورد هدایت هیدرولیکی اشباع، درخت تصمیم مدل مناسبتری نسبت به مدل یادگیری برپایه نمونه بود، همچنین این مدل اطلاعاتی از ساختار خاک تحت بررسی نیز به دست داد.

Keywords