المجلة العراقية للعلوم الاحصائية (Dec 2023)
مقارنة بين أساليب الانحدار اللوجستي والشبكة العصبية الالتفافية و Kernel لتصنيف حركة الربداء الرشيقة
Abstract
ان بيانات السلاسل الزمنية تستخدم على نطاق واسع في العديد من المجالات ومنها بيانات الاحياء المجهرية. ومن الضروري معرفة كيفية تصنيف الفئة التي تنتمي اليها كل مشاهدة وذلك باستخدام أساليب تصنيف إحصائية وخوارزميات التعلم الآلي والتعلم العميق. تعتبر دراسة حركة بعض أنواع الديدان الاسطوانية كأحد أنواع الأحياء المجهرية ومنها الربداء الرشيقة Caenorhabditis Elegans (CE) من الأمور المهمة لتحديد الأفعال وتأثيرها على حياة الديدان. في هذه الدراسة تمثلت بيانات السلسلة الزمنية لحركة CE بزوايا حركتها الموجية التي ستكون حالة الدراسة. في هذا النوع من البيانات فإن صفة اللاخطية وكذلك عدم اليقين تعد من أكثر المشاكل التي قد تؤدي الى تصنيفات لا ترقى الى ان تكون دقيقة. سيتم استخدام الشبكة العصبية الالتفافية Convolutional Neural Network (CNN) كأحد تقنيات التعلم العميق ويعتبر أسلوب غير خطي يستخدم لتصنيف حركة CE كمتغير معتمد في الحالات الثنائية بناءا على صور زوايا الحركة الموجية كمتغير مستقل وان استخدامها سيؤدي الى نتائج دقيقة وذلك لانها أسلوب غير خطي ملائم للتعامل مع بيانات الدراسة لحل مشكلات عدم الخطية وكذلك فانه ملائم للتعامل مع مشكلة عدم اليقين من خلال التمثيل الصوري للبيانات الرقمية. كذلك تم استخدام الانحدار اللوجستي Logistic Regression (LR) وطريقة النواة Kernel أيضا لتصنيف زوايا حركة CE. وتمت الاستفادة من الانحدار الذاتي Auto Regressive (AR) بالاعتماد على رتبة نموذج الانحدار الذاتي AR(p) في تحديد هيكلية الأساليب المستخدمة. ومن خلال مقارنة النتائج بين الأساليب المستخدمة يتبين ان أسلوب CNN يتفوق على الأساليب الأخرى المستخدمة باستخدام مقاييس الدقة للتصنيف. ولذلك فمن الممكن استنتاج ان استخدام أسلوب CNN والذي يعتمد على التصنيف الصوري يؤدي الى نتائج تصنيفية دقيقة مقارنة بالاساليب الأخرى المعتمدة على التصنيف الرقمي.
Keywords