المجلة العراقية للعلوم الاحصائية (Dec 2023)

التحقيق النظري للنماذج في خوارزمية تخفيض الأبعاد متعددة العوامل المعممة للأنماط الظاهرية الترتيبية

  • محمد ابراهيم عثمان,
  • زيد الخالدي

DOI
https://doi.org/10.33899/iqjoss.2023.0181255
Journal volume & issue
Vol. 20, no. 2
pp. 212 – 224

Abstract

Read online

تشير الدراسات السريرية إلى العلاقة الوثيقة بين بعض الأمراض ووجود تداخلات محددة بين العوامل الجينية وكما هو الحال في كثير من الدراسات، فإن كشف التداخلات الجينية ذات التأثير الكبير على ظهور الأمراض الوراثية يحتاج إلى تحليلات احصائية مستفيضة. وبسبب الحجم الهائل للبيانات الجينية في الجنس البشري، فكان لا بد من تطوير طرق إحصائية مكيفة للتعامل مع البيانات الابعاد العالية. تعد خوارزمية تخفيض الأبعاد متعددة العوامل Multifactor Dimensionality Reduction (MDR) أحد الخوارزميات اللامعلمية الرائدة في هذا المجال. حيث تعمل الخوارزمية على تخفيض أبعاد البيانات الجينية للحصول على أهم تداخل ذات تأثير مباشر على زيادة احتمالية ظهور الأمراض الوراثية. وتعتمد الخوارزمية في تكوينها على مجموعة من الإجراءات اللامعلمية لتشخيص التداخل الجيني الأعلى تأثيراً على متغيرات الاستجابة الثنائية حصراً. وكأي طريقة إحصائية، فإن هذه الخوارزمية لا تخلو من نقاط الضعف والمحددات التطبيقية، لذا كان لا بد من تطوير الخوارزمية لتجاوز المعوقات. أحد نقاط الضعف في هذه الخوارزمية هي عدم إمكانية الخوارزمية من التعامل مع البيانات التي تحتوي على متغير استجابة من النوع الترتيبي. طور بعض الباحثين تعميماً لخوارزمية تخفيض الأبعاد متعددة العوامل لتمكينها من العامل مع البيانات الترتيبي. مع ذلك فإن الخوارزمية المعممة أكثر تعقيداً من الخوارزمية الأصلية. لذلك اقترحنا تطوير الخوارزمية المعممة تطويراً بسيطاً وذلك بتوظيف الانحدار اللوجستي الترتيبي في تصنيف الافراد في العينة، مع الإبقاء على جميع خطوات الخوارزمية الأصلية دون تغيير. ومن ناحية أخرى، فإن خوارزمية MDR تعتمد اسلوباً لا معلمياً للتحقق من معنوية التداخلات المرشحة في الخوارزمية. وينبني هذا الاجراء اللامعلمي على فكرة الاختبارات التباديلية، وهو يستهلك وقتاً زمنياً طويلاً جداً مقارنة بالإجراءات المعلمية المعتمدة على الأساليب النظرية. اقترح بعض الباحثين استخدام توزيع القيمة المتطرفة المعمم للتحقق من المعنوية الإحصائية للتداخلات المرشحة، لكن لم يرد استخدام هذا الأسلوب الا مع المتغيرات المعتمدة المستمرة والثنائية. تم في هذا البحث توظيف الاسلوب النظري المعتمد على توزيع القيمة المتطرفة المعمم بدلا من الاختبارات التباديلية المعتمدة في الخوارزمية وذلك عندما يكون متغير الاستجابة من النوع الترتيبي.

Keywords