Tikrit Journal of Administrative and Economic Sciences (Sep 2021)

استخدام السلاسل الزمنية لمخرجات التحليل العنقودي مع التطبيق العملي

  • Sumeya Ali Hussien,
  • Wakae Ali Hadba

DOI
https://doi.org/10.25130/tjaes.17.55.3.29
Journal volume & issue
Vol. 17, no. 55, 3

Abstract

Read online

يعد التحليل العنقودي في بيانات السلاسل الزمنية من الموضوعات المهمة في تحليل البيانات وايجاد اتجاهات متشابهة في السلاسل الزمنية الذي يمثل تحديا كبيرا في مختلف المجالات ازداد الاهتمام بدراسة عنقدة بيانات السلاسل الزمنية منقبل العلماء حيث اثبتت فعالياتها في توفير معلومات مهمة في مختلف المجالات استهدف البحث بصورة أساسية عملية العنقدة لبيانات السلاسل الزمنية لتسهيل التنبؤ للعناقيد المتكونة واستغلال الوقت والجهد، تم استخدام عنقدة بيانات السلاسل الزمنية في مجالات علمية متنوعة لاكتشاف الأنماط التي تمكن محللي البيانات من استخراج معلومات قيمة من مجـموعة بيـانات معقـدة وضـخمة ويتـم تجمـيع (عنقـدة) المجـموعات المتجانسـة معـا علـى أسـاس مقـياس تشـابه معـين. واستخـدمت البيـانات الشـهرية لإنتاجـية الطـاقة الكـهربائية فـي كركـوك لدراسـة السـلوكية الزمنيـة لهـا، تـم استخـدام طـريقة العنقـدة الهرميـة Hierarchical Clustering Method والطريقة المعتمدة في طريقة الربط هي طريقة الربط الهرمية طريقة وورد (ward’s method) بالاعتماد على مصفوفة التشابه واعتمدنا على مقياس مسافة القطاع مسافة منهاتن City-block (manhaten) distance لإيجاد مصفوفة التشابه بين العناقيد وبغية الوصول الى مجموعات (عناقيد) متجانسة التي تجمعها صفات مشتركة بالاعتماد على انتاجيتها، تستخدم العنقدة الهرمية التجميعية ورسم المخطط الشجري والتنبؤ بالقيم المستقبلية لإنتاجية العناقيد. ان اهم النتائج التي توصل اليها البحث هي تكوين أربعة عناقيد وبناء نموذج سلاسل زمنية لكل عنقود، ومـن خـلال تحـليل السلسـلة تبيـن انهـا غيـر مسـتقرة وغيـر عشـوائية ولغـرض تحـقيق الاستقـرارية والعشـوائية تـم اجـراء التحـويلات اللازمـة، واستخـدام معـايير المفاضـلة (Akaik, Information Criteria: AIC) (Schwartz Bayesian Criteria: SBIC) (Hanna-Quinn Criterion: H-Q) (Root Mean Sguare Error: RMSE) لتشخيص النـمـاذج المـعـنـويـة لاخـتــيـار النـمــوذج الـمـلائــم والـكـفــؤ، التـنـبـؤ للعـنــقــود الأول بالنـمــوذج ARIMA (0,1,1)، النـمــوذج الــذي تــم اسـتـخـدامـه للـعــنـقــود الثــانــي هـــو SARIMA (2,0,0)x(1,1,2)12، العنقود الثالث بسبب توقف الوحدات عن الإنتاج منذ سنة 2014 ولحد الان الوحدات معطلة أي انها لا تنتج الكهرباء أساسا لترك اعمال التأهيل فأن القيم المستقبلية المتنبئ بها هنا تكون صفر، العنقود الرابع تم استخدام النموذج ARIMA (2,1,0) وكانت التنبؤات جيدة وقريبة من الواقع للفترة من تشرين الثاني 2020 لغاية تشرين الثاني 2022 لمدة سنتين.

Keywords