Сучасні інформаційні системи (Jul 2022)

МОДЕЛІ МАШИННОГО НАВЧАННЯ ДЛЯ ПЕРЕДБАЧЕННЯ КІЛЬКОСТІ ЗАХВОРІЛИХ НА COVID-19 В УКРАЇНІ ТА ІНДІЇ

  • Ganna Khoroshun,
  • Oleksandr Ryazantsev,
  • Mark Koverha,
  • Sergey Pokryshka

DOI
https://doi.org/10.20998/2522-9052.2022.2.03
Journal volume & issue
Vol. 6, no. 2

Abstract

Read online

Побудовані моделі передбачення кількості захворілих на COVID-19 з використанням методів машинного навчання. Побудовані моделі навчались на даних зібраних з різних офіційних джерел, включаючи Всесвітню Організацію Здоров’я, з початку епідемії до теперішнього часу. Для навчання моделей передбачення кількості захворілих на COVID-19 обрано Україну та Індію. Методами, що надали високу точність прогнозу для існуючих даних, виявились алгоритми лінійної регресії для України та градієнтного бустингу для Індії. Аналіз даних проводився за допомогою мови програмування Python, з використанням бібліотеки Sklearn, яка побудована на основі SciPy (Scientific Python). Крім того, використовувалась бібліотека алгоритму градієнтного бустингу XGboost. Для розробки моделі обрано багатофакторне прогнозування часових рядів з використанням у якості предикаторів запізнення часового ряду. Визначено характеристики, що враховуються при навчанні моделі, а саме: дата початку події, день тижня, номер тижня, місяць та інші. Проведено аналіз щодо визначення впливу цих параметрів на якість навчання моделі. Оцінені похибки моделей та точність прогнозу з найкращими показниками 0.83 для України та 0.75 для Індії. Побудовані моделі дозволяють передбачати епідеміологічну ситуацію в майбутньому, координувати дії у різних галузях охорони здоров'я та проводити обґрунтовані превентивні заходи на державному рівні.

Keywords