KPI Science News (Dec 2021)

ПОРІВНЯЛЬНИЙ АНАЛІЗ МОДЕЛЕЙ ГЛИБОКИХ НЕЙРОННИХ МЕРЕЖ ДЛЯ ПРОГНОЗУВАННЯ ДІАГНОЗУ COVID-19

  • Nadezhda I. Nedashkovskaya,
  • Oleksandr O. Sapelnikov

DOI
https://doi.org/10.20535/kpisn.2021.3.251462
Journal volume & issue
no. 3

Abstract

Read online

Проблематика. Ситуація з коронавірусом COVID-19 станом на середину 2021 року знову викликає занепокоєння у всьому світі через появу нового небезпечнішого штаму “Дельта”. Науковці намагаються побудувати математичні моделі опису поширення захворюваності. У Китаї, США й інших країнах розробляють інструменти штучного інтелекту, спрямовані на прогнозування діагнозу COVID-19, і впроваджують їх у лікарнях. Мета дослідження. Порівняти розпізнавання різними моделями глибоких згорткових нейронних мереж хвороби COVID-19 на основі рентген-зображень грудної клітки людини. Методика реалізації. Моделі побудовано на основі архітектур мереж VGG16, ResNet50 і SqueezeNet із додаванням шарів для регуляризації цих мереж. Перед останнім, вихідним шаром мережі додавали шар дропауту. Навчання моделей здійснювали з використанням технології передачі знань transfer learning. Якість моделей оцінювали за матрицею помилок (confusion matrix), показниками точності (precision), повноти (recall/sensitivity), специфічності (specificity) і F-міри на валідаційній/тестовій множині рентген-зображень. Результати дослідження. Побудовано кілька моделей нейронних мереж, що поділяють рентген-зображення грудної клітки людини на класи: хворий на COVID-19 (клас 1) або здоровий (клас 2). Модель на основі архітектури ResNet50 отримала досить велике значення precision 96 % для класу 1 і загальне значення specificity 96,14 %. Recall виявлення захворювання на основі цієї моделі склала 88 %. Модель на основі архітектури VGG-16 правильно класифікувала 100 % (експеримент 1) / 96 % (експеримент 2) хворих на COVID-19 із тестової вибірки. Значення precision для класу хворих і значення загальної specificity на основі цієї моделі, однак, були меншими й склали 89 % / 92 % і 88,46 % / 92,31 % відповідно для двох експериментів. Значення F-міри для моделей ResNet50 і VGG-16 були досить значними й рівними 92 і 94 %. Висновки. Моделі глибоких згорткових нейронних мереж показали обнадійливі результати прогнозування діагнозу COVID-19 і потребують досліджень. Прогнозування діагнозу за допомогою розробленого програмного продукту на основі цих моделей триває до однієї хвилини – це швидше, ніж тести RT-PCR (ПЛР із зворотною транскрипцією), які нині використовують для підтвердження захворювання.

Keywords