Науковий вісник НЛТУ України (Sep 2024)

Інноваційні методики інтегрування даних для оптимізації процесу наповнення сховища даних

  • Р. Б. Юринець,
  • І. Б. Пірко

DOI
https://doi.org/10.36930/40340614
Journal volume & issue
Vol. 34, no. 6

Abstract

Read online

Проаналізовано та оцінено альтернативні методики інтегрування даних, що не потребують класичного ETL-підходу (англ. Extract, Transform, Load). Основну увагу приділено вивченню обмежень традиційного ETL, зокрема аналізу проблем, з якими стикаються організації через їх складність та витрати, пов'язані з традиційними ETL-процесами. Проаналізовано платформи, які дають змогу інтегрувати та наповнювати сховища даних без потреби писати складний код. Окремо розглянуто, як ці системи дають можливість швидше та ефективніше реагувати на зміни в даних і бізнес-вимогах. Зосереджено увагу на стратегіях і технологіях для інкрементного завантаження даних, які можуть значно зменшити навантаження та витрати на ресурси порівняно з повним перезавантаженням даних. Також проаналізовано, як ці методи допомагають утримувати дані актуальними без постійного повного оновлення сховища. Це дослідження сприяє детальному розумінню сучасних інструментів і методів, які роблять процес оптимізації наповнення сховища даних більш ефективним та доступним для широкого кола організацій, зокрема і тих, що не мають значних технічних ресурсів. Також підкреслено значення наявності кваліфікованих розробників і їхній вплив на загальні витрати проєкту, що не може бути недооцінений. Роль якісної комунікації між командами розробників, дата аналітиків і бізнес-користувачів є критичною для успішної реалізації проєктів з інтегрування даних. Ефективний обмін інформацією та чітке визначення бізнес-вимог відіграють ключову роль у синхронізації та оптимізації процесів завантаження та оброблення даних, що в остаточному підсумку веде до кращого рівня обслуговування та зменшення часу реакції на зміни у бізнес-середовищі. Результати дослідження демонструють, що впровадження технологій Incremental Data Loading та CDC (англ. Change Data Capture) у великій роздрібній компанії значно покращило тривалість завантаження даних та оперативність бізнес-процесів. Порівнюючи результати впровадження з інших галузей, з'ясовано, що методики Incremental Data Loading мають універсальний характер, але потребують індивідуального підходу залежно від сектора застосування. Обговорення рекомендацій для компаній, що розглядають адаптацію цього підходу, має значний потенціал для покращення ефективності роботи, зниження витрат та підвищення якості обслуговування клієнтів, особливо у роздрібному секторі.

Keywords