Analiza porównawcza możliwości i ograniczeń wykorzystania silników Apache Flink, Apache Spark oraz Apache Storm w strumieniowym przetwarzaniu danych

Tomasz Waksmundzki; Dariusz Chaładyniak

doi:10.26348/znwwsi.31.7

Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki (Dec 2024)

Analiza porównawcza możliwości i ograniczeń wykorzystania silników Apache Flink, Apache Spark oraz Apache Storm w strumieniowym przetwarzaniu danych

Tomasz Waksmundzki,
Dariusz Chaładyniak

Affiliations

Tomasz Waksmundzki
Dariusz Chaładyniak

DOI: https://doi.org/10.26348/znwwsi.31.7
Journal volume & issue: Vol. 18, no. 31
pp. 7 – 40

Abstract

Read online

Artykuł przedstawia analizę porównawczą trzech silników do przetwarzania strumieniowego danych: Apache Flink, Apache Spark i Apache Storm. Obejmuje ona kryteria porównawcze, takie jak: architektura, interfejsy, tryby przetwarzania, tryby uruchomieniowe, niezawodność, skalowalność, wydajność, źródła i ujścia danych. W ramach badań przeprowadzono serię eksperymentów, w których każdy silnik był testowany w czasie rzeczywistym podczas realizacji zadania detekcji anomalii w pomiarach parametrów środowiskowych. Eksperymenty obejmowały analizę wpływu liczby czujników, rozmiaru okna agregującego oraz obciążenia systemu na opóźnienia w generowaniu ostrze-żeń, zużycie zasobów (CPU, pamięć RAM) i liczbę wygenerowanych ostrzeżeń przez każdy z silników. Wnioski z badań dostarczają informacji na temat efektywności i przydatności każdego z analizowanych silników w kontekście przetwarzania strumieniowego danych, zwłaszcza w zastosowaniach związanych z detekcją anomalii środowiskowych.

Published in Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki

ISSN: 1896-396X (Print); 2082-8349 (Online)
Publisher: Warsaw School of Computer Science
Country of publisher: Poland
LCC subjects: Science: Mathematics: Instruments and machines: Electronic computers. Computer science
Website: http://zeszyty-naukowe.wwsi.edu.pl/

About the journal

Abstract

Keywords