Jurnal Teknologi Informasi dan Ilmu Komputer (Jul 2024)
Identifikasi Dini Curah Hujan Berpotensi Banjir Menggunakan Algoritma Long Short-Term Memory (Lstm) Dan Isolation Forest
Abstract
Curah hujan yang tinggi merupakan faktor utama yang dapat mengakibatkan banjir di suatu daerah. Pola curah hujan yang semakin tidak teratur dan peningkatan curah hujan ekstrem membuat pengendalian banjir semakin sulit. Identifikasi dini diperlukan untuk memahami peran curah hujan dalam manajemen sumber daya air dan perancangan infrastruktur air yang tangguh untuk daerah rawan banjir. Dengan keterbatasan data dan parameter input tunggal, model yang diusulkan menghadapi tantangan dalam forecasting pola curah hujan jangka panjang dan generalisasi data. Studi ini memproses data curah hujan BMKG untuk menghasilkan forecasting menggunakan Long Short-Term Memory (LSTM) berdasarkan pola data series dan hubungan jangka panjang. Algoritma Isolation Forest kemudian digunakan untuk mengidentifikasi secara otomatis curah hujan dengan potensi banjir. Probabilitas curah hujan tinggi diidentifikasi untuk menghitung ketahanan infrastruktur air dan menetapkan standar yang sesuai untuk daerah beriklim hujan dan rawan banjir. Prediksi LSTM dievaluasi menggunakan Mean Square Error (terbaik 19,11) dan Root Mean Square Error (terbaik 4,37) sebelum dilakukan forecasting jangka panjang. Model yang diusulkan bertujuan untuk membantu pemangku kepentingan secara cepat mengidentifikasi probabilitas curah hujan tinggi jangka panjang, khususnya di daerah Semarang. Abstract High rainfall is a key factor causing floods in an area. Increasingly irregular rainfall patterns and rising extreme rainfall make it more challenging to control floods. Early identification is needed to understand rainfall's role in water resource management and designing resilient water infrastructure for flood-prone areas. With limited data and single input parameters, the proposed model faces challenges in long-term rainfall pattern forecasting and data generalization. This study processes BMKG rainfall data to generate forecasts using Long Short-Term Memory (LSTM) based on data series patterns and long-term relationships. The Isolation Forest algorithm is then used to automatically identify rainfall with flood potential. The probability of high rainfall is identified to calculate water infrastructure resilience and set appropriate standards for rainy, flood-prone areas. LSTM predictions are evaluated using Mean Square Error (best 19.11) and Root Mean Square Error (best 4.37) before conducting long-term forecasting. The proposed model aims to help stakeholders quickly identify the probability of long-term high rainfall, particularly in the Semarang area.