Jurnal Teknologi Informasi dan Ilmu Komputer (Dec 2024)
Analisis Sentimen Berbahasa Inggris Dengan Metode Lstm Studi Kasus Berita Online Pariwisata Bali
Abstract
Semaikin berkembangnya pariwisata di Bali, persepsi terhadap berita yang beredar tentang pariwisata menjadi faktor penting yang memengaruhi citra destinasi wisata tersebut. Namun, analisis sentimen terhadap berita pariwisata berbahasa Inggris seringkali menghadapi tantangan, terutama karena kompleksitas bahasa dan ketidakseimbangan data sentimen. Penelitian ini bertujuan untuk memperdalam pemahaman mengenai tren dan isu terkini yang berhubungan tentang industri pariwisata Bali melalui analisis sentimen berdasarkan konten berita. Fokus utama penelitian adalah pada berita pariwisata Bali yang diunggah dalam portal media online internasional, khususnya dari Australia dan Inggris. Analisis sentimen dilakukan menggunakan model machine learning LSTM (Long-Term Memory), dengan data berita yang telah diberi label sentimen oleh pakar sesuai dengan isi berita. Pembagian dataset optimal adalah 90% untuk data pelatihan dan 10% untuk data pengujian. Hasil penelitian menunjukkan bahwa model LSTM berhasil mencapai tingkat akurasi sebesar 81,36%. Selanjutnya, untuk mengidentifikasi pola topik yang tersembunyi dan mengelompokkan berita dengan topik atau isu serupa, digunakan metode LDA (Latent Dirichlet Allocation). Penelitian ini mengungkap bahwa jumlah topik yang ideal bervariasi tergantung pada nilai kohesi yang diperoleh dari sentimen data yang digunakan. Implikasi temuan ini dapat memberikan wawasan lebih dalam tentang persepsi dan respon terhadap berita pariwisata Bali, sekaligus menunjukkan potensi aplikasi model machine learning dan metode LDA dalam analisis tren industri pariwisata. Abstract As tourism in Bali continues to grow, perceptions of news circulating about tourism have become an important factor influencing the image of the tourist destination. However, sentiment analysis of English-language tourism news often faces challenges, especially due to the complexity of the language and the imbalance of sentiment data. This research aims to deepen understanding of the latest trends and issues related to the Bali tourism industry through sentiment analysis based on news content. The main focus of the research is on Bali tourism news uploaded on international online media portals, especially from Australia and England. Sentiment analysis is carried out using the LSTM (Long-Term Memory) machine learning model, with news data that has been labeled with sentiment by experts according to the content of the news. The optimal dataset division is 90% for training data and 10% for testing data. The research results show that the LSTM model succeeded in achieving an accuracy level of 81.36%. Furthermore, to identify hidden topic patterns and group news with similar topics or issues, the LDA (Latent Dirichlet Allocation) method is used. This research reveals that the ideal number of topics varies depending on the cohesion value obtained from the sentiment data used. The implications of these findings can provide deeper insight into perceptions and responses to Bali tourism news, as well as showing the potential application of machine learning models and LDA methods in analyzing tourism industry trends.