Jurnal Teknologi Informasi dan Ilmu Komputer (Aug 2024)

Pengaruh Tahapan Preprocessing Terhadap Model Indobert Dan Indobertweet Untuk Mendeteksi Emosi Pada Komentar Akun Berita Instagram

  • Ulfia Khairani,
  • Viska Mutiawani,
  • Hendri Ahmadian

DOI
https://doi.org/10.25126/jtiik.1148315
Journal volume & issue
Vol. 11, no. 4

Abstract

Read online

Platform media sosial seperti Instagram telah membentuk ruang di mana berita dapat dengan mudah ditemukan dan menarik perhatian individu. Pada Instagram, dapat memberikan komentar-komentar terhadap berita yang telah dibaca. Pemahaman terhadap emosi yang mengiringi komentar-komentar yang telah diberikan pengguna pada postingan berita dapat membantu memahami bagaimana berita tersebut diserap, diinterpretasi, dan direspons oleh publik. Penelitian ini mengkategorikan empat emosi yaitu marah, senang, takut, dan sedih dengan menggunakan model terlatih IndoBERT dan IndoBERTweet. Penelitian ini bertujuan untuk membandingkan model IndoBERT dan IndoBERTweet dalam mendeteksi emosi pada komentar akun berita Instagram dan mengeksplorasi dampak penggunaan tahapan preprocessing khususnya remove stopwords dan stemming pada kedua model. Hasil penelitian menunjukkan bahwa model yang tidak melalui tahapan remove stopwords dan stemming menghasilkan kinerja yang lebih baik dibandingkan model yang melalui tahapan remove stopwords dan stemming, dengan perolehan akurasi sebesar 92,54% untuk model IndoBERTweet dan 88,81% untuk model IndoBERT. Abstract Social media platforms such as Instagram have created a space where news can be easily discovered and attract the attention of individuals. On Instagram, people can provide comments on the news they have read. Understanding the emotions that accompany the comments that users have given on news posts can help understand how the news is absorbed, interpreted and responded to by the public. This research categorizes four emotions, anger, happiness, fear and sadness, using pre-trained models IndoBERT and IndoBERTweet. This research aims to compare the IndoBERT and IndoBERTweet models in detecting emotions in Instagram news account comments and explore the impact of preprocessing stages, especially removing stopwords and stemming on both models. The research results showed that the model that did not go through the remove stopwords and stemming stages produced better performance than the model that went through the remove stopwords and stemming stages, with an accuracy of 92.54% for the IndoBERTweet model and 88.81% for the IndoBERT model.

Keywords