JSiI (Jurnal Sistem Informasi) (Sep 2024)
PERBANDINGAN KINERJA PRE-TRAINED INDOBERT-BASE DAN INDOBERT-LITE PADA KLASIFIKASI SENTIMEN ULASAN TIKTOK TOKOPEDIA SELLER CENTER DENGAN MODEL INDOBERT
Abstract
Era digital telah membawa revolusi dalam dunia e-commerce dengan mengintegrasikan platform media sosial dan platform e-commerce, yang menghasilkan inovasi seperti aplikasi TikTok Tokopedia Seller Center. Aplikasi ini menggabungkan platform e-commerce dengan fitur media sosial, memungkinkan pengguna untuk mengelola penjualan sekaligus memperluas jangkauan pasar dan mempromosikan produk melalui video pendek yang interaktif pada platform media sosial TikTok. Dengan adanya inovasi fitur baru dalam aplikasi ini, penelitian ini melakukan analisis sentimen untuk memahami persepsi dan ulasan berbahasa Indonesia dari para pengguna aplikasi TikTok Tokopedia Seller Center menggunakan model deep learning IndoBERT. Data ulasan dikumpulkan menggunakan teknik scraping pada Google Play Store sebanyak 3.145 ulasan yang dilabeli secara manual menjadi 1.755 klasifikasi sentimen negatif dan 1390 klasifikasi sentimen positif. Tahapan preprocessing seperti teks cleaning, case folding, normalisasi teks, dan stopword removal dilakukan untuk memberihkan data teks sebelum digunakan untuk pelatihan model. Data yang sudah dibersihkan terbagi menjadi 64% data training sebesar 2.012 data, 16% data validation sebesar 504 data, dan 20% data testing sebesar 629 data. Dua varian pre-trained model IndoBERT, yaitu Indobert-base-p2 versi besar dan Indobert-lite-base-p2 versi lebih ringan digunakan dalam penelitian ini untuk pemrosesan bahasa alami khusus bahasa Indonesia. Hasil penelitian menunjukkan bahwa komparasi model IndoBERT dengan kedua pre-trained menunjukkan bahwa pre-trained Indobert-base-p2 mendapatkan hasil akurasi yang lebih unggul dibandingkan Indobert-lite-base-p2, dengan akurasi sebesar 97%, presisi sebesar 97%, recall sebesar 97%, dan f1-score sebesar 97%, sedangkan pre-trained Indobert-lite-base-p2 dengan akurasi sebesar 94%, presisi sebesar 94%, recall sebesar 94%, dan f1-score sebesar 94%.