Journal of Electrical Engineering and Computer (Oct 2024)

Pengaruh Komposisi Split Data Terhadap Performa Akurasi Analisis Sentimen Algoritma Naïve Bayes dan SVM

  • Yoga Adi Prasetyo,
  • Ema Utami,
  • Ainul Yaqin

DOI
https://doi.org/10.33650/jeecom.v6i2.9188
Journal volume & issue
Vol. 6, no. 2
pp. 382 – 390

Abstract

Read online

Analisis sentimen merupakan bidang yang penting dalam pengolahan bahasa alami dan aplikasi sosial media modern. Penelitian ini menginvestigasi pengaruh dari variasi komposisi split data terhadap performa akurasi model analisis sentimen menggunakan SVM dan Naive Bayes. Metode eksperimen menggunakan variasi dari teknik k-fold cross-validation untuk membandingkan hasil dari berbagai proporsi pembagian data latih dan uji. Hasil eksperimen menunjukkan bahwa komposisi split data memiliki dampak signifikan terhadap performa akurasi kedua algoritma, dengan beberapa proporsi split data menghasilkan hasil yang lebih konsisten dan stabil dibandingkan dengan yang lain. Temuan ini memberikan wawasan yang berharga dalam pengaturan praktis untuk pelatihan model analisis sentimen yang lebih efektif dan andal. Teknik ekstraksi fitur yang digunakan Term Frequency-Inverse Document Frequency (TF-IDF), dengan algoritma klasifikasi Naive Bayes dan Support Vector Machine (SVM). Performa model dievaluasi menggunakan metrik seperti akurasi, presisi, recall, dan F1-score. Hasil penelitian menunjukkan bahwa signifikan model SVM dengan rasio 80:20 mencapai akurasi 76,66% dan F1-score 77 %, dibandingkan metode SVM dan Naïve Bayes dengan rasio lainnya.

Keywords