Jurnal Teknologi Informasi dan Ilmu Komputer (Jun 2021)

Analisis Sentimen Ulasan Kedai Kopi Menggunakan Metode Naive Bayes dengan Seleksi Fitur Algoritme Genetika

  • Naziha Azhar,
  • Putra Pandu Adikara,
  • Sigit Adinugroho

DOI
https://doi.org/10.25126/jtiik.2021834436
Journal volume & issue
Vol. 8, no. 3
pp. 609 – 618

Abstract

Read online

Di era sekarang, kedai kopi tak hanya dikenal sebagai tempat berkumpul dan menyeruput kopi saja, tetapi kedai kopi telah menjadi tempat yang nyaman untuk belajar dan bekerja. Namun, tidak semua kedai kopi memiliki kualitas yang baik sesuai dengan apa yang diharapkan pelanggan. Ulasan tentang kedai kopi dapat membantu pemilik kedai kopi untuk mengetahui bagaimana respons mengenai produk dan pelayanannya. Ulasan tersebut perlu diklasifikasikan menjadi ulasan positif atau negatif sehingga membutuhkan analisis sentimen. Terdapat beberapa tahap pada penelitian ini yaitu pre-processing untuk pemrosesan ulasan, ekstraksi fitur menggunakan Bag of Words dan Lexicon Based Features, serta mengklasifikasikan ulasan menggunakan metode Naïve Bayes dengan Algoritme Genetika sebagai seleksi fitur. Data yang digunakan pada penelitian ini sebanyak 300 data dengan 210 data sebagai data latih dan 90 data sebagai data uji. Hasil evaluasi yang didapatkan dari klasifikasi Naïve Bayes dan seleksi fitur Algoritme Genetika yaitu accuracy sebesar 0,944, precision sebesar 0,945, recall sebesar 0,944, dan f-measure sebesar 0,945 dengan menggunakan parameter Algoritme Genetika terbaik yaitu banyak generasi = 50, banyak populasi = 18, crossover rate = 1, dan mutation rate = 0. Abstract In this era, coffee shops are not only known as a place to gather and drink coffee, but also have become a comfortable place to study and work. However, not all coffee shops are in good quality according to what customers expect. Coffee shop reviews can help coffee shop owners to find out the response to their products and services. These reviews need to be classified as positive or negative reviews so that sentiment analysis is needed. There are several steps in this study, which are pre-processing to process reviews, feature extraction using Bag of Words and Lexicon Based Features, also classifying reviews using the Naïve Bayes method with Genetic Algorithm as a feature selection. The data used in this study were 300 data with 210 data as training data and 90 data as test data. Evaluation results obtained from the Naïve Bayes classification and Genetic Algorithm feature selection are 0.944 for accuracy, 0.945 for precision, 0.944 for recall, and 0.945 for f-measure using the best Genetic Algorithm parameters which are many generations = 50, many populations = 18, crossover rate = 1, and mutation rate = 0.