Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi) (Dec 2018)
Pengaruh Normalisasi Teks Dengan Text Expansion Dalam Deteksi Komentar Spam Pada Youtube
Abstract
Popularitas Youtube sebagai website berbagi video terbesar di dunia memberikan celah kepada spammer untuk mendapatkan keuntungan dari Youtube dengan cara yang ilegal. Salah satu cara yang dilakukan adalah melakukan komentar spam pada video-video yang ada di Youtube. Komentar spam menjadi hal yang sangat meresahkan pemilik channel. Varian komentar spam kian banyak dan menyulitkan untuk dideteksi oleh Youtube. Peneliti melakukan evaluasi beberapa metode klasifikasi dengan menerapkan normalisasi teks pada tahap praproses menggunakan metode TextExpansion untuk mengatasi masalah ini. Dataset yang diuji adalah dataset Youtube Spam Collections dari UCI Machine Learning Library yang terdiri dari 5 dataset dari komentar yang diekstrak dari video Psy, Katy Perry, LMFAO, Eminem dan Shakira. Dataset terdiri dari 1005 komentar spam dan 951 komentar bukan spam. Hasil evaluasi menunjukkan TextExpansion mampu menghasilkan nilai akurasi tertinggi 90.23%. Untuk mengetahui pengaruh penerapan metode TextExpansion, peneliti melakukan uji beda t-test pada setiap dataset. Hasil uji beda t-test pada setiap dataset menunjukkan nilai P(T<=t) two-tail < 0.05 yang menunjukkan adanya pengaruh yang signifikan setelah diterapkan normalisasi teks menggunkan metode TextExpansion.
Keywords