Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI

M. Irfan Raif; Nuraisa Novia  Hidayati; Tekad  Matulatan

doi:10.25126/jtiik.20241127404

Jurnal Teknologi Informasi dan Ilmu Komputer (Aug 2024)

Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI

M. Irfan Raif,
Nuraisa Novia Hidayati,
Tekad Matulatan

Affiliations

M. Irfan Raif: Universitas Maritim Raja Ali Haji, Tanjung Pinang
Nuraisa Novia Hidayati: Badan Riset dan Inovasi Nasional, Jakarta
Tekad Matulatan: Universitas Maritim Raja Ali Haji, Tanjung Pinang

DOI: https://doi.org/10.25126/jtiik.20241127404
Journal volume & issue: Vol. 11, no. 2

Abstract

Read online

Penelitian ini mengembangkan sistem deteksi otomatis kata-kata baku dan non-baku pada data Twitter berbasis Kamus Besar Bahasa Indonesia (KBBI). Twitter merupakan platform media sosial yang populer, namun sering kali digunakan dengan kata-kata tidak baku yang mengganggu komunikasi. Normalisasi kata-kata tidak baku diperlukan untuk pemrosesan dan analisis tweet. Penelitian sebelumnya menggunakan metode Levenshtein Distance dan pengklasifikasi Naïve Bayes, serta Term Based Random Sampling dalam proses Stopword Removal. Preprocessing penting dalam klasifikasi teks di media sosial. Penelitian ini fokus pada preprocessing dan deteksi kata-kata baku dan non-baku pada data Twitter menggunakan KBBI. Sistem otomatis ini membantu peneliti mencari kata-kata non-baku atau slang dengan mudah, meningkatkan kualitas komunikasi, dan pemahaman pesan di data Twitter yang mencerminkan tren bahasa yang berkembang. Penelitian ini juga memperkenalkan pendekatan yang terstruktur untuk mengotomatisasi deteksi kata-kata baku dan non-baku, dengan langkah-langkah yang meliputi pengumpulan data, preprocessing data, identifikasi bahasa tidak baku, penghapusan kata berimbuhan, dan identifikasi kata slang. Metode ini mendukung analisis sentimen dalam text mining dan memastikan hasil klasifikasi sentimen yang lebih akurat dalam data Twitter. Berdasarkan pengujian, langkah-langkah preprocessing meningkatkan performa metode penentuan polarity dengan accuracy InSet sebesar 66,66% dan F1-score sebesar 61,40%.

Published in Jurnal Teknologi Informasi dan Ilmu Komputer

ISSN: 2355-7699 (Print); 2528-6579 (Online)
Publisher: University of Brawijaya
Country of publisher: Indonesia
LCC subjects: Technology: Technology (General): Industrial engineering. Management engineering: Information technology
Website: http://jtiik.ub.ac.id

About the journal