Comparing text classification algorithms with n-grams for mediation prediction

Retzi Y. Lewu; Kusrini Kusrini; Ainul Yaqin

doi:10.22146/ijccs.93929

IJCCS (Indonesian Journal of Computing and Cybernetics Systems) (Apr 2024)

Comparing text classification algorithms with n-grams for mediation prediction

Retzi Y. Lewu,
Kusrini Kusrini,
Ainul Yaqin

Affiliations

Retzi Y. Lewu
Kusrini Kusrini
Ainul Yaqin

DOI: https://doi.org/10.22146/ijccs.93929
Journal volume & issue: Vol. 18, no. 2

Abstract

Read online

Tingkat keberhasilan mediasi perkara perdata di pengadilan negeri dari tahun ke tahun sangat rendah dan menyebabkan penumpukan perkara yang harus ditangani dengan persidangan. Sementara itu, pendaftaran perkara baru dengan klasifikasi perkara serupa terus bermunculan dan wajib dimediasi. Penelitian ini dilakukan dengan memanfaatkan data mediasi perkara terdahulu sebagai dataset untuk memprediksi hasil mediasi perkara baru. Ketika n-gram digunakan pada dataset yang telah di-preprocessing, hanya ditemukan nilai pada unigram (n=1). Pada penerapan model menggunakan algoritma machine learning, dihasilkan akurasi yang sama sebesar 0.6875 pada Algoritma Naïve Bayes, Logistic Regression dan Support Vector Machine (SVM), sedangkan algoritma Decision tree menghasilkan akurasi paling rendah sebesar 0,375. Rendahnya nilai dikarenakan Decision Tree lebih cenderung overfit untuk digunakan dengan teks berbahasa Indonesia. Pola kalimat formal pada dokumen mediasi berbahasa Indonesia tidak memenuhi unsur – unsur kata majemuk, imbuhan, variasi susunan kata, dan semantik leksikal. Untuk penelitian selanjutnya direkomendasikan penggunaan algoritma klasifikasi lain, pemanfaataannya pada dokumen – dokumen lain seperti putusan pengadilan, penentuan rangking mediator berdasarkan keberhasilan mediasi serta implementasi model pada aplikasi e-mediasi yang terintegrasi dengan sistem informasi manajemen perkara

algoritma klasifikasi teks, n-gram, prediksi hasil mediasi

Published in IJCCS (Indonesian Journal of Computing and Cybernetics Systems)

ISSN: 1978-1520 (Print); 2460-7258 (Online)
Publisher: Universitas Gadjah Mada
Country of publisher: Indonesia
LCC subjects: Science: Science (General): Cybernetics; Science: Mathematics: Instruments and machines: Electronic computers. Computer science
Website: https://jurnal.ugm.ac.id/ijccs

About the journal

Abstract

Keywords