Natural Language Processing untuk Otomatisasi Pengenalan Pronomina dalam Kalimat Bahasa Indonesia

Mohammad Farid Naufal; Selvia Ferdiana Kusuma

doi:10.25126/jtiik.2022946394

Jurnal Teknologi Informasi dan Ilmu Komputer (Oct 2022)

Natural Language Processing untuk Otomatisasi Pengenalan Pronomina dalam Kalimat Bahasa Indonesia

Mohammad Farid Naufal,
Selvia Ferdiana Kusuma

Affiliations

Mohammad Farid Naufal: Universitas Surabaya, Surabaya
Selvia Ferdiana Kusuma: Politeknik Elektronika Negeri Surabaya, Surabaya

DOI: https://doi.org/10.25126/jtiik.2022946394
Journal volume & issue: Vol. 9, no. 5

Abstract

Read online

Pronomina (kata ganti) adalah jenis kata yang dapat dipakai untuk menggantikan posisi kata benda atau orang dalam suatu kalimat. Penggunaan pronomina akan mudah dipahami apabila serangkaian kalimat dibaca secara utuh. Namun jika rangkaian kalimat tersebut hanya dibaca pada kalimat-kalimat tertentu, maka akan sulit memahami kalimat yang memiliki pronomina. Pada pengolahan bahasa alamiah, diperlukan kejelasan konteks dari sebuah kalimat. Dalam konteks otomatisasi pengolahan bahasa alamiah, adanya pronomina dapat menyulitkan komputer untuk memahami kalimat tersebut. Oleh sebab itu, dalam pengolahan bahasa alamiah yang mengandung pronomina diperlukan pre proses berupa pengubahan pronomina ke dalam bentuk subjek atau objek asli yang dirujuk. Metode yang diusulkan untuk menyelesaikan permasalahan ini adalah pendekatan berbasis sintaktik. Pendekatan ini menitikberatkan pada struktur kata yang digunakan dan struktur komponen kata yang digunakan. Metode yang diusulkan memiliki 4 tahapan yakni pengumpulan data, pembangkitan aturan, otomatisasi pengenalan pronominal, dan terakhir adalah evaluasi. Metode yang diusulkan telah diujicobakan untuk mengenali adanya pronomina dari kalimat-kalimat pada materi Ilmu Pengetahuan Alam dan Ilmu Pengetahuan Sosial di jenjang sekolah dasar. Hasil evaluasi menunjukkan bahwa metode yang diusulkan dapat digunakan untuk mengubah subjek yang berbentuk pronomina menjadi subjek atau objek asli yang dirujuk. Rata-rata akurasi yang didapatkan sebesar 81%. Akurasi tersebut didapatkan dari perbandingan antara jumlah kata ganti yang berhasil diidentifikasi subjeknya dengan keseluruhan data uji. Hasil dari penelitian ini dapat digunakan peneliti di bidang Natural Language Processing untuk melakukan praproses terhadap teks yang akan diolah. Abstract A pronoun is a word that can be used to replace a noun or person in a sentence. The use of pronouns will be easy to understand if a series of sentences is read in its entirety. However, if the sentence series is only read in specific sentences, it will be difficult to understand sentences with pronouns. In natural language processing, it is necessary to clarify the context of a sentence. In the context of automation of natural language processing, the existence of pronouns can make it difficult for computers to understand the sentence. Therefore, in processing natural language containing pronouns, it is necessary to pre-process in the form of converting pronouns into the form of the original subject or object referred to. The method proposed to solve this problem is a syntactic-based approach. This approach focuses on the structure of the words used and the word components used. The proposed method has 4 stages, namely data collection, rule generation, automation of pronoun recognition and the last is evaluation. The proposed method has been evaluated to identify the existence of pronouns from sentences in the Natural Sciences and Social Sciences material at the elementary school level. The evaluation results show that the proposed method can be used to change the subject in the form of a pronoun into the original subject or object referred to. The average accuracy obtained is 81%. The accuracy is obtained from the comparison between the number of pronouns that have been identified with the overall test data. Researchers in natural language processing can use the results of this study to pre-process their text.

Published in Jurnal Teknologi Informasi dan Ilmu Komputer

ISSN: 2355-7699 (Print); 2528-6579 (Online)
Publisher: University of Brawijaya
Country of publisher: Indonesia
LCC subjects: Technology: Technology (General): Industrial engineering. Management engineering: Information technology
Website: http://jtiik.ub.ac.id

About the journal