Otomatisasi Pembangkitan Pertanyaan untuk Bahasa Indonesia (Systematic Literature Review)

Mohammad Farid Naufal; Selvia Ferdiana Kusuma

doi:10.25126/jtiik.20231016455

Jurnal Teknologi Informasi dan Ilmu Komputer (Feb 2023)

Otomatisasi Pembangkitan Pertanyaan untuk Bahasa Indonesia (Systematic Literature Review)

Mohammad Farid Naufal,
Selvia Ferdiana Kusuma

Affiliations

Mohammad Farid Naufal: Universitas Surabaya, Surabaya
Selvia Ferdiana Kusuma: Politeknik Elektronika Negeri Surabaya, Surabaya

DOI: https://doi.org/10.25126/jtiik.20231016455
Journal volume & issue: Vol. 10, no. 1

Abstract

Read online

Penelitian tentang otomatisasi pembangkitan pertanyaan terus berkembang. Berbagai metode telah coba diterapkan pada berbagai bahasa. Setiap bahasa memiliki karakteristik yang berbeda beda. Oleh karena itu, metode yang digunakan untuk membangkitkan pertanyaan juga harus disesuaikan dengan bahasa yang digunakan. Otomatisasi pembangkitan pertanyaan untuk bahasa Indonesia juga sudah mulai berkembang sejak 2015. Hasil penelitian-penelitian tersebut perlu dianalisis agar dapat mengetahui kelebihan maupun kekurangan dari setiap metode yang pernah digunakan. Oleh karena itu, jurnal ini membahas tentang Systematic Literature Review (SLR) pembangkitan pertanyaan pada bahasa Indonesia. SLR yang dibangun ini dapat digunakan untuk bahan pertimbangan optimalisasi penelitian tentang pembangkitan pertanyaan menggunakan bahasa Indonesia di kemudian hari. Tahapan yang dilakukan dalam pembentukan SLR adalah perencanaan literature review, kemudian melakukan literature review dan terakhir adalah pelaporan hasil literature review. Pencarian pada google scholar menghasilkan 27 penelitian yang relevan dengan kata kunci. Penerapan kriteria inklusi dan eksklusi menghasilkan 15 penelitian yang relevan. Kemudian proses backward dan forward snowballing yang dilakukan menghasilkan 2 penelitian tambahan. Total penelitian yang dianalisis berjumlah 17 penelitian. Proses selanjutnya adalah penilaian kualitas penelitian. Hasil penilaian kualitas penelitian menunjukkan bahwa keseluruhan penelitian yang berjumlah 17 penelitian tersebut memiliki kualitas yang baik untuk dianalisis. Hasil analisis yang dilakukan menunjukkan bahwa penelitian awal terkait pembangkitan pertanyaan untuk bahasa Indonesia masih memiliki beberapa celah. Diantaranya terkait dataset yang belum memadai, model pertanyaan yang kurang beragam, belum adanya penanganan/preproses model kalimat unstructured, dan belum adanya pembangkitan pertanyaan yang berasal dari gabungan beberapa informasi. Abstract Research on automated question generation is constantly evolving. Various methods have been tried to be applied in various languages. Each language has different characteristics. Therefore, the method used to generate questions should be adapted based on the language. The automation of question generation for Indonesian has also begun to develop since 2015. The result of these studies need to be analyzed to find out the advantages and disadvantages of each method that has been used. Therefore, this journal discusses the Systematic Literature Review (SLR) for generating questions in Indonesian. The SLR that was built can be used for consideration of optimizing research on generating questions using Indonesian in the future. The steps taken in this SLR are planning analysis, then carrying out the analysis and finally reporting the analysis. A search on Google Scholar yielded 27 studies that were relevant to the keyword. The application of inclusion and exclusion criteria resulted in 15 relevant studies. Then the backward and forward snowballing processes carried out resulted in 2 additional studies. Total research analyzed amounted to 17 studies. The next process is the assessment of research quality. The results of the research quality assessment showed that the overall 17 studies had good quality for analysis. The results of the analysis carried out indicate that the initial research related to question generation for Indonesian still has some gaps. For examples about datasets, question models, handling unstructured sentence models, and generating questions from a combination of some information.

Published in Jurnal Teknologi Informasi dan Ilmu Komputer

ISSN: 2355-7699 (Print); 2528-6579 (Online)
Publisher: University of Brawijaya
Country of publisher: Indonesia
LCC subjects: Technology: Technology (General): Industrial engineering. Management engineering: Information technology
Website: http://jtiik.ub.ac.id

About the journal