Riset Jurnal Literatur : Penggunaan Metode Stemming Pada Bahasa Daerah Melayu-Ambon

Vinnesa Patricia Carolina; Ema Utami; Ainul Yaqin

doi:10.33650/jeecom.v6i1.8517

Journal of Electrical Engineering and Computer (Apr 2024)

Riset Jurnal Literatur : Penggunaan Metode Stemming Pada Bahasa Daerah Melayu-Ambon

Vinnesa Patricia Carolina,
Ema Utami,
Ainul Yaqin

Affiliations

Vinnesa Patricia Carolina: Universitas AMIKOM Yogyakarta
Ema Utami: Universitas AMIKOM Yogyakarta
Ainul Yaqin: Universitas AMIKOM Yogyakarta

DOI: https://doi.org/10.33650/jeecom.v6i1.8517
Journal volume & issue: Vol. 6, no. 1
pp. 186 – 196

Abstract

Read online

Stemming dalam bahasa Ambon merupakan tantangan yang signifikan karena lexiconnya yang luas, mencakup sekitar 127.000 kata dasar seperti yang tercatat dalam Kamus Besar Bahasa Indonesia. Hal ini disebabkan oleh kompleksitas stemming yang timbul dari tugas untuk mengekstrak kata-kata dasar dari kata-kata yang memiliki imbuhan, yang memerlukan penghapusan berbagai imbuhan seperti awalan, sisipan, akhiran, dan kombinasinya. Proses ini memiliki pentingan yang besar karena sangat memengaruhi kualitas hasil analisis. Untuk mengatasi kompleksitas linguistik ini, beberapa algoritma stemming telah dikembangkan. Algoritma-algoritma ini termasuk Nazief & Adriani, Enhanced Confix Stripping, Sastrawi, dan Tala, masing-masing menawarkan teknik unik untuk menangani kompleksitas stemming dalam bahasa Indonesia. Pemilihan algoritma yang tepat sangat penting untuk memastikan akurasi dan kehandalan proses stemming dalam kerangka analisis. Dalam penelitian stemming yang telah dilakukan, terdapat variasi dalam metode-metode yang digunakan. Algoritma stemming yang paling sering digunakan adalah Nazief & Adriani, dengan 17 kasus tercatat. Kemudian, Enhanced Confix Stripping juga cukup populer dengan 12 kasus. Sastrawi, meskipun dengan frekuensi yang lebih rendah, tetap digunakan dalam 4 kasus. Sedangkan algoritma Tala, meskipun jarang digunakan, tetap muncul dalam 1 kasus. Hal ini mencerminkan diversitas dan pilihan yang tersedia dalam memilih metode stemming yang sesuai dengan kebutuhan penelitian. Meskipun demikian, hal ini mungkin terkait dengan faktor-faktor seperti proyek penelitian yang sedang berlangsung, ketersediaan dana, atau kondisi eksternal lainnya yang memengaruhi produksi penelitian pada periode tersebut. Dengan demikian, penelitian tentang stemming tetap menjadi topik yang menarik dan relevan, dengan potensi untuk terus berkembang dan memberikan kontribusi yang berarti dalam pemrosesan teks dan penelitian linguistik di masa mendatang.

Published in Journal of Electrical Engineering and Computer

ISSN: 2715-0410 (Print); 2715-6427 (Online)
Publisher: LP3M Universitas Nurul Jadid
Country of publisher: Indonesia
LCC subjects: Technology: Electrical engineering. Electronics. Nuclear engineering
Website: https://ejournal.unuja.ac.id/index.php/jeecom

About the journal

Abstract

Keywords