Journal of Electrical Engineering and Computer (Apr 2024)
Riset Jurnal Literatur : Penggunaan Metode Stemming Pada Bahasa Daerah Melayu-Ambon
Abstract
Stemming dalam bahasa Ambon merupakan tantangan yang signifikan karena lexiconnya yang luas, mencakup sekitar 127.000 kata dasar seperti yang tercatat dalam Kamus Besar Bahasa Indonesia. Hal ini disebabkan oleh kompleksitas stemming yang timbul dari tugas untuk mengekstrak kata-kata dasar dari kata-kata yang memiliki imbuhan, yang memerlukan penghapusan berbagai imbuhan seperti awalan, sisipan, akhiran, dan kombinasinya. Proses ini memiliki pentingan yang besar karena sangat memengaruhi kualitas hasil analisis. Untuk mengatasi kompleksitas linguistik ini, beberapa algoritma stemming telah dikembangkan. Algoritma-algoritma ini termasuk Nazief & Adriani, Enhanced Confix Stripping, Sastrawi, dan Tala, masing-masing menawarkan teknik unik untuk menangani kompleksitas stemming dalam bahasa Indonesia. Pemilihan algoritma yang tepat sangat penting untuk memastikan akurasi dan kehandalan proses stemming dalam kerangka analisis. Dalam penelitian stemming yang telah dilakukan, terdapat variasi dalam metode-metode yang digunakan. Algoritma stemming yang paling sering digunakan adalah Nazief & Adriani, dengan 17 kasus tercatat. Kemudian, Enhanced Confix Stripping juga cukup populer dengan 12 kasus. Sastrawi, meskipun dengan frekuensi yang lebih rendah, tetap digunakan dalam 4 kasus. Sedangkan algoritma Tala, meskipun jarang digunakan, tetap muncul dalam 1 kasus. Hal ini mencerminkan diversitas dan pilihan yang tersedia dalam memilih metode stemming yang sesuai dengan kebutuhan penelitian. Meskipun demikian, hal ini mungkin terkait dengan faktor-faktor seperti proyek penelitian yang sedang berlangsung, ketersediaan dana, atau kondisi eksternal lainnya yang memengaruhi produksi penelitian pada periode tersebut. Dengan demikian, penelitian tentang stemming tetap menjadi topik yang menarik dan relevan, dengan potensi untuk terus berkembang dan memberikan kontribusi yang berarti dalam pemrosesan teks dan penelitian linguistik di masa mendatang.
Keywords