Jurnal Teknologi Informasi dan Ilmu Komputer (Oct 2023)
Penerapan Algoritma Support Vector Machine pada Analisis Sentimen Terhadap Identitas Kependudukan Digital
Abstract
Identitas Kependudukan Digital merupakan inovasi yang dikeluarkan oleh pemerintah yang diklaim dapat menjadi solusi permasalahan pencetakan dan pendistribusian e-KTP. Pemerintah telah berkomitmen untuk mendukung upaya digitalisasi E-KTP menjadi Identitas Kependudukan Digital yang mana masyarakat harus ikut mendukung upaya digitalisasi ini. Kehadiran Identitas Kependudukan Digital telah menjadi sorotan publik yang menimbulkan pro dan kontra. Himpunan data penelitian berasal dari crawling komentar pengguna Facebook dari 16 Februari hingga 10 Maret 2023, dengan proses pengolahan menggunakan pembobotan kata TF-IDF dan algoritma Support Vector Machine. Python merupakan bahasa pemrograman yang dipilih untuk melakukan pengumpulan hingga pengolahan data penelitian. Dari 902 yang diproses, dihasilkan 78,27% negatif, 12,97 netral, dan 8,76% positif. Dengan menggunakan perbandingan data latih dan data uji sebesar 80:20, didapati nilai akurasi pada data uji yang dihasilkan oleh Support Vector Machine adalah 77%. Tingginya angka persentase negatif yang diperoleh menunjukkan ketidakpuasan masyarakat terhadap Identitas Kependudukan Digital, dan diharapkan adanya penelitian ini dapat menjadi informasi bagi pihak-pihak terkait guna perbaikan di masa mendatang. Abstract Identitas Kependudukan Digital is an innovation issued by the government which is claimed to be a solution to the problem of printing and distributing e-KTP. The government has committed to supporting efforts to digitize E-KTP into Identitas Kependudukan Digital which the public must participate in supporting this digitization effort. The presence of Identitas Kependudukan Digital has been in the public spotlight which raises pros and cons. The research dataset comes from crawling Facebook user comments from February 16 to March 10, 2023, with processing using TF-IDF word weighting and Support Vector Machine algorithms. Python is the programming language chosen to collect and process research data. Of the 902 processed, 78.27% were negative, 12.97 were neutral, and 8.76% were positive. Using a comparison of training data and test data of 80:20, it was found that the accuracy value of the test data produced by the Support Vector Machine was 77%. The high number of negative percentages obtained shows public dissatisfaction with Digital Population Identity, and it is hoped that this research can be an information for related parties for future improvements.