Jurnal Infotel (Aug 2017)

Perbaikan Missing value Menggunakan Pendekatan Korelasi Pada Metode K-Nearest Neighbor

  • Novta Dany'el Irawan,
  • Wijono Wijono,
  • Onny Setyawati

DOI
https://doi.org/10.20895/infotel.v9i3.286
Journal volume & issue
Vol. 9, no. 3
pp. 305 – 311

Abstract

Read online

Missing value sering terjadi dalam metode klasifikasi dikarenakan informasi tentang obyek tidak diberikan, sulit dicari atau memang informasi tersebut tidak ada. Hal ini menyebabkan menurunnya keakuratan dan kualitas data pada saat data diolah. Pendekatan korelasi dilakukan karena peneliti harus mengetahui tentang ada tidaknya dan kuat lemahnya hubungan variable yang terkait dalam suatu objek atau subjek yang diteliti. Metode klasifikasi yang digunakan yaitu metode K-NN, karena metode ini termasuk metode klasifikasi yang memiliki konsistensi yang kuat. Metode ini mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama berdasarkan nilai K atau tertangga terdekat. Pendekatan korelasi dapat dilakukan untuk mengatasi missing value, terbukti dengan meningkatnya hasil klasifikasi dan hilangnya data yang belum terklasifikasi. Kuisioner berfungsi sebagai alat ukur, kuisioner berisi beberapa pertanyaan yang diberikan kepada responden, dari hasil kuisioner dilakukan analisa data untuk mengetahui tingkat korelasi data cadangan. Setelah mendapatkan tingkat korelasi data cadangan, maka data cadangan tersebut digunakan sebagai pengganti data yang terdapat missing value. Sebelum dilakukan penggantian data yang terdapat missing value, hasil klasifikasi dari 500 data adalah jurusan IPA sejumlah 88 siswa, jurusan IPS 126 siswa, jurusan bahasa 271 siswa, dan belum terklasifikasi/false 15 siswa. Setelah dilakukan penggantian data yang terdapat missing value, hasil klasifikasi dari 500 data adalah jurusan IPA berjumlah 102 siswa, jurusan IPS berjumlah 316 siswa, bahasa berjumlah 82 siswa, dan tidak ada data yang belum terklasifikasi. Berdasarkan hasil percobaan yang dilakukan nilai k = 3, 5, 7, 9, dan 11. Dapat diketahui nilai k = 5 memiliki tingkat akurasi yang tinggi dibandingkan dengan nilai k yang lain yaitu 97%, jadi dalam penelitian ini nilai k yang dipakai pada metode K-NN adalah 5