Jurnal Pengukuran Psikologi dan Pendidikan Indonesia (Feb 2019)
Pengaruh Jumlah Kategori, Rentang Threshold dan Metode Estimasi terhadap Akurasi Skor Tes pada Beberapa Model Politomi
Abstract
Tskor tes yang akurat merupakan salah satu tujuan utama yang ingin dicapai dari sebuah pengetesan. Namun umumnya masyarakat masih menggunakan cara klasik untuk memperoleh skor tes. Misalnya menjumlahkan hasil jawaban benar dari sebuah tes. Sebagaimana diketahui, terdapat beberapa asumsi pada tes klasik yang amat sulit dijumpai pada data skor tes. Maka itu pendekatan tes tidak lagi dilakukan dengan pendekatan klasik, tetapi dilakukan dengan pendekatan teori tes modern. Salah satu aspek yang dibahas dari teori tes modern ialah cara atau prosedur penskoran terhadap tes. Terdapat beberapa hal yang memengaruhi keakurasian skor tes pada pendekatan tes modern, yaitu dalam penelitian ini model politomi, jumlah kategori, rentang threshold dan metode estimasi. Model politomi (GRM dan GPCM), jumlah kategori (3 dan 4) dan rentang threshold (equal dan unequal) dipilih karena variabel tersebut berkaitan erat dengan data khususnya data kategorik. Data dalam penelitian ini berupa kategorik seperti skala Likert (0, 1, 2, 3...dst). Pada teori tes modern, penskoran dihitung berdasarkan susunan respon peserta tes terhadap butir item pada tes. Maka itu, diperlukan metode estimasi (MLR, WLSMV, EAP dan MLE). Penelitian ini menggunakan simulasi studi dengan kondisi 25 item, 500 responden dan 25 replikasi untuk setiap satu data. Interaksi variasi dari seluruh variabel independen sejumlah 2x2x2x4 menghasilkan 32 data. Variabel dependen dalam penelitian ini yaitu RMSE dan standard error. Analisis data menggunakan uji-F. Hasil penelitian menunjukkan bahwa pada kriteria RMSE, model data jumlah kategori 4 dan rentang threshold equal, serta dikalibrasi dengan model politomi GRM dan metode estimasi MLR dan WLSMV menghasilkan nilai RMSE terkecil dibandingkan dengan interaksi model data dan kalibrasi yang lain. sedangkan pada kriteria standard error, model data jumlah kategori 4 dan rentang equal, serta dikalibrasi dengan model GPCM dan metode estimasi MLE menghasilkan nilai standard error terkecil. Dari kedua kriteria tersebut, perbedaan nilai yang signifikan hanya pada kriteria RMSE. Untuk penelitian simulasi, kriteria RMSE lebih sensitif dalam menghasilkan keakurasian skor tes. Untuk aplikasi pada data empiris, model politomi GRM dan metode estimasi WLSMV atau MLR diduga lebih menghasilkan skor tes yang presisi.
Keywords