JUTI: Jurnal Ilmiah Teknologi Informasi (Jan 2015)
PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA
Abstract
Ringkasan berita diartikan sebagai teks yang dihasilkan dari satu atau lebih kalimat yang menyampaikan informasi penting dari berita. Salah satu fase penting dalam peringkasan adalah pembobotan kalimat (sentence scoring). Dimana pada peringkasan berita, metode pembobotannya sebagian besar menggunakan fitur dari berita sendiri. Padahal dalam satu topik berita dimungkinkan adanya multiple issue. Dari multiple issue biasanya hanya ada satu isu yang menjadi pokok pembicaraan yang disebut dengan Trending Issue. Trending Issue inilah yang harusnya dipertimbangkan pada proses peringkasan berita sehingga ringkasan yang dihasilkan lebih koheren. Penelitian ini bertujuan untuk meringkas multi berita menggunakan metode pembobotan berdasarkan Trending Issue dengan tetap mempertimbangkan fitur penting berita, yaitu word frequency, TF-IDF, posisi kalimat, dan kemiripan kalimat terhadap judul (NeFTIS). Dimana Trending Issue didapatkan dari data Twitter dengan cara mengelompokkan tweets kemudian melakukan ekstraksi isu pada tiap kelompok yang terbentuk. Selanjutnya tiap isu diberikan bobot menggunakan konsep Cluster Importance (CI). Isu dengan bobot terbesar yang akan dipilih sebagai Trending Issue. Ada 5 tahap yang dilakukan untuk menghasilkan ringkasan multi berita dengan menggunakan NeFTIS, yaitu ekstraksi Trending Issue, seleksi berita, ekstraksi fitur berita, penghitungan total bobot kalimat, dan penyusunan ringkasan. Untuk mengukur kualitas sistem digunakan metode evaluasi ROUGE-1 dengan menganalisa performa dari hasil ringkasan dengan menggunakan metode pembobotan NeFTIS dibandingkan dengan hasil ringkasan dengan hanya menggunakan fitur berita (NeFS). Hasil rata-rata max-ROUGE-1 untuk seluruh variasi jumlah kalimat yang menyusun ringkasan (n) menunjukan bahwa metode pembobotan NeFTIS lebih akurat dibanding dengan metode pembobotan NeFS dengan nilai rata-rata max-ROUGE-1 terbesar 0.8201 untuk n=30.