Text
Sistem Peringkasan Multi Dokumen Bahasa Indonesia Berdasarkan LDA-Significance Sentences
Sistem peringkasan multi dokumen pada Bahasa Indonesia dapat membantu masyarakat dalam mendapatkan informasi berita online yang lebih komprehensif. Algoritma clustering pada domain data teks yang banyak dikembangkan pada satu dasawarsa adalah Latent Dirichlet Allocation (LDA). Metode LDA memberikan kontribusi yang cukup baik dalam bidang klasifikasi teks dan temu balik informasi. Salah satu penggunaan LDA adalah peringkaan dokumen, dikarenakan LDA mampu mendapatkan kerangka pemikiran dari suatu dokumen. Penelitian peringkasan multi dokumen Bahasa Indonesia dengan menggunakan pendekatan unsupervised learning khususnya LDA masih terbatas. Metode LDA dan Significance Sentence mempunyai keunggulan untuk memilih kalimat representative dari dokumen sumber. Pengujian model dilakukan dengan menggunakan kombinasi parameter alfa 0,1 dan 0,001 serta beta 0,001 dan 0,1 , dengan dikombinasikan bobot level peringkasan 10%, 30%, dan 50% pada proses perangkingan kalimat di masing-masing dokumen. Hasil pengujian berdasarkan nilai cosine similarity menunjukkan hasil uji terbaik diperoleh pada kombinasi parameter alfa 0,01 dan beta 0,1 serta level ringkasan 50% dengan nilai cosine similarityI sebesar 0,931.
B20000185 | TES17-53.083.8 AGU s | Archivelago Indonesia Marine Library - Perpustakaan Kementerian Kelautan dan Perikanan | Available |
No other version available