Sistem Peringkasan Multi Dokumen Bahasa Indonesia Berdasarkan LDA-Significance Sentences

Collection Location Archivelago Indonesia Marine Library
Edition
Call Number TES17-53.083.8 AGU s
ISBN/ISSN
Author(s) Agus Widjanarko
Subject(s) Bahasa Indonesia

Karya ilmiah
Tesis
Local Content
Publikasi Internal
Classification TES17-53.083.8
Series Title
GMD Text
Language Indonesia
Publisher
Publishing Year
Publishing Place 2017
Collation xii, 77hlm; 30cm x 21,5cm
Abstract/Notes Sistem peringkasan multi dokumen pada Bahasa Indonesia dapat membantu masyarakat dalam mendapatkan informasi berita online yang lebih komprehensif. Algoritma clustering pada domain data teks yang banyak dikembangkan pada satu dasawarsa adalah Latent Dirichlet Allocation (LDA). Metode LDA memberikan kontribusi yang cukup baik dalam bidang klasifikasi teks dan temu balik informasi. Salah satu penggunaan LDA adalah peringkaan dokumen, dikarenakan LDA mampu mendapatkan kerangka pemikiran dari suatu dokumen. Penelitian peringkasan multi dokumen Bahasa Indonesia dengan menggunakan pendekatan unsupervised learning khususnya LDA masih terbatas. Metode LDA dan Significance Sentence mempunyai keunggulan untuk memilih kalimat representative dari dokumen sumber. Pengujian model dilakukan dengan menggunakan kombinasi parameter alfa 0,1 dan 0,001 serta beta 0,001 dan 0,1 , dengan dikombinasikan bobot level peringkasan 10%, 30%, dan 50% pada proses perangkingan kalimat di masing-masing dokumen. Hasil pengujian berdasarkan nilai cosine similarity menunjukkan hasil uji terbaik diperoleh pada kombinasi parameter alfa 0,01 dan beta 0,1 serta level ringkasan 50% dengan nilai cosine similarityI sebesar 0,931.
Specific Detail Info
Image
  Back To Previous