KLASIFIKASI TOPIK PADA WEB BERITA ONLINE DENGAN PENDEKATAN TEKS MINING

M. EDO, NOPRIAN and Edi Surya, Negara (2020) KLASIFIKASI TOPIK PADA WEB BERITA ONLINE DENGAN PENDEKATAN TEKS MINING. Diploma thesis, Universitas Bina Darma.

[img] Text
BAB 0.pdf

Download (1MB)
[img] Text
BAB I.pdf

Download (504kB)
[img] Text
DP.pdf

Download (402kB)

Abstract

Pesatnya perkembangan dalam dunia informasi digital menyebabkan peningkatan volume informasi yang berbentuk teks seperti dokumen berita. Di sosial media dokumen berita sangat banyak di unggah dalam rentan waktu yang begitu cepat dan salah satunya adalah Twitter. Twitter adalah layanan sosial media yang sudah sangat banyak melayani pengguna sehingga menjadikannya sebagai salah satu sosial media yang memiliki data yang sangat besar. Dari data yang sangat besar tersebut dapat dimanfaatkan sebagai sumber dokumen berita untuk web berita online. Akan tetapi dengan banyaknya topik yang di ektraksi pada data Twitter membuat data yang masuk memiliki beragam topik yang menyebabkan kesulitan dalam mengidentifikasi topik dari kumpulan data yang diambil dan akan Membutuhkan waktu yang banyak jika harus dilakukan secara manual oleh manusia. Sedangkan, data tersebut berpotensi dibutuhkan untuk memberikan informasi secepat mungkin.Dengan dilakukannya penelitian ini, bertujuan untuk mengklasifikasikan topik pada data yang diambil dari Twitter secara otomatis sehingga dapat membuat klasifikasi pada dokumen berita yang diambil,dapat lebih efektiv dan efesien dan tidak membutuhkan waktu sebanyak dilakukan manual oleh manusia. Penelitian dilakukan dengan metode Latent Dirichlet Allocation (LDA). Dokumen berita yang akan di klasifikasi adalah dokumen berita bahasa Indonesia dan akan di klasifikasikan kedalam topik yang akan ditentukan. Eksperimen pemodelan topik dengan metode LDA menyimpulkan bahwa jumlah topik yang didbentuk dari 9094 data tweet adalah 10 topik. Hasil eksperimen ini Latent Dirichlet Allocaion dapat digunakan untuk text mining, tetapi data tweet yang dihasilkan belum layak untuk dijadikan informasi dalam pengambilan topik berita. Karena hasil dari metode ini masih membutuhkan peninjauan kembali oleh manusia untuk mengetahui fakta dari topic yang dihasilkan.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Klasifikasi Dokumen Berita, Latent Dirichlet Allocation (LDA)
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Z Bibliography. Library Science. Information Resources > Z665 Library Science. Information Science
Divisions: Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science
Depositing User: Mrs Octaviana T
Date Deposited: 05 Aug 2021 02:13
Last Modified: 05 Aug 2021 02:13
URI: http://repository.binadarma.ac.id/id/eprint/2031

Actions (login required)

View Item View Item