Peringkasan dan Support Vector Machine pada Klasifikasi Dokumen


Author

Kania Evita Dewi, S.Pd., M.Si Nelly Indriani Widiastuti, M.T. Dr. Ednawati Rainarli, S.Si., M.Si.

Abstrak

Klasifikasi adalah proses pengelompokkan objek yang memiliki karakteristik atau ciri yang sama ke dalam beberapa kelas. Klasifikasi dokumen secara otomatis dapat dilakukan dengan menggunakan ciri atau fitur kata yang muncul pada dokumen latih. Jumlah dokumen yang besar dan banyak mengakibatkan jumlah kata yang muncul sebagai fitur akan bertambah. Oleh karena itu, peringkasan dipilih untuk mereduksi jumlah kata yang digunakan dalam proses klasifikasi. Untuk proses klasifikasi digunakan metode Support Vector Machine (SVM) untuk multikelas. SVM dipilih karena dianggap memiliki reputasi yang baik dalam klasifikasi. Penelitian ini menguji penggunaan ringkasan sebagai seleksi fitur dalam klasifikasi dokumen. Peringkasan menggunakan kompresi 50%. Hasil yang diperoleh menunjukkan bahwa proses peringkasan tidak mempengaruhi nilai akurasi dari klasifikasi dokumen yang menggunakan SVM. Akan tetapi, penggunaan peringkasan berpengaruh pada peningkatan hasil akurasi dari metode klasifikasi Simple Logistic Classifier (SLC). Hasil pengujian metode klasifikasi menunjukkan bahwa penggunaan metode Naïve Bayes Multinomial (NBM) menghasilkan akurasi yang lebih baik dari pada metode SVM.

Detail Publikasi Jurnal

Penelitian Induk: -
Jenis Publikasi:Jurnal Nasional Terakreditasi
Jurnal:Jurnal INFOTEL
Volume:9
Nomor:4
Tahun:2017
Halaman:416 - 421
P-ISSN:2085-3688
E-ISSN:2460-0997
Penerbit:INSTITUT TEKNOLOGI TELKOM PURWOKERTO
Tanggal Terbit:2017-10-04
URL: http://ejournal.st3telkom.ac.id/index.php/infotel
DOI: https://doi.org/10.20895/infotel.v9i4.312