DETEKSI UJARAN KEBENCIAN BERBASIS VIDEO DENGAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENTS (MFCC) - HIDDEN MARKOV MODEL (HMM) DAN CONVOLUTIONAL NEURAL NETWORK (CNN)
Main Article Content
Abstract
Peningkatan penyebaran konten kebencian di media sosial membutuhkan tindakan penanggulangan yang serius. Sejumlah metode telah dikembangkan untuk mendeteksi konten kebencian secara otomatis dengan tujuan mengklasifikasikan konten tekstual sebagai ujaran kebencian atau bukan. Dalam penelitian ini, pendeteksian ujaran kebencian akan dilakukan pada konten video dengan model isolated word recognition. Model ini hanya dapat mendeteksi kata, bukan kalimat sehingga harus dilakukan pemotongan kalimat menjadi kata menggunakan metode silence split. Metode Mel Frequency Cepstral Coefficients (MFCC) - Hidden Markov Model (HMM), dan Convolutional Neural Network (CNN) digunakan untuk mengklasifikasikan konten video sebagai ujaran kebencian. Pengujian pada penelitian ini terdiri dari 2 bagian, yakni pengujian speech to text menggunakan metode word error rate (WER) dan menghasilkan WER sebesar 9.433% untuk data testing perempuan dan WER sebesar 7.54% untuk data testing laki-laki, serta pengujian text classification menggunakan metode confusion matrix dan mendapatkan nilai akurasi sebesar 88%.
Downloads
Article Details
References
Alfina I., Mulia R., Fanany M. I., EkanataY., 2017, Hate Speech Detection in the Indonesian Language: A Dataset and Preliminary Study, 9th InternationalConference on Advanced ComputerScience and Information Systems 2017(ICACSIS)
Chen C. Y., 2014, Fighting Online Hate Speech, https://publicpolicy.googleblog.com/2014/09/fighting-online-hate-speech.html
Febriyani M., Sunarto, Husin B. R., 2018, Analisis Faktor Penyebab Pelaku Melakukan Ujaran Kebencian (Hate Speech) dalam Media Sosial, Jurnal Poenale, Universitas Lampung, Vol. 6, No. 3
Hasan M. R., Jamil M., Rabbani M. G., Rahman M. S., 2004, Speaker Identification using Mel Frequency Cepstral Coefficients, 3rd International Conference on Electrical & Computer Engineering (ICECE).
Huang X., Acero A., Hon H. W., 2001, Spoken Language Processing: A Guide to Theory, Algorithm, and System Development, Prentice Hall, USA
Jalan L., Masrani R., Jadhav R., Palav T., 2013, Speech Recognitiion Based Learning System, International Journal of Engineering Trends and Technology, Vol. 4, No. 2.
Kim Y., 2014, Convolutional Neural Networks for Sentence Classification, Conference on Empirical Methods in Natural Language Processing (EMNLP)
Medistiara Y., 2017, Selama 2017 Polri Tangani 3.325 Kasus Ujaran Kebencian, https://news.detik.com/berita/d-3790973/selama-2017-polri-tangani-3325-kasus-ujaran-kebencian
Montacie C., Caraty M. J., 1998, A Silence / Noise / Music / Speech Splitting Algorithm, 5th International Conference on SpokenLanguage Processing (ICSLP 98)
Patel I., Rao Y. S., 2010, Speech Recognition using HMM with MFCC – An Analysis using Frequency Spectral Decomposion Technique, Signal & Image Processing : An International Journal (SIPIJ), Vol. 1, No. 2.
Putra B. P., Irawan B., Setianingsih C., 2018, Deteksi Ujaran Kebencian dengan Menggunakan Algoritma Convolutional Neural Network pada Gambar, e-Proceeding of Engineering, Universitas Telkom, Vol. 5, No. 2
Tychtl Z., Psutka J., 1999, Speech Production Based on the Mel-Frequency Cepstral Coefficients, Speech Communication and Technology