Pengenalan Ucapan Bahasa Indonesia Menggunakan MFCC dan Recurrent Neural Network (original) (raw)
Related papers
Metoda Mel Frequency Cepstrum Coefficients (MFCC) untuk Mengenali Ucapan pada Bahasa Indonesia
2012
Sampai saat ini belum ada suatu aplikasi yang dapat digunakan untuk mengubah ucapan dalam bahasa Indonesia menjadi tulisan yang memenuhi kaidah penulisan bahasa Indonesia. Kajian untuk mengubah ucapan menjadi tulisan, setakat ini baru berada pada pengubahan ucapan abjad untuk diterjemahkan menjadi huruf. Sementara, jika ucapan melalui bahasa Indonesia dapat di ubah ke dalam tulisan akan dapat menambah pola penyebaran informasi di kalangan akademis, pemerintahan dan masyarakat secara luas dan adaptif. Di dalam pertemuan ilmiah, non ilmiah, interogasi, dan pidato politik yang umumnya tidak menggunakan teks book sebagai media penyampai secara baku. Audien yang disasar oleh informasi yang diciptakan oleh pertemuan tersebut akan lebih merata, luas, dan seluruh strata. Walau suara dapat menjadi media penyampai informasi namun keberagaman kemasan yang dibuat dapat meningkatkan penetrasi informasi pada seluruh lapisan strata masyarakat. Konstruksi perangkat lunak dibuat dengan menggunaka...
2018
Abstrak Karya tulis ini membahas implementasi sistem pengenalan ucapan dalam bahasa Indonesia dimana suatu perangkat membaca file suara lalu ditranslasikan menjadi teks sesuai dengan kata yang diucapkan pada file suara tersebut didasarkan pada kata yang sudah dilatih ke dalam sistem. Metode MFCC digunakan untuk proses ekstraksi ciri dimana akustik vektor atau vektor ciri direduksi jumlah dimensinya menggunakan PCA, lalu hasil ektraksi ciri tersebut diklasterkan dengan algoritma Y. Linde, A. Buzo, dan R. Gray (LBG) dan diklasifikasikan menggunakan HMM. Pengurangan dimensi pada vektor akustik atau vektor ciri dilakukan karena jumlah dimensi data yang diekstrak dari sinyal suara menggunakan MFCC yang tinggi. Metode PCA dipilih karena PCA mampu memproyeksikan data ke space yang bervariansi tinggi sehingga data yang redundant atau kurang signifikan bisa direduksi. Selain itu pengurangan dimensi pada vektor ciri dapat meningkatkan performansi sistem dikarenakan jumlah dimensi yang berkura...
Sistem Pengenal Tutur Bahasa Indonesia Berbasis Suku Kata Menggunakan MFCC, Wavelet Dan HMM
This paper presented the development of an automatic speech recognition (ASR) system based on Indonesian syllable using HMM classifier. The recognition rate for an ASR based on Indonesian syllable is still low. This problem might be occurs because the extraction process was applicated directly to the whole syllables. Therefore, in this research the feature extraction process is implemented to each of its constituent phonemes. MFCC and WPT were used as the feature extraction method. Feature of MFCC is obtained by applying frame of 512 sample for each phoneme. In Mel Frequency Warping process using 40 units of triangular filter banks. As for WPT feature extraction process, wavelet daubechies db3 and db7 were used with 5th level decomposition. Feature that extracted then randomly selected and established as a syllable's feature. The recognition accuracy using training data showed 100% accuracy for WPT feature, and 75% for MFCC feature. While using the external testing data the result showed the best accuracy are 100% for WPT db7, 83.33% for WPT db3 and 50% for MFCC. Whole best recognition results were obtained at the point of intersection for the consonants are of 1024 samples.
Pengenalan Suku Kata Bahasa Indonesia Menggunakan Metode LPC Dan Backpropagation Neural Network
JOINTECS (Journal of Information Technology and Computer Science)
Suara menjadi komponen terpenting dalam perkembangan teknologi digital saat ini, untuk mempermudah kehidupan manusia. Berbagai sistem pengenalan suara atau Automatic Speech Recognation (ASR) telah banyak dikembangkan di berbagai negara dengan berbagai bahasa. Pengenalan suara dapat diaplikasikan di berbagai bidang kehidupan salah satunya pada sistem keamanan berbasis suara, berupa password. Di Indonesia sendiri banyak penelitian mengenai pengenalan suara menggunakan bahasa Indonesia dengan berbagai metode, tetapi masih dalam jumlah yang terbatas dan hanya berfungsi untuk perintah suatu aplikasi tertentu. Oleh karena itu, pada penelitian ini, penulis melakukan pengenalan suara berdasarkan suku kata bahasa Indonesia karena bahasa Indonesia sendiri memiliki suku kata yang terbilang banyak dibandingkan dengan suku kata bahasa asing lainnya. Sistem ini terdiri dari 4 proses yaitu proses perekaman suara, proses pre-processing, proses ekstraksi ciri menggunakan metode Linier Predictive Cod...
Aplikasi Pengenalan Ucapanmenggunakan Linear Predictive Coding (LPC) Dan Hidden Markov Model (HMM)
2015
Salah satu bidang pengolahan sinyal yang berpengaruh dalam teknologi komunikasi adalah pengenalan ucapan. Pengenalan ucapan telah memungkinkan suatu perangkat lunak untuk mengenali kata-kata yang diucapkan. Aplikasi pengenalan ucapan dapat menjadi solusi untuk mengenali kata dari sebuah ucapan. Aplikasi ini dikembangkan menggunakan Linear Predictive Coding (LPC) untuk ekstraksi ciri sinyal ucapan dan Hidden Markov Model (HMM) untuk pembentukan model tiap kata ucapan. Data ucapan yang digunakan untuk pelatihan dan pengujian berasal dari 10 sumber perekam (5 pria dan 5 wanita) yang masing-masing mengucapkan 10 kata dan untuk setiap pengucapannya diucapkan sebanyak 10 kali. Pengujian dilakukan dengan menggunakan 10-fold cross validation untuk setiap pasangan orde LPC dan state HMM. Performasi sistem diukur berdasarkan aspek rata-rata akurasi dari pengujian perekam pria dan wanita. Berdasarkan hasil pengujian, jumlah state HMM berpengaruh terhadap akurasi sistem dan hasil akurasi terbai...
Pengenalan Tutur Terisolasi Dalambahasa Indonesia Menggunakanmfcc, FCM, Dan Anfis
2013
Dalam penelitian ini Adaptive Neuro Fuzzy Inference System (ANFIS) digunakan untuk pengenalan tutur terisolasi dalam Bahasa Indonesia dengan ekstraksi ciri menggunakan algoritma Mel-Frequency Cepstrum Coefficient (MFCC). Sistem neuro-fuzzy ini mempunyai dua fase awal. Fase pertama adalah identifikasi sistem menggunakan algoritma Fuzzy CMeans (FCM) yang mengidentifikasi parameterparameter dan menginisialisasi aturan-aturan yang digunakan pada sistem inferensi fuzzy (Fuzzy Inference System, FIS). Fase kedua adalah pelatihan sistem fuzzy dengan menggunakan ANFIS untuk mengoptimasi parameter-parameter sistem fuzzy. Unjuk kerja sistem dievaluasi menggunakan sampel tutur untuk pelatihan dan pengujian. Dengan jumlah aturan fuzzy 80, 100, 120, 140, 160, 180, 200 dan 220, hasil pengujian dengan data pelatihan menunjukkan bahwa tingkat akurasi rata-rata adalah 100%. Pengujian dengan data pengujian memberikan hasil tingkat akurasi rata-rata terendah 77,33% dan tingkat akurasi rata-rata terting...
Pengenalan Ucapan Menggunakan Metode Linear Predictive Coding (LPC) dan K-Nearest Neighbor (K-NN)
Energy, 2017
Pengenalan ucapan (Speech Recognation) merupakan salah satu bagian dari bidang ilmu komunikasi yang melibatkan pengolahan sinyal (Signal Processing). dalam beberapa dekade sudah dilakukan riset tentang pengenalan ucapan, beberapa bidang telah menggunakan sistem pengenalan ucapan seperti robotika, sistem sekuriti dan lain - lain. Dalam penelitian ini, peneliti melakukan kombinasi metode antara Linear Predictive Coding (LPC) dengan K-Nearest Neighbor (K NN) dalam proses pengenalan ucapan, K-NN dipilih karena memiliki algoritma dan perhitungan yang sederhana sehingga akan berpengaruh pada efisiensi waktu di dalam eksekusi program, dengan penggunaan kombinasi metode tersebut, telah menghasilkan akurasi yang baik,, hal itu dibuktikan dari 16 data uji yang diujikan, hasil atau keputusan yang dihasilkan oleh sistem memiliki akurasi sebesar 62,5% dibandingkan dengan target yang telah ditentukan. Kata kunci : Pengenalan Ucapan, LPC, K-NN
During this time, computer cursor operation was done by pressing and moving the mouse. So, this is less flexible for computer user that require movement in operating a computer, since to use mouse comfortably someone has to sit. Moreover, physical completeness is required for mouse operating, so that for someone who has physical disabilities feels difficult to operate it. Therefore, it is required to develop a system that provides a better comfort and flexibility not only for the healthy user computer but also for the user computer who has physical disabilities. In this final project, computer cursor operation program via voice is created. With this program, someone will have more flexibility when operating the computer cursor and also people with physical disabilities is enabled to communicate with computer. Voice recognition is a technology that is apllied in this program, with the feature extraction process used MFCC (Mel-Frequency Cepstrum Coefficients) method. As for the recognitions process used artificial neural network type LVQ (Learning Vector Quantization). Voice is passed through a microphone and then it is analyzed by MFCC to produce MFCC coefficients. These coefficients are used as input vector for LVQ neural network and used as data to train the network until it has the classification capability. Programming language that is used in creating this software is Delphi programming language. Based on the result of the testing program, it is found that the success percentage rate of voice recognition with training data, that is data which is derived from databases that have been recorded and trained into the program which amounts to 240 data, is 88,89 %. While in the testing with test data, that is data which is derived from the real time sayings of respondents which is amounts to 240 data, it is found that the success percentage rate of voice recognition is 83,99 %.