Speech To Text Menggunakan Metode Hidden Markov Model (original) (raw)
Related papers
2018
Suara/ucapan adalah cara kita sebagai manusia untuk berkomunikasi dan mengekspresikan diri. Proses komunikasi tidak hanya terjadi antar manusia saja. Proses komunikasi juga terjadi antara manusia dan komputer. Pada penelitian ini akan dibangun sistem pencarian kode dari diagnosis penyakit dengan menggunakan masukan suara dan luaran teks. Tujuan dari penelitian ini adalah untuk merancang dan membangun aplikasi Speech to text kode ICD-10 dengan metode MFCC (Mel Frequency Cepstral Coefficient) dan HMM (Hidden Markov Model) yang mampu memberikan informasi mengenai kode ICD-10 dari nama diagnosis penyakit dengan pencarian menggunakan suara. Berdasarkan penelitian dan pengujian sistem Aplikasi Speech to text Kode ICD-10 mampu memberikan informasi mengenai kode diagnosis dari suatu penyakit. Hasil kecocokan data masukan dan luaran dari pengujian yang telah dilakukan menggunakan paramater jumlah data set 3, filter bank 20, iterasi 2 dan state 3 mendapatkan nilai persentase 100%.
Penggunaan Hidden Markov Model untuk Kompresi Kalimat
Bandung: Institut Teknologi Bandung, 2008
Masalah utama dalam penggunaan handheld device adalah ukuran layar yang kecil sehingga mempersulit pengguna untuk mencari dan memperoleh informasi tekstual. Penggunaan peringkasan dokumen dapat membantu memecahkan masalah ini, tetapi kalimat yang dihasilkan masih terlalu panjang. Kompresi kalimat dapat diaplikasikan untuk mengurangi panjang kalimat tanpa menghilangkan informasi yang penting. Kompresi kalimat pada tesis ini menggunakan Hidden Markov Model (HMM) yang diadaptasi dari model statistical translation dan HMM-Hedge. Algoritma Viterbi digunakan untuk mencari susunan kata yang paling optimal. Eksperimen dilakukan untuk mengkaji pengaruh penambahan tag simbol numerik dan tag entitas pada preprocessing, bobot probabilitas pada model HMM, dan bigram smoothing. Selain itu kinerja metode HMM ini dibandingkan dengan metode Knight-Marcu Noisy Channel. Eksperimen dalam tesis ini menggunakan koleksi kalimat Ziff-Davis yang terdiri atas 1067 pasang kalimat. Hasil eksperimen memperlihatkan bahwa HMM terbaik dibangun dengan penambahan tag simbol numerik pada preprocessing, Jelinek Mercer smoothing dengan γ = 0.1, dan bobot probabilitas = 0.1. Setelah dibandingkan dengan metode Knight-Marcu Noisy Channel, ternyata kinerja HMM masih lebih rendah.
Tinjauan Kasus Model Speech Recognition: Hidden Markov Model
2020
Abstrak— Teknologi pengenal suara (speech recognition) merupakan teknologi yang berkembang pesat dalam bidang kecerdasan buatan (artificial intelligent). Saat ini, teknologi pengenal suara menjadi hal yang komersil melalui berbagai media teknologi seperti smartphone dan komputer. Salah satu pembentuk struktur pengenal suara agar dapat bekerja pada perangkat tersebut adalah model statistik pengenal suara Hidden Markov Model (HMM). Penerapan HMM pada berbagai kasus menunjukkan bahwa model ini cocok dengan berbagai macam data. Tulisan ini merupakan sebuah tinjauan untuk model HMM yang bertujuan untuk memberikan gambaran dan pemahaman terhadap kinerja HMM melalui rangkuman sejumlah penelitian yang digunakan dalam berbagai data. Penerapan HMM tersebut menunjukkan optimalisasi kinerja HMM dan tinjauan terhadap sejumlah penelitian menunjukkan bahwa tingkat keberhasilan HMM dalam mengenali data mencapai 71.43%. Kata kunci— Speech recognition, artificial intelligent, model statistik, hidden ...
Speech Recognition dengan Hidden Markov Model untuk Pengenalan dan Pelafalan Huruf Hijaiyah
JURNAL Al-AZHAR INDONESIA SERI SAINS DAN TEKNOLOGI, 2019
Abstrak - Pelajaran utama dalam membaca Al Qur'an adalah mengenali dan melafalkan huruf-huruf Hijaiyah. Beberapa fakta menunjukkan bahwa pengucapan yang salah dapat memengaruhi makna secara harafiah. Speech Recognition, sebagai teknologi saat ini, dapat digunakan untuk memeriksa kesalahan dalam melafalkan surat Hijaiyah melalui pengenalan suara atau ucapan. Itu dapat dikonversi menjadi data yang dapat dipahami oleh sistem. Tujuan dari penelitian ini adalah untuk menerapkan Speech Recognition dengan Hidden Markov Model untuk pelafalan huruf Hijaiyah ketika belajar membaca Alquran. Pengenalan ucapan dan Model Hidden Markov dilakukan untuk mengembangkan sistem antar muka mesin berbasis suara. Dalam penelitian ini juga menggunakan metode Fast Fourier Transform (FFT) untuk mengekstraksi sifat. Hidden Markov Model (HMM) yang digunakan dalam proses pelatihan. Juga, menghasilkan karakteristik khusus untuk setiap huruf Hijaiyah. Dan kemudian, Euclidean Distance (ED) untuk klasifikasi akh...
Jurnal Teknik Its, 2013
Salah satu teknik sintesis ucapan adalah sistem statistik parametrik sintesis ucapan menggunakan Hidden Markov Model (HMM). HMM-based speech synthesis system (HTS) adalah toolkit terbuka (open source) yang dapat dengan mudah diperluas ke berbagai macam bahasa. Speech synthesis dalam bahasa Indonesia dengan menggunakan HTS masih belum pernah dikembangkan (under-resourced). Penelitian ini diawali dengan pembuatan basis data suara bahasa Indonesia melalui proses perekaman, kemudian diikuti dengan proses segmentasi simbol fonetik, dan pemberian label. Dalam penelitian ini diperoleh basis data dalam bahasa Indonesia sejumlah 1529 kalimat yang sesuai dengan kaidah keseimbangan fonetik (phonetically balanced), yaitu telah memenuhi 33 jenis fonem. Selain itu, diperoleh juga segmentasi dan labeling dataset sebanyak 100 kalimat hasil rekaman suara laki-laki dan 100 kalimat hasil rekaman suara wanita. Penyiapan perangkat lunak untuk menjalankan sistem sintesis ucapan berbahasa Inggris berbasis HMM telah dilakukan dengan mengaplikasikan HTS yang menggunakan Festival framework dan berhasil dengan baik. Berdasarkan hasil uji kualitas suara menggunakan uji subyektif, melibatkan 20 responden, diperoleh naturalness dengan nilai Mean Opinion Score (MOS) 3,4 untuk pengujian hasil training speaker dependent (SD) training demo dan 3,2 untuk pengujian hasil speaker adaptation/adaptive (SAD) training demo. Dengan demikian, synthetic speech yang dihasilkan dapat dikategorikan baik dan perangkat lunak yang dipakai dapat digunakan untuk melakukan perancangan sistem sintesis ucapan berbahasa Indonesia. Kata Kunci-sintesis ucapan, Hidden Markov Model (HMM), HMM-based speech synthesis (HTS)
Matics, 2016
— Arabic language has a slightly different pronunciation than the Indonesian so to learn it takes a long time. In Arabia itself, there are variants in the pronunciation of the Arabic language or dialect. Dialect is a language, and letters are used by a particular group of people in a clump that makes the difference between the readings even greeting one another. In Indonesia, alone speakers of Indonesia itself have a different dialect to native speakers. This study was analyzed of Arabic writing suitability by Indonesian speakers using Linear Predictive Coding extraction techniques. The text produces different patterns of speech. This also happens if the text is spoken by a speaker who is not the mother tongue of the speakers. The data training in this study is using the Arabic speaker sound. The feature extraction is classified using Hidden Markov Model. In the classification, using Hidden Markov Model, voice signal is analyzed and searched the maximum possible value that can be r...
2015
Suatu isyarat dapat dikenali melalui gerakan tubuh dan gerakan mulut seseorang. Dengan mengenali ciri-ciri khusus pada masing-masing isyarat, maka dapat diterjemahkan. Pada tugas akhir ini dilakukan pengenalan sejumlah kata dalam bahasa isyarat, agar orang-orang dengan kemampuan berbicara secara verbal lebih mudah menerjemahkan isyarat seorang tunarungu. Masukan secara realtime yang digunakan berupa data gambar (image) pose bahasa isyarat (berdasarkan Kamus Umum Bahasa Isyarat Indonesia) menggunakan perangkat sensor kinect. Data tersebut kemudian diolah sehingga mendapatkan data skeleton. Dari data skeleton kemudian didapatkan skeleton joint. Dalam hal ini menggunakan 6 skeleton joint untuk dijadikan data karakteristik dari setiap isyarat. Berikutnya 6 skeleton joint akan dimodelkan dengan Hidden Markov Model (HMM), dan dilakukan pelatihan sehingga dihasilkan sebuah basis data untuk seluruh HMM. Keluaran dari sistem ini berupa suara yang merupakan terjemahan dari isyarat pada masuka...
TEKTRIKA - Jurnal Penelitian dan Pengembangan Telekomunikasi, Kendali, Komputer, Elektrik, dan Elektronika
Seiring perkembangan teknologi informasi, proses belajar-mengajar semakin banyak menggunakan media alternatif. Salah satu media pembelajaran alternatif yang digunakan adalah video. Untuk mempermudah pemahaman, biasanya video pembelajaran dilengkapi dengan caption atau teks keterangan tentang apa yang dibicarakan oleh pembicara. Akan lebih menghemat waktu dan energi apabila caption dihasilkan secara otomatis berdasarkan apa yang diucapkan pembicara. Oleh karena itu pada penelitian kali ini akan dibangun sistem Automatic Video Captioning menggunakan teknologi Speech Recognition. Sinyal suara dari video masukan diekstrak dan diproses dengan sistem speech recognition untuk menghasilkan teks yang sesuai. Pada penelitian ini sistem speech recognition dibangun dengan Linear Predictive Coding untuk ekstraksi ciri dan Hidden Markov Model untuk pencocokan ciri. Teks yang dihasilkan dari sistem speech recognition tersebut kemudian digunakan sebagai caption dari video masukan. Pengujian sistem ...
Pengembangan Model Markov Tersembunyi untuk Pengenalan Kata Berbahasa Indonesia
2014
Pada paper ini disajikan suatu penerapan model HMM sebagai pengenal kata dengan ekstraksi ciri menggunakan teknik MFCC yang berbasis nilai power spektrum dari suara. Sistem yang dikembangkan bersifat text dependent dan melibatkan 10 pembicara yang mengucapkan 18 jenis kata. Pad a penelitian, ada 3 jenis gugus data untuk melatih model HMM yang terdiri dari 4, 6 dan 8 hidden state, yaitu gugus yang terdiri suara laki-laki saja, gugus yang terdiri dari suara perempuan saja, dan gugus yang terdiri dari campuran suara laki-laki dan perempuan. Ada 4 jenis data uji, yaitu data uji suara laki-lakl yang disertakan pada model pelatihan, data uji suara perempuan yang disertakan pada model, data uji suara lakl-laki yang tidak disertakan pada model, dan data uji suara perempuan yang tidak disertakan pada model. Hasil percobaan menunjukkan bahwa sistem dapat mengenali kata dengan sangat balk (sekitar 9a;i~), kalau diucapkan oleh pembicara yang disertakan dalam pembuatan model. Sistem gagal melakukan pengenalan untuk pembicara yang tidak disertakan dalam model pelatihan. Namun dengan memperluas data pelatihaa, hasil pengenalan meningkat sekitar 30 % dari sebelurnnya. Dari aspek jumlah hidden state, secara umum terlihat bahwa jumlah hidden 8 memberikan akurasi yang lebih baik disbanding 4 atau 6. Kata Kunci : Hidden Markov Model (HMM), Me-Frequency Cepstrum Coefficients (MFCC), Sistem Pengenalan Kata (SPK).