Membangun Sistem Pengenalan Ucapan Otomatis Bahasa Indonesia Menggunakan Metode Hidden Markov Model
|
|
- Yuliani Chandra
- 6 tahun lalu
- Tontonan:
Transkripsi
1 Membangun Sistem Pengenalan Ucapan Otomatis Bahasa Indonesia Menggunakan Metode Hidden Markov Model Askarya Qaulan Syadida Jurusan Teknik Informatika Universitas Dian Nuswantoro Semarang, Indonesia Dr.Muljono, S.Si, M.Kom Jurusan Teknik Informatika Universitas Dian Nuswantoro Semarang, Indonesia Abstract Dengan semakin majunya teknologi menuntut kemudahan dalam pengaksesan informasi dan penyampaian data. Menjawab tantangan tersebut, melalui perangkat komputer masukan berupa ucapan atau ujaran dapat mewujudkan tuntutan itu. Berdasarkan pendekatan yang dilakukan peneliti sebelumnya untuk membentuk model Sistem Pengenalan Ucapan Otomatis berbasis Bahasa Indonesia dengan menggunakan transisi dari model atau pendekatan tata bahasa Bahasa Inggris menghasilkan akurasi Word Error Rate yang bernilai besar. Secara garis besar untuk menghasilkan nilai akurasi yang baik dalam implementasi Sistem Pengenalan Ucapan Otomatis diperlukan pendekatan terhadap aturan tata Bahasa Indonesia. Sistem Pengenalan Ucapan Otomatis berbasis Bahasa Indonesia dapat mengenali ucapan berbentuk berkas rekaman yang diberikan, dengan format berkas waveform audio format dengan besar bit rate 8000 Hz. Pengolahan data rekaman menggunakan toolkit dari CMUSphinx, dan pembangunan aplikasi menggunakan library Sphinx4, serta memanfaatkan algoritma Hidden Markov Model. Setelah dilakukan proses testing terhadap model akustik yang terbentuk, didapatkan nilai word error rate sebesar 23,0 % dan sentence error rate sebesar 32,8 %. Semakin rendah kedua variabel tersebut maka semakin baik pengenalan terhadap inputan berkas ucapan yang diberikan. Keywords sistem pengenalan ucapan otomatis; model akustik; hidden markov model; CMUSphinx toolkit; sphinx4 Introduction I. PENDAHULUAN Dengan semakin majunya teknologi menuntut kemudahan dalam pengaksesan informasi dan penyampaian data. Menjawab tantangan itu, melalui perangkat komputer masukan berupa ucapan merupakan jawaban dari tantangan tersebut [4]. Hal ini dapat terwujud jika komputer dapat mengenali ucapan dengan satu syarat yaitu komputer mengetahui ucapan bahasa dan dapat ditranskripkan ke dalam suatu huruf atau kalimat. Bentuk ucapan jika dijabarkan ke dalam matematika, akan menghasilkan tingkatan nada bernilai probabilistik [1]. Karena setiap hasil nada yang dihasilkan tidak memiliki batasan setiap unit variabel atau antar kata. Berdasarkan sifat tersebut maka pengenalan ucapan melalui sistem komputer tidak akan menghasilkan 100% hasil yang benar [1]. Di Indonesia, perkembangan penelitian tentang Sistem Pengenalan Ucapan Otomatis (SPUO) telah dimulai sejak tahun 2003 sampai sekarang di mana tersedia tiga bentuk basis data yaitu isolated digits, connected digits, dan simple dialogs [6]. Beberapa peneliti menggunakan beragam pendekatan dan menghasilkan hasil yang beragam. Pertama dengan cara menggunakan model akustik Bahasa Inggris untuk membentuk corpus ucapan Bahasa Indonesia [7]. Kedua menggunakan model pengembangan Indonesian Large Vocabulary Continous Speech Recognition (LVCSR) dengan pendekatan cross languange [8]. Berdasarkan pendekatan yang dilakukan peneliti sebelumnya dengan menggunakan transisi dari model atau pendekatan tata bahasa Bahasa Inggris menghasilkan akurasi Word Error Rate (WER) yang bernilai besar, maka untuk menghasilkan nilai akurasi yang lebih baik diperlukan basis data Bahasa Indonesia dengan menggunakan model dan pendekatan menyeluruh terhadap sistem tatanan corpus dan model akustik Bahasa Indonesia sendiri [6]. Secara garis besar untuk menghasilkan nilai akurasi yang baik dalam implementasi SPUO diperlukan pendekatan terhadap aturan tata Bahasa Indonesia. II. TINJAUAN PUSTAKA A. Sistem Pengenalan Ucapan Otomatis Beberapa peneliti mengemukakan definisi dari SPUO. Menurut Abushariah dan Gunawan [14], SPUO memiliki tujuan untuk membuat suatu sistem cerdas yang dapat secara otomatis menerjemahkan kumpulan dari fonem kata atau string fonem dari sinyal ucapan masukan. Menurut Anusuya dan Katti [15] memberi definisi bahwa SPUO adalah sebuah proses mengubah sinyal ucapan ucapan ke urutan kata dengan cara mengimplementasikan algoritma ke sebuah mesin sehingga sebuah sistem yang dapat mengembangkan dan mengenali inputan ucapan. Menurut Kurian [16] bahwa terdapat beberapa keuntungan dalam mengaplikasikan SPUO ke dalam beberapa aplikasi, seperti aplikasi bantuan pelayanan publik melalui ucapan direktori telepon, aplikasi pengenalan query database, aplikasi pengenalan perangkat perkantoran, aplikasi pembantu ucapan untuk aktivitas operasi pada bidang kedokteran, dan aplikasi terjemahan ucapan otomatis ke dalam Bahasa Asing.
2 Pengembangan dalam beberapa tahun terakhir, peneliti melakukan representasi dari sinyal yang dieksplorasi menghasilkan beragam prediksi untuk membaca sinyal tersebut, antara lain melalui prediksi linier perceptual (PLP) [17], gabungan PLP, dan spektrum relatif (RASTA) [18], koefisien akar cepstrum (RCC) [19], dan koefisien frekuensi Mel Cepstral (MFCC) [20]. Unit Matching System dikenal sebagai back-end dari sistem SPUO. Pada modul ini bertanggung jawab untuk mengenali ciri, dan variabel yang diamati dari sinyal ucapan dengan cara menggabungkan informasi dan data yang diperoleh dari model akustik, model bahasa, dan leksikon. Model akustik adalah kumpulan berkas yang menggambarkan keragaman dari vektor fitur [11]. Pada model ini menggunakan algoritma Hidden Markov Model (HMM) digunakan untuk membuat model statistik sinyal dari SPUO [13]. Model Bahasa adalah sekumpulan data probabilistik yang dibentuk dari urutan kata transkrip [11]. Bentuk dari probabilistik ini dapat berupa model unigram atau N-gram. Model unigram biasanya digunakan dalam pencarian informasi. Model N-gram digunakan untuk memperkirakan panjangnya frasa kata atau kalimat dan urutan yang tidak diamati selama dilakukan training terhadap model. Leksikon sering disebut thesaurus adalah kosa kata bahasa yang terdiri dari semua kata-kata dan ekspresi yang akan diolah untuk dapat dimunculkan [11]. Leksikon dapat diartikan sebagai kamus fonetik. B. Hidden Markov Model Tujuan dari pengembangan sistem pengenalan ucapan secara umum didasarkan pada metode HMM. Metode ini adalah model perhitungan statistik yang akan menghasilkan urutan simbol atau jumlah. Metode HMM digunakan dalam pengenalan suara karena sinyal ucapan dapat dinyatakan sebagai sinyal stasioner piecewise atau sinyal stasioner pendek. Dalam skala waktu singkat (misalnya, 10 milidetik), ucapan dapat diperhitungkan sebagai proses stasioner. Ucapan dapat dianggap sebagai model Markov untuk banyak tujuan stokastik [12]. Alasan lain mengapa HMM populer digunakan untuk SPUO adalah karena model HMM dapat dilatih secara otomatis dan sederhana dan layak untuk digunakan secara komputasi [9]. Dalam pengenalan ucapan, HMM akan menampilkan urutan vektor bernilai riil n-dimensi (dengan n adalah bilangan bulat kecil, seperti 10), mengeluarkan satu dari setiap 10 milidetik. Vektor akan terdiri dari koefisien cepstral, yang diperoleh dengan mengambil transformasi Fourier dari jendela waktu singkat pidato dan dekorasi yang menghubungkan spektrum menggunakan transformasi kosinus, kemudian mengambil koefisien pertama (paling signifikan). Metode HMM akan cenderung ada di masing-masing state untuk distribusi statistik yang merupakan campuran diagonal covariance Gaussians, yang akan memberi kemungkinan untuk setiap vektor yang teramati [9]. Metode HMM untuk urutan kata atau fonem di buat dengan menggabungkan HMM individual yang terlatih untuk kata-kata dan fonem terpisah [12]. C. Carnegie Mellon University Sphinx4.5-realpha Carnegie Mellon University Sphinx4.5-realpha (CMUSphinx) adalah sebuah library fleksibel, terdiri atas modul-modul dan pluggable untuk mendorong inovasi baru dalam penelitian pengenalan ucapan dengan inti menggunakan algoritma Hidden Markov Model [11]. Sphinx4 merupakan kerangka kerja inti dari modul-modul yang disediakan oleh CMUSphinx. Sphinx4 menyediakan peneliti pada bidang pengenalan ucapan untuk mengembangkan bahasa baru ataupun model bahasa yang telah di training sebelumnya untuk dapat diimplementasikan secara mutakhir [12]. Figure 1 kerangka kerja Sphinx4 Ada tiga modul utama dalam kerangka Sphinx4 yaitu modul FrontEnd, modul Decoder, dan modul Linguist. Modul FrontEnd bekerja dengan cara mengambil satu atau lebih sinyal input dan parameter ke dalam urutan feature [11]. Modul Linguist berkerja dengan cara menerjemahkan semua jenis model bahasa, beserta informasi pengucapan dari kamus dan informasi struktural dari satu atau lebih banyak set dari model akustik, hasil yang diperoleh berupa SearchGraph. SearchManager di Decoder bekerja dengan menggunakan feature hasil dari modul FrontEnd dan hasil SearchGraph dari modul Linguist untuk melakukan decoding aktual, hasil yang diperoleh merupakan bentuk text atau kalimat (Speech to Text) [12]. III. METODE PENELITIAN Dalam penelitian ini dipakai berkas corpus ucapan sebanyak 10 individu berbeda dengan pembagian 6 individu berjenis kelamin perempuan, dan 4 individu berjenis kelamin laki-laki. Untuk transkrip kalimat yang diucapkan sebanyak 407 kalimat, di mana terdapat beberapa kalimat yang diucapkan kembali dengan syarat pengucapan kembali kalimat tersebut dilakukan oleh individu yang berbeda. Berkas tersebut diletakkan di dalam satu folder yang sama. Untuk berkas corpus ucapan mempunyai format *.WAV, dan untuk berkas transkrip kalimatnya mempunyai format *.sen, yang mana format *.WAV berekstensi 128 bit rate, dan berkerja pada frekuensi 8 Khz. Untuk dataset pada berkas kamus menyadur dari Kamus Umum Bahasa Indonesia susunan W.J.S Poerwadarminta yang diolah kembali oleh Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan Republik Indonesia terbitan Balai Pustaka Jakarta tahun 1986 untuk cetakan ke IX
3 A. Teknik Analisis Data Dalam pembentukan SPUO terdapat 3 berkas dasar yang dibutuhkan untuk membentuk sistem, yaitu berkas untuk model akustik, model bahasa, dan kamus 1. Untuk kepentingan berkas model akustik dilakukan dengan memilih berkas corpus ucapan 10 individu yang berbeda, diikuti oleh berkas transkrip kalimatnya, Langkah selanjutnya yaitu dilakukan persiapan terhadap berkas training transcription dengan setiap individu mempunyai 110 berkas transkripsi dan terdapat 10 individu. Kemudian sebanyak 1100 berkas diletakkan ke dalam satu berkas *.transcription. Memilih secara acak berkas corpus ucapan beserta berkas transkrip kalimatnya dari 10 individu tersebut dipilih 6 kalimat untuk setiap individu dan diletakkan ke dalam folder (/wav/ind_testing) yang akan digunakan sebagai berkas testing model akustik. 2. Untuk kepentingan berkas kamus fonetik digunakan metode sampling pada Kamus Umum Bahasa Indonesia susunan W.J.S Poerwadarminta yang diolah kembali oleh Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan Republik Indonesia terbitan Balai Pustaka Jakarta tahun 1986 cetakan ke IX di mana peneliti menyadur 7750 ejaan baru dengan penyesuaian. Berkas kamus ini diletakkan pada format berkas *.dic, yang mana pada tata cara penulisan untuk setiap kata diikuti urutan fonemnya dengan dibatasi oleh spasi <tab>. 3. Untuk berkas model bahasa diperlukan berkas transkrip kalimat model bahasa yang sesuai dengan topik bahasan. Peneliti menggunakan berkas transkrip yang digunakan oleh model akustik. Semua berkas dimasukkan ke dalam satu berkas dengan format *.txt, Tata cara penulisan dengan penghilangan tanda baca dan huruf serta memakai simbol tag <s> dan </s> untuk inisialisasi awal dan akhir kalimat. B. Usulan Metode Berikut langkah usulan metode pada penelitian yang diajukan: 1. Pemilihan dataset Dataset sampel 407 kalimat sebagai acuan pelatihan SPUO. Di mana kalimat tersebut diucapkan oleh 10 individu berbeda yaitu 6 perempuan dan 4 laki-laki dengan aksen dan logat berbeda. 2. Persiapan dataset Secara garis besar dalam pembentukkan SPUO ini dibagi menjadi 3 model, yaitu membangun kamus fonem, membentuk model bahasa dan melatih model akustik. 3. Pembangunan sistem Pengecekkan kamus fonetik menggunakan tool g2p-seq2seq. Pembentukan model biner dari model bahasa menggunakan tool CMUCMLTK. Pelatihan model akustik dengan metode encoder dan menguji hasilnya dengan metode decoder menggunakan tool sphinxtrain. 4. Implementasi SPUO Pada bagian ini dilakukan implementasi terhadap model SPUO yang telah terbentuk. Menggunakan library dari Sphinx4. C. Pengujian Metode Desain pengujian dari metode yang diajukan adalah sebagai berikut: 1. Langkah pertama yang dilakukan adalah dengan melakukan inputan berupa berkas ucapan. Data kata atau kalimat yang diucapkan linear dengan konteks model bahasa yang dibentuk. 2. Langkah kedua yaitu pengenalan urutan fonetik dari masukan ucapan. Proses ini melibatkan kamus model yang dibentuk. 3. Langkah ketiga yaitu pencocokan urutan fonetik ke dalam transkrip model bahasa. Transkrip ini berperan sebagai dataset yang akan digunakan di dalam menampilkan hipotesis hasil pengenalan ucapan. 4. Langkah berikutnya yaitu menguji urutan senone dari sifat akustik ucapan yang di latih. Hal ini dilakukan untuk mencocokkan sifat fonem dari suatu kata dengan ucapan masukan yang diberikan. 5. Langkah terakhir adalah decoding model akustik yang terbentuk dan melakukan evaluasi berdasarkan nilai Word Error Rate (WER) dari encoding model akustik tersebut. Setelah itu memasuki tahapan testing model menggunakan library Sphinx.
4 IV. HASIL PENELITIAN DAN PEMBAHASAN Sebelum dapat membangun SPUO, dibutuhkan beberapa macam data yang diperlukan. Data ini berperan dalam membangun, membentuk, dan melatih beberapa model yang diperlukan sebagai tahapan kebutuhan sistem. Dataset tersebut berupa data corpus rekaman dari 10 individu dengan setiap individu mengucapkan 110 kalimat, yang mana setiap kalimat diletakkan di dalam satu berkas, maka total data corpus ucapan terdiri dari 1100 berkas kalimat ucapan. Data corpus ucapan berformat waveform audio format (WAV) direkam pada frekuensi 8 KHz. Selain data corpus ucapan terdapat pula data transkrip kalimat sebagai terjemahan dari corpus ucapan tersebut. Jumlah dari total kalimat sebanyak 407 kalimat. Pola dari kalimat yang diucapkan dapat saling diulang antara individu satu dan setelahnya. Hal ini diperlukan untuk menciptakan model akustik yang bagus dari setiap senone anggota fonem di setiap kata. Sebagai tolak ukur terdapat 10 individu mempunyai obyek rekaman ucapan dan setiap individu mempunyai 110 transkrip kalimat, apabila kalimat yang diucapkan berbeda maka jumlah dari kalimat adalah 1100 kalimat. Hal ini akan membuat kecenderungan sifat akustik yang kurang baik, maka dataset yang dibangun lebih baik jika terdapat perulangan kalimat yang diucapkan. A. Pelatihan Model Dalam membuat model SPUO untuk Bahasa Indonesia maka tahapan yang diperlukan yaitu antara lain membangun kamus yang terdiri atas kumpulan fonem dari kata yang akan digunakan, membentuk model bahasa untuk membatasi penggunaan kata yang akan muncul, dan melatih model akustik dari senone setiap kata. 1) Membangun Kamus Fonetik a) Pada tahapan membangun kamus fonetik digunakan tool dari CMUSphinx yaitu tool Grapheme to Phoneme Sequence to Sequence (g2p-seq2seq). b) Tool konversi grafem menjadi bentuk fonem (G2P) menggunakan metode Recurrent Neural Network (RNN) dengan Long Short-Term Memory Units (LSTM). c) G2P tool menggunakan model LSTM 2 lapis berlisensi dengan 512 unit tersembunyi. d) Peneliti menyiapkan data kamus fonetik melalui penyusunan secara manual dengan menyadur Kamus Umum Bahasa Indonesia susunan W.J.S Poerwadarminta tahun 1986 cetakan ke IX sebanyak 7500 kata. e) Penambahan kata yang belum tercantum sebelumnya, seperti untuk kata nama orang, jabatan, singkatan gelar, nama daerah, ucapan Bahasa Indonesia tidak baku yang muncul pada data baik di model bahasa, ataupun di model akustik. Total kamus yang tersusun (ind.dict) untuk melingkupi pembentukan SPUO Bahasa Indonesia adalah 7994 kata. f) Pada pembangunan kamus fonetik dibutuhkan pula berkas pendukung, antara lain: berkas fonem dengan karakter dan sifat pengucapannya (ind.phone), berkas urutan fonem (ind.symbols), dan berkas simbol selain kata (ind.vp). 2) Membentuk Model Bahasa Figure 3 proses membentuk model bahasa a) Untuk membentuk model bahasa peneliti menggunakan tool Carnegie Mellon University Cambridge Statistical Languange Modeling Toolkit (CMUCLMTK). Hasil akhir yang didapatkan berbentuk mode bahasa biner (lm.bin) yang digunakan untuk melatih model akustik. b) Berkas di ubah dari bentuk format ind.text menjadi bentuk biner model bahasa, kata-kata di definisikan berdasarkan bobot N-gram. c) Tahapan penyusunan berkas ind.text ini di dalam aturan penulisan yaitu penghilangan terhadap tanda baca, seperti tanda baca titik (.), koma (,), garis (-), garis bawah (_), seru(!), tanya (?), dan sebagainya. Penggantian penulisan huruf dengan kata, lalu penggantian huruf kapital dengan huruf kecil. Memberikan inisialisasi untuk setiap kalimat dengan simbol <s> untuk penanda awal kalimat, dan simbol </s> untuk tanda akhir kalimat. d) Berkas ind.text terbentuk memiliki 1100 kalimat, maka berkas inilah yang akan menjadi grammar atau batasan kemunculan kata untuk hipotesis yang akan dihasilkan pada saat dilakukan implementasi SPUO. e) Tahapan berikutnya adalah membentuk berkas biner model bahasa dari berkas text tersebut (ind.lm.bin). 3) Melatih Model Akustik a) Hasil yang diperoleh dari tahapan sebelumnya, yaitu berupa hasil dari membangun kamus fonetik (ind.dict, ind.phone, ind.filler) dan hasil dari membentuk model bahasa (ind.lm.bin) merupakan data yang diperlukan pada pelatihan model akustik. b) Hasil yang diperoleh disebut basis data (database) pelatihan ucapan berisi informasi yang dibutuhkan untuk mengekstraksi probabilitas dari rekaman yang di latih ke dalam bentuk model akustik.
5 c) Decoder mengambil model, lalu menguji bagian dari corpus ucapan dan transkripsi berkas referensi dan memperkirakan kualitas nilai World Error Rate (WER) model. d) Basis data harus menjadi representasi bagus dari ucapan yang akan diimplementasikan dengan kata lain. Data ini akan menghasilkan hipotesis yang bagus jika data mempunyai topik bahasan ucapan yang linear dengan ucapan pada saat diimplementasikan. e) Komposisi bagian testing adalah sekitar 1/25 dari ukuran data training, dengan rincian dari data training sebanyak 1100 kalimat, terbagi menjadi rekaman setiap 10 individu mengucapkan 110 kalimat, data tersebut di ambil sampling untuk data testing sebanyak 60 kalimat, terbagi menjadi rekaman setiap 10 individu mengucapkan 6 kalimat. 4) Pengujian Model a) Setelah model terbentuk, maka uji kualitas basis data yang telah terlatih agar dapat memilih parameter terbaik, memahami bagaimana aplikasi SPUO berjalan dan mengoptimalkan kinerja hipotesis terhadap masukan ucapan. b) Untuk meyakinkan hasil yang terbaik dari ketiga indikator tersebut, maka diperlukan langkah uji decoding. B. Implementasi Sistem Pada bagian ini, dilakukan tahapan coding aplikasi Sistem Pengenalan Ucapan Otomatis (SPUO) dilakukan dengan menggunakan bahasa pemrograman Java dengan tools Netbeans dan memakai library Sphinx4. C. Hasil Implementasi dan Pengujian 1) Aplikasi berformat java archive (*.jar) yang dapat dijalankan pada beragam sistem operasi baik windows atau linux. 2) Aplikasi SPUO memberikan opsi untuk memasukkan nama berkas uji. Pastikan bahwa berkas ini terdapat pada satu jalur PATH dengan berkas projek SPUO. Berikut transkrip berkas uji : 3) Program akan memberikan hasil hipotesis beserta keterangan yang tersedia yaitu estimasi kecepatan mengenali ucapan, penggunaan memori yang digunakan, model tree Ngram yang terbentuk, dan informasi mengenai livecmn atau koefisien frekuensi Mell Cepstral (MFCC) yang dikenali. Berikut hasil hipotesis yang diberikan: 4) Perhitungan Word Error Rate (WER) keterangan : I = parameter nilai yang tersisipi S = parameter nilai yang ditambahkan D = parameter nilai yang kekurangan N = parameter jumlah kata referensi
6 No TABLE I. PERHITUNGAN WORD ERROR RATE Parameter I D S N WER Jumlah Rata-rata % CONCLUSION a. Dari 16 kalimat berkas uji Berdasarkan penelitian ini, dapat di ambil kesimpulan sebagai berikut: 1. Sistem Pengenalan Ucapan Otomatis berbasis Bahasa Indonesia dapat mengenali ucapan berbentuk berkas rekaman yang diberikan, dengan format berkas waveform audio format (*.WAV) dengan besar bit rate 8000 Hz. Pengolahan data rekaman menggunakan toolkit dari CMUSphinx, dan pembangunan aplikasi menggunakan library Sphinx4. 2. Setelah dilakukan proses testing terhadap model akustik yang terbentuk, didapatkan nilai word error rate (WER) sebesar 23,0 % dan sentence error rate (SER) sebesar 32,8 %. Semakin rendah kedua variabel tersebut maka semakin baik pengenalan terhadap inputan berkas ucapan yang diberikan. REFERENCES [1] A. Martinet, "Elements of General Linguistics," Tr. Elisabeth Palmer Rubbert (Studies in General Linguistics, vol. i.), p. Faber. p. 15., (1960). [4] Baecker, Ronald M, Human-Computer Interaction : Toward the Year 2000, Morgan Kauffman Publishers, Inc., [6] Suyanto, An Indonesian Phonetically Balanced Sentence Set for Collecting Speech Database, Jurnal Teknologi Industri, vol. XI, no. No. 1, pp , Januari [7] V. Ferdiansyah, Purwarianti, Indonesian automatic speech recognition system using English-based acoustic model, Proc. of International Conference Electrical Engineering and Informatics (ICEEI), pp. 1-4, [8] Sakti S, Markov K, Nakamura S., Rapid Development of Initial Indonesian Phonemebased Speech Recognition Using The Cross- Language Approach, Proceeding of Oriental-COSCODA, pp , [9] X X Li, Y Zhao, X Pi, Audio-visual continuous speech recognition using a coupled hidden Markov mode, Proceedings of the 7th International Conference on Spoken Language Processing, pp , [11] CMU Sphinx, cmusphinx.github.io, [Online]. Available: [Diakses ]. [12] Willie Walker, Paul Lamere, Philip Kwok, Bhiksha Raj, Rita Singh, Evandro Gouvea, Peter Wolf, Joe Woelfel, Sphinx-4: A Flexible Open Source Framework for Speech Recognition, SUN MICROSYSTEMS INC., no. SMLI TR, p. 0811, [13] S. Cook, Speech Recognition HOWTO, faqs.org, [Online]. Available: Recognition-HOWTO.html. [Diakses ]. [14] Abushariah, Gunawan, and Khalifa, English Digits Speech Recognition System Based on Hidden Markov Models, Proceedings of International Conference Computer and Communication Engineering (ICCCE), pp. 1-5, [15] M. A. Anusuya, and S. K. Katti, Speech Recognition by Machine: A Review, International Journal of Computer Science and Information Security, vol. vol.6, no. no.3, pp , [16] C. Kurian, BalaKrishnan, Speech recognition of Malayalam numbers, Nature & Biologically Inspired Computing, pp , [17] H. Hermansky, Perceptual linear predictive (PLP) analysis of speech, Journal of the Acoustical Society of America, pp , [18] Hermansky, Morgan, A. Bayya, RASTA-PLP speech analysis technique, Proc. International Conference on Acoustics, Speech and Signal Processing, [19] Lockwood, P. Alexandre and P., Root cepstral analysis: A unified view. Application to speech processing in car noise environments,, Speech Communication,, pp , [20] Mermelstein, S. B. Davis and P., Comparison of parametric representations for monosyllable word recognition in continuously spoken sentences, IEEE Transactions on Acoustic, Speech and Signal Processing, vol. 28, no. 04, 1980.
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi
Lebih terperinciIMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.3 Desember 2015 Page 7422 IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX IMPLEMENTATION
Lebih terperinci1. BAB I PENDAHULUAN 1.1. Latar Belakang
1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat
Lebih terperinciPengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model
Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Ziaul Haq, Teknik Informatika S1,Universitas Dian Nuswantoro Semarang Abstract Pengenalan
Lebih terperinciPEMBUATAN PERANGKAT BASIS DATA UNTUK SINTESIS UCAPAN (NATURAL SPEECH SYNTHESIS) BERBAHASA INDONESIA BERBASIS HIDDEN MARKOV MODEL (HMM)
PEMBUATAN PERANGKAT BASIS DATA UNTUK SINTESIS UCAPAN (NATURAL SPEECH SYNTHESIS) BERBAHASA INDONESIA BERBASIS HIDDEN MARKOV MODEL (HMM) Oleh: ELOK ANGGRAYNI NRP. 2409 100 092 Dosen Pembimbing: Prof. Dr.
Lebih terperinciIMPLEMENTASI PENDIKTEAN BAHASA INDONESIA. Hari Bagus Firdaus dan Ayu Purwarianti
IMPLEMENTASI PENDIKTEAN BAHASA INDONESIA Hari Bagus Firdaus dan Ayu Purwarianti Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung, Jalan Ganesha 10, Bandung, 40132, Indonesia E-mail: hari.firdaus@gmail.com
Lebih terperinciFrekuensi Dominan Dalam Vokal Bahasa Indonesia
Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan
Lebih terperinciImplementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara
Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Bima Laksmana Pramudita (13511042) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,
Lebih terperinciDETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti
DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA Aswin Juari dan Ayu Purwarianti Teknik Informatika, Institut Teknologi Bandung, Bandung, Indonesia aswin_tsy@yahoo.com, ayu@stei.itb.ac.id
Lebih terperinciPENERAPAN METODE POWER SPEKTRUM PADA PROSES KONVERSI SUARA UCAPAN MENJADI TEKS
1 PENERAPAN METODE POWER SPEKTRUM PADA PROSES KONVERSI SUARA UCAPAN MENJADI TEKS Yoga Arifianto, Drs. Nurul Hidayat, M. Kom Jurusan Matematika, FMIPA, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan
BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz
Lebih terperinciSPEECH TO VIDEO (S2V), SISTEM KOMUNIKASI PORTABEL UNTUK PENDERITA TUNARUNGU
JURNAL TEKNIK POMITS Vol., No., (03) -8 SPEECH TO VIDEO (SV), SISTEM KOMUNIKASI PORTABEL UNTUK PENDERITA TUNARUNGU Noora M. Rodliyah, I Ketut Eddy Purnama, dan Ahmad Zaini Jurusan Teknik Elektro, Fakultas
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
1 BAB I PENDAHULUAN 1.1. Latar Belakang Pengenalan lafal manusia agar dapat dilakukan oleh sebuah mesin telah menjadi fokus dari berbagai riset selama lebih dari empat dekade. Ide dasar yang sederhana
Lebih terperinciINDEPT, Vol. 3, No.1, Februari 2013 ISSN
SISTEM SPEAKER RECOGNITION (PENGENAL PENGUCAP) UNTUK MENCARI KARAKTERISTIK UCAPAN SESEORANG DENGAN METODE MEL FREQUENCY CEPTRUM COEFFISIENT (MFCC) MENGGUNAKAN SOFTWARE MATLAB Andriana, ST., MT. Dosen Fakultas
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan
Lebih terperinciPERANCANGAN APLIKASI SPEECH TO TEXT BAHASA INGGRIS KE BAHASA BALI MENGGUNAKAN POCKETSPHINX BERBASIS ANDROID
PERANCANGAN APLIKASI SPEECH TO TEXT BAHASA INGGRIS KE BAHASA BALI MENGGUNAKAN POCKETSPHINX BERBASIS ANDROID (Design Application Speech to Text English to Balinese Language Using PocketSphinx Base On Android)
Lebih terperinciBAB I PENDAHULUAN I.1 Latar Belakang
BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring
Lebih terperinciBAB 2 LANDASAN TEORI
6 BAB 2 LANDASAN TEORI 2.1 Disleksia Disleksia adalah ketidakmampuan bahasa, yang berpengaruh dalam hal membaca, menulis, berbicara dan mendengarkan. Ini adalah disfungsi atau gangguan dalam penggunaan
Lebih terperinciPENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI
PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI SKRIPSI I GEDE ARYA MAHARTA NIM. 1108605025 JURUSAN ILMU
Lebih terperinciBAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka
BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Suara adalah suatu alat komunikasi paling utama yang dimiliki oleh manusia. Dengan suara, manusia dapat berkomunikasi dengan manusia lainnya. Melalui suara,
Lebih terperinciIDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti
Lebih terperinciBAB 4 IMPLEMENTASI DAN EVALUASI SISTEM. pengujian pada handset Galaxy Tab Hasilnya adalah sebagai berikut :
BAB 4 IMPLEMENTASI DAN EVALUASI SISTEM 4.1 Hasil Pengujian Pengenalan Kata Setelah dilakukan proses training Bahasa Indonesia, maka dilakukan pengujian pada handset Galaxy Tab 2 7.0. Hasilnya adalah sebagai
Lebih terperinciBAB III METODOLOGI PENELITIAN
1 BAB III METODOLOGI PENELITIAN 1.1 Instrumen penelitian Pada instrumen penelitian akan dijelaskan kebutuhan perangkat lunak, kebutuhan perangkat keras, serta kebutuhan bahan penelitian. Yaitu sebagai
Lebih terperinciPREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha
PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL Adhitya Teguh Nugraha Program Studi Teknik Informatika Jurusan Teknik Elektro Fakultas Teknik Universitas Tanjungpura ituteguh@gmail.com
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Indonesia
BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai
Lebih terperinciTUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan Program Strata I Pada Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas
TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI CONNECTED DIGIT RECOGNITION DENGAN METODE MEL FREQUENCY CEPSTRUM COEFFECIENT DAN HIDDEN MARKOV MODEL UNTUK VOICE DIALING PADA HANDPHONE TIGER C KF-828 Diajukan
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Pengertian Data Compression 2.1.1 Data Menurut Oxford ( 2010 ),Data dapat diartikan suatu kumpulan angka, karakter, gambar yang sebelumnya tidak memiliki arti apa-apa hingga diproses
Lebih terperinciPengenalan Aksara Lampung Menggunakan Jaringan Syaraf Tiruan
Pengenalan Aksara Lampung Menggunakan Jaringan Syaraf Tiruan Adhika Aryantio School of Electrical Engineering and Informatics Institute Technology of Bandung 10th Ganeca Street Bandung, Indonesia. Adhikaaryantio.x6@gmail.com
Lebih terperinciTeam project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP
Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis
Lebih terperinciBAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Kecerdasan buatan (artificial intelligence) merupakan bidang yang berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang mengarah kepada bidang
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen
Lebih terperinciBAB I PENDAHULUAN. yang dikenal sebagai antarmuka pengguna grafis atau Graphical User Interface. yakni ucapan, untuk meningkatkan kemudahannya.
BAB I PENDAHULUAN 1.1 Latar Belakang Pada kebanyakan sistem operasi komputer kontemporer telah disediakan pengantaraan grafis untuk mempermudah interaksi antar pengguna dan komputer yang dikenal sebagai
Lebih terperinciSistem Pengenal Tutur Bahasa Indonesia Berbasis Suku Kata Menggunakan MFCC, Wavelet Dan HMM
ISSN: 2085-6350 Yogyakarta, 15 September 2015 CITEE 2015 Sistem Pengenal Tutur Bahasa Indonesia Berbasis Suku Kata Menggunakan MFCC, Wavelet Dan HMM Syahroni Hidayat 1, Risanuri Hidayat 2, Teguh Bharata
Lebih terperinciPERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA
PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre
Lebih terperinciKarakteristik Spesifikasi
Sinyal yang masuk difilter ke dalam sinyal frekuensi rendah (low-pass filter) dan sinyal frekuensi tinggi (high-pass filter) Lakukan downsampling pada kedua sinyal tersebut Low-pass frekuensi hasil downsampling
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari
Lebih terperinciPengembangan Sistem Pengenalan Bacaan Al-Quran Memanfaatkan Phonetically Rich and Balanced Corpus
Pengembangan Sistem Pengenalan Bacaan Al-Quran Memanfaatkan Phonetically Rich and Balanced Corpus Rahmi Yuwan Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung Bandung, Indonesia 13510031@std.stei.itb.ac.id
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review
Lebih terperinciSistem Verifikasi Penutur menggunakan Metode Mel Frequensi.
SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik
Lebih terperinciANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student
Lebih terperinciSIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.1 April 2015 Page 262 SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL SIMULATION AND ANALYSIS
Lebih terperinciPENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL
Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik
Lebih terperincii. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz
Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Saat ini, perkembangan teknologi informasi di dunia sudah sangat maju. Tentu saja, hal ini membuat banyak orang beralih dari metode manual ke penggunaan teknologi informasi.
Lebih terperinciAPLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING
APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING Dzulfie Zamzami 1, Dr.Eng.Faisal Rahutomo,ST.,M.Kom 2., Dwi Puspitasari, S.Kom., M.Kom.
Lebih terperinciRancang Bangun Modul Pengenalan Suara Menggunakan Teknologi Kinect
JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) 1 Rancang Bangun Modul Pengenalan Suara Menggunakan Teknologi Kinect Ratri Cahyarini, Umi Laili Yuhana, dan Abdul Munif Teknik
Lebih terperinciUNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007
UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 SPEAKER IDENTIFICATION DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF
Lebih terperinciBAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari
BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker
Lebih terperinciSISTEM PENGENALAN CHORD PADA FILE MUSIK DIGITAL DENGAN MENGGUNAKAN PITCH CLASS PROFILES DAN HIDDEN MARKOV MODEL. Ivanna K. Timotius, Adhi Prayogo
SISTEM PENGENALAN CHORD PADA FILE MUSIK DIGITAL DENGAN MENGGUNAKAN PITCH CLASS PROFILES DAN HIDDEN MARKOV MODEL Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen
Lebih terperinciSPEECH RECOGNITION (Pengenalan Ucapan)
MODUL 1 SPEECH RECOGNITION (Pengenalan Ucapan) Komunikasi Bahasa Lisan Human Computer Input Speech Recognition Text Output Speech Synthesis Text Generation Meaning Understanding 1 Speech recognition memiliki
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI Bab ini berisi analisis pengembangan program aplikasi pengenalan karakter mandarin, meliputi analisis kebutuhan sistem, gambaran umum program aplikasi yang
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar
Lebih terperinciudara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.
BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun
Lebih terperinciStudi dan Analisis Teknik-Teknik Steganografi Dalam Media Audio
Studi dan Analisis Teknik-Teknik Steganografi Dalam Media Audio Pudy Prima - 13508047 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10
Lebih terperinciBAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk
6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada
Lebih terperinciBAB 1 PENDAHULUAN. manusia untuk mendengar sangat luar biasa. Sistem pendengaran manusia dapat
BAB 1 PENDAHULUAN 1.1 Latar Belakang Mendengar adalah bagian penting dalam proses interaksi manusia. Kemampuan manusia untuk mendengar sangat luar biasa. Sistem pendengaran manusia dapat membedakan jenis
Lebih terperinciPenyusunan Kamus Fonetik dalam Pengembangan Sistem Pengenalan Suara Otomatis untuk Bahasa Indonesia
Penyusunan Kamus Fonetik dalam Pengembangan Sistem Pengenalan Suara Otomatis untuk Bahasa Indonesia Skripsi Amalia Zahra 120400702X Fakultas Ilmu Komputer Depok Juli 2008 HALAMAN PERNYATAAN ORISINALITAS
Lebih terperinciSISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari
SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen Satya Wacana, Salatiga,
Lebih terperinciAlgoritma Greedy untuk Membangun Korpus Pengenalan Suara Al-Quran
Algoritma Greedy untuk Membangun Korpus Pengenalan Suara Al-Quran Aisyah Dzulqaidah 13510005 1 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN PROGRAM
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM Program aplikasi ini dirancang dengan menggunakan perangkat lunak Microsoft Visual C# 2008 Express Edition. Proses perancangan menggunakan pendekatan Object Oriented
Lebih terperinciAnalisis dan Perancangan Speech Recognition Translate Bahasa Inggris-Indonesia-Gorontalo Berbasis Android
Vol. 6 No. 1 Edisi Mei 2016 ISSN: 2088-4591 Analisis dan Perancangan Speech Recognition Translate Bahasa Inggris-Indonesia-Gorontalo Berbasis Android Ismail Mohidin Program Studi Teknik Informatika, Politeknik
Lebih terperinciBAB I PENDAHULUAN. Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi secara beruntun dan dengan kemungkinan yang berbeda-beda. Sebagai contoh sekarang
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Suara Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara
Lebih terperinciBAB I PERSYARATAN PRODUK
BAB I PERSYARATAN PRODUK Pada bab ini akan dijabarkan latar belakang dan hal hal yang mendasari penelitian ini. Pembahasan tentang persyaratan produk, pembatasan dan asumsi dari penelitian ini akan dibahas
Lebih terperinciBAB 2 LANDASAN TEORI
7 BAB 2 LANDASAN TEORI 2.1 Kata baku dan tidak baku Bahasa Indonesia Kata merupakan bentuk yang sangat kompleks yang tersusun atas beberapa unsur. Kata dalam bahasa Indonesia terdiri atas satu suku kata
Lebih terperinciSeminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:
Perintah Suara Berbahasa Indonesia untuk Membuka dan Menutup Aplikasi dalam Sistem Operasi Windows Menggunakan Metode Mel Frequency Cepstrum Coefficient dan Metode Backpropagation Zakaria Ramadhan 1, Sukmawati
Lebih terperinciBAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI
BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat
Lebih terperinciPenerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows
Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows 1 Muhammad Anggia Muchtar, 2 Raisha Ariani Sirait, 3 Romi Fadillah Rahmat 1,2,3 Program Studi S1 Teknologi Informasi
Lebih terperinciPEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK
PEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK Program Studi Matematika FMIPA Universitas Negeri Semarang Abstrak. Saat ini, banyak sekali alternatif dalam
Lebih terperinciAPLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL
APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,
Lebih terperinciSuara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur
PEMBENTUKAN BASIS DATA UCAPAN DALAM BAHASA INDONESIA DAN PENGKODEANNYA BERDASARKAN LINEAR PREDICTIVE CODING (LPC) Elly Oktarina zonalee_cho@yahoo.com Universitas Gunadarma Jl. Margonda Raya No. 100 Pondok
Lebih terperinciTINJAUAN PUSTAKA. Pengenalan Suara
Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan
Lebih terperinciBINUS UNIVERSITY. Program Studi Ganda. Teknik Informatika Matematika PERANCANGAN PROGRAM APLIKASI SPEECH RECOGNIZER DENGAN SPECTROGRAM
BINUS UNIVERSITY Program Studi Ganda Teknik Informatika Matematika PERANCANGAN PROGRAM APLIKASI SPEECH RECOGNIZER DENGAN SPECTROGRAM Stefan A.Y. NIM : 0700683673 ABSTRAK Speech Recognizer atau pengenal
Lebih terperinciEKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA
EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah
Lebih terperinciBAB 1 PENDAHULUAN. dengan awal tahun 2000 pada saat telepon selular dianggap menjadi barang yang mahal.
BAB 1 PENDAHULUAN 1.1 Latar Belakang Dewasa ini penggunaan alat telekomunikasi yang dapat disebut sebagai telepon selular, ponsel atau handphone di Indonesia meningkat cukup tajam jika dibandingkan dengan
Lebih terperinciBAB I PENDAHULUAN. Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat,
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat, menjadikan statistika memegang peranan penting dalam kehidupan. Hampir semua fenomena yang terjadi
Lebih terperinciBAB 3 PERANCANGAN SISTEM. yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk
BAB 3 PERANCANGAN SISTEM 3.1 Gambaran Umum Sistem Voice Command pada demonstrasinya merupakan aplikasi pengenalan suara yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk menampung
Lebih terperinciBAB I PENDAHULUAN! 1.1 Latar Belakang
1.1 Latar Belakang BAB I PENDAHULUAN Untuk dapat tetap bisa menjalankan proses bisnisnya dengan baik, suatu instansi harus memenuhi suatu standar dalam melayani keinginan konsumen atau yang biasa dikenal
Lebih terperinciSTEGANALISIS UNTUK FILE AUDIO BERFORMAT MP3 DENGAN METODE LEAST SIGNIFICANT BIT (LSB) PADA KLASIFIKASI PRINCIPAL COMPONENT ANALYSIS (PCA)
STEGANALISIS UNTUK FILE AUDIO BERFORMAT MP3 DENGAN METODE LEAST SIGNIFICANT BIT (LSB) PADA KLASIFIKASI PRINCIPAL COMPONENT ANALYSIS (PCA) Vivin Fauziah Ramadhani 1), Bambang Hidayat, 2), Azizah. 3) 1),2),3
Lebih terperinciPERANCANGAN PROGRAM APLIKASI MEMBACA SMS MENGGUNAKAN SUARA DENGAN METODE HIDDEN MARKOV MODELS SKRIPSI. oleh : Fransisca Regina PROGRAM GANDA
PERANCANGAN PROGRAM APLIKASI MEMBACA SMS MENGGUNAKAN SUARA DENGAN METODE HIDDEN MARKOV MODELS SKRIPSI oleh : Fransisca Regina 1100008912 PROGRAM GANDA TEKNIK INFORMATIKA DAN MATEMATIKA UNIVERSITAS BINA
Lebih terperinciPerbaikan Ejaan Kata pada Dokumen Bahasa Indonesia dengan Metode Cosine Similarity
Perbaikan Ejaan pada Bahasa Indonesia dengan Metode Cosine Similarity Muhammad Fachrurrozi 1, Anne Agustina Manik 2 1,2 Jurusan Teknik Informatika Universitas Sriwijaya Kampus Unsri Indralaya Ogan Ilir
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar belakang Latar belakang umum
BAB I PENDAHULUAN 1.1 Latar belakang 1.1.1 Latar belakang umum Bahasa merupakan alat komunikasi yang penting bagi manusia, karena dengan menggunakan bahasa kita dapat mengetahui dan mengetahui informasi
Lebih terperinciBAB 1 PENDAHULUAN. Sistem Pakar (Expert System), Jaringan Saraf Tiruan (Artificial Neural Network), Visi
BAB 1 PENDAHULUAN 1.1 Latar Belakang Di era yang semakin maju ini, teknologi telah memegang peranan penting dalam kehidupan manusia sehari-hari, sehingga kemajuannya sangat dinantikan dan dinikmati para
Lebih terperinciBAB 1 PENDAHULUAN. tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai
1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Komputer adalah sebuah alat/mesin yang membantu kita untuk menyelesaikan tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai penghibur
Lebih terperinciNur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK
Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1. Kompresi File Pada dasarnya semua data itu merupakan rangkaian bit 0 dan 1. Yang membedakan antara suatu data tertentu dengan data yang lain adalah ukuran dari rangkaian bit dan
Lebih terperinciBAB I PENDAHULUAN. agama dan kepercayaan. Sehingga adanya simbol atau semboyan Bhinneka
BAB I PENDAHULUAN 1.1. Latar Belakang Indonesia memiliki berbagai macam budaya, bahasa daerah, ras, suku bangsa, agama dan kepercayaan. Sehingga adanya simbol atau semboyan Bhinneka Tunggal Ika dengan
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium,
Lebih terperinciINTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN
INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com
Lebih terperinciSISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE
SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan
Lebih terperinciJISICOM (Journal of Information System, Informatics and Computing ) APLIKASI PENGENALAN UCAPAN HURUF JEPANG MENGGUNAKAN HIDDEN MARKOV MODEL (HMM)
APLIKASI PENGENALAN UCAPAN HURUF JEPANG MENGGUNAKAN HIDDEN MARKOV MODEL (HMM) Dahlan Abdullah* 1, Cut Ita Erliana* 2 *1 Prodi Teknik Informatika, Universitas Malikussaaleh, Aceh, Indonesia *2 Prodi Teknik
Lebih terperincic. Syllable (suku kata), merupakan bagian-bagian dari sebuah kata yang dapat langsung diucapkan, misalnya glass, book, clever.
BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas tentang landasan teori mengenai pembelajaran English Grammar menggunakan speech recognition yang mengkhususkan pembelajaran tenses berbasis android, dan
Lebih terperinci1. PENDAHULUAN 1.1. Latar Belakang Masalah
1. PENDAHULUAN 1.1. Latar Belakang Masalah Kompresi data merupakan suatu proses pengubahan ukuran suatu file atau dokumen menjadi lebih kecil secara ukuran. Berkembangnya teknologi hardware dan software
Lebih terperinciTRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK
TRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK Nurhalimah Harahap¹, Eddy Muntina Dharma², Andrian Rakhmatsyah³ ¹Teknik Informatika,, Universitas Telkom
Lebih terperinciPENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK
ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan
Lebih terperinciBAB III LANDASAN TEORI
BAB III LANDASAN TEORI 3.1. Citra Digital Citra digital adalah suatu citra elektronik yang diambil dari dokumen, seperti foto, buku, maupun sebuah video. Proses perubahan citra analog menjadi citra digital
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pengaktifan peralatan elektronik yang berada di dalam rumah biasanya perlu menekan suatu tombol atau saklar. Hal ini kadang membutuhkan penggunaan waktu yang
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi sejalan dengan perkembangan interaksi manusia dan komputer. Demi kenyamanan pengguna, para pengembang perangkat lunak dan peneliti berpikir keras
Lebih terperinci