PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA. Oleh : WINI PURNAMASARI G
|
|
- Liani Kurnia
- 7 tahun lalu
- Tontonan:
Transkripsi
1 PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA Oleh : WINI PURNAMASARI G DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006
2 PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Oleh : WINI PURNAMASARI G DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006
3 ABSTRAK WINI PURNAMASARI. Pengembangan Model Markov Tersembunyi untuk Identifikasi Pembicara. Dibimbing oleh AGUS BUONO dan SRI WAHJUNI. Salah satu cabang dari Speech Processing adalah Identifikasi Pembicara yang merupakan suatu proses mengenali seseorang berdasarkan suaranya. Metode yang digunakan untuk Identifikasi Pembicara pada penelitian ini adalah Model Markov Tersembunyi dengan fungsi peluang Gaussian, dan untuk ekstraksi ciri sinyal suara digunakan fitur MFCC. Jenis Identifikasi Pembicara pada penelitian ini adalah Closed-Set Identification yang mana suara masukan yang akan dikenali merupakan bagian dari sekumpulan suara pembicara yang telah terdaftar atau diketahui dan kata yang dilatih maupun diujikan telah ditentukan. Hasil penelitian ini berupa tingkat akurasi kebenaran dari data yang diujikan. Secara keseluruhan untuk pelatihan dengan 20 data menghasilkan tingkat akurasi 71,25%, untuk pelatihan dengan 30 data menghasilkan tingkat akurasi 77,92%, dan pelatihan dengan 40 data menghasilkan tingkat akurasi tertinggi yaitu sebesar 86,25%. Kata kunci: Identifikasi Pembicara, Model Markov Tersembunyi, MFCC, Speech Processing
4 Judul Nama NRP : Pengembangan Model Markov Tersembunyi untuk Identifikasi Pembicara : Wini Purnamasari : G Pembimbing I, Menyetujui: Pembimbing II, Ir. Agus Buono, M.Si, M.Kom NIP Ir. Sri Wahjuni NIP Mengetahui: Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Prof. Dr. Ir. Yonny Koesmaryono, MS NIP Tanggal Lulus :
5 RIWAYAT HIDUP Penulis dilahirkan di jakarta pada tanggal 8 September 1984 dari ayah Enjang Ali Nurdin dan ibu Yanah Rosbani. Penulis merupakan putri pertama dari empat bersaudara. Tahun 2002 penulis lulus dari SMU Negeri 1 Bogor dan pada tahun yang sama lulus seleksi masuk IPB melalui jalur SPMB. Penulis memilih Program Studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Pada tahun 2005 Penulis menjalankan Praktik Lapangan (PL) di PT. Indosat Jakarta selama kurang lebih dua bulan.
6 PRAKATA Alhamdulillahi Rabbil alamin, puji dan syukur Penulis panjatkan kepada Allah SWT atas segala curahan rahmat dan karunia-nya sehingga skripsi dengan judul Pengembangan Model Markov Tersembunyi untuk Identifikasi Pembicara, dapat diselesaikan. Penulis juga mengucapkan terima kasih kepada Mamah Yanah Rosbani atas do a, cinta kasih, dan ajarannya tentang kesabaran dan keikhlasan. Terima kasih juga Penulis ucapkan kepada Bapak Enjang Ali Nurdin yang senantiasa memberi dukungan dan pengabdian yang tulus kepada keluarga. Selanjutnya Penulis juga ingin mengucapkan terima kasih kepada: 1. Bapak Ir. Agus Buono, M.Si., M.Kom. selaku pembimbing I, Ibu Ir. Sri Wahjuni selaku pembimbing II dan Bapak Aziz Kustiyo, S.Si selaku dosen penguji. 2. Adik-adikku Dini Cahya, Widia Adistani, dan Adella Aini, terimakasih untuk keceriaan dan semangat yang membuat hari-hari penulis jauh dari bosan. 3. Mulan, Nana, dan Puspa yang telah bersedia menjadi pembahas. 4. Sahabat-sahabatku Anggy, Dian, Mulan, Puspa untuk kenangan yang indah dan susah senang bersamanya. 5. Ichoy sebagai teman curhat Korea yang baik, terimakasih atas obrolan-obrolan kita yang seringkali sangat bermutu tapi menghibur hati dan juga Mutia terimakasih atas kebaikan hati dan perhatiannya selama kita berkuliah di IPB ini. 6. Nafi dan Nana serta Alfath terimakasih karena mau meminjamkan komputernya. 7. Mang Nanang dan Bi Ningsih serta keluarga juga Mas Min dan Mba Ratmi serta keluarga yang telah banyak membantu. 8. Mba Yani, Ka Lisa dan Edu yang telah bersedia membantu dalam penelitian ini. 9. Erna, Tika, Heni, Ratna, Ichoy, Puspa, Sophia, Ratih karena telah bersedia menampung penulis dikostannya. 10. Alfath, Zaki, Mulan, dan Anggy yang telah bersedia menyumbangkan suara. 11. Mas Irfan, Pak Soleh, Pak Fendi, Pak Yadi serta seluruh staf Departemen Ilmu Komputer. 12. Ilkomerz 39, terimakasih atas segala hal yang telah kita lalui bersama, jalan-jalan, beragam konflik, futsal, makan-makan, gosip-gosip, pokoknya semuanya baik yang senang ataupun mem-btkan, karena pada akhirnya semua hal itulah yang membuat kehidupan kita lebih berwarna dan bergairah serta akan menjadi kenangan yang semoga membuat kita tersenyum bila mengingatnya dihari tua nanti.amiin. Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, Penulis ucapkan terimakasih banyak. Semoga penelitian ini dapat memberi manfaat. Bogor, September 2006 Wini Purnamasari
7 DAFTAR ISI Halaman DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Tujuan 1 Ruang Lingkup 1 Manfaat 1 TINJAUAN PUSTAKA 1 Digitalisasi Gelombang Suara 1 Ekstraksi Sinyal Suara 2 MFCC (Mel-Frequency Cepstrum Coefficients) 2 Hidden Markov Model 3 Jenis Pengenalan Pembicara 4 METODE PENELITIAN 5 5 Analisis Fitur Suara 6 Pelatihan HMM 6 Pengujian 6 Lingkungan Pengembangan 6 HASIL DAN PEMBAHASAN 6 Hasil Identifikasi Pada Pelatihan dengan 20 7 Hasil Identifikasi Pada Pelatihan dengan 30 7 Hasil Identifikasi Pada Pelatihan dengan 40 8 Perbandingan Tingkat Akurasi Setiap Pembicara 9 Perbandingan Kesalahan Identifikasi pada Masing-masing Pembicara 9 Perbandingan Tingkat Akurasi Berdasarkan Tipe Uji 10 Perbandingan Tingkat Akurasi Berdasarkan Jumlah Pelatihan 10 KESIMPULAN DAN SARAN 10 Kesimpulan 10 Saran 11 DAFTAR PUSTAKA 11
8 DAFTAR TABEL Halaman Hasil Identifikasi pada Pelatihan dengan 20 7 Total Tingkat Akurasi Identifikasi pada Pelatihan Dengan 20 7 Hasil Identifikasi pada Pelatihan dengan 30 8 Total Tingkat Akurasi Identifikasi pada Pelatihan dengan 30 8 Hasil Identifikasi pada Pelatihan dengan 40 8 Total Tingkat Akurasi Identifikasi pada Pelatihan dengan 40 9 DAFTAR GAMBAR Halaman Diagram Blok dari Proses MFCC (Do 1994) 2 Diagram Blok Proses Pelatihan 5 Diagram Blok Proses Pengujian 5 Grafik Tingkat Akurasi Identifikasi dengan 20 7 Grafik Tingkat Akurasi Identifikasi dengan 30 8 Grafik Tingkat Akurasi Identifikasi dengan 40 9 Grafik Perbandingan Tingkat Akurasi Setiap Pembicara 9 Grafik Kesalahan Identifikasi pada Masing-Masing Pembicara 9 Grafik Perbandingan Tingkat Akurasi Identifikasi Berdasarkan Tipe Uji 10 Grafik Perbandingan Tingkat Akurasi Identifikasi Berdasarkan Jumlah Pelatihan 10 DAFTAR LAMPIRAN Halaman Algoritma Forward 13 Algoritma Viterbi 13 Algoritma Segmental K-Means 14 Hasil Identifikasi pada Pelatihan dengan 20 (Pembicara Perempuan) 15 Hasil Identifikasi pada Pelatihan dengan 20 (Pembicara Laki-Laki) 16 Hasil Identifikasi pada Pelatihan dengan 30 (Pembicara Perempuan) 17 Hasil Identifikasi pada Pelatihan dengan 30 (Pembicara Laki-Laki) 18 Hasil Identifikasi pada Pelatihan dengan 40 (Pembicara Perempuan) 19 Hasil Identifikasi pada Pelatihan dengan 40 (Pembicara Laki-Laki) 20
9 1 PENDAHULUAN Latar Belakang Suara merupakan media yang sering digunakan manusia untuk berinteraksi dengan manusia lainnya. Dari berbagai penelitian yang telah dilakukan diketahui bahwa sinyal suara dapat juga digunakan untuk berinteraksi dengan komputer, sehingga interaksi tersebut dapat berjalan lebih alami. Penelitian yang dilakukan dengan menggunakan data sinyal suara ini umumnya disebut dengan pemrosesan sinyal suara (speech processing). Speech Processing sendiri memiliki beberapa cabang kajian. Salah satu kajian dalam speech processing adalah identifikasi pembicara. Identifikasi pembicara (speaker identification) adalah suatu proses mengenali seseorang berdasarkan suaranya (Campbell 1997). Teknologi identifikasi pembicara telah digunakan untuk berbagai kepentingan, seperti layanan bank melalui telepon, belanja melalui telepon, layanan akses ke basis data, dan akses jarak jauh ke komputer. Berbagai metode yang dapat digunakan dalam penelitian mengenai identifikasi pembicara, antara lain Dynamic Time Warping (DTW), Model Markov Tersembunyi, Jaringan Syaraf Buatan, Vector Quantization (VQ). Pada penelitian ini akan dilakukan identifikasi pembicara menggunakan Model Markov Tersembunyi atau biasa disebut Hidden Markov Model (HMM). Hal itu dikarenakan metode HMM telah terbukti memiliki tingkat ketepatan yang tinggi untuk identifikasi kata bahasa Indonesia (Mandasari 2005). Tujuan Penelitian ini bertujuan untuk mengembangkan Model Markov Tersembunyi dengan fungsi peluang Gaussian untuk identifikasi pembicara. Ruang Lingkup Ruang lingkup penelitian ini dibatasi pada: 1. Pembahasan difokuskan pada tahap pemodelan pembicara dengan Model Markov Tersembunyi, tidak pada pemrosesan sinyal analog sebagai praproses sistem. 2. Ekstraksi ciri sinyal suara menggunakan Mel-Frequency Cepstrum Coefficients (MFCC). 3. Pendugaan terhadap parameter parameter Model Markov Tersembunyi dibatasi pada algoritma segmental K-means, sedangkan peluang munculnya barisan observasi dihitung dengan algoritma forward. 4. Uji kinerja model dilakukan dengan menghitung tingkat akurasi identifikasi. Manfaat Penelitian ini diharapkan dapat memberikan informasi mengenai tingkat akurasi Model Markov Tersembunyi untuk Identifikasi Pembicara. TINJAUAN PUSTAKA Digitalisasi Gelombang Suara Bunyi atau suara adalah kompresi mekanikal atau gelombang longitudinal yang merambat melalui medium. Medium atau zat perantara ini dapat berupa zat cair, padat, gas. Manusia mendengar bunyi saat gelombang bunyi, yaitu getaran di udara atau medium lain, sampai ke gendang telinga manusia (id.wikipedia.org/wiki/suara). Gelombang suara merupakan gelombang analog, sehingga agar dapat diolah dengan peralatan elektronik, gelombang suara harus direpresentasikan dalam bentuk digital. Proses mengubah masukan suara dari gelombang analog menjadi representasi data digital disebut digitalisasi suara. Proses digitalisasi suara terdiri dari dua tahap yaitu sampling dan kuantisasi (Jurafsky & Martin 2000). Sampling adalah proses pengambilan nilai setiap jangka waktu tertentu. Nilai ini menyatakan amplitudo (besar/kecilnya) volume suara pada saat itu. Hasilnya adalah sebuah vektor yang menyatakan nilai-nilai hasil sampling. Panjang vektor data ini tergantung pada panjang atau lamanya suara yang didigitalisasikan serta sampling rate yang digunakan pada proses digitalisasinya. Sampling rate itu sendiri adalah banyaknya nilai yang diambil setiap detik. Sampling rate yang biasa digunakan adalah 8000 Hz dan Hz (Jurafsky & Martin 2000). Hubungan antara panjang vektor data yang dihasilkan dengan sampling rate dan panjangnya data suara yang didigitalisasikan dapat dinyatakan secara sederhana sebagai berikut: S = F s * T, dengan S = panjang vektor F s = sampling rate yang digunakan (Hertz) T = panjang suara (detik)
10 2 Setelah melalui tahap sampling, proses digitalisasi suara selanjutnya adalah kuantisasi yaitu menyimpan nilai amplitudo ini ke dalam representasi nilai 8 bit atau 16 bit (Jurafsky & Martin 2000). Ekstraksi Ciri Sinyal Suara Sinyal suara merupakan sinyal bervariasi yang diwaktukan dengan lambat atau biasa disebut quasi-stationary (Do 1994). Ketika diamati dalam jangka waktu yang sangat pendek (5-100 ms), karakteristiknya hampir sama. Namun, dalam jangka waktu yang panjang (0,2 detik atau lebih) karakteristik sinyal berubah dan merefleksikan perbedaan sinyal suara yang diucapkan. Oleh karena itu, digunakan spektrum waktu pendek (short-time spectral analysis) untuk mengkarakterisasi sinyal suara. Beberapa fitur yang biasa digunakan antara lain Linear Predictive Coding, Perceptual Linear Prediction, dan Mel- Frequency Cepstrum Coefficients. MFCC (Mel-Frequency Cepstrum Coefficients) MFCC didasarkan pada variasi yang telah diketahui dari jangkauan kritis telinga manusia dengan frekuensi. Filter dipisahkan secara linear pada frekuensi rendah dan logaritmik pada frekuensi tinggi. Hal ini telah dilakukan untuk menangkap karakteristik penting dari sinyal suara. Tujuan utama MFCC adalah untuk meniru perilaku telinga manusia. Selain itu MFCC telah terbukti lebih bisa menyebutkan variasi dari pada gelombang suara itu sendiri. Gambar 1 Diagram blok dari proses MFCC (Do 1994) Penjelasan tiap tahapan pada proses MFCC sebagai berikut (Do 1994): 1. Frame Blocking. Pada tahap ini sinyal suara (continous speech) dibagi ke dalam frame-frame. Tiap frame terdiri dari N sample. 2. Windowing. Proses selanjutnya adalah melakukan windowing pada tiap frame untuk meminimalkan diskontinuitas sinyal pada awal dan akhir tiap frame. Konsepnya adalah meminimisasi distorsi spektral dengan menggunakan window untuk memperkecil sinyal hingga mendekati nol pada awal dan akhir tiap frame. Jika window didefinisikan sebagai w(n), 0 n N-1, dengan N adalah banyaknya sampel tiap frame, maka hasil dari windowing adalah sinyal dengan persamaan: Y t (n)=x 1 (n)w(n), 0 n N-1 Pada umumnya, window yang digunakan adalah hamming window, dengan persamaan: w(n)= cos(2πn/n-1), 0 n N-1 3. Fast Fourier Transform (FFT). Tahap ini mengkonversi tiap frame dengan N sampel dari time domain menjadi frequency domain. FFT adalah suatu algoritma untuk mengimplementasikan Discrete Fourier Transform (DFT) yang didefinisikan pada himpunan N sampel {x n } sebagai berikut: X n N 1 2 π jkn / N = x e, n = 0,1, 2,..., k = 0 k N 1 j digunakan untuk menotasikan unit imajiner, yaitu j = 1. Secara umum Xn adalah bilangan kompleks. Barisan {Xn} yang dihasilkan diartikan sebagai berikut: frekuensi nol berkorespondensi dengan n = 0, frekuensi positif 0 < f < F s /2 berkorespondensi dengan nilai 1 n N/2-1, sedangkan frekuensi negatif F s /2 < f < 0 berkorespondensi dengan N/2+1 < n < N-1. Dalam hal ini Fs adalah sampling frequency. Hasil yang didapatkan dalam tahap ini biasa disebut dengan spektrum sinyal atau periodogram. 4. Mel-frequency Wrapping. Studi psikofisik menunjukkan bahwa persepsi manusia terhadap frekuensi sinyal suara tidak berupa skala linear. Oleh karena itu, untuk setiap nada dengan frekuensi aktual f (dalam Hertz), tinggi subjektifnya diukur dengan skala mel. Skala mel-frequency adalah selang frekuensi di bawah 1000 Hz dan selang logaritmik untuk frekuensi di atas 1000 Hz, sehingga pendekatan berikut
11 3 dapat digunakan untuk menghitung melfrequency untuk frekuensi f dalam Hz: Mel(f) = 2595*log 10 (1+f/700) 5. Cepstrum. Langkah terakhir, konversikan log mel spectrum ke domain waktu. Hasilnya disebut mel frequency cepstrum coefficients. Representasi cepstral spektrum suara merupakan representasi properti spektral lokal yang baik dari suatu sinyal untuk analisis frame. Mel spectrum coefficients (dan logaritmanya) berupa bilangan riil, sehingga dapat dikonversikan ke domain waktu dengan menggunakan Discrete Cosine Transform (DCT). Hidden Markov Model Hidden Markov Model (HMM), atau Model Markov Tersembunyi, ialah suatu model peluang temporal yang menggambarkan keterkaitan antar peubah state (state variable) dari waktu ke waktu, serta antara peubah state dengan peubah teramati (observable variable). Secara visual, model ini dapat digambarkan menggunakan suatu finite state automata dengan banyaknya kemungkinan kombinasi nilai variabel dalam model. Dalam hal ini, setiap state merupakan suatu kombinasi variabel tersebut. contoh, jika terdapat suatu model temporal dengan tiga variabel biner maka banyaknya state adalah 2 3 = 8 buah. Di dalam HMM, peubah state adalah peubah yang tak teramati (hidden variable), dan peubah yang teramati adalah observable variable. Berikut adalah notasi yang digunakan dalam HMM (Dugad & Desai 1996): N : Banyaknya hidden state (state ke 1, 2, 3,, n), q t menotasikan state ke-q pada indeks waktu t. M : Banyaknya kemungkinan kemunculan peubah teramati, v k, untuk k=1,2,3,,m, adalah nilai-nilai peubah teramati. Л : adalah { Л i }, dengan Лi=P(q 1 =i), yaitu peluang pada tahap awal berada pada N state i. Dalam hal ini π 1 = 1 A : i = 1 adalah {a ij } dengan a ij =P(q t+1 =j q t =i), yaitu peluang berada di state j pada waktu t+1 jika pada waktu t berada di state i. Dalam hal ini diasumsikan a ij bebas dari waktu. B : adalah {b j (k)}, dengan b j (k)=p(v k pada waktu t q t =j), yaitu peluang peubah teramatinya yang muncul adalah simbol v k. O t : adalah notasi untuk nilai teramati pada waktu t, sehingga barisan nilai teramati (observable symbol) adalah O=O 1, O 2, O 3,, O T. T adalah panjang observasi yang dilakukan. Dengan notasi-notasi seperti di atas, maka suatu HMM dilambangkan dengan: λ = (A, B, Л) Secara umum ada tiga masalah dasar yang terdapat dalam HMM (Dugad & Desai 1996), yaitu: 1. Masalah 1 (Evaluation): Untuk suatu λ = (A, B, Л) tertentu, ingin diketahui P(O λ), yaitu peluang munculnya barisan O=O 1,O 2,O 3,,O T. Solusi: Barisan O=O 1,O 2,O 3,,O T adalah nilai teramati yang merupakan refleksi dari barisan hidden state Q = q 1,q 2,,qT. Untuk suatu barisan hidden state tertentu, Q = q 1,q 2,,q T, nilai P(O λ) dapat dihitung dengan rumus berikut: T P ( O Q, λ ) = P ( O t t = 1 q t, λ ) Menggunakan asumsi kebebasan antar observasi, nilai tersebut dapat dirumuskan menjadi: P ( O Q, λ) = b q ( O 1 ). b ( O 2 )... b ( O ) 1 q 2 q T T (1) Peluang kemunculan suatu barisan Q = q 1, q 2,, q T tertentu adalah: P( Q λ) = π q a q q a q q a q q... a q T 1 q T (2) Distribusi bersama O dengan Q diperoleh dengan mengalikan (1) dengan (2). P ( O Q, λ) = P( O Q, λ). P( Q λ) (3) Oleh karena itu nilai P(O λ) diperoleh dengan menjumlahkan (3) untuk semua kombinasi barisan hidden state yang mungkin.
12 4 P ( O λ ) = P ( O Q, λ ) P ( Q λ ) Q = πq b q ( O ) a q q b q ( O a q b O Q 2 )... T q T q ( T T ) (4) dengan Q = q 1,q 2,q 3,,q T Terlihat orde perkalian tesebut adalah (2TN T ). contoh untuk N=5 dan T=100 saja, banyaknya operasi adalah sekitar Oleh karena itu diperlukan suatu metode yang efisien untuk masalah tersebut. Solusi permasalahan ini adalah dengan prosedur forward-backward. Kedua algoritma ini berjalan dengan orde O(N 2 T), yang jauh lebih cepat dibanding O(2TN T ). 2. Masalah 2 (Decoding) : Untuk suatu λ=(a, B, Л) dan barisan observasi O=O 1, O 2, O 3,, O T tertentu, bagaimana kita memilih barisan dari state Q = q 1, q 2,, qt yang optimal, yaitu yang paling besar kemungkinannya menghasilkan O. Solusi: Pada masalah 1, solusi yang diberikan bersifat pasti. Dilain pihak pada masalah 2, solusi tergantung dari kriteria optimum yang dipakai. Ada beberapa kriteria optimum yang dapat dilakukan, yaitu: a. Memaksimumkan banyaknya hidden state yang sesuai. Besaran untuk optimisasi ini adalah γ t (i)=p(q t =S i O,λ) yang dirumuskan sebagai: α = t ( i ) β t ( i ) γ t ( i ) P ( O λ ) α = t ( i ) β t ( i ) N α t ( i ) β t ( i ) i = 1 Oleh karena itu, hidden state yang paling mungkin untuk setiap periode t adalah: Qt = arg max γ t (i) untuk 1 t T 1 i N Kelemahan algoritma ini adalah tidak memperhatikan adanya transisi state yang tidak mungkin, sehingga tidak menutup kemungkinan munculnya barisan state yang janggal. b. Modifikasi kriteria poin a, yaitu dengan memaksimumkan banyaknya segmen hidden state yang benar, yaitu dengan dua (q t,q t+1 ) tiga (q t,q t+1,q t+2 ) atau lebih segmen hidden state yang berurutan. c. Menemukan satu barisan hidden state (path) yang paling sesuai. Solusi dengan kriteria ini diperoleh dengan memaksimumkan peluang kemunculan barisan state, Q, untuk suatu O dan λ tertentu, P(Q, O,λ), yang setara dengan memaksimumkan P(O,Q λ). Pencarian path ini dilakukan dengan konsep pemrograman dinamik (dynamic programming) dan dikenal dengan algoritma viterbi. Pada penelitian ini akan digunakan solusi dengan menggunakan algoritma viterbi. 3. Masalah 3 (Learning) : Bagaimana kita melakukan pendugaan terhadap parameterparameter model HMM, λ=(a,b,л), sehingga P(O λ), atau P(O,Q λ) maksimum. Solusi : Permasalahan ini berkaitan dengan pelatihan terhadap HMM dengan tujuan model mampu mengenali pola dengan karakteristik yang mirip dengan data yang dilatihkan. Secara umum ada dua algoritma pelatihan, yaitu: a. Algoritma Segmental K-Means: Pada metode ini, parameter dari model HMM λ=(a,b,л) disesuaikan untuk memaksimumkan P(O,Q λ) dengan Q adalah barisan state yang optimum hasil dari solusi masalah 2. b. Formula Baum-Welch reestimation: Pada metode ini, parameter dari model HMM λ=(a,b,л) disesuaikan untuk meningkatkan P(O λ) hingga maksimum dicapai. Pada persamaan (1) terlihat bahwa penghitungan P(O λ) mencakup penjumlahan nilai peluang P(O,Q λ) untuk semua kemungkinan barisan Q. Jenis Pengenalan Pembicara Menurut Campbell (1997), Pengenalan Pembicara berdasarkan jenis aplikasinya dibagi menjadi: 1. Identifikasi pembicara adalah proses mengenali seseorang berdasarkan suaranya. Identifikasi pembicara dibagi dua, yaitu: Identifikasi tertutup (closed-set identification) yang mana suara masukan yang akan dikenali merupakan bagian dari sekumpulan suara pembicara yang telah terdaftar atau diketahui. Identifikasi terbuka (open-set identification) suara masukan boleh
13 5 tidak ada pada kumpulan suara pembicara yang telah terdaftar. 2. Verifikasi pembicara adalah proses menerima atau menolak permintaan identitas dari seseorang berdasarkan suaranya. Berdasarkan teks yang digunakan pengenalan pembicara dibagi menjadi dua (Campbell 1997): 1. Pengenalan pembicara bergantung teks yang mengharuskan pembicara untuk mengucapkan kata atau kalimat yang sama baik pada pelatihan maupun pengenalan. 2. Pengenalan pembicara bebas teks yang tidak mengharuskan pembicara untuk mengucapkan kata atau kalimat yang sama baik pada pelatihan maupun pengenalan. Pada penelitian kali ini akan dilakukan penelitian identifikasi pembicara dengan jenis identifikasi tertutup dengan bergantung pada teks. METODE PENELITIAN Proses identifikasi pembicara dengan menggunakan Model Markov Tersembunyi menggunakan fungsi Gaussian dalam penelitian ini dilakukan dalam 2 tahap, yaitu tahap pelatihan dan tahap pengujian. Langkah kedua tahap tersebut dapat dilihat pada Gambar 2 dan 3. Masukan data pelatihan X=X 1,X 2,,X Ekstraksi ciri suara dengan MFCC ~ x = x, x,..., x 1 Pelatihan HMM dengan algoritma Segmental K-Means Gambar 2 Diagram blok proses pelatihan 2 Model pembicara ω 13 Model pembicara 1 1 ( Pω 1 ω xnew) ~ Masukan data pengujian X=X 1,X 2,,X Ekstraksi ciri suara dengan MFCC x new = x, x,..., x Peluang maksimum Hasil identifikasi Model pembicara 4 ω 4 ( Pω 2 xnew) Gambar 3 Diagram blok proses pengujian yang digunakan pada penelitian ini adalah gelombang suara yang telah didijitasi dan direkam dari 4 pembicara, yaitu 2 pembicara laki-laki dan 2 pembicara perempuan dengan rentang usia tahun dan masing-masing pembicara diambil suaranya dalam jangka waktu yang sama. Pembicara 1 dan 2 merupakan pembicara perempuan, sedangkan pembicara 3 dan 4 merupakan pembicara laki-laki. tersebut diambil menggunakan fungsi wavrecord pada Matlab, dan disimpan menjadi file berekstensi WAV. Setiap suara diambil dengan sampling rate Hz dan direkam selama 1 detik, sehingga masing-masing menghasilkan ukuran file 31,2 KB. Pemilihan sampling rate Hz didasarkan pada pengetahuan bahwa sampling rate di atas Hz dapat meminimalkan efek aliasing pada konversi dari analog menjadi dijital. Jenis identifikasi pembicara yang dilakukan bersifat bergantung pada teks, maka kata yang diucapkan baik untuk pelatihan maupun pengujian telah ditentukan yaitu komputer dan diucapkan sebanyak 60 kali, sehingga terdapat 240 file data. Penelitian ini akan menggunakan 6 kombinasi proporsi pembagian data pelatihan dan data yang diujikan. Kombinasi tersebut antara lain: data pelatihan dengan pengujian dilakukan pada: 20 data pelatihan. 40 data pengujian.
14 data pelatihan dengan pengujian dilakukan pada: 30 data pelatihan. 30 data pengujian data pelatihan dengan pengujian dilakukan pada: 40 data pelatihan. 20 data pengujian. Analisis Fitur Suara Analisis fitur suara pada penelitian ini menggunakan MFCC. Pada implementasi MFCC ini, kecuali tahap frame blocking, digunakan fungsi dari Auditory Toolbox yang dikembangkan oleh Slanley pada tahun Setiap data suara akan dibagi menjadi frame berukuran masing-masing 30 ms. Dengan overlap 50% dan tanpa noise. Sehingga menghasilkan 66 frame. Hasil dari analisis fitur suara MFCC ini adalah 13 koefisien mel cepstrum untuk masing-masing frame. Dengan demikian setiap data menjadi matriks 13 x 66. Hasil ini merupakan masukan untuk pelatihan HMM, yaitu berupa O=O 1,O 2,,O 66. Pelatihan HMM Pelatihan bertujuan untuk membangun HMM, λ = (A,B,Л) untuk setiap model pembicara. Faktor-faktor yang diperhatikan antara lain adalah pemilihan jenis HMM dan pendugaan parameter untuk tiap model (Rabiner 1989). Pada penelitian ini, jenis HMM yang digunakan adalah HMM leftright. Hal itu dikarenakan jenis ini cocok untuk memodelkan sinyal suara yang propertinya berubah terhadap waktu. Untuk menduga parameter-parameter HMM digunakan algoritma Segmental K-means dengan jumlah state 6. Karena menurut Rabiner (1989), error minimum berada pada state yang berjumlah 6. Input untuk membangun HMM adalah sinyal suara yang telah ditransformasi menjadi barisan vektor ciri, O, ke nilai peluang kemunculannya pada suatu barisan hidden state tertentu, W, dan dinotasikan dengan P(O W). Peluang kemuculan setiap vektor ciri, O t, yang berkaitan dengan hidden state tertentu, w t, adalah b wt (O t ). Oleh karena itu yang akan dilakukan adalah menduga nilai b wt (O t ), yaitu peluang suatu vektor ciri pada waktu t sebagai representasi suara dari hidden state ke-j, dalam hal ini w t = j, yang dinotasikan sebagai b j (O t ). Dalam penelitian ini, b j (O t ) diduga dengan menggunakan asumsi kenormalan yang menggunakan fungsi peluang Gaussian untuk memetakan setiap vektor ciri ke hidden state yang ada dengan peluang tertentu. Melalui asumsi kenormalan, vektor ciri pada indeks t sebagai representasi hidden state j berdistribusi normal dengan vektor rataan μ j dan matriks kovarian j. Dengan asumsi ini, maka nilai peluang tersebut dirumuskan sebagai: ( o t μ j ) j ( ot μ j ) 2 bj( ot ) = e d / 2 1/ 2 (2π ) (det( )) Nilai-nilai parameter dari distribusi normal untuk setiap hidden state diduga dengan menggunakan algoritma Segmental K-means. Pengujian Pengujian bertujuan untuk mengukur akurasi model dalam mengenali pembicara. Pengujian dilakukan secara manual dengan menghitung berapa banyak data yang diujikan dapat memberikan hasil yang tepat yaitu data yang diujikan berhasil dikenali dengan benar, misalnya data yang diujikan adalah data Pembicara 1 maka hasil yang tepat adalah dikenali sebagai Pembicara 1. Masukan untuk menguji model adalah barisan vektor ciri sinyal suara dari seorang pembicara. Setiap model akan memberikan nilai peluang atas masukan yang diberikan. Pembicara diidentifikasi berdasarkan model yang memberikan nilai peluang tertinggi. Hasil kinerja pengujian ini kemudian dihitung sebagai rasio antara jumlah data pembicara yang diidentifikasi secara benar dengan jumlah seluruh data pembicara yang diujikan. Lingkungan Pengembangan Perangkat keras yang digunakan adalah komputer personal dengan prosesor Pentium IV 2,4 GHz, RAM sebesar 128 Mb, serta kapasitas harddisk sebesar 40 Gb. Sistem operasi yang digunakan adalah Windows XP Profesional. Perangkat lunak yang digunakan adalah Matlab 6.5 dan untuk MFCC digunakan beberapa fungsi dari Auditory Toolbox. HASIL DAN PEMBAHASAN Pada penelitian ini, matriks koragam yang digunakan pada algoritma Segmental K- Means adalah matiks koragam diagonal. Hal j
15 7 ini dilakukan dengan asumsi bahwa tidak ada korelasi antar state. Tingkat keberhasilan pada penelitian ini dilihat dari persentase keakuratan identifikasi pembicara, yang didapatkan dari rasio jumlah pembicara yang diidentifikasi benar dengan jumlah pembicara yang diujikan. Hasil Identifikasi Pada Pelatihan dengan 20 Tabel 1 Hasil identifikasi pada pelatihan dengan 20 data Teridentifikasi Pembicara ke- 1 Pembicara Pelatih- an ,5 57,5 Penguji- an Dari Tabel 1 dapat dilihat bahwa pembicara 1 pada data pelatihan mendapatkan tingkat akurasi yang baik yaitu 100%. Pembicara 2 mendapatkan tingkat akurasi yang lebih rendah yaitu sebesar 80%, dengan 20% sisa data yang diujikan teridentifikasi sebagai pembicara 1. Pembicara 3 mendapatkan tingkat akurasi yang cukup kecil, hanya sekitar 40% dengan 55% teridentifikasi sebagai pembicara 4 dan hanya sekitar 5% saja yang teridentifikasi sebagai pembicara 1. Di lain pihak pembicara 4 mendapatkan tingkat akurasi yang cukup baik yaitu sebesar 90% dengan masing-masing 5% teridentifikasi sebagai pembicara 1 dan pembicara 2. Pada data pengujian, pembicara 1 masih menghasilkan tingkat akurasi yang terbaik yaitu 100%. Dengan demikian pembicara 2 mengalami penurunan tingkat akurasi yang cukup besar yaitu menjadi 40 % dengan 60 % sisanya teridentifikasi sebagai pembicara 1. Pembicara 3 juga mengalami penurunan tingkat akurasi namun tidak besar yaitu menjadi 37,5%, dengan 57,5% teridentifikasi sebagai pembicara 4 dan 5 % lainnya teridentifikasi sebagai pembicara 1. Sementara itu pembicara 4 mengalami peningkatan tingkat akurasi pada pengujian dengan data pengujian ini, walaupun tidak banyak yaitu menjadi 95% dengan 5% teridentifikasi sebagai pembicara 1. Tabel 2 Total tingkat akurasi identifikasi pada pelatihan dengan 20 data Pembicara ke- Pelatihan Pengujian Total , Total 77,5 68,125 71,25 Persentase Pelatihan Pengujian Pembicara Gambar 4 Grafik tingkat akurasi identifikasi dengan 20 data Secara keseluruhan seperti terlihat pada Tabel 2 dan Gambar 4, pembicara 1 menghasilkan tingkat akurasi yang paling baik yaitu sebesar 100% dan pembicara 3 menghasilkan tingkat akurasi yang paling buruk yaitu 38,33%. Pembicara 2 menghasilkan tingkat akurasi 53,33% dan pembicara 4 menghasilkan tingkat akurasi yang cukup besar yaitu 93,33%. Hasil akurasi kecil yang didapatkan pembicara 2 dan pembicara 3 dikarenakan tingkat variasi berbicara pada kedua pembicara tersebut cukup besar. Total tingkat akurasi identifikasi pembicara pada data pelatihan adalah 77,5% dan untuk total tingkat akurasi identifikasi pembicara pada data pengujian didapatkan lebih rendah yaitu sebesar 68,125%. Namun demikian untuk total tingkat akurasi identifikasi pembicara secara keseluruhan dengan data pelatihan sebanyak 20 adalah 71,25% Hasil Identifikasi Pada Pelatihan dengan 30 Dari hasil percobaan dengan data pelatihan sebanyak 30 untuk masing-masing pembicara didapatkan hasil sebagaimana terlihat pada Tabel 3.
16 8 Tabel 3 Hasil identifikasi pada pelatihan dengan 30 data Teridentifikasi Pembicara ke- 1 Pembicara ,67 66,67 16,67 Pelatih- an 4 13,33 86, , ,33 Penguji- an Seperti terlihat pada Tabel 3, pembicara 1 pada data pelatihan masih mendapatkan tingkat akurasi yang baik yaitu 100%. Pembicara 2 mendapatkan tingkat akurasi sebesar 70%, dengan 30% sisa data yang diujikan teridentifikasi sebagai pembicara 1. Pembicara 3 mendapatkan tingkat akurasi 66,67% dengan 16,67% teridentifikasi sebagai pembicara 4 dan hanya sekitar 16,7% lainnya teridentifikasi sebagai pembicara 1. Di lain pihak pembicara 4 mendapatkan tingkat akurasi sebesar 86,67% dengan 13,33% teridentifikasi sebagai pembicara 1. Pada data pengujian, pembicara 1 tetap menghasilkan tingkat akurasi yang sangat baik yaitu 100%. Pembicara 2 juga mengalami penurunan tingkat akurasi menjadi 50% dengan 50% sisanya teridentifikasi sebagai pembicara 1. Di sisi lain pembicara 3 mengalami peningkatan tingkat akurasi menjadi sekitar 70%, dengan 16,67% teridentifikasi sebagai pembicara 1 dan 13,33% lainnya teridentifikasi sebagai pembicara 4. Pembicara 4 tingkat akurasinya turun menjadi 80% dengan 20% teridentifikasi sebagai pembicara 1. Tabel 4 Total tingkat akurasi identifikasi pada pelatihan dengan 30 data Pembicara ke- Pelatihan Pengujian Total , , , ,33 Total 80, ,92 Persentase Pelatihan Pengujian Pembicara Gambar 5 Grafik tingkat akurasi identifikasi dengan 30 data Secara keseluruhan pembicara 1 masih menghasilkan tingkat akurasi yang paling baik yaitu sebesar 100% dan pembicara 2 menghasilkan tingkat akurasi yang paling buruk yaitu 60%. Pembicara 3 menghasilkan tingkat akurasi 68,33% dan pembicara 4 menghasilkan tingkat akurasi sebesar 83,33%. Total tingkat akurasi identifikasi pembicara pada data pelatihan adalah 80,83% dan untuk total tingkat akurasi identifikasi pembicara pada data pengujian adalah 75%. Di lain pihak untuk total tingkat akurasi identifikasi pembicara secara keseluruhan dengan data pelatihan sebanyak 30 adalah 77,92%. Hasil Identifikasi Pada Pelatihan dengan 40 Dari hasil percobaan dengan data pelatihan sebanyak 40 untuk masing-masing pembicara didapatkan hasil sebagaimana terlihat pada Tabel 5. Tabel 5 Hasil identifikasi pada pelatihan dengan 40 data Teridentifikasi Pembicara ke- 1 Pembicara Pelatih- an Penguji- an Dari Tabel 5 dapat dilihat bahwa pembicara 1 pada data pelatihan masih mendapatkan tingkat akurasi yang baik yaitu 100%. Pembicara 2 mendapatkan tingkat akurasi sebesar 80%, dengan 20% sisa data yang diujikan teridentifikasi sebagai pembicara 1. Pembicara 3 mendapatkan
17 9 tingkat akurasi 80% dengan 15% teridentifikasi sebagai pembicara 4. Di sisi lain pembicara 4 mendapatkan tingkat akurasi sebesar 85% dengan 15% teridentifikasi sebagai pembicara 1. Pada data pengujian, pembicara 1 tetap menghasilkan tingkat akurasi yang sangat baik yaitu 100%. Pembicara 2 mengalami penurunan tingkat akurasi menjadi 65% dengan 35% sisanya teridentifikasi sebagai pembicara 1. Namun demikian pembicara 3 kembali mengalami peningkatan tingkat akurasi menjadi sekitar 90%, dengan 10% teridentifikasi sebagai pembicara 1. Pembicara 4 tingkat akurasinya pun naik menjadi 90% dengan 10% teridentifikasi sebagai pembicara 1. Tabel 6 Total tingkat akurasi identifikasi pada pelatihan dengan 40 data Pembicara ke- Pelatihan Pengujian Total , ,67 Total 86,25 86,25 86,25 Persentase Pelatihan Pengujian Pembicara Gambar 6 Grafik tingkat akurasi identifikasi dengan 40 data Secara keseluruhan pembicara 1 menghasilkan tingkat akurasi yang paling baik yaitu sebesar 100% dan pembicara 2 kembali menghasilkan tingkat akurasi yang paling buruk yaitu 75%. Pembicara 3 memiliki tingkat akurasi sebesar 83,33% dan pembicara 4 memiliki tingkat akurasi sebesar 86,67%. Total tingkat akurasi identifikasi pembicara pada data pelatihan adalah 86,25 % dan untuk total tingkat akurasi identifikasi pembicara pada data pengujian adalah 86,25%. Di lain pihak untuk total tingkat akurasi identifikasi pembicara secara keseluruhan dengan data pelatihan sebanyak 40 adalah 86,25%. Perbandingan Tingkat Akurasi Setiap Pembicara Perbandingan tingkat akurasi setiap pembicara pada masing-masing jumlah data pelatihan dapat dilihat pada Gambar 7. Persentase Pembicara 1 Pembicara 2 Pembicara 3 Pembicara Jumlah data pelatihan Gambar 7 Grafik perbandingan tingkat akurasi setiap pembicara Seperti terlihat pada Gambar 7, pembicara 1 selalu menempati tingkat akurasi identifikasi yang tertinggi baik pada pelatihan dengan 20 data, 30 data maupun 40 data dengan nilai 100%. Pembicara 3 memiliki tingkat akurasi terkecil pada pelatihan dengan 20 data, nilai yang dihasilkan hanya sekitar 38,33%. Namun demikian pada pelatihan dengan 30 data dan 40 data, pembicara 2 memiliki tingkat akurasi yang terkecil masing-masing dengan nilai 60% dan 75%. Terlihat juga pada Gambar 7 bahwa pembicara 2 dan 3 selalu mendapat tingkat akurasi yang lebih rendah dari pembicara 1 dan 4. Seperti telah disebutkan sebelumnya, hal ini dikarenakan tingkat variasi berbicara kedua pembicara tersebut lebih besar dari pada pembicara 1 dan 4. Perbandingan Kesalahan Identifikasi pada Masing-masing Pembicara Perbandingan kesalahan identifikasi yang terjadi pada penelitian ini untuk masingmasing pembicara dapat dilihat pada Gambar 8. Persentase Pembicara 1 Pembicara 2 Pembicara 3 Pembicara Salah Teridentifikasi Pembicara Gambar 8 Grafik kesalahan identifikasi pada masing-masing pembicara Terlihat pada Gambar 8, untuk pembicara 2 seluruh kesalahan merupakan salah
18 10 identifikasi sebagai pembicara 1, dimana pembicara 1 dan 2 merupakan perempuan. Di lain pihak kesalahan identifikasi pembicara 3 yang merupakan laki-laki sebagian besar merupakan kesalahan identifikasi sebagai pembicara 4 yang juga laki-laki. Secara keseluruhan, kesalahan identifikasi sebagian besar memang merupakan salah identifikasi sebagai pembicara 1 dan 4 dan seperti telah diketahui dari pembahasan sebelumnya, pembicara 1 dan 4 memiliki tingkat akurasi yang tinggi. Tingkat akurasi yang tinggi dari pembicara 1 dan 4 dikarenakan variasi gaya berbicara kedua pembicara tersebut yang tidak terlalu besar pada saat perekaman data. Perbandingan Tingkat Akurasi Berdasarkan Tipe Uji Perbandingan tingkat akurasi berdasarkan tipe data yang diujikan dapat dilihat pada Gambar 9. Persentase Pelatihan Pengujian Jumlah Pelatihan Gambar 9 Grafik perbandingan tingkat akurasi identifikasi berdasarkan tipe data uji Dari Gambar 9 terlihat bahwa tingkat akurasi yang lebih tinggi didapatkan pada pelatihan dengan 20 data dan 30 data dengan data pelatihan. Di sisi lain pada pelatihan dengan 40 data, tingkat akurasi yang didapatkan sama baik pada data pelatihan maupun data pengujian. Perbandingan Tingkat Akurasi Berdasarkan Jumlah Pelatihan Perbandingan tingkat akurasi berdasarkan jumlah data pelatihan dapat dilihat pada Gambar 10. Persentase Pelatihan 20 Pelatihan Pelatihan 30 Pelatihan 40 Diujikan Pada Pengujian Gambar 10 Grafik perbandingan tingkat akurasi identifikasi berdasarkan jumlah data pelatihan Dari Gambar 9 dapat diketahui bahwa tingkat akurasi identifikasi dengan 20 data pelatihan memiliki nilai yang paling kecil baik pada data pelatihan maupun data pengujian. Tingkat akurasi yang terbesar baik yang di ujikan pada data pelatihan maupun data pengujian adalah pada pelatihan dengan 40 data. Terlihat pula bahwa tingkat akurasi bertambah seiring dengan bertambahnya jumlah data pelatihan. KESIMPULAN DAN SARAN Kesimpulan Dari penelitian yang telah dilakukan, maka dapat disimpulkan bahwa Model Markov Tersembunyi dapat digunakan untuk identifikasi pembicara. Tingkat akurasi tertinggi yaitu 100% didapatkan pembicara 1 pada semua tipe data uji pada jumlah data pelatihan 20, 30, dan 40. Sementara itu tingkat akurasi terendah sebesar 37,5% didapatkan pembicara 3 di data pengujian pada jumlah data pelatihan 20. Nilai tinggi yang didapatkan pembicara 1 dikarenakan pembicara 1 menghasilkan data dengan sedikit variasi gaya berbicara, sedangkan pembicara 3 menghasilkan data dengan variasi gaya berbicara yang banyak sehingga tingkat akurasi yang didapatkan rendah. Dengan demikian variasi gaya berbicara berpengaruh pada hasil akurasi identifikasi dalam penelitian ini. Hal ini dapat dilihat pula pada pembicara 1 dan 4 yang selalu menghasilkan tingkat akurasi yang lebih tinggi dibandingkan pembicara 2 dan 3. Jumlah data dalam pelatihan ternyata berpengaruh terhadap tingkat akurasi identifikasi yang dihasilkan. Semakin banyak jumlah data dalam pelatihan maka semakin tinggi tingkat akurasi yang dihasilkan.
19 11 Pelatihan dengan jumlah data 20, total persentase tingkat akurasi yang dihasilkan adalah 71,25%. Pelatihan dengan jumlah data 30, total persentase yang dihasilkan meningkat menjadi 77.92%, dan pelatihan dengan jumlah data 40 menghasilkan total persentase tingkat akurasi dengan nilai tertinggi yaitu 86,25%. Slanley M Auditory Toolbox. Interval Research Corporation, Palo Alto. val/ /). [4 Juni 2006] Saran Untuk penelitian selanjutnya, disarankan untuk meningkatkan tingkat akurasi dengan berbagai cara misalnya: 1. Pada tahap praproses, dilakukan segmentasi dan penggunaan variasi besar frame dan overlap yang digunakan. 2. Pada tahap pelatihan digunakan jumlah state yang beragam. 3. Perlu dikembangkan model classifier yang mengakomodasi variability data. DAFTAR PUSTAKA Campbell,Jr JP Speaker Recognition: A Tutorial. Proceeding IEEE, Vol 85 No.9, hal , September Do MN Digital Signal Processing Mini-Project: An Automatic Speaker Recognition System. Audio Visual Communications Laboratory, Swiss Federal Institute of Technology, Laussanne, Switzerland. ct.pdf [12 Juli 2006]. Dugad R, Desai UB A Tutorial on Hidden Markov Models. Technical Report, Department of Electrical Engineering, Indian Institute of Technology-Bombay, India. Jurafsky D, Martin JH Speech and Language Processing An Introduction to Natural Language Processing, Computational Linguistic, and Speech Recognition. New Jersey: Prentice Hall. Mandasari Y Pengembangan Model Markov Tersembunyi untuk Pengenalan kata Berbahasa Indonesia [Skripsi]. Bogor: Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Rabiner LR A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. Proceeding IEEE, Vol 77 No. 2, hal , Februari 1989.
20 LAMPIRAN 12
21 13 Lampiran 1 Algoritma Forward (Rabiner 1989) Terdapat variabel α t (i) yang merupakan peluang barisan observasi O 1, O 2, O 3,, O t dan state Si pada waktu t, yang dikenal sebagai variabel forward, dan dirumuskan: 1. Inisialisasi α i) = b ( ), 1 i N 1( π i i O1 αt ( i ) = P( O1, O2,..., Ot, qt = Si λ) 2. Induksi 3. Terminasi N α t + 1 ( j) = ( ) ( + 1), αt i aij b j O t 1 t T-1dan 1 i N i= 1 N P O λ ) = i= 1 ( α ( i ) T Lampiran 2 Algoritma Viterbi (Rabiner 1989) Terdapat variabel δ T (i) yang merupakan skor terbaik (peluang tertinggi) yang dihitung pada path dari state periode pertama hingga state S i pada periode t. 1. Inisialisasi δ i) = b ( ), 1 i N ψ 1( π i i O1 1 ( i) = 0 2. Rekursi [ ( i) a ] b ( O ), δ t ( j) = max δt 1 ij j t 2 t T dan 1 i N 1 i N ψ j) = arg max[ δ ( i) a ], 2 t T dan 1 i N t ( t 1 1 i N ij 3. Terminasi P q * * T = max = 1 i N = arg max 1 i N [ δ ( i) ] T [ δ ( i) ] 4. Backtracking * qt = ψ t + 1( qt * +!), t = T-1, T-2,, 1 T
22 14 Lampiran 3 Algoritma Segmental K-Means (Dugad & Desai 1996) Metode ini digunakan pada pelatihan dengan data pelatihan yang berupa barisan O sebanyak ω dengan masing-masing mempunyai panjang T, O=O 1, O 2, O 3,, O T. 1. Pilih N observasi secara acak dan kelompokkan semua observasi data pelatihan (ada ωt observasi) ke salah satu dari N observasi yang dipilih secara acak tersebut, dengan kriteria jarak euklid minimum. Dari sini terbentuk N klaster, yang masing-masing sebagai sebuah state. 2. Hitung nlai peluang awal dan peluang transisi: banyaknya kejadian { O untuk 1 i N : 1 i} ˆ πi = total kejadian O 1 ( ω) untuk 1 i N dan 1 j N : banyaknya kejadian { O t i, O t j t a 1 } untuk semua ˆ ij = + banyaknya kejadian { O t i} untuk semua t 3. Hitung vektor rataan dan matriks koragam untuk setiap 1 i N: 1 ˆμ i = Ot N i Ot i i Ot i T V ˆ 1 i = ( Ot ˆ μ i ) ( Ot ˆ μi ) N 4. Hitung distribusi peluang observasi dari setiap data pelatihan untuk setiap state (dalam hal ini diasumsikan berdistribusi Normal), 1 i N: T [ O Vˆ 1/ 2( ˆ μ ) ( O ˆ ] 1 b ) ˆ i ( Ot ) = exp d t i i 1 t μ / 2 i (2 ) Vˆ 1/ 2 π i 5. Temukan barisan state (path) optimal, Q *, (dengan algoritma pada Lampiran 2), untuk setiap data pelatihan dari HMM ˆ λ ˆ ˆ i = ( A i, B i, ˆ πi ) yang dihitung dari tahap 2 sampai 4 di atas. Jika suatu observasi ke r, Or, pada pelatihan ke k, diklasterkan ke state j, sedangkan hidden state ke r pada barisan state optimal yang diperoleh dari pelatihan ke-k adalah state p (p j), maka O r direassign ke state p dari state j. 6. Jika tidak ada observasi yang di-reassign ke state baru, maka selesai. Jika tidak, maka ulangi langkah 2 sampai 6.
23 15 Lampiran 4 Hasil Identifikasi Pada Pelatihan dengan 20 (Pembicara Perempuan) Pembicara 1 Pembicara 2 Pelatihan Pengujian Pelatihan Pengujian 1 Pembicara 1 1 Pembicara 1 1 Pembicara 2 1 Pembicara 2 2 Pembicara 1 2 Pembicara 1 2 Pembicara 2 2 Pembicara 2 3 Pembicara 1 3 Pembicara 1 3 Pembicara 2 3 Pembicara 2 4 Pembicara 1 4 Pembicara 1 4 Pembicara 2 4 Pembicara 1 5 Pembicara 1 5 Pembicara 1 5 Pembicara 2 5 Pembicara 2 6 Pembicara 1 6 Pembicara 1 6 Pembicara 2 6 Pembicara 1 7 Pembicara 1 7 Pembicara 1 7 Pembicara 2 7 Pembicara 2 8 Pembicara 1 8 Pembicara 1 8 Pembicara 2 8 Pembicara 1 9 Pembicara 1 9 Pembicara 1 9 Pembicara 1 9 Pembicara 2 10 Pembicara 1 10 Pembicara 1 10 Pembicara 1 10 Pembicara 1 11 Pembicara 1 11 Pembicara 1 11 Pembicara 1 11 Pembicara 1 12 Pembicara 1 12 Pembicara 1 12 Pembicara 2 12 Pembicara 2 13 Pembicara 1 13 Pembicara 1 13 Pembicara 2 13 Pembicara 1 14 Pembicara 1 14 Pembicara 1 14 Pembicara 2 14 Pembicara 1 15 Pembicara 1 15 Pembicara 1 15 Pembicara 2 15 Pembicara 2 16 Pembicara 1 16 Pembicara 1 16 Pembicara 2 16 Pembicara 2 17 Pembicara 1 17 Pembicara 1 17 Pembicara 1 17 Pembicara 2 18 Pembicara 1 18 Pembicara 1 18 Pembicara 2 18 Pembicara 1 19 Pembicara 1 19 Pembicara 1 19 Pembicara 2 19 Pembicara 1 20 Pembicara 1 20 Pembicara 1 20 Pembicara 2 20 Pembicara 2 21 Pembicara 1 21 Pembicara 1 22 Pembicara 1 22 Pembicara 1 23 Pembicara 1 23 Pembicara 1 24 Pembicara 1 24 Pembicara 1 25 Pembicara 1 25 Pembicara 2 26 Pembicara 1 26 Pembicara 2 27 Pembicara 1 27 Pembicara 1 28 Pembicara 1 28 Pembicara 2 29 Pembicara 1 29 Pembicara 1 30 Pembicara 1 30 Pembicara 1 31 Pembicara 1 31 Pembicara 1 32 Pembicara 1 32 Pembicara 1 33 Pembicara 1 33 Pembicara 1 34 Pembicara 1 34 Pembicara 2 35 Pembicara 1 35 Pembicara 2 36 Pembicara 1 36 Pembicara 1 37 Pembicara 1 37 Pembicara 1 38 Pembicara 1 38 Pembicara 1 39 Pembicara 1 39 Pembicara 1 40 Pembicara 1 40 Pembicara 1
24 16 Lampiran 5 Hasil Identifikasi Pada Pelatihan dengan 20 (Pembicara Laki-Laki) Pembicara 3 Pembicara 4 Pelatihan Pengujian Pelatihan Pengujian 1 Pembicara 4 1 Pembicara 4 1 Pembicara 1 1 Pembicara 4 2 Pembicara 1 2 Pembicara 4 2 Pembicara 4 2 Pembicara 4 3 Pembicara 4 3 Pembicara 4 3 Pembicara 4 3 Pembicara 4 4 Pembicara 4 4 Pembicara 4 4 Pembicara 4 4 Pembicara 4 5 Pembicara 3 5 Pembicara 3 5 Pembicara 4 5 Pembicara 4 6 Pembicara 3 6 Pembicara 4 6 Pembicara 4 6 Pembicara 4 7 Pembicara 3 7 Pembicara 4 7 Pembicara 4 7 Pembicara 4 8 Pembicara 4 8 Pembicara 3 8 Pembicara 4 8 Pembicara 4 9 Pembicara 4 9 Pembicara 3 9 Pembicara 4 9 Pembicara 4 10 Pembicara 4 10 Pembicara 3 10 Pembicara 4 10 Pembicara 1 11 Pembicara 4 11 Pembicara 4 11 Pembicara 4 11 Pembicara 4 12 Pembicara 4 12 Pembicara 4 12 Pembicara 4 12 Pembicara 4 13 Pembicara 4 13 Pembicara 4 13 Pembicara 4 13 Pembicara 1 14 Pembicara 4 14 Pembicara 4 14 Pembicara 2 14 Pembicara 4 15 Pembicara 4 15 Pembicara 4 15 Pembicara 4 15 Pembicara 4 16 Pembicara 3 16 Pembicara 4 16 Pembicara 4 16 Pembicara 4 17 Pembicara 3 17 Pembicara 4 17 Pembicara 4 17 Pembicara 4 18 Pembicara 3 18 Pembicara 4 18 Pembicara 4 18 Pembicara 4 19 Pembicara 3 19 Pembicara 4 19 Pembicara 4 19 Pembicara 4 20 Pembicara 3 20 Pembicara 4 20 Pembicara 4 20 Pembicara 4 21 Pembicara 1 21 Pembicara 4 22 Pembicara 4 22 Pembicara 4 23 Pembicara 3 23 Pembicara 4 24 Pembicara 1 24 Pembicara 4 25 Pembicara 3 25 Pembicara 4 26 Pembicara 4 26 Pembicara 4 27 Pembicara 4 27 Pembicara 4 28 Pembicara 4 28 Pembicara 4 29 Pembicara 3 29 Pembicara 4 30 Pembicara 4 30 Pembicara 4 31 Pembicara 4 31 Pembicara 4 32 Pembicara 4 32 Pembicara 4 33 Pembicara 3 33 Pembicara 4 34 Pembicara 3 34 Pembicara 4 35 Pembicara 3 35 Pembicara 4 36 Pembicara 3 36 Pembicara 4 37 Pembicara 3 37 Pembicara 4 38 Pembicara 3 38 Pembicara 4 39 Pembicara 3 39 Pembicara 4 40 Pembicara 3 40 Pembicara 4
25 17 Lampiran 6 Hasil Identifikasi Pada Pelatihan dengan 30 (Pembicara Perempuan) Pembicara 1 Pembicara 2 Pelatihan Pengujian Pelatihan Pengujian 1 Pembicara 1 1 Pembicara 1 1 Pembicara 2 1 Pembicara 2 2 Pembicara 1 2 Pembicara 1 2 Pembicara 2 2 Pembicara 2 3 Pembicara 1 3 Pembicara 1 3 Pembicara 1 3 Pembicara 1 4 Pembicara 1 4 Pembicara 1 4 Pembicara 2 4 Pembicara 2 5 Pembicara 1 5 Pembicara 1 5 Pembicara 1 5 Pembicara 2 6 Pembicara 1 6 Pembicara 1 6 Pembicara 2 6 Pembicara 2 7 Pembicara 1 7 Pembicara 1 7 Pembicara 2 7 Pembicara 2 8 Pembicara 1 8 Pembicara 1 8 Pembicara 2 8 Pembicara 2 9 Pembicara 1 9 Pembicara 1 9 Pembicara 1 9 Pembicara 1 10 Pembicara 1 10 Pembicara 1 10 Pembicara 1 10 Pembicara 2 11 Pembicara 1 11 Pembicara 1 11 Pembicara 1 11 Pembicara 1 12 Pembicara 1 12 Pembicara 1 12 Pembicara 2 12 Pembicara 1 13 Pembicara 1 13 Pembicara 1 13 Pembicara 2 13 Pembicara 1 14 Pembicara 1 14 Pembicara 1 14 Pembicara 2 14 Pembicara 1 15 Pembicara 1 15 Pembicara 1 15 Pembicara 2 15 Pembicara 2 16 Pembicara 1 16 Pembicara 1 16 Pembicara 2 16 Pembicara 1 17 Pembicara 1 17 Pembicara 1 17 Pembicara 1 17 Pembicara 1 18 Pembicara 1 18 Pembicara 1 18 Pembicara 2 18 Pembicara 2 19 Pembicara 1 19 Pembicara 1 19 Pembicara 2 19 Pembicara 1 20 Pembicara 1 20 Pembicara 1 20 Pembicara 2 20 Pembicara 1 21 Pembicara 1 21 Pembicara 1 21 Pembicara 2 21 Pembicara 1 22 Pembicara 1 22 Pembicara 1 22 Pembicara 2 22 Pembicara 1 23 Pembicara 1 23 Pembicara 1 23 Pembicara 2 23 Pembicara 1 24 Pembicara 1 24 Pembicara 1 24 Pembicara 2 24 Pembicara 2 25 Pembicara 1 25 Pembicara 1 25 Pembicara 2 25 Pembicara 2 26 Pembicara 1 26 Pembicara 1 26 Pembicara 1 26 Pembicara 2 27 Pembicara 1 27 Pembicara 1 27 Pembicara 2 27 Pembicara 2 28 Pembicara 1 28 Pembicara 1 28 Pembicara 1 28 Pembicara 2 29 Pembicara 1 29 Pembicara 1 29 Pembicara 2 29 Pembicara 1 30 Pembicara 1 30 Pembicara 1 30 Pembicara 1 30 Pembicara 1
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti
Lebih terperinciudara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.
BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar
Lebih terperincii. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz
Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode
Lebih terperinciKarakteristik Spesifikasi
Sinyal yang masuk difilter ke dalam sinyal frekuensi rendah (low-pass filter) dan sinyal frekuensi tinggi (high-pass filter) Lakukan downsampling pada kedua sinyal tersebut Low-pass frekuensi hasil downsampling
Lebih terperinciPENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G
PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA Oleh : VICKY ZILVAN G64103043 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciPengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.
Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi
Lebih terperinciPENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar
PENDAHULUAN Latar Belakang Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit
Lebih terperinciPerbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan
Lebih terperinciPENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO
PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI SKRIPSI
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat
Lebih terperinciPrediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov
A39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi dan Daryono Budi Utomo Departemen Matematika, Fakultas Matematka dan Ilmu Pengetahuan Alam, Institut Teknologi
Lebih terperinciBAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian
BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan
Lebih terperinciTINJAUAN PUSTAKA. Pengenalan Suara
Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan
Lebih terperinciPENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI
PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR PERNYATAAN
Lebih terperinciPENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK
ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan
Lebih terperinciSISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI
SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN
Lebih terperinciBAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari
BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Suara (Wicara) Suara khususnya wicara merupakan cara yang natural bahkan paling penting dalam melakukan proses komunikasi. Dalam kehidupan sehari-hari, manusia melakukan berbagai
Lebih terperinciAPLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM)
APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM) Eko Widiyanto, Sukmawati Nur Endah, Satriyo Adhy, Sutikno Jurusan Ilmu Komputer/Informatika,
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia
Lebih terperinciANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student
Lebih terperinciTeam project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP
Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis
Lebih terperinciPengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model
Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Ziaul Haq, Teknik Informatika S1,Universitas Dian Nuswantoro Semarang Abstract Pengenalan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Genre Menurut Kamus Besar Bahasa Indonesia, genre adalah jenis, tipe, atau kelompok sastra atas dasar bentuknya. Jadi genre musik merupakan pengelompokan musik berdasarkan kemiripan
Lebih terperinciSISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari
SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen Satya Wacana, Salatiga,
Lebih terperinciPEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA
PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciFrekuensi Dominan Dalam Vokal Bahasa Indonesia
Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan
BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz
Lebih terperinciINDEPT, Vol. 3, No.1, Februari 2013 ISSN
SISTEM SPEAKER RECOGNITION (PENGENAL PENGUCAP) UNTUK MENCARI KARAKTERISTIK UCAPAN SESEORANG DENGAN METODE MEL FREQUENCY CEPTRUM COEFFISIENT (MFCC) MENGGUNAKAN SOFTWARE MATLAB Andriana, ST., MT. Dosen Fakultas
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari
Lebih terperinciPENERAPAN LEARNING VECTOR QUANTIZATION
PENERAPAN LEARNING VECTOR QUANTIZATION (LVQ) DAN EKSTRAKSI CIRI MENGGUNAKAN MEL- FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) UNTUK TRANSKRIPSI SUARA KE TEKS LAKSMI NIRMALA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS
Lebih terperinciJaringan Syaraf Tiruan pada Robot
Jaringan Syaraf Tiruan pada Robot Membuat aplikasi pengenalan suara untuk pengendalian robot dengan menggunakan jaringan syaraf tiruan sebagai algoritma pembelajaran dan pemodelan dalam pengenalan suara.
Lebih terperinciPENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS
PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER CLARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA
Lebih terperinciIdentifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri
Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Vicky Zilvan, S.Kom. UPT LPSN - LIPI v_q1e@yahoo.com Furqon Hensan Muttaqien, S.Komp. P2 Informatika - LIPI fh.muttaqien@informatika.lipi.go.id
Lebih terperinciPENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV
PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV Marianus Hendra Wijaya 1), Linggo Sumarno 2) 1) Program Studi Teknik Elektro Fakultas Sains dan Teknologi Universtas Sanata Dharma Yogyakarta
Lebih terperinciPrediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov
JURNAL SAINS DAN SENI POMITS Vol. 6, No.2, (2017) 2337-3520 (2301-928X Print) A 39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi Daryono Budi Utomo Jurusan
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Indonesia
BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai
Lebih terperinciPENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG
PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad
Lebih terperinciSeminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:
Perintah Suara Berbahasa Indonesia untuk Membuka dan Menutup Aplikasi dalam Sistem Operasi Windows Menggunakan Metode Mel Frequency Cepstrum Coefficient dan Metode Backpropagation Zakaria Ramadhan 1, Sukmawati
Lebih terperinciAplikasi Teknik Speech Recognition pada Voice Dial Telephone
Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Oleh: Ahmad Irfan Abdul Rahman Tri Budi Santoso Titon Dutono Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi
Lebih terperinciPENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI
PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciRANCANG BANGUN APLIKASI PENGENAL PENUTUR MENGGUNAKAN METODE HIDDEN MARKOV MODEL (HMM)
RANCANG BANGUN APLIKASI PENGENAL PENUTUR MENGGUNAKAN METODE HIDDEN MARKOV MODEL (HMM) Maryati Gultom 1), Mukhlisa 2), Derry Alamsyah 3) 1 gultommaryati@gmail.com, 2 immobulus92@gmail.com, 3 derryfseiei@gmail.com
Lebih terperinciSistem Verifikasi Penutur menggunakan Metode Mel Frequensi.
SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik
Lebih terperincivii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI
vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Emosi Emosi adalah perasaan intens yang ditujukan kepada seseorang atau sesuatu dan juga merupakan reaksi terhadap seseorang atau kejadian.emosi dapat ditunjukkan ketika merasa
Lebih terperinciSISTEM PENGENALAN CHORD PADA FILE MUSIK DIGITAL DENGAN MENGGUNAKAN PITCH CLASS PROFILES DAN HIDDEN MARKOV MODEL. Ivanna K. Timotius, Adhi Prayogo
SISTEM PENGENALAN CHORD PADA FILE MUSIK DIGITAL DENGAN MENGGUNAKAN PITCH CLASS PROFILES DAN HIDDEN MARKOV MODEL Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen
Lebih terperinciPERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI
PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI DAPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciPERBANDINGAN METODE KUANTISASI VEKTOR DAN MODEL MARKOV TERSEMBUNYI PADA PENGENALAN PEMBICARA BERBAHASA INDONESIA TESIS
PERBANDINGAN METODE KUANTISASI VEKTOR DAN MODEL MARKOV TERSEMBUNYI PADA PENGENALAN PEMBICARA BERBAHASA INDONESIA TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut
Lebih terperinciPENGEMBANGAN HIDDEN MARKOV MODELS UNTUK FONEM BERBAHASA INDONESIA PADA SISTEM KONVERSI SUARA KE TEKS SRI DANURIATI
PENGEMBANGAN HIDDEN MARKOV MODELS UNTUK FONEM BERBAHASA INDONESIA PADA SISTEM KONVERSI SUARA KE TEKS SRI DANURIATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBab 3. Perancangan Sistem
34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara
Lebih terperinciPENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO
PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciPenerapanHidden Markov Model (HMM) pada Pengenalan Penutur
Jatisi, Vol. 1 No. 1 September 2014 111 PenerapanHidden Markov Model (HMM) pada Pengenalan Penutur Mukhlisa* 1, Maryati Gultom 2, Derry Alamsyah 3 1,2,3 STMIK GI MDP; Jln. Rajawali No. 14, 0711 376400
Lebih terperinciTRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY
TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION
PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION DETECTION OF THE LEVEL OF YOUTH, ADULTS AND ELDERLY BY USING MFCC METHOD AND FUZZY
Lebih terperinciAlgoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition
Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition Abstrak Angela Irfani 1, Ratih Amelia 2, Dyah Saptanti P 3 Laboratorium Ilmu dan Rekayasa Komputasi Departemen Teknik
Lebih terperinciBAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka
BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Suara adalah suatu alat komunikasi paling utama yang dimiliki oleh manusia. Dengan suara, manusia dapat berkomunikasi dengan manusia lainnya. Melalui suara,
Lebih terperinciAPLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT
APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT DAN LINEAR VECTOR QUANTIZATION UNTUK PENGENDALIAN GERAK ROBOT Anggoro Wicaksono, Sukmawati NE, Satriyo Adhy,
Lebih terperinciUNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007
UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 SPEAKER IDENTIFICATION DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF
Lebih terperinciPENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO
PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR
Lebih terperinciSuara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur
PEMBENTUKAN BASIS DATA UCAPAN DALAM BAHASA INDONESIA DAN PENGKODEANNYA BERDASARKAN LINEAR PREDICTIVE CODING (LPC) Elly Oktarina zonalee_cho@yahoo.com Universitas Gunadarma Jl. Margonda Raya No. 100 Pondok
Lebih terperinciBAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk
6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada
Lebih terperinciBAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian
BAB III METODE PENELITIAN 3.1 Model Penelitian Penelitian yang dilakukan dapat dijelaskan melalui blok diagram seperti yang terlihat pada Gambar 3.1. Suara Burung Burung Kacer Burung Kenari Pengambil an
Lebih terperinciPENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO
PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU
Lebih terperinciEKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON
EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON Nurmasyitah 1, Mursyidah 2, Jamilah 3 Program Studi Teknik Multimedia dan Jaringan, Jurusan Teknologi Informasi dan Komputer, Politeknik
Lebih terperinciJurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau
Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, 121-132 121 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Aplikasi Pengenalan Ucapan Dengan Ekstraksi Ciri Mel- Frequency Cepstrum Coefficients
Lebih terperincimemahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital dengan suatu pola tertentu. Kata-kata yang diucapkan di
APLIKASI PENGENALAN UCAPAN KATA BAHASA INGGRIS MENGGUNAKAN LINEAR PREDICTIVE CODING (LPC) DAN HIDDEN MARKOV MODEL (HMM) Juniar Lestary ne3a_azza@yahoo.com Universitas Gunadarma Jl. Margonda Raya No. 100
Lebih terperinciPenerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification
Jurnal Telematika, vol. 11 no. 1, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker
Lebih terperinciIdentifikasi Suara Pengontrol Lampu Menggunakan Mel-Frequency Cepstral Coefficients dan Hidden Markov Model
Identifikasi Suara Pengontrol Lampu Menggunakan Mel-Frequency Cepstral Coefficients dan Hidden Markov Model Angga Kersana Munggaran 1, Esmeralda C Djamal, Rezki Yuniarti Jurusan Informatika, Fakultas MIPA
Lebih terperinciPenekanan Derau secara Adaptif pada Pengenalan Ucapan Kata
Penekanan Derau secara Adaptif pada Pengenalan Ucapan Kata Achmad Bayhaki (L2F 002 541) Jurusan Teknik Elektro, Fakultas Teknik, Universitas Diponegoro, Semarang, Indonesia trainingmoment@yahoo.com Abstrak
Lebih terperinciSISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE
SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan
Lebih terperinciHYBRID JARINGAN SYARAF TIRUAN DAN MODEL MARKOV TERSEMBUNYI UNTUK PENGENALAN BILANGAN BERBAHASA INDONESIA MENGGUNAKAN CSLU TOOLKIT
HYBRID JARINGAN SYARAF TIRUAN DAN MODEL MARKOV TERSEMBUNYI UNTUK PENGENALAN BILANGAN BERBAHASA INDONESIA MENGGUNAKAN CSLU TOOLKIT Oleh ELLYSA KURNIASARI G64101043 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA
Lebih terperinciPERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA
PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,
Lebih terperinciUNIVERSITAS BINA NUSANTARA
UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006 PERANCANGAN SISTEM PROTEKSI FILE DENGAN PASSWORD SUARA Rendy Sesario 0600615431 Samanta Limbrada
Lebih terperinciBAB III. Hidden Markov Models (HMM) Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata,
BAB III Hidden Markov Models (HMM) 3.1 Pendahuluan Rantai Markov mempunyai state yang dapat diobservasi secara langsung. Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata, beberapa
Lebih terperinciBAB I PENDAHULUAN 1.1 LATAR BELAKANG
BAB I PENDAHULUAN 1.1 LATAR BELAKANG Informasi tentang pemasangan iklan di suatu radio (antara lain mengenai, jam berapa suatu iklan ditayangkan, dalam sehari berapa kali suatu iklan ditayangkan dan berapa
Lebih terperinciPengembangan Model Markov Tersembunyi untuk Pengenalan Kata Berbahasa Indonesia. Agus Buono', Yani Mandasarl', Shelvie Nidya Neyman"
~l!..... f'p' Pengembangan Model Markov Tersembunyi untuk Pengenalan Kata Berbahasa ndonesia Agus Buono', Yani Mandasarl', Shelvie Nidya Neyman" Departemen lmu Komputer FMPA PB Kampus PB Darmaga-Bogor
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN
BAB IV HASIL DAN PEMBAHASAN 4.1. Pengujian Perangkat Lunak Dalam mengetahui perangkat lunak yang dibuat bisa sesuai dengan metode yang dipakai maka dilakukan pengujian terhadap masin-masing komponen perangkat.
Lebih terperinciPERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER
PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER MUTIA FIJRI TAUFANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium,
Lebih terperinciMETODE PENELITIAN. Gambar 1 Alur metode penelitian.
akan menggunakan bantuan aplikasi pemrosesan audio (Rochesso 2007). Penambahan Derau Derau merupakan suara-suara yang tidak diinginkan. Munculnya derau dapat menurunkan kualitas suatu berkas audio. Penambahan
Lebih terperinciPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
IDENTIFIKASI SUARA MANUSIA SEBAGAI KATA SANDI ATAU PASSWORD MENGGUNAKAN METODE HIDDEN MARKOV MODELS SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik
Lebih terperinciBAB I PENDAHULUAN I.1 Latar Belakang
BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring
Lebih terperinciANALISA DAN PERANCANGAN PERANGKAT LUNAK PERINTAH SUARA SEBAGAI PENUNJANG SARANA INPUT PADA SISTIM OPERASI MICROSOFT WINDOWS XP
UNIVERSITAS BINA NUSANTARA Jurusan Tehnik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 ANALISA DAN PERANCANGAN PERANGKAT LUNAK PERINTAH SUARA SEBAGAI PENUNJANG SARANA INPUT PADA
Lebih terperinciUNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV
UNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV SKRIPSI YUNANTO WIDYATMAJI 0404030881 FAKULTAS TEKNIK
Lebih terperinciKAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI. Oleh : SITI NURBAITI G
KAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI Oleh : SITI NURBAITI G14102022 DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007 ABSTRAK SITI
Lebih terperinciBAB II DASAR TEORI Suara. Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan
BAB II DASAR TEORI 2. 1 Suara Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitude tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun benda
Lebih terperinciAvailable online at TRANSMISI Website TRANSMISI, 13 (3), 2011,
Available online at TRANSMISI Website http://ejournal.undip.ac.id/index.php/transmisi TRANSMISI, 13 (3), 2011, 82-86 Research Article Aplikasi Pengenalan Ucapan dengan Ekstraksi Mel-Frequency Cepstrum
Lebih terperinciDigital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods
Pemrosesan Sinyal DigitalUntuk Mengidentifikasi Akord Dasar Penyanyi Dengan Metode Mel Frequency Cepstral Coeficients (MFCC) Dan Jaringan Syaraf Tiruan Backpropagation Digital Signal Processing To Identify
Lebih terperinciSISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR
SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR Ali Mustofa Jurusan Teknik Elektro, Universitas Brawijaya Email: a_tofa@yahoo.com Abstrak - Pengenalan penutur adalah
Lebih terperinciPENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO
PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU
Lebih terperinciPREDIKSI PERGERAKAN NILAI TUKAR RUPIAH TERHADAP DOLAR AMERIKA SERIKAT MENGGUNAKAN HIDDEN MARKOV MODEL (HMM)
Jurnal LOG!K@, Jilid 6, No 1, 2016, Hal 32-41 ISSN 1978 8568 PREDIKSI PERGERAKAN NILAI TUKAR RUPIAH TERHADAP DOLAR AMERIKA SERIKAT MENGGUNAKAN HIDDEN MARKOV MODEL (HMM) Mahmudi dan Ardi Program Studi Matematika,
Lebih terperinciIMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION
IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION TUGAS AKHIR Diajukan Untuk Memenuhi Sebagian Persyaratan Dalam Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun oleh : PAULA
Lebih terperinciPengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu
239 Pengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu Zulham Effendi *), Firdaus **), Tati Erlina ***), Ratna Aisuwarya
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Suara Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara
Lebih terperinci