PERBANDINGAN METODE KUANTISASI VEKTOR DAN MODEL MARKOV TERSEMBUNYI PADA PENGENALAN PEMBICARA BERBAHASA INDONESIA TESIS

Ukuran: px
Mulai penontonan dengan halaman:

Download "PERBANDINGAN METODE KUANTISASI VEKTOR DAN MODEL MARKOV TERSEMBUNYI PADA PENGENALAN PEMBICARA BERBAHASA INDONESIA TESIS"

Transkripsi

1 PERBANDINGAN METODE KUANTISASI VEKTOR DAN MODEL MARKOV TERSEMBUNYI PADA PENGENALAN PEMBICARA BERBAHASA INDONESIA TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh DEVI HANDAYA NIM : (Program Studi Magister Teknik Elektro) INSTITUT TEKNOLOGI BANDUNG Juni 2016

2 ABSTRAK PERBANDINGAN METODE KUANTISASI VEKTOR DAN MODEL MARKOV TERSEMBUNYI PADA PENGENALAN PEMBICARA BERBAHASA INDONESIA Oleh Devi Handaya NIM: (Program Studi Magister Teknik Elektro) Tesis ini menyajikan perbandingan dua buah metode pengklasifikasi berdasarkan tingkat akurasi dalam mengenali pembicara berbahasa Indonesia. Metode pertama adalah Kuantisasi Vektor (KV) yang merupakan sebuah metode pengenalan pembicara berbasis jarak distorsi dan metode kedua adalah Model Markov Tersembunyi (MMT) berbasis nilai peluang dari data yang terobservasi. Perbandingan dilakukan untuk pengucapan sebuah kata, kalimat sederhana, dan kalimat lengkap. Berdasarkan eksperimen, dapat disimpulkan bahwa umumnya metode MMT menghasilkan akurasi yang lebih baik dari pada metode KV terutama untuk data dengan pengucapan kalimat sederhana. Kata kunci: Kuantisasi Vektor (KV), Model Markov Tersembunyi (MMT), Pengenalan Pembicara Berbahasa Indonesia i

3 ABSTRACT COMPARISON OF THE INDONESIAN SPEAKER RECOGNITION USING VECTOR QUANTIZATION AND HIDDEN MARKOV MODEL By Devi Handaya NIM: (Electrical Engineering Master Program ) This thesis presents a comparison of two classifier methods based on the level of accuracy in recognizing the Indonesian speaker. The first method is Vector Quantization (VQ), which is a speaker recognition method based on distortion distance and the second method is Hidden Markov Model (HMM) based on the probability value of the data is observed. Comparisons are made in the pronunciation of a word, simple sentences, and complete sentences. Based on the experiments, it can be concluded that in general HMM method yields better accuracy than VQ method especially for data with the pronunciation of simple sentences. Keywords: Vector Quantization (VQ), Hidden Markov Model (HMM), Indonesian Speaker Recognition ii

4 PEDOMAN PENGGUNAAN TESIS Tesis S2 yang tidak dipublikasikan terdaftar dan tersedia di Perpustakaan Institut Teknologi Bandung, dan terbuka untuk umum dengan ketentuan bahwa hak cipta ada pada pengarang dengan mengikuti aturan HaKI yang berlaku di Institut Teknologi Bandung. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau peringkasan hanya dapat dilakukan seizin pengarang dan harus disertai dengan kaidah ilmiah untuk menyebutkan sumbernya. Sitasi hasil penelitian Tesis ini dapat ditulis dalam bahasa Indonesia sebagai berikut: Handaya, D. (2016): Perbandingan Metode Kuantisasi Vektor dan Model Markov Tersembunyi Pada Pengenalan Pembicara Berbahasa Indonesia, Tesis Program Magister, Institut Teknologi Bandung. dan dalam bahasa Inggris sebagai berikut: Handaya, D. (2016): Comparison of the Indonesian speaker recognition using vector quantization and hidden markov model, Master s Program Thesis, Institut Teknologi Bandung. Memperbanyak atau menerbitkan sebagian atau seluruh tesis haruslah seizin Dekan Sekolah Pascasarjana, Institut Teknologi Bandung. iii

5 KATA PENGANTAR Dengan menyebut nama Allah yang Maha Pemurah lagi Maha Penyayang, puji syukur diucapkan ke hadirat-nya, akhirnya penulis dapat menyusun dan menyelesaikan tesis yang berjudul Perbandingan Metode Kuantisasi Vektor dan Model Markov Tersembunyi Pada Pengenalan Pembicara Berbahasa Indonesia". Tesis ini disusun guna memenuhi persyaratan untuk menyelesaikan jenjang magister dari Program Studi Magister Teknik Elektro, Institut Teknologi Bandung. Penulis juga mengucapkan terima kasih atas kerjasama dan dukungan dari berbagai pihak baik secara psikis maupun disiplin ilmu kepada: Bapak Prof. Dr. Carmadi Machbub, selaku pembimbing pertama yang telah memberikan bimbingan, arahan dan motivasi dalam menyelesaikan tesis ini. Bapak Dr. Egi Muhammad Idris Hidayat, selaku pembimbing kedua yang telah memberikan bimbingan, arahan dan motivasi dalam menyelesaikan tesis ini. Bapak Dr. Iyas Munawar, selaku dosen wali yang telah memberikan bimbingan, arahan dan motivasi dalam menyelesaikan perkuliahan. Bapak Iwan, Resti Fauziah, bapak Hanif F dan kang Wisnu yang selalu menyertai penulis selama mengerjakan penelitian dan bekerjasama dalam menyelesaikan tesis ini. Rekan rekan Kendali dan Sistem Cerdas 2014 yang selalu memberikan semangat, kejutan, dan diskusi diskusinya selama menyelesaikan perkuliahan. Kedua orang tua yang saya cintai, Bapak dan Ibu terima kasih dukungan dan do anya, sehingga penulis dapat menyelesaikan tesis ini. Relawan yang bersedia menyumbangkan suaranya sebagai objek penelitian dalam penelitian tesis ini. Dan pihak pihak yang juga telah banyak memberikan bantuan kepada penulis yang tidak dapat penulis sebutkan satu per satu. iv

6 Penulis menyadari bahwa tesis ini masih jauh dari sempurna, banyak kelemahan baik dalam penyajian maupun penulisannya. Oleh karena itu penulis mengharapkan kritik dan saran yang membangun guna penyempurnaan penelitian dan penulisan selanjutnya. Akhir kata penulis berharap semoga penulisan tesis ini dapat bermanfaat bagi kita semua. Bandung, Juni 2016 Penulis v

7 DAFTAR ISI ABSTRAK... i ABSTRACT... ii PEDOMAN PENGGUNAAN TESIS... iii KATA PENGANTAR... iv DAFTAR ISI... vi DAFTAR LAMPIRAN... vii DAFTAR GAMBAR... viii DAFTAR TABEL... x Bab I Pendahuluan... 1 I.1 Latar Belakang... 1 I.2 Tujuan... 2 I.3 Batasan Masalah... 3 I.4 Metode Penelitian... 3 I.5 Sistematika Penulisan... 4 Bab II Tinjauan Pustaka... 6 II.1 Pengenalan Suara... 6 II.2 Ekstraksi Fitur: Mel Frequency Cepstral Coefficients... 8 II.3 Kuantisasi Vektor (KV) II.4 Model Markov Tersembunyi (MMT) II.5 Bahasa Indonesia Bab III Perancangan Sistem dan Eksperimen III.1 Perancangan Awal Sistem dan Eksperimen Pengenalan Pembicara 22 III.2 Perancangan Sistem dan Eksperimen Ekstraksi Fitur III.3 Perancangan Sistem dan Eksperimen Pengklasifikasi Bab IV Pengujian dan Pembahasan IV.1 Pengujian Sistem IV.2 Pembahasan Bab V Kesimpulan dan Saran V.1 Kesimpulan V.2 Saran DAFTAR PUSTAKA vi

8 DAFTAR LAMPIRAN Lampiran A Data Hasil Pengujian Pengenalan Pembicara dengan Metode Kuantisasi Vektor...L1 A.1 Pengujian Kata...L1 A.2 Pengujian Kalimat Sederhana...L3 A.3 Pengujian Kalimat Lengkap...L5 Lampiran B Data Hasil Pengujian Pengenalan Pembicara dengan Metode Model Markov Tersembunyi...L7 B.1 Pengujian Kata...L7 B.2 Pengujian Kalimat Sederhana...L9 B.3 Pengujian Kalimat Lengkap...L11 vii

9 DAFTAR GAMBAR Gambar II.1 Sistem produksi suara manusia... 6 Gambar II.2 Sistem pendengaran dalam teling manusia... 7 Gambar II.3 Diagram blok proses MFCC... 8 Gambar II.4 Proses frame blocking... 9 Gambar II.5 Mel frequency wrapping Gambar II.6 Konsep diagram dalam formasi buku kode kuantisasi vektor Gambar II.7 Model markov tersembunyi tipe ergodik Gambar II.8 Model markov tersembunyi tipe kiri ke kanan Gambar II.9 Alur proses algoritma maju Gambar II.10 Alur proses algoritma mundur Gambar III.1 Diagram blok utama dalam sistem pengenalan pembicara Gambar III.2 Mel filter bank Gambar III.3 Proses pengenalan pembicara dengan metode kuantisasi vektor Gambar III.4 Diagram alir pelatihan algoritma Linde, Buzo, dan Gray Gambar III.5 Proses pengenalan pembicara menggunakan metode model markov tersembunyi Gambar III.6 Diagram alir pelatihan dengan metode model markov tersembunyi Gambar III.7 Diagram alir algoritma Baum Welch Gambar III.8 Diagram alir pengujian dengan metode model markov tersembunyi Gambar IV.1 Digram blok perbandingan pengujian pengenalan pembicara Gambar IV.2 Penggambaran sinyal suara dalam pengucapan kata saya yang digunakan sebagai data latih Gambar IV.3 Penggambaran sinyal suara dalam pengucapan kata saya yang digunakan sebagai data uji Gambar IV.4 Penggambaran sinyal suara dalam pengucapan kalimat saya sedang belajar yang digunakan sebagai data uji viii

10 Gambar IV.5 Penggambaran sinyal suara dalam pengucapan kalimat saya berangkat menggunakan bus ke kampus yang digunakan sebagai data uji Gambar IV.6 Pengujian kata dalam kuantisasi vektor dan model markov tersembunyi Gambar IV.7 Pengujian kalimat sederhana dalam kuantisasi vektor dan model markov tersembunyi Gambar IV.8 Pengujian kalimat lengkap dalam kuantisasi vektor dan model markov tersembunyi ix

11 DAFTAR TABEL Tabel III.1 Waktu pengambilan data untuk data latih dan data uji Tabel IV.1 Data hasil pengenalan pembicara dalam pengujian kata dengan metode kuantisasi vektor Tabel IV.2 Data hasil pengenalan pembicara dalam pengujian kalimat sederhana dengan metode kuantisasi vektor Tabel IV.3 Data hasil pengenalan pembicara dalam pengujian kalimat lengkap dengan metode kuantisasi vektor Tabel IV.4 Data hasil pengenalan pembicara dalam pengujian kata dengan metode HMM Tabel IV.5 Data hasil pengenalan pembicara dalam pengujian kalimat sederhana dengan metode HMM Tabel IV.6 Data hasil pengenalan pembicara dalam pengujian kalimat lengkap dengan metode HMM Tabel IV.7 Perbandingan hasil rekapitulasi akurasi x

12 Bab I Pendahuluan I.1 Latar Belakang Suara merupakan salah satu komponen penunjang yang digunakan manusia dalam berkomunikasi. Seperti halnya gambar atau citra, suara manusia juga memiliki keunikannya masing masing walaupun terkadang ada yang dapat menirukan suara orang lain, tetapi dasarnya tidak akan identik dengan pemilik suara aslinya. Hal yang unik dari suara manusia berupa amplitudo suara, nada bicara, bahkan setiap wilayah memiliki logatnya masing masing dan sebagainya. Dengan adanya keunikan tersebut, maka setiap suara manusia dapat dibedakan. Manusia dapat mengenali pemilik suara orang lain dengan frekuensi kebiasaan mendengar suara tersebut, sehingga lama kelamaan akan hafal. Umumnya teknologi pengenalan identitas dari keunikan ini yang biasa dikenal dengan teknologi biometrik dengan membandingkan kecocokan antara data biometrik seseorang yang berada di basis data. Beberapa jenis teknologi tersebut digunakan dalam pengenalan suara (voice recognition), pengenalan wajah (face recognition), pengenalan iris mata (iris recognition), pengenalan sidik jari, dan pengenalan tulisan tangan (handwriting recognition). Teknologi pengolahan sinyal suara saat ini telah dikembangkan dalam mengenali sinyal suara tersebut. Pengolahan sinyal suara tidak kalah pentingnya dibandingkan dengan pengolaha citra. Hal ini dikarenakan pengolahan citra atau gambar hanya terbatas jika terdapat kontak langsung dengan objek, sehingga pengembangnya perlu memikirkan cara untuk menembus batasan batasan tersebut seperti objek yang tidak tampak karena terhalangi oleh gedung atau tembok, sedangkan pengolahan sinyal suara dapat diamati saat amplitudo suaranya besar, sehingga mencakup jarak pengamat. Pengenalan pembicara (speaker recognition) yang merupakan bagian dari pengenalan suara adalah proses yang dilakukan mesin cerdas dalam mengenali pembicara berdasarkan informasi keunikan pribadi dari sinyal suaranya (Irino T, 1

13 dkk., 2002). Pengenalan pembicara telah digunakan dalam melakukan verifikasi identitas pembicara dan mengendalikan sistem seperti penekanan nomor telepon (voice dialing), absensi, kemanan benda rahasia, dan pengendali jarak jauh dengan komputer (Abdallah S, dkk., 2012). Penelitian dalam pengolahan sinyal suara menjadi bahan perbincangan praktisi sistem kecerdasan buatan (Artificial Inteligence). Dengan munculnya beberapa metode yang digunakan dalam melakukan pengenalan pembicara seperti yang dilakukan oleh Yuan Yujin, dkk. (2010) dalam mengekstraksi suara menggunakan Mel Frequency Cepstral Coefficient (MFCC) yang memiliki rata-rata pengenalan pembicara sebesar 89,2% dan Linear Prediction Cepstrum Coefficient (LPCC) yang memiliki rata-rata pengenalan pembicara sebesar 87,63%, sehingga MFCC dapat lebih baik dalam mengekstraksi suara. Kemudian beberapa penelitian yang menggunakan Model Markov Tersembunyi (MMT) dan Kuantisasi Vektor (KV) sebagai pengklasifikasi dalam penelitian yang dilakukan Ivan K. T. dan Danie Kurniawan (2011) menggunakan MMT dapat mencapai tingkat keberhasilan 76,52%, penelitian menggunakan KV dengan akurasi 95% yang dilakukan oleh Danko Komlen (2011), kemudian dengan tingkat akurasi 82% menggunakan MFCC - KV lebih baik dibandingkan menggunakan LPCC KV (Jorge Martinez, 2012), dan begitu pula disampaikan penelitian Shahzadi Farah dan Azra Shamim (2013) bahwa MFCC KV lebih baik dibandingkan dengan menggunakan Linear Predictive Coding (LPC) - KV. Dengan demikian penelitian ini akan membuktikan kehandalan dua buah metode yang banyak digunakan oleh peneliti sebelumnya dengan pengujian untuk pembicara yang menggunakan bahasa Indonesia untuk metode Kuantisasi Vektor (KV) dan Model Markov Tersembunyi (MMT). Analisis perbandingan ini belum pernah dilakukan untuk pembicara yang menggunakan bahasa Indonesia, sehingga pengujian dilakukan kepada pembicara yang menggunakan bahasa Indonesia. I.2 Tujuan Tujuan penelitian yang dilakukan adalah sebagai berikut. 1. Merancang sistem pengenalan suara manusia berbahasa Indonesia 2

14 2. Mengamati pengaruh sistem pengenalan suara manusia berbahasa Indonesia terhadap pengujian kata dan kalimat dari data latih kata 3. Membandingkan sistem pengenalan suara manusia berbahasa Indonesia melalui metode Kuantisasi Vektor (KV) dan Model Markov Tersembunyi (MMT) I.3 Batasan Masalah Untuk menyederhanakan masalah dan efisiensi waktu serta biaya, dalam penelitian ini terdapat pembatasan masalah sebagai berikut. 1. Perangkat yang digunakan berupa mikrofon analog 16 Bit dengan frekuensi sampling Hz, laptop dengan prosesor core i3 dan RAM 2GB 2. Perancangan pemrograman simulasi pengenalan suara menggunakan Matlab R2013b 3. Sampel suara yang direkam berupa kata saya sebagai data latih dan data uji dengan durasi 2 detik, kalimat saya sedang belajar sebagai data uji dengan durasi 3 detik, dan kalimat Saya berangkat menggunakan bus ke kampus yang kemudian disimpan dalam format.wav 4. Pengambilan data dilakukan secara luar jaringan (offline) agar mendapatkan beberapa data pengukuran seperti jarak euclidean, parameter pemodelan, dan nilai parameter evaluasi I.4 Metode Penelitian Dalam menyelesaikan penelitian tesis ini diperlukan langkah langkah sebagai berikut: 1. Studi literatur Mempelajari dan menganalisis berbagai sumber informasi seperti buku buku dan literatur referensi yang serupa dengan penelitian yang akan dilakukan 2. Analisis desain Berdasarkan hasil studi literatur akan dibuat analisis desain dalam menyelesaikan proses perbandingan algoritma untuk setiap metode 3. Pembuatan sistem Hasil perancangan diimplementasikan dengan menggunakan Matlab sebagai pemrosesan sistem pengenalan suara 3

15 4. Pengujian dan evaluasi Berdasarkan aplikasi yang telah dibuat kemudian dilakukan uji coba sistem dan mengevaluasi sistem sesuai dengan tujuan penelitian 5. Pengambilan data Setelah pengujian dan didapatkan hasil yang sesuai dengan tujuan penelitian kemudian dilakukan pengambilan data 6. Penulisan laporan Penulisan laporan hasil pengujian dan pengambilan data dibukukan dalam laporan penelitian I.5 Sistematika Penulisan Dalam penulisan laporan tesis ini terdiri dari lima bab dengan masing masing bab menguraikan beberapa hal yang terkait dengan perancangan yang dilakukan. Bab I Pendahuluan. Bab ini mengemukakan latar belakang, tujuan, batasan masalah, metode penelitian, dan sistematika penulisan. Bab II Tinjauan Pustaka. Bab ini menjelaskan teori dasar mengenai pengenalan pembicara (speaker recognition), mel-frequency cepstral coefficient, kuantisasi vektor, model markov tersembunyi, dan bahasa Indonesia. Bab III Perancangan Sistem dan Eksperimen. Bab ini membahas perancangan awal sistem dan eksperimen pengenalan pembicara, perancangan sistem dan eksperimen yakni ekstraksi fitur, dan perancangan sistem dan ekesperimen untuk pengklasifikasi, serta perangkat lunak pengenalan pembicara. Bab IV Pengujian dan Pembahasan. Bab ini membahas pengujian sistem pengenalan pembicara yang menghasilkan data yang dibutuhkan sebagai analisis pembahasan perbandingan metode. 4

16 Bab V Penutup. Bab ini mengemukakan bagian penutup dari pelaporan penelitian yang meliputi kesimpulan dan saran agar dapat dikembangkan dengan metode lainnya untuk sistem kerja yang sama. Dalam bab selanjutnya akan disampaikan teori-teori dasar hasil dari peninjauan beberapa literatur yang digunakan. Literatur tersebut dapat berupa buku-buku, makalah penelitian yang telah dipublikasikan, dan sebagainya yang dijadikan sebagai referensi dalam melakukan penelitian ini. 5

17 Bab II Tinjauan Pustaka II.1 Pengenalan Suara II.1.1 Suara Manusia Suara manusia merupakan operasi penyaringan sinyal akustik saat bekerjanya laring dan paru sebagai sumber perangsang dan hidung sebagai filter. Fitur utama dari suara manusia yaitu nada dan pola suara yang berasal dari pita suara saat bergetar, sehingga membentuk frekuensi nada. Ketika udara melalui laring, udara bergetar dengan frekuensi nada. Kemudian udara yang mengalir melalui supralaring akan mulai bergaung dengan frekuensi tertentu yang ditentukan berdasarkan panjang dan diameter rongga saluran supralaring yang biasa disebut sebagai resonansi (Elminir, 2012). Gambar II.1 Sistem produksi suara manusia ( 6

18 Telinga merupakan organ tubuh yang digunakan manusia dalam sistem pendengaran. Melakukan pembuatan sistem pendengaran manusia menjadi tantangan para peneliti untuk dapat melakukan pengolahan sifat sifat suara yang ada dalam suara manusia dengan berbagai jenis kebisingan lingkungan. Model pengembangan komputasi dibuat dengan meniru sifat psikoakustik dari telinga bagian dalam berdasarkan fitur sistem penyaringan mekanis dan getaran. Gambar II.2 Sistem pendengaran dalam telinga manusia ( II.1.2 Pengenalan Pembicara (Speaker Recognition) Konsep pengenalan suara umumnya dapat dikategorikan dua bagian, yaitu pengenalan pembicaraan (speech recognition) dan pengenalan pembicara (speaker recognition). Pengenalan pembicaraan berkaitan dengan proses mengenali pembicaraan berdasarkan sinyal suara yang diucapakan seperti aplikasi suara ke teks (Speech-to-Text) atau teks ke suara (Text-to-Speech), sedangkan pengenalan pembicara merupakan sistem yang digunakan secara otomatis dalam mengenali pemilik atau individu yang sedang berbicara melalui sinyal suaranya. Proses tersebut dilakukan oleh mesin cerdas berdasarkan informasi keunikan pribadi dari sinyal suaranya (Irino T, dkk., 2002). 7

19 Pengenalan pembicara sendiri sebenarnya dapat dibagi menjadi dua, yaitu verifikasi pembicara (speaker verification) merupakan proses verifikasi seorang pembicara yang sebelumnya identitas pembicara telah diketahui. Proses dilakukan dengan membandingkan one to one (1:1), dengan kata lain fitur suara yang masuk saat itu dibandingkan langsung dengan fitur suara seseorang tertentu, sedangkan identifikasi pembicara (speaker identification) merupakan proses mendapatkan identitas dari seorang pembicara dengan melakukan perbandingan fitur suara yang dimasukan dengan semua fitur suara dari tiap tiap pembicara yang telah disimpan dalam basis data. Proses ini dilakukan dengan membandingkan one to many (1:N) (Darma Putra dan Adi Resmawan, 2011). Dalam penelitian ini ditekankan terhadap sistem pengenalan pembicara khususnya identifikasi pembicara karena suara yang dimasukan akan dibandingkan dengan beberapa suara yang telah disimpan sebelumnya di basis data. Hasil perhitungan perbandingan yang paling mendekati kecocokannya dianggap sebagai pemilik suara dari individu tertentu. II.2 Ekstraksi Fitur: Mel Frequency Cepstral Coefficients Setiap sinyal suara atau ucapan memiliki cirinya masing masing yang menjadikannya unik dimiliki setiap individu, sehingga dapat digunakan dalam mengenali pembicara. Untuk dapat dikenali, tentunya sinyal suara tersebut perlu dicari ciri cirinya dengan metode komputasi yang dapat mengekstraksi ciri suara seseorang. Salah satu metode yang banyak digunakan dalam mengekstrasi ciri suara yaitu metode Mel Frequency Cepstral Coefficients (MFCC). Diagram blok proses MFCC digambarkan sebagai berikut. Sinyal Suara Praproses Frame Blocking Windowing Cepstrum DCT Mel Frequency Warping FFT Proses MFCC Gambar II.3 Diagram blok proses MFCC 8

20 Di awal proses MFCC, dilakukan proses normalisasi terhadap sinyal suara yang lemah dan dilakukan penyaringan (filtering) menggunakan tapis lolos rendah (lowpass filter) agar derau spektrum tinggi yang tidak diperlukan tidak perlu diolah. Tahap tahap yang dilalui dalam proses MFCC dijelaskan sebagai berikut. II.2.1 Frame Blocking dan Windowing Sinyal suara merupakan sinyal yang tidak stasioner atau sifatnya berubah ubah terhadap, sehingga tidak dapat dilakukan ekstraksi ciri secara langsung. Oleh karena itu, sinyal dikelompokkan menjadi beberapa blok dan proses diskontinyu diminimalkan di bagian awal dan akhir sinyal. Parameter proses windowing yaitu lebar jendela, jarak antar jendela, dan bentuk jendela yang kemudian menghasilkan ukuran bingkai (M) dan perpindahan bingkai (N). Prosesnya dapat dilihat seperti gambar berikut. N N N N M M M M M Gambar II.4 Proses frame blocking Persamaan yang digunakan dalam proses windowing dalam penelitian ini menggunakan hamming window dengan persamaan berikut. w[n] = 0,54 0,46 cos ( 2πn N x 1 ) dengan: w[n] = windowing ke-n N x = jumlah data dari sinyal / jumlah sampel dalam tiap bingkai n = waktu diskrit ke-n dengan nilai fungsi jendela untuk waktu ke n, (II.1) Hasil perhitungan persamaan (II.1) selanjutnya dimasukan ke persamaan berikut. y[n] = w[n] s[n] (II.2) 9

21 dengan: y[n] = sinyal setelah windowing s[n] = sinyal asli II.2.2 Fast Fourier Transform (FFT) Setiap sinyal yang berada dalam ranah waktu untuk dapat diproses MFCC tentunya harus ditransformasikan terlebih dahulu ke dalam ranah frekuensi dengan menggunakan Fast Fourier Transform. Dasarnya, sinyal yang masuk untuk diproses adalah sinyal diskrit, sehingga proses transformasinya menggunakan persamaan Discrete Fourier Transform (DFT) berikut. N f 1 X k = x r e j2πkr N f r=0 (II.3) dengan: X k = sinyal dalam ranah frekuensi N f = jumlah sinyal sampling r = sinyal periodik sampling k = indeks ranah frekuensi Persamaan (II.3) dapat ditulis kembali menjadi, X k = N f 1 r=0 x r w rk, dengan w = e j 2π N f (II.4) Misalkan bahwa N f dapat dibagi dua, maka persamaan (II.4) menjadi r genap dan r ganjil, sehingga persamaan menjadi berikut. N f 2 1 N f 2 1 N 2 1 r=0 + X k = r=0 x 2r w 2rk + x (2r+1) w (2r+1)k r=0 = x 2r w 2rn N 2 1 w n r=0 x (2r+1) w 2rn (II.5) Suku pertama persamaan (II.5) yaitu r genap {x 0, x 2,, x Nf 2} N f 2 1 E k = r=0 x 2r w 2rn (II.6) Suku kedua persamaan (II.5) yaitu r ganjil {x 1, x 3,, x Nf 1} N f 2 1 O k = r=0 x (2r+1) w 2rn (II.7) Kemudian DFT dalam deret N f dapat dinyatakan dengan persamaan berikut. X k = E k + w n O k (II.8) 10

22 Karena DFT dalam deret N f, maka hubungan periodiknya menjadi, 2 E k = E k+ N f 2 dan O k = O k+ N f 2 (II.9) (II.10) Dengan demikian, untuk dapat mencari spektrum tertentu hanya perlu melakukan sebanyak dua kali ( N f 2 )2 atau N 2 f perkalian (Indah Susilawati, 2009). Sesuai dengan 2 namanya yaitu fast atau cepat dalam FFT lebih cepat dibandingkan dengan DFT misalkan terdapat n buah data, dengan DFT memerlukan perhitungan n 2 kali perhitungan. Dalam FFT perhitungan memerlukan ( n 2 + 1)n + n 2 kali. Misalkan jika n = 100, maka dengan DFT perlu = kali perhitungan, sedangkan dengan FFT cukup dilakukan ( )100 + = (51x100) + 50 = 5150 kali perhitungan. 2 2 II.2.3 Mel Frequency Warping Proses warping spectrum sinyal dengan menggunakan mel filter bank segitiga. Proses ini dilakukan untuk melinierkan ekstraksi ciri agar memperoleh vektor fitur yang mewakili amplitude terkompresi secara logaritmik. Untuk mengubah frekuensi suara menjadi frekuensi mel menggunakan skala mel yang dimaksudkan karena pendengaran manusia tidak berskala linier, sehingga tinggi subjektif di tiap nada dapat terukur dengan skala mel (Zilvan, 2011). Persamaan dalam membentuk skala mel adalah sebagai berikut. mel (f) = 2595 loq 10 (1 + f ) (II.11) 700 dengan: f = frekuensi (Hz) Proses dilakukan seperti dalam Gambar II.5 berikut. 11

23 2 Mel - Filter Bank Frekuensi (Hz) Gambar II.5 Mel frequency wrapping Seperti yang disebutkan sebelumnya bahwa mel filter bank berbentuk segitiga. Dengan frekuensi (Hz) diwakili oleh sumbu X dan power (db) sinyal suara diwakili oleh sumbu Y. II.2.4 Discrete Cosine Transform (DCT) Bagian ini, merupakan proses terakhir agar diperoleh vektor ciri yang diinginkan. Discrete Cosine Transform merupakan transformasi Fourier yang dikenakan untuk fungsi sinyal diskrit dengan hanya mengambil bagian cosinus saja dari eksponensial kompleks. Persamaan yang diberikan adalah sebagai berikut. F(k) = dengan: N f 1 r=0 f(n) F(k) = fungsi sinyal diskrit cosinus f(n)= fungsi sinyal diskrit. cos ( 2πrk N ) (II.12) Jika dalam DFT dihasilkan variabel kompleks yang terdiri dari bagian riil dan imajiner, maka hasil DCT hanya berupa bagian riil tanpa imajiner. Hal ini banyak membantu karena dapat mengurangi perhitungan. Dalam DCT nilai besaran adalah hasil dari DCT itu sendiri dan tanpa memperhatikan fasanya. 12

24 II.3 Kuantisasi Vektor (KV) Kuantisasi vektor adalah sebuah proses dalam memetakan vektor dari ruang vektor yang besar menjadi bentuk terbatas dalam ruang tersebut (Yegnanarayana B, dkk., 2001). Kuantisasi vektor yang digunakan dalam penelitian ini adalah metode Linde, Buzo, dan Gray (LBG). Dasarnya kuantisasi vektor ini berawal dari algoritma Lloyd (K-means algorithm atau Lloyd algorithm), yang kemudian dikembangkan menjadi algoritma LBG (Linde Y, dkk., 1980). Algoritma Lloyd membagi satu set vektor training menjadi L sel. Secara sederhana dipaparkan oleh I. Elfitri (2002), algoritmanya dapat dijelaskan sebagai berikut. Inisialisasi Atur untuk m = 0 (iterasi ke-m). Tentukan satu set vektor kode y i (0), 1 i L. (buku kode awal). Klasifikasi Buat satu set vektor latih ke dalam L sel dengan aturan nearest neighbor : x C i (m vq ), jika d[x, y i (mm vq )] d[x, y j (m vq )], untuk semua j i (II.13) dengan: d = distance C i (m vq ) = indeks centroid Perbaharui vektor kode Ubah m vq menjadi m vq + 1. Hitung kembali vektor kode yang baru di tiap sel dengan prinsip centroid. y i (m vq ) = centroid[c i (m vq )], 1 i L (II.14) Tes terminasi iterasi Jika terdapat penurunan distorsi D(m vq ) dalam iterasi ke- m relatif terhadap D = D(m vq -1) lebih kecil dari nilai ambang tertentu, maka iterasi dihentikan. Jika tidak, maka kembali lagi ke langkah dua Agar tiap-tiap iterasi dapat menghasilkan sebuah buku kode yang optimal, maka harus dipenuhi dengan dua keadaan yaitu aturan nearest neighbor dan centroid. Nearest neighbor melakukan klasifikasi berdasarkan kedekatan lokasi suatu data dengan data lain (Eko Prasetyo, 2012). Algoritma LBG merupakan penyempurnaan algoritma Lloyd dengan menambahkan proses pembagian (splitting) agar memperoleh buku kode awal. Centroid dari semua vektor masukan dibagi menjadi 13

25 dua vektor kode. Kemudian dalam satu set vektor training akan dibagi dua dengan aturan nearest neighbor. Centroid dari kedua kluster tersebut kemudian diiterasi dengan algoritma Lloyd, sehingga diperoleh dua vektor kode dalam 1 bit quantizer. Proses tersebut kembali diiterasi, sehingga didapatkan vektor quantizer yang diinginkan (I. Elfitri, 2008). Masukan fitur vektor dibandingkan dengan seluruh kode buku. Kode buku dengan nilai jarak rata rata paling dekat yang dipilih. Rumus untuk menghitung besarnya jarak euclidean didefinisikan berikut. n y = i ei=1 (p ei q ei ) 2 (II.15) dengan: y = jarak euclidean ei = jumlah euclidean indeks n i = jumlah semua euclidean Dengan p dan q merupakan nilai centroid dari kode buku (G. Nijhawan dan MK. Soni, 2014) yang diilustrasikan seperti dalam gambar berikut. Codebook untuk Pembicara 1 Codebook untuk Pembicara 2 Pembicara 1 Sampel Centroid Pembicara 2 Sampel Centroid Ruang Vektor Fitur Gambar II.6 Konsep diagram dalam formasi buku kode kuantisasi vektor 14

26 II.4 Model Markov Tersembunyi (MMT) Model Markov Tersembunyi (MMT) merupakan model dari rantai Markov yang statusnya tidak dapat diamati secara langsung (tersembunyi), tetapi hanya dapat diobservasi melalui suatu himpunan pengamatan variabel lain. Model markov tersembunyi memiliki tipe model ergodik dan kiri ke kanan (left to right). Model ergodik merupakan tipe model markov tersembunyi yang setiap statusnya terhubung, sedangkan model kiri ke kanan merupakan tipe model markov tersembunyi yang urutan statusnya terhubung dengan dirinya dan terhubung dari kiri ke kanan. Jenis kiri ke kanan untuk model yang sifatnya berubah dari waktu ke waktu dan tidak dapat kembali ke status sebelumnya seperti pembicaraan (speech) (Rabiner, 1989) Gambar II.7 Model markov tersembunyi tipe ergodik Gambar II.8 Model markov tersembunyi tipe kiri ke kanan Dasarnya model markov tersembunyi terdiri dari tiga hal. II.4.1 Evaluasi Evaluasi merupakan proses penghitungan peluang dari urutan nilai observasi yang diberikan oleh model markov tersembunyi. Dalam tahap ini, diasumsikan parameter model telah ditemukan, sehingga evaluasi atau pencarian nilai peluang dapat 15

27 dilakukan. Tahap evaluasi menggunakan algoritma maju dan mundur, berikut penjelasannya. Algoritma maju β t (i) β t+1 (j) a i1 X 2 Xi a i2 a i3 X 1 X n t t+1 Gambar II.9 Alur proses algoritma maju Jika variabel maju α t (i), disaat t dan status i, maka persamaannya. α t (i) = P(O 1, O 2,, O T, q t = i λ) (II.16) dengan: O = indeks matrik terobservasi Penyelesain dengan n keadaan dan observasi sampai T secara iterasi. Inisialisasi α t (i) = π i b i (O 1 ), 1 i n (II.17) dengan: π = matrik status awal b i (O 1 ) = matriks pertama yang terobservasi Induksi n i α t+1 (j) = [ i=1 α t (i)a ij ]b j (O t+1 ) (II.18) dengan: n i = jumlah status a ij = matrik transisi 16

28 Terminasi n i P(O λ) = α t (i) i=1 (II.19) Algoritma mundur β t (i) β t+1 (j) a i1 X 2 Xi a i2 a i3 X 1 X n t t+1 Gambar II.10 Alur proses algoritma mundur Keadaan mengalir ke belakang dari observasi terakhir saat t. Persamaan peluang algoritma mundur β t (i) sebagai berikut: β t (i) = P(O t+1, O t+2,, O T, q t = i λ) (II.20) dan dianalogikan dengan prosedur algoritma maju β t (i) dengan langkah: Inisialisasi β t (i) = 1 1 i n (II.21) Induksi α t+1 (j) = a ij b j (O t+1 )β t+1 (j), t = T 1, T 2,, 1, 1 i n (II.22) II.4.2 Pengkodean (Decoding) Pengkodean dilakukan untuk mencari status yang terbaik dari urutan observasi model markov tersembunyi dengan algoritma Viterbi. Dalam tahap ini juga sama seperti tahap evaluasi, yaitu parameter model diasumsikan sudah ditemukan, sehingga pencarian status terbaik dapat ditentukan. Langkah langkah tahap pengodean sebagai berikut. 17

29 Inisialisasi δ t (i) = π i b i (O 1 ), 1 i n Rekursi (II.23) δ t (j) = max 1 i n [δ t 1(i)a ij ]b j (O t ), 1 j n (II.24) Terminasi P = max 1 i n [δ t(i)] dengan: P = peluang (II.25) II.4.3 Parameter Estimasi Algoritma Baum Welch melakukan pelatihan untuk memperoleh parameter model markov tersembunyi. Parameter A Parameter A ditunjukkan dengan kumpulan status transisi yang membentuk matrik tertentu yaitu A = {a ij }, untuk 1 i, j n. Bentuk a ij = P[q t+1 = X j q t = X i ] merupakan peluang ketika status j untuk waktu t+1 jika dalam waktu t berada di status i dengan: a ij = peluang transisi dari status i ke status j P = peluang q t+1 = kondisi setelah q t q t = kondisi saat t X j = status ke j X i = status ke i n = banyaknya status tersembunyi dalam model Parameter B Parameter B ditunjukkan bahwa B = {b j (k)}, untuk 1 j n, 1 k m yang m merupakan b j (k) = P[y k terhadap t q t = X j ], 0 b j (k) dan k=1 b j (k) = 1. dengan: b j (k) = peluang distribusi matriks observasi y k = peluang dengan kluster index k dalam status j 18

30 m = banyaknya simbol observasi yang berbeda setiap status Kerapatan kontinyu (continuos density) MMT sering dikarakterisasi oleh fungsi kerapatan (density function) atau campuran fungsi kepadatan tertentu di setiap status yang telah dijelaskan oleh L. R. Rabiner (1989), hal tersebut senada pula seperti yang diungkapkan oleh Mikael Nilsson (2005). Dengan asumsi penggunaan Gaussian Mixture, kepadatan emisi status j didefinisikan sebagai: b j (o t ) = K k=1 w jk N(O; μ jk ; jk ), j = 1,2,, N (II.26) dengan: K = number of mixture w jk = mixing coefficient Untuk k th Gaussian, status j dengan batasan stokastik dengan persamaan berikut. K k=1 w jk = 1j = 1,2,, N (II.27) dengan: N = Gaussian density function dengan mean μ jk ε R d dan matriks kovarian jk ε R dxd untuk k th campuran. Matriks inisial di status i Diperlukan inisialisasi matriks awal status yang ditunjukkan oleh π = {π i }, dengan n i=1 π i = P[q 1 X i ], 0 π i dan π i = 1, sehingga model markov tersembunyi dapat dilambangkan dengan λ = (A, B, π). II.5 Bahasa Indonesia Dalam komunikasi lisan dan tulisan membutuhkan kemampuan berbahasa yang memadai, sehingga menghasilkan sebuah komunikasi sesuai dengan Ejaan Yang Disempurnakan (EYD). Indonesia memiliki berbagai keragaman budaya dan bahasa, sehingga dalam tata bahasa Indonesia terdapat interferensi yang unik. Seperti yang disampaikan Jendra (1991) bahwa interferensi dalam tata bahasa dapat meliputi bidang tata bunyi (fonologi), tata bentukan kata (morfologi), tata kalimat (sintaksis), dan kosakata (leksikon). Berbagai interferensi tentunya akan memengaruhi berbagai bentuk pengucapan untuk pembicara yang menggunakan bahasa Indonesia. Pengaruh tersebut juga akan memengaruhi bentuk dari vektor ciri yang dimiliki para pembicara berbahasa Indonesia. Berikut penjelasan dari masing masing interferensi dalam tata bahasa. 19

31 Interferensi fonologi Menurut Harimurti Kridalaksana (1985), fonologi yaitu bidang linguistik yang mengkaji bunyi bunyi bahasa menurut fungsinya. Interferensi fonologi seperti penghilangan, penambahan, dan perubahan sebuah huruf dalam satu kata yang seharusnya. Sebagai contoh dalam penyebutan kata meliat yang seharusnya kata melihat dengan pengurangan huruf /h/. Perubahan dapat saja terjadi seperti penghilangan fonem baik di awal, tengah, maupun akhir. Interferensi morfologi Morfologi merupakan cabang ilmu linguistik yang menyelidiki tentang seluk beluk pembentukan kata (awalan, akhiran, sisipan) (M. Ramlan, 2001). Interferensi morfologi seperti penggantian imbuhan yang seharusnya digunakan. Seperti kata ketabrak, bentuk kata tersebut berasal dari kata dasar bahasa Indonesia yang ditambah dengan afiks bahasa daerah tertentu. Hal ini sebenarnya tidar diperlukan karena dalam bahasa Indonesia sudah ada padanannya sendiri berupa afiks ter-, sehingga menjadi tertabrak. Interferensi sintaksis Sintaksis yang membahas struktur internal kalimat berupa frasa, klausa, dan kalimat. Interferensi sintaksis seperti penyimpangan struktur kalimat di dalam diri penutur terjadi kontak antara bahasa Indonesia dan bahasa lainnya yang telah dikuasai (Suwito, 1988). Seperti dicontohkan dalam kalimat Mobilnya ayahnya Joko yang paling bagus sendiri di desa itu, seharusnya dalam bahasa Indonesia yang benar menjadi Mobil ayah Joko yang paling bagus di desa itu. Interferensi leksikon Leksikon merupakan kajian perbendaharaan kata, sehingga jika tercampur dalam setiap pengucapan akan berbicara dalam beberapa bahasa dalam satu kalimat. Hal ini seperti yang biasa diucapkan oleh penutur tertentu karena terbiasa berbahasa daerah, sehingga dalam berbicara bahasa Indonesia masih terdapat suara khasnya atau dengan kata lain biasa disebut logat. Dalam bab berikutnya dijelaskan mengenai perancang yang dilakukan dalam mencapai rencana pembuatan sistem pengenalan pembicara. Kemudian cara-cara 20

32 eksperimen yang digunakan dalam tahap pelatihan dan pengujian berupa diagram blok dan diagram alir algoritma. Bab III Perancangan Sistem dan Eksperimen 21

33 III.1 Perancangan Awal Sistem dan Eksperimen Pengenalan Pembicara Sistem pengenalan pembicara dirancang dengan menggunakan mel frequency cepstral coefficient sebagai ekstraksi fiturnya, sehingga didapatkan vektor ciri yang kemudian akan didistribusikan sebagai masukan untuk pengklasifikasi. Kuantisasi vektor dan model markov tersembunyi sebagai pengklasifikasi akan melakukan tugasnya untuk menentukan pemilik suara dari suara yang diujikan. Gambaran umum dari sistem diberikan oleh diagram berikut. Vektor Kuantisasi Hasil Pengenalan MFCC Hidden Markov Model Hasil Pengenalan Gambar III.1 Diagram blok utama dalam sistem pengenalan pembicara Dalam penelitian ini dikenal data latih dan data uji. Berikut penjelasan dari kedua jenis data tersebut. Data latih Data latih merupakan kumpulan data suara responden yang akan dilatih untuk kemudian disimpan sebagai basis data kepemilikan identitas suara individu responden. Data uji Data uji merupakan kumpulan data suara responden yang akan dimasukan dalam tahap pengujian untuk kemudian dibandingkan dengan basis data dari data latih dan ditentukan kepemilikan identitas suara individu responden tersebut. Jumlah reponden yang direkam sebanyak empat pembicara. Untuk data latih, dilakukan perekaman secara langsung dengan menggunakan Matlab. Berikut teknik yang digunakan dalam pengambilan data latih. Setiap pembicara dilakukan perekaman untuk data latih sebanyak lima kali Rekaman data latih berupa pengucapan kata saya. 22

34 Hasil perekaman dilakukan pelatihan dan disimpan sebagai basis data di Matlab. Saat pengambilan data uji, dilakukan dalam tiga tipe tingkat kesulitan, yaitu: Pengujian kata Saat pengujian kata ini dilakukan masing masing responden sebanyak sepuluh kali perekaman dalam pengucapan kata saya. Perekaman pengujian kata dilakukan dengan durasi 2 detik. Pengujian kalimat sederhana Saat pengujian kalimat sederhana, dilakukan masing masing responden sebanyak sepuluh kali perekaman dalam pengucapan kalimat saya sedang belajar. Perekaman pengujian kalimat sederhana dilakukan dengan durasi 3 detik. Pengujian kalimat lengkap Saat pengujian kalimat lengkap yang berarti memiliki kelengkapan berupa subjek, predikat, objek, dan keterangan, dilakukan masing masing responden sebanyak sepuluh kali perekaman dalam pengucapan kalimat saya berangkat menggunakan bus ke kampus. Perekaman pengujian kalimat lengkap dilakukan dengan durasi 7 detik. Ketiga bentuk pengambilan data pengujian diambil dengan perbedaan rentang waktu satu minggu dengan rincian berikut. Tabel III.1 Waktu pengambilan data untuk data latih dan data uji Minggu ke- Pengambilan Data Data latih : Pengucapan kata 1 Data uji : Pengucapan kata 2 Data uji : Pengucapan kalimat sederhana 3 Data uji : Pengucapan kalimat lengkap III.2 Perancangan Sistem dan Eksperimen Ekstraksi Fitur Sistem ekstraksi fitur dalam penelitian ini menggunakan mel frequency cepstral coefficient dengan tahap sebagai berikut. Frame Blocking dan Windowing 23

35 Suara yang telah direkam, kemudian dibuat menjadi 256 sampel tiap bingkainya dan jarak antar bingkai 100. Setelah itu, dilakukan windowing dengan hamming window untuk kemudian hasilnya dikalikan dengan sinyal aslinya, sehingga didapat fungsi sinyal yang baru. Fast Fourier Transform (FFT) Sinyal yang akan diproses dalam filter bank di tahap selanjutnya tentu harus ditransformasikan terlebih dahulu menuju ranah frekuensi dengan transformasi Fourier. Sinyal suara ini sudah berupa sinyal diskrit, sehingga proses transformasinya menggunakan transformasi Fourier diskrit atau DFT. Dasarnya, FFT merupakan DFT yang dikembangkan agar proses komputasinya lebih singkat. Hasil keluaran dari proses ini berupa sinyal diskrit dalam ranah frekuensi. Mel Frequency Warping Tahap mel frequency warping merupakan tahap inti dari ekstraksi fitur. Jumlah warping yang digunakan sebanyak 20 buah filterbank untuk kemudian terbentuk cepstrum. Bentuk dari 20 segitiga filterbank yang digunakan oleh salah satu pengujian kata seperti gambar berikut. 2 Mel - Filter Bank Frekuensi (Hz) Gambar III.2 Mel filter bank Discrete Cosine Transform (DCT) 24

36 Sinyal sinyal yang telah dilakukan penyaringan akan berupa variabel kompleks. Untuk dapat membantu mengurangi perhitungan, maka DCT akan mengambil bagian cosinusnya dari eksponensial kompleks. Hasil yang didapat berupa bagian riil yang merupakan nilai besarannya. III.3 Perancangan Sistem dan Eksperimen Pengklasifikasi III.3.1 Tahap Pelatihan dan Pengujian dengan Metode Kuantisasi Vektor Dalam proses pengenalan pembicara menggunakan metode kuantisasi vektor, secara umum prosesnya dapat dilihat oleh gambar di bawah ini. Data Latih Ekstraksi Ciri Pelatihan Penentuan Centroid Data Uji Ekstraksi Ciri Evaluasi Jarak Euclidean Jarak Terpendek Hasil Prediksi Gambar III.3 Proses pengenalan pembicara dengan metode kuantisasi vektor Tahap pelatihan yang dibangun metode kuantisasi vektor menggunakan algoritma LBG yang merupakan pengembangan algoritma Llyod. Pengembangan tersebut berada di bagian masukan awal vektor dengan membagi dua vektor kode menggunakan aturan nearest neighbour. Kemudian masing masing dikluster dan diiterasi dengan algoritma Lloyd sampai didapatkan vektor quantizer yang diinginkan. Metode kuantisasi vektor yang dilakukan sesuai dengan diagram alir dalam Gambar III.4 berikut. 25

37 Mulai Tentukan Centroid Bagi tiap Centroid (D=0) m vq = 2*m vq A Buat Kluster Vektor Tentukan Centroid Hitung Distorsi (D) ((D - D) / D) < e Ya Tidak D = D A m vq < M Ya Tidak Selesai Gambar III.4 Diagram alir pelatihan algoritma Linde, Buzo, dan Gray (LBG) (Adaptasi dari Lawrence Rabiner dan Biing-Hwang Juang, 1993) Dalam tahap pengujian, tiap tiap kode buku akan dihitung jarak euclidean-nya menggunakan persamaan (II.15) dan jarak yang paling dekat dipilih sebagai kesamaan vektor ciri antara data uji dan data latih. 26

38 III.3.2 Tahap Pelatihan dan Pengujian dengan Metode Model Markov Tersembunyi Dalam penelitian ini menggunakan model markov tersembunyi model kiri ke kanan, karena menurut L. R. Rabiner (1989) untuk proses pengenalan suara yang sifatnya tersembunyi lebih baik dirancang menggunakan model kiri ke kanan dari pada model ergodik dan menggunakan tipe Continuous Hidden Markov Model (CHMM). Status yang digunakan dalam metode model markov tersembunyi ini berjumlah 6 (Dimasatria, 2016). Secara umum, diagram blok dari proses pengenalan pembicara menggunakan metode model markov tersembunyi dalam Gambar III.5. Data Latih Ekstraksi Ciri Pelatihan / Pemodelan HMM Data Uji Ekstraksi Ciri Evaluasi Probabilitas Terbesar Hasil Prediksi Gambar III.5 Proses pengenalan pembicara menggunakan metode model markov tersembunyi Tahap pelatihan dengan metode model markov tersembunyi Tahap pelatihan dilakukan untuk menentukan parameter estimasi, sehingga terbentuk model markov tersembunyi berupa λ = (A, B, π). Dalam penelitian ini menggunakan CHMM, sehingga untuk parameter B terdiri dari mean dan kovarian. Berikut diagram alir pelatihan dengan metode model markov tersembunyi. Mulai Muat Basis Data Sinyal Suara Latih Ekstraksi Ciri : MFCC Pemodelan HMM Algoritma Baum Welch Selesai Gambar III.6 Diagram alir pelatihan dengan metode model markov tersembunyi 27

39 Data latih yang berada di basis data, kemudian diproses ekstraksi ciri. Keluaran dari ekstraksi ciri merupakan vektor yang terobservasi yang kemudian dijadikan sebagai masukan oleh proses pelatihan dengan algoritma Baum Welch Masukan diproses dengan algoritma maju dan mundur untuk mendapatkan nilai parameter A. Dalam parameter B, diwakili oleh mean dan kovarian dengan masukan dari vektor yang terobservasi juga. Begitu pula untuk matrik awal atau parameter π, sehingga didapat model untuk model markov tersembunyi. Berikut diagram alir dari algoritma Baum Welch dalam Gambar III.7. 28

40 Mulai A Data yang Terobservasi Model HMM Pilih State dan Tipe Model HMM Selesai Inisialisasi Parameter HMM Latih Parameter HMM Simpan Parameter HMM Masukkan Urutan Data Sesuaikan Model HMM Hitung Nilai Log dari tiap Model Nilai Maksimum Log A Gambar III.7 Diagram alir algoritma Baum Welch 29

41 Tahap pengujian dengan metode model markov tersembunyi Pengujian dilakukan untuk mengetahui seberapa besar nilai peluang data suara uji terhadap kecocokannya dengan data latih. Jika dalam tahap pelatihan, inisialisasi matriks transisi dan matriks emisi diisi dengan acak, sedangkan untuk tahap pengujian, inisialisasi matriks transisi dan matriks emisi berasal dari data proses pelatihan. Di awal proses pengujian tetap dilakukan ekstraksi ciri, kemudian keluarannya dijadikan vektor ciri. Proses pengujian atau evaluasi ini menggunakan algoritma maju karena yang ingin dicari hanya nilai peluang dari data uji di setiap basis data hasil pelatihan. Nilai peluang yang paling tinggi, menentukan kecocokan antara data uji terhadap basis data latih. Nilai peluang yang didapat merupakan hasil penyekalaan (scaling) dikarenakan rentang datanya terlalu jauh (Nilsson, 2005). Berikut maju yang digunakan dalam tahap pengujian dengan metode model markov tersembunyi. Mulai Muat Basis Data Sinyal Suara Uji Ekstraksi Ciri : MFCC Evaluasi HMM Algoritma Maju Pembicara Dikenali Selesai Gambar III.8 Diagram alir pengujian dengan metode model markov tersembunyi 30

42 Dalam bab selanjutnya dijelaskan mengenai pengujian sistem pengenalan pembicara baik diujikan menggunakan metode kuantisasi vektor maupun metode model markov tersembunyi. Setelah dilakukan pengujian akan dipaparkan data hasil pengujiannya berupa pembahasan dari hasil pengujian kata, kalimat sederhana, dan kalimat lengkap. 31

43 Bab IV Pengujian dan Pembahasan IV.1 Pengujian Sistem Pengujian dilaksanakan dengan membandingkan hasil eksperimen dari sistem pengenalan pembicara dengan menggunakan metode kuantisasi vektor dan model markov tersembunyi. Hasil eksperimen berupa nilai akurasi dari masing masing pembicara yang dihitung dengan persamaan Speaker Identification Rate (SIR), didefinisikan berikut. %SIR = Jumlah data teridentifikasi Jumlah total data (IV.1) Diagram blok pengujian perbandingan hasil eksperimen pengenalan pembicara ini diberikan dalam gambar berikut. MFCC Model Markov Tersembunyi Kuantisasi Vektor Uji Kata Uji Kalimat Sederhana Uji Kalimat Lengkap Uji Kata Uji Kalimat Sederhana Uji Kalimat Lengkap Hasil Pengenalan Hasil Pengenalan Hasil Pengenalan Hasil Pengenalan Hasil Pengenalan Hasil Pengenalan Hitung Persentase Pengenalan Hitung Persentase Pengenalan Hitung Persentase Pengenalan Hitung Persentase Pengenalan Hitung Persentase Pengenalan Hitung Persentase Pengenalan Bandingkan Hasil Akurasi Pengujian Kata Bandingkan Hasil Akurasi Pengujian Kalimat Sederhana Bandingkan Hasil Akurasi Pengujian Kalimat Lengkap Gambar IV.1 Digram blok perbandingan pengujian pengenalan pembicara 32

44 Berikut penjelasan dari diagram blok di atas. Suara diekstraksi cirinya menggunakan mel frequency cepstral coefficient Hasil ekstraksi ciri, kemudian dilakukan pengujian dengan metode kuantisasi vektor dan model markov tersembunyi Masing masing metode, akan dihasilkan berupa hasil pengenalan yang diujikan dalam tiga tingkat kesulitan yang telah dibahas sebelumnya yaitu pengujian kata, kalimat sederhana, dan kalimat lengkap Berdasarkan pengujian selama sepuluh kali, maka hasil pengenalan akan dibentuk dalam persentase keakuratan sistem metode tersebut Membandingkan tingkat akurasi dari masing masing metode terhadap tingkat kesulitannya IV.1.1 Pengujian Sistem Perekaman Suara Suara yang menjadi objek langsung direkam dan diolah di Matlab, untuk itu perlu ditinjau keadaan suaranya baik melalui penggambaran sinyal suara maupun mendengarkan hasil rekaman. Berikut akan disampaikan hasil pengujian berupa beberapa contoh penggambaran sinyal suara dari salah satu responden. sa ya Gambar IV.2 Penggambaran sinyal suara dalam pengucapan kata saya yang digunakan sebagai data latih 33

45 sa ya Gambar IV.3 Penggambaran sinyal suara dalam pengucapan kata saya yang digunakan sebagai data uji saya sedang belajar Gambar IV.4 Penggambaran sinyal suara dalam pengucapan kalimat saya sedang belajar yang digunakan sebagai data uji 34

46 saya berangkat menggunakan bis ke kampus Gambar IV.5 Penggambaran sinyal suara dalam pengucapan kalimat saya berangkat menggunakan bus ke kampus yang digunakan sebagai data uji Berdasarkan pengujian dengan memunculkan grafik suara dan diputar rekamannya, maka perekaman suara telah sesuai dengan kata dan kalimat pengucapan yang diinginkan. IV.1.2 Hasil Pengujian Sistem Pengenalan Pembicara dengan Metode Kuantisasi Vektor Hasil Pengujian Kata Pengujian dilakukan dengan memasukan data suara ke dalam sistem. Pengujian dilakukan selama sepuluh kali pengucapan kata saya. Sistem akan menghitung jarak dari masing masing euclidean antara seluruh data latih dengan data uji yang dimasukkan. Kemudian ditentukan jarak terdekat merupakan hasil pengenalan pembicara. Data hasil penghitungan jarak dalam pengujian pengucapan kata saya terlampir. Berdasarkan hasil penghitungan jarak, didapat hasil pengenalan pembicara dengan metode kuantisasi vektor dalam Tabel IV.1. 35

47 Tabel IV.1 Data hasil pengenalan pembicara dalam pengujian kata dengan metode kuantisasi vektor No. Pembicara A B C D 1 x X 2 x 3 x 4 x x 5 x 6 x X 7 8 x x 9 x x 10 x X Akurasi 60% 20% 80% 90% Hasil Pengujian Kalimat Sederhana Dalam pengujian kalimat sederhana, dengan dilakukan pemasukan data suara ke dalam sistem selama sepuluh kali pengucapan kalimat saya sedang belajar. Sistem juga akan menghitung jarak euclidean antara seluruh data latih dengan data uji yang dimasukkan. Data hasil penghitungan jarak untuk pengujian pengucapan kalimat saya sedang belajar pun terlampir. Setelah melihat data hasil penghitungan jarak didapat hasil pengenalan pembicara dengan metode kuantisasi vektor dalam tabel berikut. Tabel IV.2 Data hasil pengenalan pembicara dalam pengujian kalimat sederhana dengan metode kuantisasi vektor No. Pembicara A B C D 1 x x X 2 x x 3 x x 4 x x 5 x x 6 x x 7 x x 8 x x 9 x x 10 x x Akurasi 0% 0% 100% 90% 36

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi

Lebih terperinci

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar. BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar

Lebih terperinci

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti

Lebih terperinci

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar PENDAHULUAN Latar Belakang Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit

Lebih terperinci

SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR

SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR Ali Mustofa Jurusan Teknik Elektro, Universitas Brawijaya Email: a_tofa@yahoo.com Abstrak - Pengenalan penutur adalah

Lebih terperinci

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker

Lebih terperinci

PenerapanHidden Markov Model (HMM) pada Pengenalan Penutur

PenerapanHidden Markov Model (HMM) pada Pengenalan Penutur Jatisi, Vol. 1 No. 1 September 2014 111 PenerapanHidden Markov Model (HMM) pada Pengenalan Penutur Mukhlisa* 1, Maryati Gultom 2, Derry Alamsyah 3 1,2,3 STMIK GI MDP; Jln. Rajawali No. 14, 0711 376400

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Indonesia

BAB 1 PENDAHULUAN. Universitas Indonesia BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai

Lebih terperinci

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad

Lebih terperinci

RANCANG BANGUN APLIKASI PENGENAL PENUTUR MENGGUNAKAN METODE HIDDEN MARKOV MODEL (HMM)

RANCANG BANGUN APLIKASI PENGENAL PENUTUR MENGGUNAKAN METODE HIDDEN MARKOV MODEL (HMM) RANCANG BANGUN APLIKASI PENGENAL PENUTUR MENGGUNAKAN METODE HIDDEN MARKOV MODEL (HMM) Maryati Gultom 1), Mukhlisa 2), Derry Alamsyah 3) 1 gultommaryati@gmail.com, 2 immobulus92@gmail.com, 3 derryfseiei@gmail.com

Lebih terperinci

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi. SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz

Lebih terperinci

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan

Lebih terperinci

Jaringan Syaraf Tiruan pada Robot

Jaringan Syaraf Tiruan pada Robot Jaringan Syaraf Tiruan pada Robot Membuat aplikasi pengenalan suara untuk pengendalian robot dengan menggunakan jaringan syaraf tiruan sebagai algoritma pembelajaran dan pemodelan dalam pengenalan suara.

Lebih terperinci

INDEPT, Vol. 3, No.1, Februari 2013 ISSN

INDEPT, Vol. 3, No.1, Februari 2013 ISSN SISTEM SPEAKER RECOGNITION (PENGENAL PENGUCAP) UNTUK MENCARI KARAKTERISTIK UCAPAN SESEORANG DENGAN METODE MEL FREQUENCY CEPTRUM COEFFISIENT (MFCC) MENGGUNAKAN SOFTWARE MATLAB Andriana, ST., MT. Dosen Fakultas

Lebih terperinci

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition... DAFTAR ISI PERNYATAAN... i KATA PENGANTAR... ii UCAPAN TERIMA KASIH... iii ABSTRAK... v ABSTRACT... vi DAFTAR ISI... vii DAFTAR TABEL... ix DAFTAR GAMBAR... x DAFTAR LAMPIRAN... xii BAB I PENDAHULUAN...

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA 1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Suara (Wicara) Suara khususnya wicara merupakan cara yang natural bahkan paling penting dalam melakukan proses komunikasi. Dalam kehidupan sehari-hari, manusia melakukan berbagai

Lebih terperinci

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,

Lebih terperinci

APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM)

APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM) APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM) Eko Widiyanto, Sukmawati Nur Endah, Satriyo Adhy, Sutikno Jurusan Ilmu Komputer/Informatika,

Lebih terperinci

UNIVERSITAS BINA NUSANTARA

UNIVERSITAS BINA NUSANTARA UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006 PERANCANGAN SISTEM PROTEKSI FILE DENGAN PASSWORD SUARA Rendy Sesario 0600615431 Samanta Limbrada

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi

Lebih terperinci

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student

Lebih terperinci

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN

Lebih terperinci

TINJAUAN PUSTAKA. Pengenalan Suara

TINJAUAN PUSTAKA. Pengenalan Suara Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan

Lebih terperinci

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA SKRIPSI PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA MADE GDE JAYA HARRY KHESA S JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA BUKIT JIMBARAN

Lebih terperinci

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO 02.50.0020 PROGRAM STUDI TEKNIK ELEKTRO FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS KATOLIK

Lebih terperinci

SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari

SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen Satya Wacana, Salatiga,

Lebih terperinci

Bab 3. Perancangan Sistem

Bab 3. Perancangan Sistem 34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara

Lebih terperinci

APLIKASI PENGENALAN UCAPAN SEBAGAI PENGATUR KECEPATAN PUTARAN KIPAS ANGIN

APLIKASI PENGENALAN UCAPAN SEBAGAI PENGATUR KECEPATAN PUTARAN KIPAS ANGIN APLIKASI PENGENALAN UCAPAN SEBAGAI PENGATUR KECEPATAN PUTARAN KIPAS ANGIN Riva Anggara Yudha*, Achmad Hidayatno, ST, MT **, Ajub Ajulian Z, ST, MT ** Jurusan Teknik Elektro, Fakultas Teknik, Universitas

Lebih terperinci

Aplikasi Pengenalan Suara Dalam Pengaksesan Sistem Informasi Akademik

Aplikasi Pengenalan Suara Dalam Pengaksesan Sistem Informasi Akademik Aplikasi Pengenalan Suara Dalam Pengaksesan Sistem Informasi Akademik Jenny Putri Hapsari (L2F003511) Jurusan Teknik Elektro, Fakultas Teknik, Universitas Diponegoro, Semarang, Indonesia jenny_putri_hapsari@yahoo.com

Lebih terperinci

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

Frekuensi Dominan Dalam Vokal Bahasa Indonesia Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan

Lebih terperinci

PENGENALAN JENIS IKAN DENGAN METODE HIDDEN MARKOV MODEL MENGGUNAKAN DSK TMS320C6713 SKRIPSI

PENGENALAN JENIS IKAN DENGAN METODE HIDDEN MARKOV MODEL MENGGUNAKAN DSK TMS320C6713 SKRIPSI PENGENALAN JENIS IKAN DENGAN METODE HIDDEN MARKOV MODEL MENGGUNAKAN DSK TMS320C6713 SKRIPSI Oleh ARIO MUHAMAD FANIE 0403030195 DEPARTEMEN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS INDONESIA GANJIL 2007/2008

Lebih terperinci

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Ziaul Haq, Teknik Informatika S1,Universitas Dian Nuswantoro Semarang Abstract Pengenalan

Lebih terperinci

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis

Lebih terperinci

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,

Lebih terperinci

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk 6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada

Lebih terperinci

1. BAB I PENDAHULUAN 1.1. Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang 1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat

Lebih terperinci

BAB 2 DASAR TEORI. Penerapan hidden..., Leni Nur Hidayati, FT UI, 2010.

BAB 2 DASAR TEORI. Penerapan hidden..., Leni Nur Hidayati, FT UI, 2010. 4 BAB 2 DASAR TEORI Transmisi dari citra adalah hal penting dalam komunikasi citra interaktif pada beberapa aplikasi seperti pengamatan jarak jauh (remote surveillance), pembelanjaan elektronik (electronic

Lebih terperinci

BAB 3 PERANCANGAN SISTEM

BAB 3 PERANCANGAN SISTEM 21 BAB 3 PERANCANGAN SISTEM Sebelum citra tanda tangan dikenali dengan menggunakan Hidden Markov Model (HMM) citra tanda tangan tersebut ditransmisikan dengan dikompresi menggunakan Run Length Encoding

Lebih terperinci

UNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV

UNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV UNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV SKRIPSI YUNANTO WIDYATMAJI 0404030881 FAKULTAS TEKNIK

Lebih terperinci

APLIKASI PENGENALAN UCAPAN SEBAGAI PENGATUR MOBIL DENGAN PENGENDALI JARAK JAUH

APLIKASI PENGENALAN UCAPAN SEBAGAI PENGATUR MOBIL DENGAN PENGENDALI JARAK JAUH APLIKASI PENGENALAN UCAPAN SEBAGAI PENGATUR MOBIL DENGAN PENGENDALI JARAK JAUH Muh. Widyanto Tri Saksono*, Achmad Hidayatno, ST, MT **, Ajub Ajulian Z, ST, MT ** Jurusan Teknik Elektro, Fakultas Teknik,

Lebih terperinci

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification Jurnal Telematika, vol. 11 no. 1, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker

Lebih terperinci

Identifikasi Suara Pengontrol Lampu Menggunakan Mel-Frequency Cepstral Coefficients dan Hidden Markov Model

Identifikasi Suara Pengontrol Lampu Menggunakan Mel-Frequency Cepstral Coefficients dan Hidden Markov Model Identifikasi Suara Pengontrol Lampu Menggunakan Mel-Frequency Cepstral Coefficients dan Hidden Markov Model Angga Kersana Munggaran 1, Esmeralda C Djamal, Rezki Yuniarti Jurusan Informatika, Fakultas MIPA

Lebih terperinci

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT DAN LINEAR VECTOR QUANTIZATION UNTUK PENGENDALIAN GERAK ROBOT Anggoro Wicaksono, Sukmawati NE, Satriyo Adhy,

Lebih terperinci

EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON

EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON Nurmasyitah 1, Mursyidah 2, Jamilah 3 Program Studi Teknik Multimedia dan Jaringan, Jurusan Teknologi Informasi dan Komputer, Politeknik

Lebih terperinci

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang BAB 1 PENDAHULUAN 1.1 Latar Belakang Kecerdasan buatan (artificial intelligence) merupakan bidang yang berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang mengarah kepada bidang

Lebih terperinci

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI SKRIPSI

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 21 PERANGKAT LUNAK UNTUK MEMBUKA APLIKASI PADA KOMPUTER DENGAN PERINTAH SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENTS Anna Dara Andriana Program Studi Teknik Informatika Fakultas Teknik

Lebih terperinci

BAB I PENDAHULUAN I.1 Latar Belakang

BAB I PENDAHULUAN I.1 Latar Belakang BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring

Lebih terperinci

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan

Lebih terperinci

Warble Of Lovebird Classification Using Mel Frequency Cepstral Coefficient (MFCC)

Warble Of Lovebird Classification Using Mel Frequency Cepstral Coefficient (MFCC) ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 2968 KLASIFIKASI SUARA LOVEBIRD DENGAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN FUZZY LOGIC Warble Of Lovebird Classification

Lebih terperinci

Gambar 2.1. Katak Sawah (Djatmiko, 2005)

Gambar 2.1. Katak Sawah (Djatmiko, 2005) BAB 2 LANDASAN TEORI 2.1. Katak Sawah Katak sawah merupakan salah satu jenis katak yang memiliki nama latin Fejerfarya cancrivora. Katak sawah sesuai dengan namanya banyak dijumpai di daerah persawahan,

Lebih terperinci

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION TUGAS AKHIR Diajukan Untuk Memenuhi Sebagian Persyaratan Dalam Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun oleh : PAULA

Lebih terperinci

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Emosi Emosi adalah perasaan intens yang ditujukan kepada seseorang atau sesuatu dan juga merupakan reaksi terhadap seseorang atau kejadian.emosi dapat ditunjukkan ketika merasa

Lebih terperinci

Bab 1. Pendahuluan. aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi

Bab 1. Pendahuluan. aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi 1 Bab 1 Pendahuluan 1.1 Latar Belakang Di era teknologi informasi khususnya internet, keberadaan sistem proteksi yang aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi tersedia

Lebih terperinci

PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA. Oleh : WINI PURNAMASARI G

PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA. Oleh : WINI PURNAMASARI G PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA Oleh : WINI PURNAMASARI G64102051 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Isyarat tutur merupakan isyarat yang diproduksi oleh alat ucap manusia hingga menghasilkan informasi, baik berupa makna dari isyarat tutur yang diucapkan maupun yang

Lebih terperinci

BAB 1 PENDAHULUAN. berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition

BAB 1 PENDAHULUAN. berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition BAB 1 PENDAHULUAN 1.1 Latar Belakang Speaker recognition adalah salah satu bidang pengenalan pola yang berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition yang mengenali kata atau

Lebih terperinci

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov A39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi dan Daryono Budi Utomo Departemen Matematika, Fakultas Matematka dan Ilmu Pengetahuan Alam, Institut Teknologi

Lebih terperinci

UNIVERSITAS INDONESIA SIMULASI PENGENALAN CHORD TERISOLASI BERBASISKAN SPEAKER DEPENDENT DENGAN METODE HIDDEN MARKOV MODEL SKRIPSI

UNIVERSITAS INDONESIA SIMULASI PENGENALAN CHORD TERISOLASI BERBASISKAN SPEAKER DEPENDENT DENGAN METODE HIDDEN MARKOV MODEL SKRIPSI UNIVERSITAS INDONESIA SIMULASI PENGENALAN CHORD TERISOLASI BERBASISKAN SPEAKER DEPENDENT DENGAN METODE HIDDEN MARKOV MODEL SKRIPSI Diajukan untuk melengkapi sebagian persyaratan menjadi sarjana teknik

Lebih terperinci

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia

Lebih terperinci

BAB II LANDASAN TEORI. Konsep ini pertama kali diperkenalkan oleh Fritz Bauer, yang menerapkan

BAB II LANDASAN TEORI. Konsep ini pertama kali diperkenalkan oleh Fritz Bauer, yang menerapkan 6 BAB II LANDASAN TEORI 2.1 Konsep Dasar Rekayasa Piranti Lunak Konsep ini pertama kali diperkenalkan oleh Fritz Bauer, yang menerapkan beberapa syarat dalam merekayasa suatu piranti lunak yang kita buat

Lebih terperinci

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION DETECTION OF THE LEVEL OF YOUTH, ADULTS AND ELDERLY BY USING MFCC METHOD AND FUZZY

Lebih terperinci

Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition

Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition Abstrak Angela Irfani 1, Ratih Amelia 2, Dyah Saptanti P 3 Laboratorium Ilmu dan Rekayasa Komputasi Departemen Teknik

Lebih terperinci

Implementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC)

Implementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC) ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.3 December 2016 Page 3998 IMPLEMENTASI KUNCI BERBASIS SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) Implementation of Voice

Lebih terperinci

KAMUS DIGITAL DENGAR TULIS UCAP BAHASA INDONESIA

KAMUS DIGITAL DENGAR TULIS UCAP BAHASA INDONESIA KAMUS DIGITAL DENGAR TULIS UCAP BAHASA INDONESIA Ricky*, Wahyudi, ST, MT **, Achmad Hidayatno, ST, MT ** Jurusan Teknik Elektro, Fakultas Teknik, Universitas Diponegoro Jl. Prof. Sudharto, Tembalang, Semarang,

Lebih terperinci

Available online at TRANSMISI Website TRANSMISI, 13 (3), 2011,

Available online at TRANSMISI Website  TRANSMISI, 13 (3), 2011, Available online at TRANSMISI Website http://ejournal.undip.ac.id/index.php/transmisi TRANSMISI, 13 (3), 2011, 82-86 Research Article Aplikasi Pengenalan Ucapan dengan Ekstraksi Mel-Frequency Cepstrum

Lebih terperinci

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM) Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM) Inggih Permana 1, Benny Sukma Negara 2 1 Universitas Sultan Sarif Kasim Riau 2 Universitas Sultan Sarif

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium,

Lebih terperinci

PENGENALAN NADA PIANIKA MENGGUNAKAN JENDELA SEGITIGA, DCT, DAN FUNGSI JARAK EUCLEDIAN

PENGENALAN NADA PIANIKA MENGGUNAKAN JENDELA SEGITIGA, DCT, DAN FUNGSI JARAK EUCLEDIAN PEGEALA ADA PIAIKA MEGGUAKA JEDELA SEGITIGA, DCT, DA FUGSI JARAK EUCLEDIA Linggo Sumarno Jurusan Teknik Elektro, Universitas Sanata Dharma Kampus III, Paingan, Maguwoharjo, Depok, Sleman, Yogyakarta 558

Lebih terperinci

PENERAPAN LEARNING VECTOR QUANTIZATION

PENERAPAN LEARNING VECTOR QUANTIZATION PENERAPAN LEARNING VECTOR QUANTIZATION (LVQ) DAN EKSTRAKSI CIRI MENGGUNAKAN MEL- FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) UNTUK TRANSKRIPSI SUARA KE TEKS LAKSMI NIRMALA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Genre Menurut Kamus Besar Bahasa Indonesia, genre adalah jenis, tipe, atau kelompok sastra atas dasar bentuknya. Jadi genre musik merupakan pengelompokan musik berdasarkan kemiripan

Lebih terperinci

UNIVERSITAS BINA NUSANTARA

UNIVERSITAS BINA NUSANTARA UNIVERSITAS BINA NUSANTARA Program Studi Ganda 2006-200 Skripsi Sarjana Program Ganda Semester Ganjil 2006/200 HALAMAN ABSTRAK SKRIPSI PROGRAM GANDA UNIVERSITAS BINA NUSANTARA Devi Natalia 0600656841 ABSTRAK

Lebih terperinci

BAB III. Hidden Markov Models (HMM) Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata,

BAB III. Hidden Markov Models (HMM) Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata, BAB III Hidden Markov Models (HMM) 3.1 Pendahuluan Rantai Markov mempunyai state yang dapat diobservasi secara langsung. Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata, beberapa

Lebih terperinci

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization Neneng Nurhamidah 1, Esmeralda C. Djamal, Ridwan Ilyas Jurusan Informatika, Fakultas MIPA

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Pengenalan lafal manusia agar dapat dilakukan oleh sebuah mesin telah menjadi fokus dari berbagai riset selama lebih dari empat dekade. Ide dasar yang sederhana

Lebih terperinci

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, 121-132 121 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Aplikasi Pengenalan Ucapan Dengan Ekstraksi Ciri Mel- Frequency Cepstrum Coefficients

Lebih terperinci

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.1 April 2015 Page 262 SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL SIMULATION AND ANALYSIS

Lebih terperinci

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Agustini, Biometrik Suara Dengan Transformasi Wavelet 49 BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Ketut Agustini (1) Abstract: Biometric as one of identification or recognition

Lebih terperinci

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR PERNYATAAN

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Tetris Tetris adalah sebuah tipe permainan yang dibuat oleh seorang programmer berkebangsaan Rusia yang bernama Alexey Pajitnov pada tahun 1984 dan semenjak saat itu game tetris

Lebih terperinci

memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital dengan suatu pola tertentu. Kata-kata yang diucapkan di

memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital dengan suatu pola tertentu. Kata-kata yang diucapkan di APLIKASI PENGENALAN UCAPAN KATA BAHASA INGGRIS MENGGUNAKAN LINEAR PREDICTIVE CODING (LPC) DAN HIDDEN MARKOV MODEL (HMM) Juniar Lestary ne3a_azza@yahoo.com Universitas Gunadarma Jl. Margonda Raya No. 100

Lebih terperinci

Penekanan Derau secara Adaptif pada Pengenalan Ucapan Kata

Penekanan Derau secara Adaptif pada Pengenalan Ucapan Kata Penekanan Derau secara Adaptif pada Pengenalan Ucapan Kata Achmad Bayhaki (L2F 002 541) Jurusan Teknik Elektro, Fakultas Teknik, Universitas Diponegoro, Semarang, Indonesia trainingmoment@yahoo.com Abstrak

Lebih terperinci

BAB 3 PERANCANGAN SISTEM. yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk

BAB 3 PERANCANGAN SISTEM. yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk BAB 3 PERANCANGAN SISTEM 3.1 Gambaran Umum Sistem Voice Command pada demonstrasinya merupakan aplikasi pengenalan suara yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk menampung

Lebih terperinci

PENGENALAN LAFAL HUKUM NUN MATI MENGGUNAKAN HIDDEN MARKOV MODEL

PENGENALAN LAFAL HUKUM NUN MATI MENGGUNAKAN HIDDEN MARKOV MODEL Jurnal LOG!K@, Jilid 6, No. 1, 2016, Hal. 1-10 ISSN 1978 8568 PENGENALAN LAFAL HUKUM NUN MATI MENGGUNAKAN HIDDEN MARKOV MODEL Agus Jamaludin, Arief Fatchul Huda, dan Rini Sahyandari Program Studi Matematika

Lebih terperinci

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows 1 Muhammad Anggia Muchtar, 2 Raisha Ariani Sirait, 3 Romi Fadillah Rahmat 1,2,3 Program Studi S1 Teknologi Informasi

Lebih terperinci

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR

Lebih terperinci

ALGORITMA PENGENALAN UCAPAN HURUF HIJAIYAH BERTANDA BACA DENGAN LINEAR PREDICTIVE CODING (LPC) DAN HIDDEN MARKOV MODEL (HMM)

ALGORITMA PENGENALAN UCAPAN HURUF HIJAIYAH BERTANDA BACA DENGAN LINEAR PREDICTIVE CODING (LPC) DAN HIDDEN MARKOV MODEL (HMM) 40257 Means OPEN ACCESS ISSN 2460-3295 socj.telkomuniversity.ac.id/indosc ALGORITMA PENGENALAN UCAPAN HURUF HIJAIYAH BERTANDA BACA DENGAN LINEAR PREDICTIVE CODING (LPC) DAN HIDDEN MARKOV MODEL (HMM) Haby

Lebih terperinci

Verifikasi Citra Wajah Menggunakan Metode Discrete Cosine Transform Untuk Aplikasi Login

Verifikasi Citra Wajah Menggunakan Metode Discrete Cosine Transform Untuk Aplikasi Login The 13 th Industrial Electronics Seminar 011 (IES 011) Electronic Engineering Polytechnic Institute of Surabaya (EEPIS), Indonesia, October 6, 011 Verifikasi Citra Wajah Menggunakan Metode Discrete Cosine

Lebih terperinci

Kata Kunci: Suara; Mel Frequency Cepstral Coefficient; K-NEAREST NEIGHBOUR

Kata Kunci: Suara; Mel Frequency Cepstral Coefficient; K-NEAREST NEIGHBOUR 120 Dielektrika, [P-ISSN 2086-9487] [E-ISSN 2579-650X] Vol. 4, No. 2 : 120-126, Agustus 2017 KLASIFIKASI SUARA BERDASARKAN USIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN K-NEAREST NEIGHBOUR

Lebih terperinci

KOMPRESI SINYAL SUARA DENGAN MENGGUNAKAN STANDAR MPEG-4

KOMPRESI SINYAL SUARA DENGAN MENGGUNAKAN STANDAR MPEG-4 KOMPRESI SINYAL SUARA DENGAN MENGGUNAKAN STANDAR MPEG-4 Disusun Oleh : Nama : Michael Darmawan Nrp : 0322130 Jurusan Teknik Elektro, Fakultas Teknik, Universitas Kristen Maranatha, Jl. Prof.Drg.Suria Sumantri,

Lebih terperinci

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode

Lebih terperinci

BAB I PENDAHULUAN. Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi

BAB I PENDAHULUAN. Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi secara beruntun dan dengan kemungkinan yang berbeda-beda. Sebagai contoh sekarang

Lebih terperinci