SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI FAKULTAS MATEMATIKA DAN ILMU

Ukuran: px
Mulai penontonan dengan halaman:

Download "SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI FAKULTAS MATEMATIKA DAN ILMU"

Transkripsi

1 PERBANDINGAN METODE WAVELET DAUBECHI IES DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIANN BOGOR BOGOR 211

2 PERBANDINGAN METODE WAVELET DAUBECHIES DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 211

3 ABSTRACT AYU GUSTIAWATI. The comparison of Wavelet Daubechies and MFCC methods as feature extraction for phoneme recognition with Probabilistic Neural Netowork (PNN) as classifier. Under the direction of AGUS BUONO. Nowadays, the development of telecommunication research is rapidly increasing. One of the research is in sound area. Sound is a way for human to interact with computers, known as word recogniser. Word recogniser is a part of voice recogniser that make the computers possible to receive input from word that pronounced. Word that pronounced contain phonemes that arranged into sentence. Voice recognition technology can recognise and understand words that pronounce by digitalising it, and tuning the digital signal with certain pattern that has been saved in a hardware. The result from this word identification will be displayed into printed word. This research will compare between Wavelet Daubechies and MFCCas identity extraction on word recognition with (PNN) as pattern identifier. PNN is a pattern identifier that has high accuracy. The comparison between trained data and tested data in research is 75% : 25%. Tested data that has been used was vary, such as: testing with increase the noise (pure noise) and data with noise increasing from 3dB, 2dB and 1dB. The result from this research is that the identity extraction by using MFCC is much better than with Wavelet Daubechies. From the pure original data (without noise increasing) the accuracy is 92.3% and in data with noise increasing 3dB, noise 2dB and noise 1dB the accuracy is 5.96%, 26.92% and 19.23%. Keywords : Phoneme, Wavelet Daubechies, MFCC, PNN, Noise.

4 Judul : Perbandingan Metode Wavelet Daubechies dan MFCC sebagai Ekstraksi Ciri pada Pengenalan Fonem dengan Probabilistic Neural Network (PNN) sebagai Classifier Nama : Ayu Gustiawati NRP : G Menyetujui : Pembimbing Dr. Ir. Agus Buono, M.Si, M.Kom NIP Mengetahui : Ketua Departemen Dr. Ir. Sri Nurdiati, M.Sc NIP Tanggal Lulus :

5 PRAKATA Puji dan Syukur penulis ucapkan kepada Allah SWT yang telah memberikan rahmat dan hidayah- Nya sehingga skripsi dengan judul Perbandingan Metode Wavelet Daubechies dan MFCC sebagai Ekstraksi Ciri pada Pengenalan Fonem dengan Probabilistic Neural Network (PNN) sebagai Classifier dapat diselesaikan. Penelitian ini dilaksanakan mulai Agustus 21 sampai dengan Maret 211, bertempat di Departemen Ilmu Komputer. Penulis mengucapkan terima kasih kepada semua pihak yang telah membantu sehingga skripsi ini dapat diselesaikan, diantaranya : 1. Papa dan Mama terkasih atas dukungan, doa, dan kasih sayangnya kepada penulis. 2. Bapak Dr. Ir. Agus Buono, M.Si, M.Kom selaku pembimbing atas waktu, saran, dan bimbingan yang telah diberikan. 3. Sidik yang selalu sabar memberikan dukungan waktunya. 4. Kak Nisa, Panji dan Beni yang telah membantu memberikan ilmu dan waktunya. 5. Teman - teman seperjuangan di Ekstensi ILKOM dan semua pihak yang tidak dapat penulis sebutkan satu persatu yang telah membantu penulis dalam menyelesaikan penelitian ini. Akhirnya penulis berharap semoga skripsi ini dapat bermanfaat bagi semua pihak yang membutuhkan. Amin. Bogor, April 211 Ayu Gustiawati

6 RIWAYAT HIDUP Penulis dilahirkan di Padang, Propinsi Sumatera Barat, pada tanggal 24 Agustus Penulis merupakan anak tunggal, pasangan Bapak Amril dan Ibu Yusni. Tahun 1999 penulis lulus dari Sekolah Dasar Negeri 5 Padang Pasir, Padang. Pada tahun yang sama penulis melanjutkan di Sekolah Menengah Pertama Negeri 1 Padang dan pada tahun 22 penulis melanjutkan ke Sekolah Menengah Umum Negeri 1 Padang. Tahun 25 penulis lulus dari SMU dan diterima di Direktorat Program Diploma Institut Pertanian Bogor (IPB), program keahlian Manajemen Informatika melalui jalur USMI. Tahun 28 penulis lulus dari program Diploma dan pada tahun yang sama melanjutkan studi di Progran Sarjana Ilmu Komputer Penyelenggaraan Khusus IPB, Fakultas Matematika dan Ilmu Pengetahuan Alama (MIPA) Institut Pertanian Bogor.

7 DAFTAR ISI Halaman DAFTAR GAMBAR... vi DAFTAR TABEL... vi DAFTAR LAMPIRAN... vii PENDAHULUAN... 1 Latar Belakang... 1 Tujuan Penelitian... 1 Ruang Lingkup... 1 Manfaat... 1 TINJAUAN PUSTAKA... 1 Sinyal... 1 Sinyal Suara... 1 Speech Recognition... 2 Digitalisasi Gelombang Suara... 2 Noise... 2 White Gaussian Noise... 3 Fonem... 3 Wave... 3 Wavelet... 4 Wavelet Daubechies... 4 Mel-Frequency Cepstrum Coefficients (MFCC)... 5 Probabilistic Neural Network (PNN)... 6 METODOLOGI PENELITIAN... 6 Kerangka Pemikiran... 6 Data Suara... 6 Penghapusan Silent... 7 Normalisasi... 7 Segmentasi Sinyal... 7 Data Latih dan Data Uji... 7 Ekstraksi Ciri (Wavelet dan MFCC)... 8 Perata-rataan Hasil MFCC dan Wavelet... 8 Pemodelan PNN... 8 Pengujian Model PNN... 8 Perhitungan Nilai Akurasi... 8 Lingkup Pengembangan Sistem... 8 HASIL DAN PEMBAHASAN... 8 Sinyal Suara Asli (Tanpa Penambahan Noise)... 1 Wavelet Daubechies Orde 4 (db4)... 1 MFCC... 1 Perbandingan Wavelet Daubechies Orde 4 (Db4) dengan MFCC pada Suara Asli Sinyal Suara dengan Penambahan Noise Daubechies Orde 4 (db4) dengan Penambahan Noise 3dB Wavelet Daubechies Orde 4 (db4) dengan Penambahan Noise 2dB Wavelet Daubechies orde 4 (db4) dengan Penambahan Noise 1dB Perbandingan Wavelet Daubechies dengan Penambahan Noise 3dB, 2dB, 1dB MFCC dengan Penambahan Noise 3dB MFCC dengan Penambahan Noise 2dB MFCC dengan Penambahan Noise 1dB Perbandingan MFCC dengan Penambahan Noise 3dB, 2dB, 1dB Perbandingan Wavelet Daubechies dan MFCC antara Data Asli dan Data dengan Penambahan Noise 3dB, 2dB, 1dB iv

8 Halaman KESIMPULAN DAN SARAN Kesimpulan Saran DAFTAR PUSTAKA LAMPIRAN v

9 DAFTAR GAMBAR Halaman 1 Sinyal suara Tanpa Noise White Gaussian Noise 3dB White Gaussian Noise 2dB White Gaussian Noise 1dB Diagram Blok MFCC Struktur PNN Diagram Alur Penelitian Pemotongan Silent Segmentasi Sinyal Penghapusan Silent Data Uji Tanpa Penambahan Noise Data Uji yang Ditambahkan Noise 3dB Data Uji yang Ditambahkan Noise 2dB Data Uji yang Ditambahkan Noise 1dB Grafik Tingkat Akurasi Suara Asli dengan Wavelet Daubechies Masing-Masing Fonem Grafik Tingkat Akurasi Suara Asli dengan MFCC Masing-Masing Fonem Grafik Perbandingan Tingkat Akurasi Suara Asli dengan Wavelet Daubechies dan MFCC Masing-Masing Fonem Perbandingan Tingkat Akurasi Suara Asli dengan Wavelet Daubechies dan MFCC Grafik Tingkat Akurasi Suara dengan Noise 3 db Menggunakan Wavelet Daubechies Masing- Masing Fonem Grafik Tingkat Akurasi Suara dengan Noise 2dB Menggunakan Wavelet Daubechies Masing- Masing Fonem Grafik Tingkat Akurasi Suara dengan Noise 1dB Menggunakan Wavelet Daubechies Masing- Masing Fonem Grafik Perbandingan Tingkat Akurasi Menggunakan Wavelet Daubechies terhadap Suara Asli dan Suara dengan Penambahan Noise 3dB, 2dB, dan 1dB Grafik Tingkat Akurasi Suara dengan Noise 3dB Menggunakan MFCC Masing-Masing Fonem Grafik Tingkat Akurasi Suara dengan Noise 2dB Menggunakan MFCC Masing-Masing Fonem Grafik Tingkat Akurasi Suara dengan Noise 1dB Menggunakan MFCC Masing-Masing Fonem Grafik Perbandingan Tingkat Akurasi Menggunakan MFCC terhadap Suara Asli dan Suara dengan Penambahan Noise 3dB, 2dB, dan 1dB Grafik Perbandingan Tingkat Akurasi Wavelet Daubechies dan MFCC terhadap Suara Asli dan Suara dengan Penambahan Noise 3dB, 2dB, dan 1dB DAFTAR TABEL Halaman 1 Segmentasi Fonem Jumlah Tiap Fonem... 9 vi

10 DAFTAR LAMPIRAN Halaman Lampiran 1 Hasil Pendeteksian Masing-Masing Fonem untuk Wavelet Daubechies Lampiran 2 Matriks Confusion Wavelet Daubechies Lampiran 3 Hasil Pendeteksian Masing-Masing Fonem untuk MFCC Lampiran 4 Matriks Confusion MFCC... 2 Lampiran 5 Hasil Pendeteksian Masing-Masing Fonem untuk Wavelet Daubechies dengan Penambahan Noise 3dB Lampiran 6 Matriks Confusion Wavelet Daubechies dengan Penambahan Noise 3dB Lampiran 7 Hasil Pendeteksian Masing-Masing Fonem untuk Wavelet Daubechies dengan Penambahan Noise 2dB Lampiran 8 Matriks Confusion Wavelet Daubechies dengan Penambahan Noise 2dB Lampiran 9 Hasil Pendeteksian Masing-Masing Fonem untuk Wavelet Daubechies dengan Penambahan Noise 1dB Lampiran 1 Matriks Confusion Wavelet Daubechies dengan Penambahan Noise 1dB Lampiran 11 Hasil Pendeteksian Masing-Masing Fonem untuk MFCC dengan Penambahan Noise 3dB Lampiran 12 Matriks Confusion MFCC dengan Penambahan Noise 3dB Lampiran 13 Hasil Pendeteksian Masing-Masing Fonem untuk MFCC dengan Penambahan Noise 2dB Lampiran 14 Matriks Confusion MFCC dengan Penambahan Noise 2dB... 3 Lampiran 15 Hasil Pendeteksian Masing-Masing Fonem untuk MFCC dengan Penambahan Noise 1dB Lampiran 16 Matriks Confusion MFCC dengan Penambahan Noise 1dB vii

11 Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia untuk berinteraksi dengan komputer, dikenal dengan istilah pengenalan kata. Pengenalan kata merupakan bagian dari pengenalan suara yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Kata yang diucapkan terdiri dari fonem-fonem yang menyusun sebuah kata. Teknologi pengenalan suara memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Hasil dari identifikasi kata yang diucapkan ditampilkan dalam bentuk tulisan. Berbagai sistem pengenalan suara atau yang dapat disebut juga Automatic Speech Recognition (ASR) telah banyak dikembangkan di berbagai negara dengan berbagai bahasa. Beberapa sistem pengenalan suara yang telah dikembangkan (Ruvinna 28) : Spoken Dialoque System, sistem yang dapat melakukan dialog singkat guna mendapatkan informasi tertentu. Seperti pada seorang customer service, pengguna hanya perlu menjawab ya atau tidak untuk mendapatkan informasi tertentu. Speed Dialing System, sistem yang dapat mengenali sebuah nama atau ID seseorang dan mencarinya dalam buku telepon untuk segera dihubungi. Pengguna tidak perlu mencari nomor telepon seseorang, biasanya dalam telepon selular, untuk dapat menghubungi seseorang, pengguna tidak perlu mencari nomor telepon orang tersebut. Namun cukup dengan menyebutkan nama atau ID orang yang akan dihubungi dan sistem secara otomatis menghubunginya. Speech to Text Translation System, sistem yang secara otomatis mengetikkan kata-kata yang diucapkan pengguna. Oleh karena itu, penulis melakukan penelitian dengan membandingkan metode Wavelet Daubechies dan MFCC sebagai ekstraksi ciri pada pengenalan kata dengan Probabilistic Neural Network (PNN) sebagai pengenalan pola. PNN merupakan salah satu jenis pengenalan pola yang memiliki akurasi cukup tinggi (Suhartono MN 27). Tujuan Penelitian Penelitian ini bertujuan membandingkan metode Wavelet Daubechies dan MFCC sebagai ekstraksi ciri pada pengenalan fonem dengan PNN untuk mendapatkan informasi tingkat akurasi. Ruang Lingkup Ruang lingkup dari penelitian ini antara lain: 1. Kata yang digunakan terdiri atas sebelas kata yaitu coba, fana, gajah, jaya, malu, pacu, quran, tip-x, visa, weda, dan zakat. 2. Masing-masing kata direkam oleh satu orang pembicara sebanyak 16 kali dalam waktu satu detik, time frame 3 ms, overlap 5%, dan sampling rate 12Hz. 3. Penelitian ini terbatas pada pengenalan fonem tunggal (bukan pengenalan kata atau kalimat). 4. Segmentasi untuk masing-masing fonem dilakukan secara manual. 5. Ekstraksi ciri yang digunakan adalah pemodelan Wavelet Daubechies dan MFCC. 6. Metode yang digunakan pada penelitian ini adalah Probabilistic Neural Network (PNN). 7. Kata yang diucapkan berbahasa Indonesia. Manfaat Manfaat dari penelitian ini antara lain : 1. Menambah pustaka penelitian pengenalan fonem menggunakan metode Wavelet Daubechies dan MFCC dengan Probabilistic Neural Network (PNN). 2. Memberikan informasi tingkat akurasi pengenalan fonem menggunakan metode Wavelet Daubechies dan MFCC dengan Probabilistic Neural Network (PNN). Sinyal TINJAUAN PUSTAKA Menurut Proakis JG & Manolakis DG (27), sinyal adalah suatu besaran fisik yang berubah terhadap variabel waktu, ruang atau variabel independen lainnya. Sinyal Suara Menurut Pelton GE (1993), sinyal suara manusia dibangkitkan dari tekanan udara paruparu yang menyebabkan pita suara bergetar. 1

12 Efek dari getaran tersebut menyebabkan tekanan udara ke lubang vokal dengan frekuensi getaran yang bervariasi, pada akhirnya melalui bibir dan lubang hidung keluar tekanan gelombang sinyal suara. Menurut Proakis JG & Manolakis DG (27), sinyal suara dihasilkan dengan memaksa udara melewati pita suara. Generasi sinyal biasanya diasosiasikan dengan sebuah sistem yang merespon stimulus. Sistem itu terdiri atas pita suara dan saluran suara, yang disebut juga dengan rongga suara. Stimulus yang berkombinasi dengan sistem tersebut disebut dengan sumber sinyal. Contoh sinyal suara dapat dilihat pada Gambar 1. Gambar 1 Sinyal suara (Proakis JG & Manolakis DG 27) Speech Recognition Speech recognition adalah proses konversi sebuah sinyal akustik, yang berasal dari mikrofon atau telepon, menjadi satu atau sekumpulan kata. Pengenalan suara merupakan masalah besar dan sulit untuk dipecahkan, karena terdapat faktor-faktor tidak tetap yang terkait dengan sebuah sinyal. Beberapa faktor tidak tetap tersebut di antaranya ialah (Zue V, Cole R, & Ward W 27) : Phonetic variabilities, atau yang biasa dikenal sebagai homofon, dimana terdapat dua kata atau lebih yang memiliki penulisan berbeda namun pengucapannya sama, contohnya: bang dengan bank. Acoustic variabilities, yang dapat terjadi karena perbedaan lingkungan tempat berbicara. Within-speaker variabilities, yang dapat terjadi karena kondisi fisik dari pembicara yang dapat disebabkan oleh emosi yang sedang dirasakan. Across-speaker variabilities, hal ini dapat terjadi karena perbedaan logat atau cara pengucapan seseorang. Speech recognition didasarkan pada digitalisasi suatu bentuk gelombang yang sesuai dengan data yang digunakan kemudian diekstraksi dengan menggunakan teknik praproses yang sesuai. Setelah itu data diproses untuk mendapatkan representasi dari sinyal suara (Al-Akaidi 24). Digitalisasi Gelombang Suara Menurut Pelton GE (1993), digitalisasi merupakan proses mengubah sinyal analog menjadi sinyal digital. Sinyal suara yang direkam menggunakan mikrofon akan dikonversi menjadi sinyal analog. Sinyal analog memiliki karakter kontinyu dalam ruang waktu dan amplitudo. Proses digitalisasi terdiri atas dua tahap yaitu sampling dan kuantisasi. Sampling merupakan pengambilan nilai pada setiap jangka waktu tertentu yang akan menghasilkan suatu nilai vektor. Panjang nilai vektor yang dihasilkan tergantung dari panjangnya sinyal suara yang didigitalisasi dan sampling rate yang digunakan. Sampling rate adalah banyaknya nilai yang diambil tiap detik. Sampling rate yang biasanya digunakan pada pengenalan suara yaitu 8Hz 16Hz. Setelah tahap sampling maka proses selanjutnya adalah proses kuantisasi. Kuantisasi merupakan proses menyimpan nilai amplitudo ini ke dalam representasi nilai 8 bit atau 16 bit (Jurafsky & Martin 27). Hubungan panjang vektor yang dihasilkan, sampling rate dan panjang data suara yang digitalisasi dinyatakan dengan persamaan 1. S = F s x T (1) Keterangan: S = panjang vektor F s = sampling rate yang digunakan (Hertz) T = panjang suara (detik) Noise Noise dari berbagai jenis membuat sebuah pengenalan menjadi lebih sulit. Deteksi pengenalan suara tanpa noise jauh lebih mudah dibandingkan dengan suara yang ditambahkan noise. Penambahan noise sendiri akan mengakibatkan sejumlah tingkat kesalahan dalam pendeteksian (Jurafsky & Martin 27). Ukuran noise dapat dilihat pada persamaan 2. 1 (2) Keterangan : = sinyal asli = sinyal dengan noise ^ 2

13 White Gaussian Noise White noise didefinisikan sebagai suatu urutan nilai random berkorelasi. White noise adalah wideband dimana semua frekuensi sama. Pembuatan white noise, tidak mempedulikan bagaimana kemungkinan nilainilai amplitudo didistribusikan (Smith 21). Gaussian noise merupakan ide dari white noise yang disebabkan oleh fluktuasi pada sinyal. Gaussian noise adalah white noise dengan distribusi normal (McAndrew 24). White gaussian noise dibutuhkan untuk digital signal processing atau identifikasi sistem dari digital signal processing (Donadio M 1992). Sinyal tanpa noise dan sinyal dengan penambahan white gaussian noise 3dB, 2dB, dan 1dB dapat dilihat pada Gambar 2, Gambar 3, Gambar 4 dan Gambar 5. Gambar 4 White Gaussian Noise 2dB Gambar 2 Tanpa Noise Gambar 3 White Gaussian Noise 3dB Fonem Gambar 4 White Gaussian Noise 1dB Menurut Resmiwati (29), fonem adalah satuan bunyi terkecil yang mampu menunjukkan kontras warna. Fonem dapat dibagi menjadi empat bagian yaitu: 1. Fonem vokal, merupakan bunyi ujaran akibat adanya udara yang keluar dari paruparu tidak terkena hambatan atau halangan. Jumlah fonem vokal ada lima yaitu: a, i, u, e, dan o. 2. Fonem konsonan, merupakan bunyi ujaran akibat adanya udara yang keluar dari paruparu mendapatkan hambatan atau halangan. Jumlah fonem konsonan ada 21 buah yaitu: b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, w, x, y, dan z. 3. Fonem vokal rangkap, merupakan gabungan dua fonem vokal yang menghasilkan bunyi rangkap, yaitu : ai, au, dan ai. 4. Fonem konsonan rangkap, merupakan gabungan dua buah konsonan, yaitu : ny, ng, kh, dan sy. Wave Wave didefinisikan sebagai sebuah fungsi yang bergerak dari waktu atau ruang. Analisis 3

14 Fourier merupakan analisis wave. Perluasan sinyal atau fungsi wave berdasarkan sinusoids telah terbukti sangat berguna dalam bidang matematika, science, dan teknik mesin khususnya periodik, waktu yang tidak berlainan (time-invariant), atau fenomena ketidakseimbangan (Burrus et al. 1998). Wavelet Wavelet adalah sebuah small wave yang energinya terkonsentrasi dalam waktu untuk analisis transien, ketidakseimbangan atau fenomena yang berubah-ubah terhadap waktu (Burrus et al. 1998). Wavelet ditunjukkan pertama kali sebagai dasar pendekatan baru untuk pemrosesan sinyal dan analisis yang disebut teori multiresolusi. Teori multiresolusi berkaitan dengan analisis dan representasi sinyal atau citra pada lebih dari satu resolusi. Hasil pendekatan teori multiresolusi yakni fitur yang tidak terdeteksi pada suatu resolusi dapat terdeteksi pada resolusi lain (Gonzalez & Woods 22). Secara umum transformasi wavelet kontinyu dituliskan, γ (s,τ) = f(t) ψ s,t (x) dt (3) dimana ψ s,t (x)= ψ (4) dan s,τ disebut dengan parameter skala dan translasi. Menurut Burrus et al. (1998), teori wavelet didasari oleh pembangkitan sejumlah tapis (filter) dengan menggeser dan menskala suatu wavelet berupa tapis pelewat tengah (band-pass filter). Penambahan skala wavelet akan meningkatkan durasi waktu, mengurangi lebar bidang (bandwidth) dan menggeser frekuensi pusat ke nilai frekuensi yang lebih rendah. Sebaliknya pengurangan skala menurunkan durasi waktu, menambah lebar bidang dan menggeser frekuensi ke nilai frekuensi yang lebih tinggi. Menurut McAndrew 24 yang dirujuk pada Oktabroni I N 28, wavelet dapat digunakan untuk mengurangi noise, deteksi tepi, dan kompresi citra. Wavelet Daubechies Wavelet Daubechies secara historis berasal dari sistem Haar. Wavelet Daubechies ini merupakan karya gemilang dari Ingrid Daubechies. h 2 + h h h 3 2 = 1 (5) h h 2 + h 1 h 3 2 = (6) h 3 - h 2 + h 1 h = (7) h 3-1h 2 + 2h 1 3h = (8) Persamaan (4, 5, 6, dan 7) merupakan empat persamaan dengan empat bilangan yang tidak diketahui yaitu h, h 1, h 2, dan h 3. Persamaan tersebut pertama kalinya diperkenalkan dan diselesaikan oleh Ingrid Daubechies, ditunjukkannya bahwa persamaan-persamaan ini mempunyai penyelesaian tunggal / 2 ; (9) / 2 ; (1) / 2 ; (11) / 2 ; (12) Matriks Transformasi ditemukan oleh Ingrid Daubechies yang memungkinkan melalui suatu sinyal dari resolusi 2 j ke resolusi 2 j+1. Untuk menyederhanakannya, matriks ini disebut matriks DAUB. c j = H c j+1 (13) d j = G c j+1 (14) Pada persamaan (13) dan (14) dimana H berkaitan dengan suatu filter low pass dan G berkaitan dengan filter high pass. H dan G disebut filter konjugasi kuadratur. 2 (15) 2 (16) Dari persamaan (15) dan (16), dapat dibentuk suatu matriks transformasi yang mempunyai elemen-elemen h(n) dan g(n). Dapat dihitung dengan persamaan g(n) = (-1) n h((2n-1)-n). Jika N = 2 maka akan diperoleh: g() = h(3); (17) g(1) = -h(2); (18) g(2) = h(1); (19) g(3) = -h(); (2) Dengan mengganti variabel-variabel yang bersesuaian, akan diperoleh matriks DAUB4 dengan empat koefisien yang disebut juga matriks transformasi. Matriks transformasi dari Wavelet Daubechies dapat dilihat pada persamaan 2 (Agustini 26). h() h(1) h(3) h(2) h(2) h(3) h(1) h() h(2) h(1) h() h() h(3) h(3) h(1) h(2) h(2) h(1) h(3) h() h() h(3) h(2) h(1) h(2) h(3) h(1) h() h() h(1) h(3) h(2) (21) 4

15 Umumnya Wavelet Daubechies ditulis dengan dbn dengan N menunjukkan orde. Daubechies ditopang secara kompak oleh induk wavelet dan fungsi skala dalam interval {,2N-1} dengan N bilangan bulat 1 dan mempunya sifat sebagai berikut (Agustini 26) : 1. Fungsi ψ mempunyai sejumlah tertentu momen nol yaitu, (22) untuk k =, 1, 2,, N-1 2. Supp φ, 2N-1 dan Supp ψ 1-N, N 3. Fungsi konjugasi kuadratur mempunyai bentuk dekomposisi H (filter lowpass) dan G (filter highpass) berhingga yang memungkinkan untuk mengoptimalkan perhitungan koefisien wavelet dengan algoritma dekomposisi dari S. Mallat. Mel-Frequency Cepstrum Coefficients (MFCC) MFCC didasarkan pada variasi yang telah diketahui dari jaringan kritis telinga manusia terhadap frekuensi. Filter dipisahkan secara linear pada frekuensi rendah dan logaritmik pada frekuensi tinggi. Hal ini dilakukan untuk menangkap karakteristik penting dari sinyal suara (Do Mn 1995). Diagram blok MFCC dapat dilihat pada Gambar 6 (Buono 29). Input Suara yg telah melalui praproses frame1 frame 3 frame 5 frame 7... Fast Fourier Transforn (FFT): frame 2 frame 4 frame 6... Frame Blocking WINDOWING Y(t) = X(t) * W(n), <n<n-1 W(n)= cos (2πn/(N-1)) Mel Frequency Wrapping: mel (f)=2595 log(1+ f/7) Spektrum Mel : H(k) adalah nilai filter segitiga ke-i Cepstrum Coefficients : Discrete Cosine Transform j=1,2,3,...j ; J=jumlah koefisien ; M=jumlah filter Gambar 6 Diagram Blok MFCC (Buono29) Tahapan MFCC yaitu : 1. Frame blocking Frame blocking merupakan tahapan untuk membagi sinyal suara kedalam frame-frame yang terdiri atas N sample. 2. Windowing Windowing dilakukan dengan cara meminimalisasikan distorsi mengunakan window untuk memperkecil sinyal hingga mendekati nol pada awal dan akhir tiap frame. Jika window didefinisikan sebagai w(n), n N-1, dengan N adalah banyaknya sampel tiap frame. Window yang biasanya digunakan adalah window hamming karena kesederhanaan formulanya yang dapat dilihat pada persamaan 23 dan persamaan 243. Y 1 (n) = x 1 (n)w(n), n N-1 (23) w(n)= cos (2πn/N-1) (24) 3. Fast Fourier Transform (FFT) Tahapan ini bertujuan untuk mengonversi tiap frame dengan N sample dari time domain menjadi frekuency domain. FFT merupakan algoritme yang mengimplementasikan Discrete Fourier Transfom (DFT) yang didefinisikan pada persamaan 25. / (25) dengan k=,1,2,,n-1 4. Mel Frequency Wrapping Persepsi manusia terhadap frekuensi sinyal suara tidak berupa skala linear. Oleh karena itu, untuk setiap nada dengan frekuensi aktual f (dalam Hertz), tinggi subjektifnya diukur dengan skala mel. Skala melfrequency adalah selang frekuensi di bawah 1Hz dan selang logaritmik untuk frekuensi di atas 1Hz. Perhitungan melfrequency dapat dilihat pada persamaan 26 dan 27. mel(f) = 2595 * log 1 (1 + f / 7) (26) (27) Keterangan : i = 1, 2, 3, M H(k) = nilai filter segitiga ke-i 5. Cepstrum Tahapan ini bertujuan untuk mengonversi mel frequency ke domain waktu menggunakan Discrete Cosine Transform 5

16 )( xp () 212/ hd =π (. 12 nh id =Σ. (DCT) yang dapat dilihat pada persamaan berikut : cos (28) Keterangan : = nilai koefisien C ke j j = jumlah koefisien yang diharapkan = hasil mel-frequency wrapping pada frekuensi i = 1, 2,.n jumlah wrapping M = jumlah filter Probabilistic Neural Network (PNN) Menurut Ganchecv (25), PNN untuk klasifikasi, mapping, dan associative memory diperkenalkan pertama kali oleh Specht tahun PNN diformulasikan ke dalam fourlayer neural network yang sudah terlatih. Secara umum PNN dapat dituliskan,. Keterangan : k = fungsi kernel, dimana e = 2,17 h = parameter (29) k = (3) Struktur PNN terdiri atas empat layer, dapat dilihat pada Gambar 7. Gambar 7 Struktur PNN (Ganchev 25) 1. Input layer, berfungsi sebagai input data pada PNN. 2. Pattern layer, berfungsi menghitung jarak antara nilai input data suara dengan nilai pola dari tiap anggota kelas. Nilai hasil pattern layer dapat ditunjukkan pada persamaan berikut : (31) Keterangan: d x i x ij h j i j n = banyaknya data pada pattern layer = input data uji ke-j = pattern ke-i data ke-j = smoothing parameter (α x simpangan baku ke-j x n 1/5 ) = 1, 2 sampai n = i, 2 sampai = banyaknya pattern pada satu kelas 3. Summation Layer, menghasilkan peluang untuk satu kelas yang didapat dari penjumlahan pattern layer. Hasilnya dibagi dengan (2π) d/2 h i h 2...h d n. Nilai h i h 2...h d n adalah nilai smoothing dari kelas tersebut. Persamaan untuk menghitung peluang tersebut adalah : Keterangan: h i h 2...h d n = nilai smoothing dari kelas (f i (x)) = pattern layer (32) 4. Decision Layer (Output Layer), membandingkan hasil peluang pada setiap kelas kemudian input data dimasukkan dalam kelas yang memiliki nilai peluang terbesar. METODOLOGI PENELITIAN Kerangka Pemikiran Penelitian ini dilakukan dengan pengambilan sebelas kata. Masing-masing kata direkam sebanyak 16 kali dari satu orang pembicara. Kemudian, dilakukan proses penghapusan silent. Selanjutnya, data suara tersebut diolah dengan Wavelet Daubechies dan MFCC sebagai ekstraksi cirinya. Data yang sudah diolah dibagi menjadi dua kelompok yaitu, data latih dan data uji. Kemudian, data latih dimodelkan dengan menggunakan PNN. Adapun langkah-langkah dalam proses pengenalan kata ini dapat dilihat pada Gambar 8. Data Suara Data suara yang digunakan pada penelitian ini berjumlah sebelas kata yang berasal dari satu orang pembicara. Masing-masing kata tersebut direkam sebanyak 16 kali dalam waktu satu detik, sampling rate 12Hz, overlap 5% dengan time frame 3 ms. Kata yang diucapkan antara lain coba, fana, gajah, jaya, malu, pacu, quran, tip-x, visa, weda, dan zakat. 6

17 Mulai Normalisasi Pengambilan data suara Penghapusan silent Normalisasi bertujuan untuk mendapatkan range nilai amplitudo yang sama dari masing- dengan masing suara. Normalisasi dilakukan cara membagi setiap nilai dengan nilai maksimum pada masing-masing suara sehingga memiliki amplitudo satu untuk nilai maksimum dan minus satu untuk nilai minimum. Normalisasi Segmentasi Sinyal Data latih Ektraksi ciri (MFCC dan Wavlelet) Segmentasi Data uji Ektraksi ciri (MFCC dan Wavlelet) Segmentasi adalah tahap dimana setiap sinyal suara dibagi-bagsegmentasi dilakukan secara manual berdasarkan fonem. Proses dengann menggunakan Audacity sehingga didapat 26 fonem dari masing-masing suara. Ilustrasi segmentasi sinyal suara dapat dilihat pada Gambar 1. Perata-rataan Perata-rataan Model PNN Gambar 8 Diagram Alur Penelitian Penghapusan Silent Silent merupakan bagian diam yang biasanya terdapatt pada saat awal dan akhir proses perekaman suara. Data suara yang terkumpul merupakan suaraa kotor yang mengandung silent. Pada proses ini dilakukan pembersihan data suara dengan menghilangkan silent dari tiap- tiap suara. Penghapusan silent dilakukan secara manual dengan menggunakan Audacity. Ilustrasi pemotongan silent dapat dilihat pada Gambar 9. silent Pengujian model PNN Perhitungan nilai akurasi Selesai silent Gambar 9 Pemotongann Silent c Fonem-fonem yang dilihat pada Tabel 1. Tabel 1 Segmentasi Fonem Kata coba /c/, /o/, /b/, /a/ fana gajah jaya malu /m/, /a/, /l/, /u/ pacu /p/, /a/, /c/, /u/ tip-x /t/, /i/, /p/, /x/ visa /v/, /i/, /s/, /a/ weda /w/, /e/, /d/, /a/ zakat o b Gambar 1 Segmentasi Sinyal Fonem /f/, /a/, /n/, /a/ /g/, /a/, /j/, /a/, /h/ /j/, /a/, /y/, /a/ /z/, /a/, /k/, /a/, /t/ Data Latih dan Dataa Uji a disegmentasi dapat Pengambilan data latih dan data uji dilakukan dengan cara mengelompokkan semua fonem kedalam kelasnya masing-masing. Setelah dikelompokkan sebanyak 16 fonem teratas dari masing-masing kelas diambil untuk dijadikan data latih dan data uji. Proporsi data latih dan data uji yaitu 75% : 25%. Data uji yang digunakan yaitu data tanpa penambahan noise (data asli) dan data dengan penambahan noise 3dB, 2dB, dan 1dB. Noise yang ditambahkan adalah White Gaussian noise. 7

18 Ekstraksi Ciri (Wavelet dan MFCC) Ekstraksi ciri merupakan proses untuk menentukan satu nilai atau vektor yang dipergunakan sebagai penciri objek. Tujuan utamanya adalah mereduksi ukuran data tanpa mengubah karakteristik dari sinyal suara. Ciri yang biasa dipergunakan adalah nilai koefisien cepstral dari sebuah frame. Tahapan dari proses ini yaitu framing, windowing, fast fourier transform dan transformasi wavelet daubechies, mel-frequency wrapping, dan cepstrum. Data suara yang telah disegmentasi selanjutnya dilakukan proses framing. Tiap frame berukuran 3 ms, overlap 5%, dan 13 koefisien mel cepstrum. Pada transformasi wavelet pengenalan fonem yang diproses akan mengalami penurunan fitur. Wavelet yang digunakan adalah Wavelet Daubechies (db4) satu level. Hasil dari matriks ekstraksi ciri ini merupakan masukan untuk pembelajaran pada PNN. Perata-rataan Hasil MFCC dan Wavelet Proses ini bertujuan untuk menyamakan ukuran matriks untuk tiap suara pada masingmasing baris sehingga terbentuk ukuran matriks n 1. Hasil dari ekstraksi ciri MFCC dan wavelet yaitu matriks ciri n k, n adalah koefisien dan k adalah jumlah frame. Pemodelan PNN Hasil dari perata-rataan MFCC dan wavelet selanjutnya dapat digunakan untuk membangun pemodelan PNN. Input data yang digunakan pada proses ini mempunyai ukuran matriks 13xN. Input data tersebut diidentifikasikan dengan pattern layer pada Persamaan 3. Parameter h pada Persamaan 3 digunakan nilai 1,14 (simpangan baku) n -1/5. Nilai ialah nilai hasil pattern layer ke i, dimana i=1, 2 sampai banyaknya observasi pada satu kelas. Setelah memperoleh selisih jarak antara nilai data input dengan data pada pattern layer, maka nilai tersebut dibagi dengan nilai smoothing parameter. Nilai smoothing didapat dari simpangan baku data setiap pattern ke j=1, 2 sampai jumlah koefisien yang digunakan. Pengujian Model PNN Pengujian model PNN ini dilakukan dengan cara memasukkan data uji (matriks n 1) ke dalam tiap kelas untuk mendapatkan nilai peluang. Perhitungan pada pengujian setiap kelas menggunakan Persamaan 31, sehingga nilai peluang p(x) diperoleh dari setiap kelas pada pengujian model PNN. Nilai peluang terbesar dari satu kelas merupakan hasil akhir dari tahapan ini. Perbandingan data latih dan data uji adalah 75% : 25%. Perhitungan Nilai Akurasi Perhitungan nilai akurasi bertujuan untuk mengetahui hasil tingkat akurasi dari pengujian model PNN pada pengenalan fonem. Pada tahap ini kita bisa melihat fonem-fonem mana saja yang berhasil dikenali dengan baik dan fonemfonem yang mungkin tidak bisa dikenali sama sekali. Selain itu kita juga bisa mengetahui metode mana yang lebih tinggi akurasinya. Perhitungan tingkat akurasi dapat dilihat pada persamaan berikut : Lingkup Pengembangan Sistem (33) Perangkat keras yang digunakan pada penelitian ini berupa komputer notebook dengan spesifikasi: Intel Core2 Duo processor 1,3 GHz Memori DDR3 4 GB Harddisk 32 GB Perangkat lunak yang digunakan yaitu : Sistem Operasi : Microsoft Xp Matlab 7.1 Audacity 1.3 HASIL DAN PEMBAHASAN Data suara yang telah direkam pada frekuensi 12Hz diperoleh sebanyak 176 kata untuk selanjutnya dilakukan penghapusan silent. Proses ini bertujuan untuk menghilangkan bagian silent yang terdapat pada awal dan akhir dari suara. Penghapusan silent dapat dilihat pada Gambar 11. Data suara yang sudah dibersihkan disegmentasi per fonem tunggal. Semua fonem dikelompokkan per huruf agar lebih mudah diproses. Jumlah dari tiap fonem dapat dilihat pada Tabel 2. Pembersihan data suara Gambar 11 Penghapusan Silent 8

19 Tabel 2 Jumlah Tiap Fonem Fonem Jumlah Fonem Jumlah /a/ 224 /n/ 32 /b/ 16 /o/ 16 /c/ 32 /p/ 32 /d/ 16 /q/ 16 /e/ 16 /r/ 16 /f/ 16 /s/ 16 /g/ 16 /t/ 32 /h/ 16 /u/ 48 /i/ 32 /v/ 16 /j/ 32 /w/ 16 /k/ 16 /x/ 16 /l/ 16 /y/ 16 /m/ 16 /z/ 16 Akan tetapi penelitian ini hanya memilih 16 fonem dari jumlah masing-masing fonem yang ada. Hal ini dikarenakan jumlah fonem /a/ yang terlalu banyak yang menyebabkan fonem /a/ akan dominan untuk dikenali. Setelah didapat 16 fonem kemudian data tersebut dibagi menjadi data latih dan data uji dengan proporsi 75% : 25% untuk selanjutnya diekstraksi ciri dan dimodelkan menggunakan PNN. Struktur PNN pada penelitian ini dapat dilihat pada Gambar 12. Input layer merupakan input data yang berjumlah 13 sesuai banyaknya jumlah koefisien yang digunakan. Masingmasing kelas pada pattern layer berjumlah 12 sesuai banyaknya observasi yang digunakan. Pada layer ini dihitung jarak antara nilai input data dengan nilai pola dari tiap anggota kelas. Hasil dari pattern layer ini akan dijumlahkan dengan hasil dari pattern layer lainnya yang satu kelas. Proses ini terjadi pada summation layer. Pada summation layer diperoleh nilai terbesar untuk suatu kelas. Summation layer berjumlah 26 kelas sesuai jumlah kelas yang ada. Hasil dari summation layer tiap-tiap kelas dibandingkan pada decision layer berdasarkan nilai peluang terbesar sehingga input data dapat dikenali sebagai kelas tertentu. Gambar 12 Implementasi Struktur PNN Pengujian yang dilakukan meliputi data uji asli (tanpa penambahan noise) dan data uji yang ditambahkan noise 3dB, 2dB, dan 1dB. Untuk mendapatkan hasil akurasi yang baik pengujian dilakukan secara berulang kali dengan mengombinasikan data latih dan data uji dari masing-masing fonem. Data uji tanpa penambahan noise dan data uji yang ditambahkan noise 3dB, 2dB, dan 1dB untuk fonem /a/ dapat dilihat secara berturutturut pada Gambar 13, Gambar 14, Gambar 15, dan Gambar 16. Gambar 13 Data Uji Tanpa Penambahan Noise 9

20 Gambar 14 Data Uji yang Ditambahkan Noise 3dB Sinyal Suara Asli (Tanpa Penambahan Noise) Penelitian sinyal suara asli dilakukan dengan dua proses ekstraksi ciri yaitu wavelet dan MFCC. Induk wavelet yang digunakan adalah Wavelet Daubechies orde 4 (db4). Wavelet Daubechies Orde 4 (db4) Pengujian dengan ekstraksi ciri Wavelet Daubechies memperoleh akurasi sebesar 32.69% untuk keseluruhan fonem. Grafik tingkat akurasi suara asli dengan Wavelet Daubechies untuk masing-masing fonem dapat dilihat pada Gambar 17. Dapat dilihat bahwa akurasi yang dihasilkan belum memuaskan dimana masih terdapat fonem-fonem yang belum bisa dikenali. Fonem yang belum bisa dikenali di antaranya fonem /d/, /j/, /l/, /n/, /r/, /s/, /v/, /w/ dan /x/. Selain itu juga terdapat dua fonem yang dikenali cukup baik dengan akurasi di atas 7%, yaitu fonem /e/, /o/, /p/, /q/, /u/ dan /z/. Hasil pendeteksian masing-masing fonem untuk Wavelet Daubechies dan matriks confusion dapat dilihat pada Lampiran 1 dan Lampiran 2. Fonem yang paling dominan terdeteksi pada metode wavelet daubechies menggunakan data asli adalah fonem /e/. Gambar 15 Data Uji yang Ditambahkan Noise 2dB Gambar 16 Data Uji yang Ditambahkan Noise 1dB Penambahan noise yang dilakukan mengakibatkan sinyal suara asli tertimpa oleh besarnya noise yang ditambahkan. Terlihat bahwa penambahan noise 1dB memberikan pengaruh yang besar terhadap sinyal suara dibandingkan dengan penambahan noise 2dB dan 3dB. Ini mengakibatkan sinyal suara akan sulit dikenali sesuai besarnya noise yang ditambahkan. Gambar 17 Grafik Tingkat Akurasi Suara Asli dengan Wavelet Daubechies Masing-Masing Fonem MFCC Pengujian dengan ekstraksi ciri MFCC memperoleh akurasi cukup baik yaitu sebesar 92.3% untuk keseluruhan fonem. Grafik tingkat akurasi suara asli dengan MFCC untuk masingmasing fonem dapat dilihat pada Gambar 18. Hampir semua fonem dikenali dengan akurasi di atas 7% dan hanya dua fonem yang memperoleh akurasi 5% pada penelitian ini. 1

21 Gambar 18 Grafik Tingkat Akurasi Suara Asli dengan MFCC Masing-Masing Fonem Fonem yang memperoleh tingkat akurasi 1% sebanyak 2 fonem yaitu /b/, /d/, /e/, /f/, /g/, /h/, /j/, /l/, /m/, /n/, /o/, /p/, /r/, /s/, /u/, /v/, /w/, /x/, /y/, dan /z/. Fonem yang memperoleh tingkat akurasi 75% berturut-turut yaitu berturut-turut yaitu /a/, /c/, /i/, dan /q/. Fonem yang memperoleh tingkat akurasi 5 yaitu fonem /k/ dan /t/. Hasil pendeteksian masingmasing fonem untuk MFCC dan matriks confusion dapat dilihat pada Lampiran 3 dan Lampiran 4. Perbandingan Wavelet Daubechies Orde 4 (Db4) dengan MFCC pada Suara Asli Perbandingan Wavelet Daubechies dan MFCC untuk semua fonem dapat dilihat pada Gambar 19. Terdapat empat fonem yang tidak dikenali pada pengujian yang menggunakan ekstraksi ciri Wavelet Daubechies sedangkan jika menggunakan MFCC fonem-fonem tersebut dapat dikenali semua. Gambar 2 Perbandingan Tingkat Akurasi Suara Asli dengan Wavelet Daubechies dan MFCC Sinyal Suara dengan Penambahan Noise Noise yang ditambahkan pada penelitian ini adalah noise 3dB, 2dB, dan 1dB dengan ekstraksi ciri Wavelet Daubechies dan MFCC. Daubechies Orde 4 (db4) dengan Penambahan Noise 3dB Grafik tingkat akurasi suara dengan noise 3dB menggunakan Wavelet Daubechies untuk masing-masing fonem dapat dilihat pada Gambar 21. Akurasi yang diperoleh dengan pengujian menggunakan ekstraksi ciri Wavelet Daubechies untuk penambahan noise 3dB adalah 24.3% untuk keseluruhan fonem. Akurasi dengan penambahan noise 3dB menurun sebesar 8.66% dibandingkan dengan suara asli. Pada pengujian dengan penambahan noise 3dB terdapat tiga fonem yang mempunyai akurasi di atas 7% yaitu fonem /e/, /o/ dengan akurasi 75% dan fonem /p/ dengan akurasi 1%. Hasil pendeteksian masingmasing fonem untuk Wavelet Daubechies dengan penambahan noise 3dB dan matriks confusion dapat dilihat pada Lampiran 5 dan Lampiran 6. Fonem yang paling dominan terdeteksi pada penambahan noise 3dB yaitu fonem /e/. Gambar 19 Grafik Perbandingan Tingkat Akurasi Suara Asli dengan Wavelet Daubechies dan MFCC Masing-Masing Fonem Gambar 2 menunjukkan perbandingan Wavelet Daubechies dan MFCC secara keseluruhan. Terlihat bahwa ekstraksi ciri menggunakan MFCC memperoleh akurasi yang cukup baik sebesar 92.3% dengan selisih mencapai 59.61% jika dibandingkan dengan Wavelet Daubechies. Gambar 21 Grafik Tingkat Akurasi Suara dengan Noise 3 db Menggunakan Wavelet Daubechies Masing-Masing Fonem 11

22 Wavelet Daubechies Orde 4 (db4) dengan Penambahan Noise 2dB Akurasi yang diperoleh dengan pengujian menggunakan ekstraksi ciri Wavelet Daubechies untuk penambahan noise 2dB adalah 12.5% untuk keseluruhan fonem. Akurasi dengan penambahan noise 2dB menurun sebesar 11.53% dari penambahan noise 3dB dan 2.19% dari suara asli. Pada penambahan noise 2dB masih terdapat fonemfonem yang belum dikenali yaitu fonem /a/, /b/, /d/, /f/, /g/, /h/, /j/, /k/, /n, /q/, /r/, /s/, /t/, /v/, /w/, /x/, /y/, dan /z/ sedangkan fonem yang memperoleh akurasi 1% hanya hanya fonem /p/. Grafik tingkat akurasi suara dengan noise 2dB menggunakan Wavelet Daubechies untuk masing-masing fonem dapat dilihat pada Gambar 22. Hasil pendeteksian masing-masing fonem untuk Wavelet Daubechies dengan penambahan noise 2dB dan matriks confusion dapat dilihat pada Lampiran 7 dan Lampiran 8. Fonem yang paling dominan terdeteksi pada penambahan noise 2dB yaitu fonem /l/. Gambar 22 Grafik Tingkat Akurasi Suara dengan Noise 2dB Menggunakan Wavelet Daubechies Masing-Masing Fonem Wavelet Daubechies orde 4 (db4) dengan Penambahan Noise 1dB Pengujian dengan ekstraksi ciri Wavelet Daubechies untuk penambahan noise 1dB memperoleh akurasi sebesar 3.84% untuk keseluruhan fonem. Grafik tingkat akurasi suara dengan noise 1dB menggunakan Wavelet Daubechies untuk masing-masing fonem dapat dilihat pada Gambar 23. Akurasi dengan penambahan noise 1dB menurun sebesar 2.19% dari penambahan noise 3dB, 8.66% dari penambahan noise 2%, dan 28.85% dari suara asli. Hasil pendeteksian masing-masing fonem untuk Wavelet Daubechies dengan penambahan noise 1dB dan matriks confusion dapat dilihat pada Lampiran 9 dan Lampiran 1. Fonem yang paling dominan terdeteksi pada penambahan noise 1dB yaitu fonem /o/. Ini dikarenakan dengan penambahan noise 1dB membuat fonem-fonem yang diujikan menyerupai fonem /p/. Gambar 23 Grafik Tingkat Akurasi Suara dengan Noise 1dB Menggunakan Wavelet Daubechies Masing-Masing Fonem Perbandingan Wavelet Daubechies dengan Penambahan Noise 3dB, 2dB, 1dB Tingkat akurasi perbandingan noise pada ekstraksi ciri Wavelet Daubechies dapat dilihat pada Gambar 24. Tingkat akurasi pada data suara asli lebih bagus dibandingkan dengan data suara dengan penambahan noise. Penambahan noise pada penggunaan ekstraksi ciri Wavelet Daubechies tidak terlalu berpengaruh dibandingkan dengan suara asli (tanpa noise). Ini disebabkan wavelet dapat digunakan untuk mengurangi noise yang ditambahkan. Pada Gambar 24 terlihat semakin kecil noise yang ditambahkan semakin kecil tingkat akurasi pengenalan fonem, sedangkan jika semakin besar noise yang ditambahkan, akan semakin besar tingkat akurasi pengenalan fonemnya. Gambar 24 Grafik Perbandingan Tingkat Akurasi Menggunakan Wavelet Daubechies terhadap Suara Asli dan Suara dengan Penambahan Noise 3dB, 2dB, dan 1dB MFCC dengan Penambahan Noise 3dB Akurasi yang diperoleh dengan pengujian menggunakan ekstraksi ciri MFCC untuk penambahan noise 3dB adalah 5.96% untuk keseluruhan fonem. Akurasi dengan penambahan noise 3dB menurun sebesar 41.34% dibandingkan dengan suara asli. Grafik tingkat akurasi suara dengan noise 3dB 12

23 menggunakan MFCC untuk masing-masing fonem dapat dilihat pada Gambar 25. Fonem yang paling dominan terdeteksi pada penambahan noise 3dB yaitu fonem /l/. MFCC dengan Penambahan Noise 1dB Pengujian dengan ekstraksi ciri MFCC untuk penambahan noise 1dB memperoleh akurasi sebesar 19.23% untuk keseluruhan fonem. Grafik tingkat akurasi suara dengan noise 1dB menggunakan MFCC untuk masing-masing fonem dapat dilihat pada Gambar 27. Gambar 25 Grafik Tingkat Akurasi Suara dengan Noise 3dB Menggunakan MFCC Masing-Masing Fonem Hal ini membuktikan penambahan noise 3dB jauh lebih baik dari pada penambahan noise 2dB dan 1dB. Hasil pendeteksian masing-masing fonem untuk MFCC dengan penambahan noise dan matriks confusion dapat dilihat pada Lampiran 11 dan Lampiran 12. MFCC dengan Penambahan Noise 2dB Akurasi yang diperoleh dengan pengujian menggunakan ekstraksi ciri MFCC untuk penambahan noise 2dB hanya mencapai 26.92% untuk keseluruhan fonem. Akurasi dengan penambahan noise 2dB menurun sebesar 24.4% dibandingkan dengan penambahan noise 3dB dan 65.38% jika dibandingkan dengan suara asli. Pada penambahan noise 2dB terdapat lima fonem yang memperoleh akurasi 1% yaitu fonem /a/, /d/, /l/, /m/, dan /s /. Fonem yang paling dominan terdeteksi pada penambahan noise 1dB yaitu fonem /l/. Grafik tingkat akurasi suara dengan noise 2dB menggunakan MFCC untuk masing-masing fonem dapat dilihat pada Gambar 26. Hasil pendeteksian masing-masing fonem untuk MFCC dengan penambahan noise 2dB dan matriks confusion dapat dilihat pada Lampiran 13 dan Lampiran 14. Gambar 27 Grafik Tingkat Akurasi Suara dengan Noise 1dB Menggunakan MFCC Masing-Masing Fonem Pada Gambar 27 terlihat hanya delapan fonem yang dapat dikenali. Fonem tersebut di antaranya fonem /a/, /d/,/m/ dengan akurasi 1%, /l/, /p/, /s/ dengan akurasi 5%, dan /i/, /j/ dengan akurasi 25%. Hasil pendeteksian masing-masing fonem untuk MFCC dengan penambahan noise 1dB dan matriks confusion dapat dilihat pada Lampiran 15 dan Lampiran 16. Fonem yang paling dominan terdeteksi pada penambahan noise 1dB yaitu fonem /a/. Perbandingan MFCC dengan Penambahan Noise 3dB, 2dB, 1dB Tingkat akurasi perbandingan noise pada ekstraksi ciri MFCC dapat dilihat pada Gambar 28. Gambar 26 Grafik Tingkat Akurasi Suara dengan Noise 2dB Menggunakan MFCC Masing-Masing Fonem Gambar 28 Grafik Perbandingan Tingkat Akurasi Menggunakan MFCC terhadap Suara Asli dan Suara dengan Penambahan Noise 3dB, 2dB, dan 1dB Pada data suara asli tingkat akurasinya jauh lebih bagus dibandingkan dengan data suara dengan penambahan noise. Selisih antara data asli dengan penambahan noise 3dB ialah 13

24 41.34%, 65.38% jika dibandingkan dengan penambahan noise 2dB dan mencapai 73.7% jika dengan penambahan noise 1dB. Perbandingan Wavelet Daubechies dan MFCC antara Data Asli dan Data dengan Penambahan Noise 3dB, 2dB, 1dB Tingkat akurasi perbandingan Wavelet Daubechies dan MFCC antara data asli dan data dengan penambahan noise 3dB, 2dB, dan 1dB dapat dilihat pada Gambar 29. Gambar 29 Grafik Perbandingan Tingkat Akurasi Wavelet Daubechies dan MFCC terhadap Suara Asli dan Suara dengan Penambahan Noise 3dB, 2dB, dan 1dB Akurasi menggunakan MFCC lebih tinggi dibandingkan dengan menggunakan Wavelet Daubechies yaitu sebesar 92.3%. Pada Gambar 29 dapat dilihat ekstraksi ciri menggunakan Wavelet Daubechies memperoleh akurasi kurang dari 5%. Hal ini menunjukkan ekstraksi ciri dengan Wavelet Daubechies tidak jauh lebih baik dari pada ekstraksi ciri dengan MFCC. Kesimpulan KESIMPULAN DAN SARAN Berdasarkan penelitian yang dilakukan, didapatkan kesimpulan sebagai berikut : 1. Ekstraksi ciri menggunakan MFCC pada pengenalan fonem jauh lebih baik dibandingkan dengan menggunakan Wavelet Daubechies. Pada data asli (tanpa penambahan noise) diperoleh akurasi sebesar 92.3% dan pada data yang ditambahkan noise 3dB, 2dB, dan 1dB akurasi yang diperoleh secara berturut-turut adalah 5.96%, 26.92%, dan 19.23%. 2. Akurasi data suara yang ditambahkan noise 3dB lebih tinggi dari pada akurasi data suara yang ditambahkan noise 2dB dan noise 1dB. Ini mengakibatkan adanya kemunduran tingkat akurasi. Oleh karena itu, dapat disimpulkan jika semakin kecil noise yang ditambahkan pada fonem maka akan semakin banyak jumlah fonem yang dapat dikenali (akurasi tinggi). Jika semakin besar noise yang ditambahkan pada fonem maka akan semakin sedikit jumlah fonem yang dapat dikenali (akurasi rendah). Saran Penelitian ini masih banyak kekurangan yang memungkinkan dilakukan pengembangan lebih lanjut. Beberapa saran yang dapat ditambahkan diantaranya : 1. Penelitian ini dapat dikembangkan ke arah pengenalan kata atau bahkan pengenalan kalimat. 2. Penggunaan kata yang lebih bervariasi serta menambah jumlah kata yang digunakan untuk data uji dan data latih. 3. Penambahan jumlah pembicara dan menggunakan dua atau lebih dalam pengucapan. 4. Segmentasi yang dilakukan tidak lagi secara manual (auto-correlation ). DAFTAR PUSTAKA Agustini K. 26. Perbandingan Metode Transformasi Wavelet Sebagai Praproses Pada Sistem Identifikasi Pembicara. [Tesis]. Bogor : Sekolah Pasca Sarjana, Institut Pertanian Bogor. Al-Akaidi M. 24. Fractal Speech Processing. Cambridge University Press. Buono A. 29. Representasi Nilai HOS dan Model MFCC Sebagai Ekstraksi Ciri Pada Sistem Identifikasi Pembicara di Lingkungan Ber-Noise Menggunakan HMM. [Disertasi]. Depok: Program Pascasarjana, Universitas Indonesia. Burrus C.S, Gopinath RA, & Gou H. (1998). Introduction to Wavelets and Wavelet Transforms A Primer. International Edition, Prentice-Hall International, Inc. Donadio MB How To Geberate White Gaussian Noise. p/howtos/how-to-generate-white-gaussiannoise [diakses 12 Maret 211]. Donoho DL, et al. 23. Locally Stationary Covariance And Signal Estimation With Macrotiles. [Jurnal]. IEE Transaction On Signal Processing, Vol. 51 No. 3. Ganchev TD. 25. Speaker Recognition. [Disertasi].Yunani : Wire Communications 14

25 Laboratory Department of Computer and Electrical Engineering University of Patras. Gonzalez RC, Woods RE. 22. Digital Image Processing, Second Edition. New Jersey: Prentice Hall. Jurafsky D, Martin JH. 27. Speech And Language Processing: An Introduction To Natural Language Processing, Computational Linguistics, And Speech Recognition. New Jersey : Prentice Hall. McAndrew A. 24. An Introduction to Digital Image Processing with Matlab. School of Computer Science and Mathematics Victoria University of Technology. Pelton GE Voice Processing. New York: McGraw-Hill, Inc. Proakis JG, Manolakis D. 27. Digital Signal Processing : Principles, Algorithms, and Applications. New Jersey : Pearson Prentice Hall. Resmiwati NUE. 29. Pengenalan Kata Berbahasa Indonesia dengan Menggunakan Hidden Markov Models Berbasiskan Fonem. [Skripsi]. Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor. Ruvinna. 28. Pengenalan Kata Berbahasa Indonesia Dengan Hidden Markov Model (Hmm) Menggunakan Algoritme Baum- Welch. [Skripsi]. Bogor : Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor. Smith JO. 21. Spectral Audio Signal Processing. Center for Computer Research in Music and Acoustics (CCRMA) Department of Music, Stanford University, Stanford, California 9435 USA. Suhartono MN. 27. Pengembangan Model Identifikasi Pembicara Dengan Probabilistic Neural Network. [Skripsi]. Bogor : Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor. Zue V, Cole R, & Ward W Survey of the State of the Art in Human Language Technology. vey/ch1node4.ht [diakses 2 Juni 21]. 15

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia

Lebih terperinci

Karakteristik Spesifikasi

Karakteristik Spesifikasi Sinyal yang masuk difilter ke dalam sinyal frekuensi rendah (low-pass filter) dan sinyal frekuensi tinggi (high-pass filter) Lakukan downsampling pada kedua sinyal tersebut Low-pass frekuensi hasil downsampling

Lebih terperinci

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi

Lebih terperinci

PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS

PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER CLARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar. BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre

Lebih terperinci

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR PERNYATAAN

Lebih terperinci

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode

Lebih terperinci

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan

Lebih terperinci

PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI

PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI DAPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER

PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER MUTIA FIJRI TAUFANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

TINJAUAN PUSTAKA. Pengenalan Suara

TINJAUAN PUSTAKA. Pengenalan Suara Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan

Lebih terperinci

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN

Lebih terperinci

vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI

vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI SKRIPSI

Lebih terperinci

HASIL DAN PEMBAHASAN. Generalisasi =

HASIL DAN PEMBAHASAN. Generalisasi = 6 Kelas Target Sidik jari individu 5 0000100000 Sidik jari individu 6 0000010000 Sidik jari individu 7 0000001000 Sidik jari individu 8 0000000100 Sidik jari individu 9 0000000010 Sidik jari individu 10

Lebih terperinci

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar PENDAHULUAN Latar Belakang Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit

Lebih terperinci

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

Frekuensi Dominan Dalam Vokal Bahasa Indonesia Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan

Lebih terperinci

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad

Lebih terperinci

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA 1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat

Lebih terperinci

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan

Lebih terperinci

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

BAB 3 ANALISIS DAN PERANCANGAN SISTEM BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Masalah Indera pendengaran manusia tidak dapat mengetahui secara pasti jenis nada apa yang didengar olehnya, terkecuali para pemusik profesional. Hal

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi

Lebih terperinci

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,

Lebih terperinci

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi. SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik

Lebih terperinci

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Emosi Emosi adalah perasaan intens yang ditujukan kepada seseorang atau sesuatu dan juga merupakan reaksi terhadap seseorang atau kejadian.emosi dapat ditunjukkan ketika merasa

Lebih terperinci

PENERAPAN LEARNING VECTOR QUANTIZATION

PENERAPAN LEARNING VECTOR QUANTIZATION PENERAPAN LEARNING VECTOR QUANTIZATION (LVQ) DAN EKSTRAKSI CIRI MENGGUNAKAN MEL- FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) UNTUK TRANSKRIPSI SUARA KE TEKS LAKSMI NIRMALA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS

Lebih terperinci

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis

Lebih terperinci

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA Oleh : VICKY ZILVAN G64103043 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Agustini, Biometrik Suara Dengan Transformasi Wavelet 49 BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Ketut Agustini (1) Abstract: Biometric as one of identification or recognition

Lebih terperinci

BAB I PENDAHULUAN I.1 Latar Belakang

BAB I PENDAHULUAN I.1 Latar Belakang BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring

Lebih terperinci

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student

Lebih terperinci

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Perkembangan teknologi informasi dapat mempermudah pekerjaan manusia dalam kehidupan sehari-hari. Pekerjaan manusia secara manual dapat digantikan dengan sistem otomatis. Salah

Lebih terperinci

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker

Lebih terperinci

1. BAB I PENDAHULUAN 1.1. Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang 1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari

Lebih terperinci

PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO

PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

Hardisk 80 GB Perangkat lunak Window XP Profesional MATLAB 7.0.1

Hardisk 80 GB Perangkat lunak Window XP Profesional MATLAB 7.0.1 Hardisk 8 GB Perangkat lunak Window XP Profesional MATLAB 7..1 HASIL DAN PEMBAHASAN Percobaan yang dilakukan pada penelitian ini terdiri atas dua macam, yaitu citra yang akan mengalami proses pengenalan

Lebih terperinci

SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari

SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen Satya Wacana, Salatiga,

Lebih terperinci

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION DETECTION OF THE LEVEL OF YOUTH, ADULTS AND ELDERLY BY USING MFCC METHOD AND FUZZY

Lebih terperinci

Jaringan Syaraf Tiruan pada Robot

Jaringan Syaraf Tiruan pada Robot Jaringan Syaraf Tiruan pada Robot Membuat aplikasi pengenalan suara untuk pengendalian robot dengan menggunakan jaringan syaraf tiruan sebagai algoritma pembelajaran dan pemodelan dalam pengenalan suara.

Lebih terperinci

PENDETEKSIAN KATA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN CODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL

PENDETEKSIAN KATA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN CODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL PENDETEKSIAN KATA DENGAN MF SEBAGAI EKSTRAKSI IRI DAN ODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, 121-132 121 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Aplikasi Pengenalan Ucapan Dengan Ekstraksi Ciri Mel- Frequency Cepstrum Coefficients

Lebih terperinci

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV Marianus Hendra Wijaya 1), Linggo Sumarno 2) 1) Program Studi Teknik Elektro Fakultas Sains dan Teknologi Universtas Sanata Dharma Yogyakarta

Lebih terperinci

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk 6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Genre Menurut Kamus Besar Bahasa Indonesia, genre adalah jenis, tipe, atau kelompok sastra atas dasar bentuknya. Jadi genre musik merupakan pengelompokan musik berdasarkan kemiripan

Lebih terperinci

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Ziaul Haq, Teknik Informatika S1,Universitas Dian Nuswantoro Semarang Abstract Pengenalan

Lebih terperinci

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: Perintah Suara Berbahasa Indonesia untuk Membuka dan Menutup Aplikasi dalam Sistem Operasi Windows Menggunakan Metode Mel Frequency Cepstrum Coefficient dan Metode Backpropagation Zakaria Ramadhan 1, Sukmawati

Lebih terperinci

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB 3 PERANCANGAN SISTEM

BAB 3 PERANCANGAN SISTEM 20 BAB 3 PERANCANGAN SISTEM 3.1 Rancangan Perangkat Keras Sistem ini hanya menggunakan beberapa perangkat keras yang umum digunakan, seperti mikrofon, speaker (alat pengeras suara), dan seperangkat komputer

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Isyarat tutur merupakan isyarat yang diproduksi oleh alat ucap manusia hingga menghasilkan informasi, baik berupa makna dari isyarat tutur yang diucapkan maupun yang

Lebih terperinci

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods Pemrosesan Sinyal DigitalUntuk Mengidentifikasi Akord Dasar Penyanyi Dengan Metode Mel Frequency Cepstral Coeficients (MFCC) Dan Jaringan Syaraf Tiruan Backpropagation Digital Signal Processing To Identify

Lebih terperinci

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 IDENTIFIKASI CAMPURAN

Lebih terperinci

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA SKRIPSI PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA MADE GDE JAYA HARRY KHESA S JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA BUKIT JIMBARAN

Lebih terperinci

PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN SKRIPSI NADIA WIDARI NASUTION

PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN SKRIPSI NADIA WIDARI NASUTION PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN SKRIPSI NADIA WIDARI NASUTION 110803016 DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2015 ii

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 21 PERANGKAT LUNAK UNTUK MEMBUKA APLIKASI PADA KOMPUTER DENGAN PERINTAH SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENTS Anna Dara Andriana Program Studi Teknik Informatika Fakultas Teknik

Lebih terperinci

dengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan

dengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan dengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan Gambar 8 Struktur PNN. 1. Lapisan pola (pattern layer) Lapisan pola menggunakan 1 node untuk setiap data pelatihan yang digunakan.

Lebih terperinci

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY Erni Seniwati 1), Ninik Tri Hartanti 2) 1 Sistem Informasi, STMIK Amikom erni.s@amikom.ac.id 2 Sistem Informasi, STMIK Amikom

Lebih terperinci

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Oleh: Ahmad Irfan Abdul Rahman Tri Budi Santoso Titon Dutono Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi

Lebih terperinci

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan

Lebih terperinci

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION TUGAS AKHIR Diajukan Untuk Memenuhi Sebagian Persyaratan Dalam Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun oleh : PAULA

Lebih terperinci

Sistem Pengenal Tutur Bahasa Indonesia Berbasis Suku Kata Menggunakan MFCC, Wavelet Dan HMM

Sistem Pengenal Tutur Bahasa Indonesia Berbasis Suku Kata Menggunakan MFCC, Wavelet Dan HMM ISSN: 2085-6350 Yogyakarta, 15 September 2015 CITEE 2015 Sistem Pengenal Tutur Bahasa Indonesia Berbasis Suku Kata Menggunakan MFCC, Wavelet Dan HMM Syahroni Hidayat 1, Risanuri Hidayat 2, Teguh Bharata

Lebih terperinci

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

IDENTIFIKASI BUNYI DALAM PEMBELAJARAN NADA DASAR PERMAINAN SULING BATAK MENGGUNAKAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT SKRIPSI

IDENTIFIKASI BUNYI DALAM PEMBELAJARAN NADA DASAR PERMAINAN SULING BATAK MENGGUNAKAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT SKRIPSI IDENTIFIKASI BUNYI DALAM PEMBELAJARAN NADA DASAR PERMAINAN SULING BATAK MENGGUNAKAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT SKRIPSI MUHAMMAD WARDANA 121402024 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS

Lebih terperinci

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification Jurnal Telematika, vol. 11 no. 1, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker

Lebih terperinci

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Vicky Zilvan, S.Kom. UPT LPSN - LIPI v_q1e@yahoo.com Furqon Hensan Muttaqien, S.Komp. P2 Informatika - LIPI fh.muttaqien@informatika.lipi.go.id

Lebih terperinci

PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA

PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian

BAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian BAB III METODE PENELITIAN 3.1 Model Penelitian Penelitian yang dilakukan dapat dijelaskan melalui blok diagram seperti yang terlihat pada Gambar 3.1. Suara Burung Burung Kacer Burung Kenari Pengambil an

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul

BAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul 37 BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil 4.1.1 Pengambilan Database Awalnya gitar terlebih dahulu ditala menggunakan efek gitar ZOOM 505II, setelah ditala suara gitar dimasukan kedalam komputer melalui

Lebih terperinci

PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA. Oleh : WINI PURNAMASARI G

PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA. Oleh : WINI PURNAMASARI G PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA Oleh : WINI PURNAMASARI G64102051 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006

Lebih terperinci

PENGENALAN SUARA MENGGUNAKAN POHON KEPUTUSAN RELASI ACAK. Disusun Oleh:

PENGENALAN SUARA MENGGUNAKAN POHON KEPUTUSAN RELASI ACAK. Disusun Oleh: PENGENALAN SUARA MENGGUNAKAN POHON KEPUTUSAN RELASI ACAK Disusun Oleh: Nama : Simon Petro Sianiapar Nrp : 0422098 Jurusan Teknik Elektro, Fakultas Teknik, Universitas Kristen Maranatha, Jl. Prof.Drg.Suria

Lebih terperinci

APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM)

APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM) APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM) Eko Widiyanto, Sukmawati Nur Endah, Satriyo Adhy, Sutikno Jurusan Ilmu Komputer/Informatika,

Lebih terperinci

DAFTAR ISI. Halaman LEMBAR PENGESAHAN SURAT PERNYATAAN ABSTRAK... i ABSTRACT... ii KATA PENGANTAR...iii DAFTAR ISI... v DAFTAR GAMBAR...

DAFTAR ISI. Halaman LEMBAR PENGESAHAN SURAT PERNYATAAN ABSTRAK... i ABSTRACT... ii KATA PENGANTAR...iii DAFTAR ISI... v DAFTAR GAMBAR... ABSTRAK Noise merupakan salah satu kendala yang mempengaruhi kualitas sinyal suara yang ditransmisikan. Noise tersebut dapat berasal dari peralatan komunikasi itu sendiri atau pengaruh dari sumber luar.

Lebih terperinci

100% Akurasi = (11) Lingkungan Pengembangan

100% Akurasi = (11) Lingkungan Pengembangan Algoritme Dekomposisi Wavelet Dekomposisi wavelet Haar dapat dijelaskan sebagai berikut : 1 Transformasi linear digunakan untuk mengubah ruang warna secara linear menjadi warna dasar. Karena citra yang

Lebih terperinci

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength JURNAL FISIKA DAN APLIKASINYA VOLUME 12, NOMOR 1 JANUARI 2016 Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength Dody Kurniawan, Ahmad Syakir, Hana Afifah,

Lebih terperinci

Karakterisasi Suara Vokal dan Aplikasinya Dalam Speaker Recognition

Karakterisasi Suara Vokal dan Aplikasinya Dalam Speaker Recognition Karakterisasi Suara Vokal dan Aplikasinya Dalam Speaker Recognition Siwi Setyabudi, Agus Purwanto dan Warsono Laboratorium Getaran dan Gelombang, Jurdik Fisika, FMIPA, UNY ABSTRAK Penelitian ini bertujuan

Lebih terperinci

Jony Sitepu/ ABSTRAK

Jony Sitepu/ ABSTRAK PERBANDINGAN ESTIMASI SELUBUNG SPEKTRAL DARI BUNYI VOICED MENGGUNAKAN METODE AUTO-REGRESSIVE (AR) DENGAN OPTIMIZATION OF THE LIKELIHOOD CRITERION (OLC) Jony Sitepu/0422166 Jurusan Teknik Elektro, Fakultas

Lebih terperinci

dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. akurasi =.

dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. akurasi =. dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. Gambar 5 Macam-macam bentuk partisi citra. Ekstraksi Fitur Pada tahap ini semua partisi dari citra dihitung

Lebih terperinci

BAB II DASAR TEORI Suara. Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan

BAB II DASAR TEORI Suara. Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan BAB II DASAR TEORI 2. 1 Suara Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitude tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun benda

Lebih terperinci

Identifikasi Speech Recognition Manusia dengan Menggunakan Average Energy dan Silent Ratio Sebagai Feature Extraction Suara pada Komputer

Identifikasi Speech Recognition Manusia dengan Menggunakan Average Energy dan Silent Ratio Sebagai Feature Extraction Suara pada Komputer Identifikasi Speech Recognition Manusia dengan Menggunakan Average Energy dan Silent Ratio Sebagai Feature Extraction Suara pada Komputer Identification Human speech recognition using Average energy and

Lebih terperinci

Identifikasi Suara Vokal Suku Banjar Berdasarkan Frekuensi Formant

Identifikasi Suara Vokal Suku Banjar Berdasarkan Frekuensi Formant Identifikasi Suara Vokal Suku Banjar Berdasarkan Frekuensi Formant Arfan Eko Fahrudin 1), Nofida Risna Diyanti 2) dan Tetti Novalina Manik 1) Abstrak: Telah dibuat program untuk mengidentifikasi suara

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada masa sekarang, Digital Signal Processing (DSP) atau pemrosesan sinyal digital sudah banyak diterapkan di berbagai bidang karena data dalam bentuk digital

Lebih terperinci

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 SPEAKER IDENTIFICATION DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF

Lebih terperinci

Bab 3. Perancangan Sistem

Bab 3. Perancangan Sistem 34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium,

Lebih terperinci

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik

Lebih terperinci

MODUL II : SPEECH AND AUDIO PROCESSING

MODUL II : SPEECH AND AUDIO PROCESSING MODUL II : SPEECH AND AUDIO PROCESSING TUJUAN 1. Memahami karakteristik sinyal suara dan audio 2. Mampu melakukan pengolahan terhadap sinyal suara dan audio 3. Mampu menggunakan tool untuk pengolahan sinyal

Lebih terperinci

PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI

PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI SKRIPSI I GEDE ARYA MAHARTA NIM. 1108605025 JURUSAN ILMU

Lebih terperinci

PENGENALAN CITRA WAJAH DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF TIRUAN BACK-PROPAGATION

PENGENALAN CITRA WAJAH DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF TIRUAN BACK-PROPAGATION PENGENALAN CITRA WAJAH DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF TIRUAN BACK-PROPAGATION Suhendry Effendy Jurusan Teknik Informatika, Fakultas Ilmu Komputer, Bina Nusantara University

Lebih terperinci

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Suara adalah suatu alat komunikasi paling utama yang dimiliki oleh manusia. Dengan suara, manusia dapat berkomunikasi dengan manusia lainnya. Melalui suara,

Lebih terperinci

Hubungan 1/1 filter oktaf. =Frekuesi aliran rendah (s/d -3dB), Hz =Frekuesi aliran tinggi (s/d -3dB), Hz

Hubungan 1/1 filter oktaf. =Frekuesi aliran rendah (s/d -3dB), Hz =Frekuesi aliran tinggi (s/d -3dB), Hz Hubungan 1/1 filter oktaf f 1 f 2 f 1 = 2 1/2f c f 1 = 2 1/2f c f 1 = 2f c1 = frekuensi tengah penyaring =Frekuesi aliran rendah (s/d -3dB), Hz =Frekuesi aliran tinggi (s/d -3dB), Hz Analisis oktaf sepertiga,

Lebih terperinci