PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS

Ukuran: px
Mulai penontonan dengan halaman:

Download "PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS"

Transkripsi

1 PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER CLARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

2 PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER CLARA Skripsi Sebagai salah suatu syarat untuk memperoleh gelar Sarjana Komputer pada Program Studi Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

3 ABSTRACT CLARA. Application of Mel Frequency Cepstrum Coefficients (MFCC) as Feature Extraction on Phoneme Recognition with Probabilistic Neural Network (PNN) as Classifier. Supervised by AGUS BUONO. Voice recognition (speech recognition) is one field of study in voice processing. This technology can convert voice signals into a form of written information (text). With this technology, people can interact with a computer. MFCC feature extraction computes the cepstral coefficients by considering the human hearing. This research is a phoneme recognition using feature extraction MFCC and PNN as feature matching model. This study compares the coefficient, overlap, and the test data without noise and with noise. MFCC is used with 13, 20, 26 coefficients and 0%, 25%, 50% overlap. Noise is added by 30 db, 20 db and 10 db. From the comparison of the three overlaps, produced the best accuracy at 50% overlap with an accuracy of 94,71%. From comparing the three coefficients, better accuracy resulting in coefficients of 20 and 26 with an accuracy of 97,12% at 50% overlap. After comparing between the coefficients of 20 and 26 with overlap of 25% then the coefficient 26 is obtained that better accuracy of 94,23%. This shows that in this study the coefficient 26 is the best. In this research, there are three noise variables. The variables are 10 db, 20 db, and 30 db. The best accuracy reached when the noise variable is 30 db rather than 10 db or 20 db because the accuracy has the closest accuracy compared by the accuracy when noise was not added into the data. When the noise variable is 30 db, the percentage of accuracy is 85,3%. Keywords: phoneme recognition, MFCC, PNN.

4 Judul Skripsi Nama NIM : Penerapan Mel Frequency Cepstrum Coefficients (MFCC) Sebagai Ekstraksi Ciri pada Pengenalan Fonem dengan Probabilistic Neural Network (PNN) Sebagai Classifier : Clara : G Menyetujui: Pembimbing Dr. Ir. Agus Buono, M.Si, M.Kom NIP Mengetahui: Ketua Departemen Dr. Ir. Sri Nurdiati, M.Sc NIP Tanggal Lulus:

5 RIWAYAT HIDUP Penulis dilahirkan pada tanggal 10 Mei 1987 di Jakarta. Penulis merupakan anak kedua dari tiga bersaudara. Tahun 2005 penulis lulus dari SMAN 9 Bekasi, pada tahun yang sama penulis lulus seleksi masuk IPB melalui jalur Undangan Seleksi Masuk IPB. Tahun 2008 penulis lulus dari program Diploma Manajemen Informatika Institut Pertanian Bogor, pada tahun yang sama penulis melanjutkan program studi Sarjana di Departemen Ilmu Komputer, Institut Pertanian Bogor, dengan memilih program studi Ilmu Komputer.

6 PRAKATA Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunia-nya sehingga karya ilmiah ini berhasil diselesaikan. Terima kasih penulis ucapkan kepada Bapak Dr. Ir. Agus Buono, M.Si, M.Kom selaku pembimbing. Adapun penulis mengucapkan terima kasih kepada: 1. Kedua orang tua, kakak, dan adik yang telah memberikan dukungan spiritual dan material, sehingga penulis dapat menyelesaikan studi di departemen Ilmu Komputer IPB. 2. Dosen penguji, Bapak Aziz Kustiyo, S.Si, M.Kom dan Bapak Mushthofa, S.Kom, M.Sc atas saran dan bimbingannya. 3. Teman-teman satu bimbingan atas bantuan sample suara dan kerjasamanya. 4. Teman-teman Ekstensi ILKOM angkatan 3, atas kerjasamanya selama penelitian. Semoga penelitian ini bermanfaat bagi kemajuan teknologi, khususnya di bidang ilmu komputer. Bogor, Maret 2011 Clara

7 DAFTAR ISI Halaman DAFTAR TABEL... v DAFTAR GAMBAR... v DAFTAR LAMPIRAN... v PENDAHULUAN Latar Belakang... 1 Tujuan Penelitian... 1 Ruang Lingkup Penelitian... 1 Manfaat Penelitian... 1 TINJAUAN PUSTAKA Pemrosesan Sinyal Suara... 1 Digitalisasi Gelombang Suara... 2 Ekstraksi Ciri Mel-Frequency Cepstrum Coefficients (MFCC)... 2 Pengenalan Pola Probabilistic Neural Network (PNN)... 3 Fonem... 4 METODE PENELITIAN Kerangka Pemikiran... 4 Data Suara... 4 Penghapusan Silence... 4 Normalisasi... 5 Segmentasi Sinyal... 5 Data Latih dan Data Uji... 5 Ekstraksi Ciri (MFCC)... 6 Perata-rataan Hasil MFCC... 6 Pemodelan PNN... 6 Pengujian Model PNN... 6 Perhitungan Nilai Akurasi... 6 Lingkungan Pengembangan... 6 HASIL DAN PEMBAHASAN Perbandingan Overlap 0%, 25%, dan 50%... 7 Perbandingan Koefisien 13, 20, dan Hasil Akurasi Pengenalan Fonem... 7 Hasil Pengujian dengan Noise... 7 Perbandingan Koefisien, Overlap, dan Data Uji... 8 KESIMPULAN DAN SARAN Kesimpulan... 8 Saran... 9 DAFTAR PUSTAKA... 9 LAMPIRAN iv

8 DAFTAR TABEL Halaman 1 Kata dalam penelitian Jumlah data tiap fonem Jumlah data latih dan data uji DAFTAR GAMBAR Halaman 1 Sinyal analog Sinyal diskret Tahapan transformasi sinyal suara menjadi informasi (Buono 2009) Diagram Alur MFCC (Buono 2009) Bagan Model PNN (Ganchev 2005) Diagram Alur Penelitian Perbandingan akurasi sistem pada overlap 0%, 25%, dan 50% Perbandingan akurasi sistem pada koefisien 13, 20, dan Perbandingan data uji tanpa noise dan dengan noise Sinyal suara asli dan sinyal suara dengan noise 10 db Perbandingan koefisien, overlap, dan jenis data uji DAFTAR LAMPIRAN Halaman 1 Grafik perbandingan tingkat akurasi per fonem pada overlap 0%, 25%, dan 50% Grafik Perbandingan tingkat akurasi per fonem pada koefisien 13, 20, dan Perbandingan koefisien, overlap, dan jenis data uji v

9 Latar Belakang PENDAHULUAN Perkembangan teknologi menuntut manusia untuk mengembangkan teknologi yang dapat melakukan berbagai keperluan dengan mudah. Pengenalan suara (speech recognition) merupakan salah satu teknologi yang saat ini sedang dikembangkan. Pengenalan suara (speech recognition) adalah salah satu bidang kajian dalam pemrosesan suara. Teknologi ini dapat mengubah sinyal suara menjadi sebuah informasi berupa tulisan (teks). Dengan teknologi ini, manusia dapat berinteraksi dengan komputer. Pengenalan suara hanya membutuhkan alat tambahan berupa mikrofon dan kartu suara sedangkan pengenalan lain misalnya sidik jari atau wajah membutuhkan alat tambahan seperti scanner. Hal ini sedikit banyak menekan biaya pengembangan sistem. Beberapa ekstraksi ciri untuk pengenalan suara antara lain Linear Predictive Coding, Perceptual Linear Prediction, Mel-Frequency Cepstrum Coefficients (MFCC), dan Wavelet. Tujuan ekstraksi ciri adalah mengubah vektor suara yang dihasilkan dari digitalisasi yang memiliki vektor yang besar menjadi vektor ciri, tanpa menghilangkan karakteristik suara tersebut. Beberapa model pengenalan pola yang dapat digunakan untuk pengenalan suara antara lain Jarak Euclid, Distribusi Normal, dan Probabilistic Neural Network (PNN). Pada penelitian ini dilakukan pengenalan fonem menggunakan ekstraksi ciri MFCC dan PNN sebagai pengenalan pola. Hal ini dikarenakan PNN telah terbukti memiliki akurasi yang tinggi pada penelitian yang telah dilakukan oleh Fransiswa (2010). Berbasis fonem dalam pengenalan kata sangat diperlukan agar bersifat large vocabulary. Jika sebuah kata ingin dikenali dengan baik maka diperlukan penelitian pengenalan fonem. Tujuan Penelitian Penelitian ini bertujuan menerapkan Mel- Frequency Cepstrum Coefficients (MFCC) sebagai ekstraksi ciri pada pengenalan fonem dengan Probabilistic Neural Network (PNN) sebagai classifier. Ruang Lingkup Penelitian Ruang lingkup penelitian ini adalah : 1. Menggunakan sebelas kata yaitu coba, fana, gajah, jaya, malu, pacu, quran, tip-x, visa, weda, dan zakat yang merepresentasikan fonem /a/ sampai /z/. 2. Setiap kata diucapkan sebanyak 16 kali. 3. Semua kata diucapkan oleh satu orang. 4. Pengaturan ekstraksi ciri MFCC dengan nilai sampling rate Hz direkam selama 1 detik, time frame 30 ms, overlap 0%, 25%, dan 50%, koefisien 13, 20, dan 26. Manfaat Penelitian Penelitian ini diharapkan memberikan informasi tingkat akurasi pengenalan fonem tunggal menggunakan Probabilistic Neural Network (PNN). Selain itu diharapkan model yang dihasilkan dalam penelitian ini dapat dikembangkan untuk pengenalan kata berbasis fonem yang bersifat large vocabulary. TINJAUAN PUSTAKA Pemrosesan Sinyal Suara Sinyal suara merupakan gelombang longitudinal yang merambat melalui media (zat perantara). Batas frekuensi bunyi yang dapat didengar oleh manusia berkisar antara frekuensi 20 Hz sampai dengan 20 KHz, dan frekuensi yang dapat didengar dengan baik dan jelas oleh telinga manusia yaitu di atas Hz (Pelton 1993). Berdasarkan pada peubah bebas waktu (t) sinyal dibedakan menjadi dua jenis yaitu: a. Sinyal Analog Sinyal analog adalah suatu besaran yang berubah dalam waktu atau dalam ruang dan yang memiliki semua nilai untuk setiap nilai waktu (atau setiap nilai ruang). Sinyal analog sering disebut sinyal kontinu untuk menggambarkan bahwa besaran itu memiliki nilai yang kontinu (tak terputus). Sinyal analog dapat dilihat pada Gambar 1. Gambar 1 Sinyal analog. b. Sinyal Diskret Sinyal Diskret merupakan suatu besaran yang berubah dalam waktu atau dalam ruang dan yang memiliki nilai pada suatu titik-titik waktu tertentu. Jarak setiap titik waktu bisa saja berbeda-beda namun untuk kemudahan 1

10 penurunan sifat matematikanya biasanya jarak antar titik waktu adalah sama. Sinyal diskret dapat dilihat pada Gambar 2. Gambar 2 Sinyal diskret. Pemrosesan sinyal suara merupakan teknik mentransformasi sinyal suara menjadi informasi yang berarti sesuai dengan yang diinginkan (Buono 2009). Pada proses transformasi terdapat tahapan yang perlu dilakukan di antaranya digitalisasi sinyal analog, ekstraksi ciri, dan pengenalan pola, seperti yang diilustrasikan pada Gambar 3. Gambar 3 Tahapan transformasi sinyal suara menjadi informasi (Buono 2009). Digitalisasi Gelombang Suara Gelombang suara yang ditangkap berupa sinyal analog. Sinyal analog harus diubah menjadi sinyal digital yang disebut proses digitalisasi. Proses digitalisasi suara terdiri atas dua tahap yaitu sampling dan kuantisasi (Jurafsky & Martin 2000). Sampling adalah pengambilan nilai-nilai dalam jangka waktu tertentu. Sampling rate yang biasanya digunakan pada pengenalan suara ialah 8000 Hz sampai dengan Hz (Jurafsky & Martin 2000). Hubungan panjang vektor yang dihasilkan, sampling rate dan panjang data suara yang digitalisasi dinyatakan dengan persamaan 1. Keterangan: S = F s x T (1) S = panjang vektor F s = sampling rate yang digunakan (Hertz) T = panjang suara (detik) Setelah tahap sampling maka proses selanjutnya adalah proses kuantisasi. Proses ini menyimpan nilai amplitudo ini ke dalam representasi nilai 8 bit atau 16 bit (Jurafsky & Martin 2000). Ekstraksi Ciri Mel-Frequency Cepstrum Coefficients (MFCC) Ekstraksi ciri merupakan proses untuk menentukan vektor yang dapat digunakan sebagai penciri objek atau individu. Ciri yang biasa digunakan adalah koefisien cepstral. MFCC merupakan ekstraksi ciri yang menghitung koefisien cepstral dengan mempertimbangkan pendengaran manusia. MFCC memiliki tahapan yang terdiri atas (Do 1994): 1. Frame Blocking. Tahap ini sinyal suara continous speech dibagi ke dalam beberapa frame serta dilakukan overlapping frame agar tidak kehilangan informasi. 2. Windowing. Windowing merupakan salah satu jenis filtering untuk meminimalisasikan distorsi antar frame. Proses ini dilakukan dengan mengalikan antar frame dengan jenis window yang digunakan. Penelitian suara banyak menggunakan window hamming karena kesederhanaan formulanya dan nilai kerja window. Dengan pertimbangan tersebut, maka penggunaan window Hamming cukup beralasan. Persamaan window Hamming adalah : w(n)= cos(2 n/n-1) (2) Keterangan: n = 0,.., N-1 3. Fast Fourier Transform (FFT). Tahapan selanjutnya ialah mengubah tiap frame dari domain waktu ke dalam domain frekuensi. FFT adalah algoritme yang mengimplementasikan Discrete Fouries Transform (DFT). Hasil DFT ialah bilangan kompleks dengan Persamaan 3 untuk mencari nilai real dan Persamaan 4 untuk mencari nilai imaginer. (3) (4) 2

11 Keterangan: N = jumlah data k = 0, 1, 2,..., N/2 x[i] = data pada titik ke i Proses selanjutnya ialah menghitung nilai magnitudo FFT. Magnitudo dari bilangan kompleks adalah Input Suara yg telah melalui praproses frame1 frame 3 frame 5 frame 7 frame 2 frame frame 6 Framming. 4. Mel-Frequency Wrapping. Persepsi sistem pendengaran manusia terhadap frekuensi sinyal suara ternyata tidak hanya bersifat linear. Penerimaan sinyal suara untuk frekuensi rendah (<1000) bersifat linear, sedangkan untuk frekuensi tinggi (>1000) bersifat logaritmik. Skala inilah yang disebut dengan skala mel-frequency yang berupa filter. Pada Persamaan 5 ditunjukkan hubungan skala mel dengan frekuensi dalam Hz: WINDOWING Y(t) = X(t) * W(n), 0<n<N-1 W(n)= cos (2 n/(n-1)) Fast Fourier Transforn (FFT): Mel Frequency Wrapping: mel (f)=2595 log(1+ f/700) Spektrum Mel : H(k) adalah nilai filter segitiga ke-i (5) Proses wrapping terhadap sinyal dalam domain frekuensi dilakukan menggunakan persamaan 6. (6) Keterangan: Xi = nilai frequency wrapping pada filter i=1,2 sampai n jumlah filter. X(k) = nilai magnitudo frekuensi pada k frekuensi. Hi(k) = nilai tinggi pada filter i segitiga dan k frekuensi, dengan k=0, 1 sampai N-1 jumlah magnitudo frekuensi. 5. Cepstrum. Tahap ini merupakan tahap terakhir pada MFCC. Pada tahap ini melfrequency akan diubah menjadi domain waktu menggunakan Discrete Cosine Transform (DCT) dengan persamaan 7. (7) Keterangan : Cj = nilai koefisien C ke j. j = 1, 2, sampai jumlah koefisien yang diharapkan Xi = nilai X hasil mel-frequency wrapping pada frekuensi i= 1, 2 sampai n jumlah wrapping M = jumlah filter Diagram alur dari MFCC dapat dilihat pada Gambar 4. Cepstrum Coefficients : Discrete Cosine Transform j=1,2,3,...j ; J=jumlah koefisien ; M=jumlah filter Gambar 4 Diagram Alur MFCC (Buono 2009). Pengenalan Pola Network (PNN) Probabilistic Neural Donald F. Specht membuat tulisan yang berjudul Probabilistic Neural Network pada tahun 1990 sebagai penyempurnaan idenya pada tahun 1966 (Fausett 1994). Probabilistic Nural Network menggunakan data pelatihan (supervised learning) untuk mengklasifikasi. PNN dirancang menggunakan ide dari teori probabilitas klasik yaitu pengklasifikasi Bayesian dan estimator pengklasifikasi Parzen untuk Probability Density function. Dengan menggunakan pengklasifikasi Bayesian dapat ditentukan bagaimana sebuah data masukan diklasifikasi sebagai anggota suatu kelas dari beberapa kelas yang ada, yaitu yang mempunyai nilai maksimum pada kelas tersebut. PNN memiliki struktur yang terdiri atas empat layer yaitu: 1. Input layer. Layer ini untuk input data pada PNN 2. Pattern layer. Layer ini untuk menghitung jarak antara nilai input data suara dengan nilai pola dari tiap anggota kelas. Nilai hasil 3

12 pattern layer dapat ditunjukkan pada persamaan 8. (8) Keterangan: -0.5 z² k(z) = e d = banyaknya data pada satu pattern layer x j = input data uji ke-j x ij = pattern ke-i data ke-j h j = smoothing parameter ( x simpangan baku ke-j x ) i = 1, 2 sampai n j = 1, 2 sampai d n = banyaknya pattern pada satu kelas 3. Summation Layer. Layer ini menghasilkan peluang untuk satu kelas. Peluang tersebut didapat dari penjumlahan pattern layer pada kelas tersebut dan hasilnya dibagi dengan (2 ) d/2 h i h 2...h d n. Nilai h i h 2...h d adalah nilai smoothing dari kelas tersebut. Persamaan untuk menghitung peluang tersebut adalah : (9) 4. Decision Layer. Layer ini membandingkan hasil peluang pada setiap kelas. Selanjutnya, input data dimasukkan dalam kelas yang memiliki nilai peluang terbesar. x1 x2 xt input layer f1,1 f1,m1 f2,1 f2,m2 fk,1 fk,mk pattern layer.. Gambar 5 Bagan Model PNN (Ganchev 2005). p1 kelas 1 p2 kelas 2 pk kelas K summation layer D decision layer D(x) Fonem Fonem merupakan satuan bunyi terkecil yang mampu menunjukkan kontras makna (Depdikbud 2003). Fonem dibagi menjadi dua yaitu: 1. Fonem vokal merupakan bunyi ujaran akibat adanya udara yang keluar dari paru-paru tidak terkena hambatan atau halangan. Jumlah fonem vokal ada lima yaitu a, i, u, e, dan o. 2. Fonem konsonan merupakan bunyi ujaran akibat adanya udara yang keluar dari paruparu mendapatkan hambatan atau halangan. Jumlah fonem konsonan ada 21 buah yaitu b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, w, x, y, dan z. METODE PENELITIAN Kerangka Pemikiran Penelitian ini dilakukan dengan mengambil data suara dari satu orang dengan mengucapkan satu kata sebanyak 16 kali. Bagian silence pada data suara akan dihapus. Proses selanjutnya yaitu normalisasi dan segmentasi. Data dibagi menjadi dua yaitu data latih dan data uji. Kemudian data akan diolah dengan proses MFCC. Hasil MFCC dirata-ratakan pada setiap data suara. Data Suara Penelitian ini akan menggunakan data yang telah didigitalisasi dan direkam dari satu orang pembicara yang mengucapkan satu kata sebanyak 16 kali. Setiap suara direkam dengan rentang waktu satu detik dengan sampling rate Hz. Kata yang digunakan dalam penelitian ini dapat dilihat pada Tabel 1. Tabel 1 Kata dalam penelitian. Kata Fonem Kata Fonem coba /a/,/b/,/c/,/o/ quran /a/,/n/,/q/,/r/,/u/ fana /a/,/f/,/n/ tip-x /i/,/p/,/t/,/x/ gajah /a/,/g/,/h/,/j/ visa /a/,/i/,/s/,/v/ jaya /a/,/j/,/y/ weda /a/,/d/,/e/,/w/ malu /a/,/l/,/m/,/u/ zakat /a/,/k/,/t/,/z/ pacu /a/,/c/,/p/,/u/ Penghapusan Silence Tahap ini sinyal yang memiliki bagian yang silence akan dihapus baik di depan atau di belakang menggunakan Audacity pada data latih dan data uji. 4

13 Normalisasi Normalisasi dilakukan dengan mengabsolutkan nilai-nilai data suara dan mencari nilai maksimumnya. Selanjutnya, setiap nilai data tersebut dibagi dengan nilai maksimumnya. Hal ini dilakukan agar menormalkan suara sehingga memiliki amplitudo maksimum satu dan minimum minus satu. Untuk lebih jelas metode penelitian ini dapat dilihat pada Gambar 6. Data latih Ekstraksi ciri (MFCC) Perata-rataan hasil MFCC Model PNN mulai Data suara Penghapusan silence Normalisasi Segmentasi Pengujian Model PNN Analisis akurasi Selesai Data uji Ekstraksi ciri (MFCC) Perata-rataan hasil MFCC Gambar 6 Diagram Alur Penelitian. Segmentasi Sinyal Tahap segmentasi sinyal merupakan tahap dimana setiap fonem dari kata-kata yang ada akan dipisahkan secara manual menggunakan Audacity. Hasil dari banyaknya segmentasi dari kata yang digunakan sebagaimana dijelaskan pada Tabel 1 maka jumlah data dari tiap fonem dijelaskan dalam Tabel 2. Tabel 2 Jumlah data tiap fonem. Fonem Jumlah Fonem Jumlah a 224 n 32 b 16 o 16 c 32 p 32 d 16 q 16 e 16 r 16 f 16 s 16 g 16 t 32 h 16 u 48 i 32 v 16 j 32 w 16 k 16 x 16 l 16 y 16 m 16 z 16 Data Latih dan Data Uji Data dibagi menjadi data latih dan data uji. Proporsi data latih dan data uji yaitu 75%:25%. Data uji yang digunakan yaitu tanpa noise dan data uji yang ditambah noise 30 db, 20 db, dan 10 db. Noise yang ditambahkan pada sinyal perekaman suara dalam penelitian ini menggunakan Gaussian white noise dengan maksud untuk mengetahui sinyal mana yang memberikan generalisasi yang lebih baik pada testing identifikasi yang dibuat terhadap sinyal yang tanpa ditambahkan noise. Lebih detail banyaknya data latih dan data uji untuk masingmasing fonem dapat dilihat pada Tabel 3. Tabel 3 Jumlah data latih dan data uji. Fonem Data latih Data uji Fonem Data latih Data uji a n 24 8 b 12 4 o 12 4 c 24 8 p 24 8 d 12 4 q 12 4 e 12 4 r 12 4 f 12 4 s 12 4 g 12 4 t 24 8 h 12 4 u i 24 8 v 12 4 j 24 8 w 12 4 k 12 4 x 12 4 l 12 4 y 12 4 m 12 4 z

14 Ekstraksi Ciri (MFCC) Tahap ekstraksi ciri merupakan tahap untuk menentukan vektor penciri dan biasanya menggunakan koefisien cepstral. Proses yang dilakukan pada tahap ini adalah Framing, windowing, Fast Fourier Transform, Mel- Frequency Wrapping, dan Cepstrum. Proses MFCC dilakukan dengan menggunakan toolbox yang tersedia yaitu Auditory Toolbox yang dikembangkan oleh Slaney (1998) dimana membutuhkan lima parameter yaitu : 1. Input yaitu suara yang merupakan masukan dari setiap pembicara. 2. Sampling rate yaitu banyaknya nilai yang diambil dari setiap detik. Penelitian ini menggunakan sampling rate sebesar Hz. 3. Time frame yaitu waktu yang digunakan untuk satu frame (dalam milidetik). Time frame yang digunakan adalah 30 ms. 4. Lap yaitu overlaping yang diinginkan (harus kurang dari 100%). Lap yang digunakan pada penelitian ini adalah 0%, 25%, dan 50%. 5. Cepstral coefficient yaitu jumlah cepstrum yang diinginkan sebagai output. Cepstral coefficient yang digunakan sebanyak 13, 20, dan 26. Setiap data suara dilakukan proses framing dimana masing-masing frame berukuran 30 ms dengan overlap 0%, 25%, dan 50% tanpa noise. Penelitian ini menggunakan 13, 20, dan 26 koefisien mel cepstrum untuk masing-masing frame. Hasil matriks ini yang merupakan masukan untuk Probabilistic Neural Network (PNN). Perata-rataan Hasil MFCC MFCC memiliki hasil berupa matriks ciri n k, n adalah koefisien dan k adalah jumlah frame. Agar ukuran matriks sama untuk setiap suara yaitu berbentuk n 1 untuk setiap suara, maka dilakukan proses perata-rataan koefisien pada setiap baris. Pemodelan PNN Data uji digunakan sebagai input data. Input data tersebut diidentifikasikan dengan pattern layer pada Persamaan 8. Parameter h pada Persamaan 8 digunakan nilai 1,14 (simpangan baku) n -1/5. Nilai ialah nilai hasil pattern layer ke i, dimana i=1, 2 sampai banyaknya observasi pada satu kelas. Setelah memperoleh selisih jarak antara nilai data input dengan data pada pattern layer, maka nilai tersebut dibagi dengan nilai smoothing parameter. Nilai smoothing didapat dari simpangan baku data setiap pattern ke j=1, 2 sampai jumlah koefisien yang digunakan. Pengujian Model PNN Setiap data uji (matriks n 1) dimasukkan ke dalam setiap kelas pada model PNN. Perhitungan pada pengujian setiap kelas menggunakan Persamaan 9, sehingga nilai peluang p(x) diperoleh dari setiap kelas pada pengujian model PNN. Nilai p(x) terbesar pada satu kelas merupakan pemenang, sehingga input data dikenali sebagai kelas tersebut. Perhitungan Nilai Akurasi Perhitungan dilakukan dengan membandingkan banyaknya hasil kata yang benar dengan kata yang diuji. Persentase tingkat akurasi dihitung dengan fungsi berikut: Hasil = (10) Lingkungan Pengembangan Sistem ini diimplementasikan dengan MATLAB 7.0 yang dijalankan pada sistem operasi Windows 7, sedangkan perangkat keras yang digunakan adalah Intel Atom M 1.66 GHz, 1 GB RAM.s. HASIL DAN PEMBAHASAN Kata yang digunakan sebanyak sebelas yang masing-masing direkam sebanyak 16 kali. Data tersebut masih berupa data suara kotor karena masih terdapat silent, sehingga perlu dibersihkan dengan menghilangkan silent setelah itu dilakukan normalisasi. Proses segmentasi dilakukan secara manual sehingga membutuhkan waktu yang cukup lama. Segmentasi secara manual menghasilkan data suara berjumlah 752 yang meliputi 26 fonem. Data fonem yang dihasilkan dari segmentasi kemudian ditetapkan 75% sebagai data latih dan 25% sebagai data uji sehingga penelitian ini menggunakan data sebanyak 564 untuk data latih dan 188 untuk data uji. Kemudian data diekstraksi menggunakan MFCC yang dimplementasi menggunakan fungsi yang sudah tersedia yang dikembangkan oleh Slaney pada tahun Seperti yang telah dijelaskan sebelumnya, frame yang digunakan sebesar 30 ms, dimana terjadi overlap antar frame sebesar 0%, 25%, dan 50%, serta cepstral coefficient yang digunakan sebesar 13, 20, dan 26 untuk setiap frame. Data pelatihan yang telah diolah dan dilakukan praproses digunakan untuk membangun model pengenalan kata dengan 6

15 PNN. Model PNN ini yang selanjutnya diuji dengan data pengujian yang telah diolah. Perbandingan Overlap 0%, 25%, dan 50% Kehilangan informasi dapat dihindari dengan melakukan overlapping frame yang satu dengan frame tetangganya. Perbandingan tingkat keakurasian model pengenalan fonem dapat dilihat pada overlap yang berbeda, baik pada overlap 0%, 25%, maupun 50%. 100% 80% 60% 40% 20% 0% Rata-rata maksimum minimum 100% 100% 100% 91.83% 94.71% 87.5% 75% 62.5% 50% overlap 0% overlap 25% overlap 50% Gambar 7 Perbandingan akurasi sistem pada overlap 0%, 25%, dan 50%. Pada Gambar 7 ditunjukkan bahwa rata-rata akurasi, pengenalan fonem maksimum, dan pengenalan fonem yang minimum memiliki akurasi yang paling baik pada overlap 50%. Hal ini berarti informasi yang diambil dari tetangganya yang paling baik adalah overlap 50% pada pengenalan fonem. Jika tidak diambil informasi dari tetangganya atau overlap 0% maka akurasi menurun sangat drastis. Semakin besar overlap bukan berarti hasilnya pasti semakin baik tetapi dapat juga tergantung dengan kecepatan berbicara dan lebar frame namun pada kasus ini overlap 50% yang paling baik. Perbandingan Koefisien 13, 20, dan 26 Jumlah koefisien yang berbeda dapat mengindikasikan cocok atau tidaknya jumlah matriks ciri pada model. Perbandingan tingkat keakurasian model pengenalan fonem dapat dilihat pada jumlah koefisien yang berbeda, baik pada koefisien 13, 20 maupun 26. Hasil rata-rata akurasi model pada koefisien 13, 20, dan 26 dapat dilihat pada Gambar 8. Koefisien 20 dan 26 memiliki akurasi yang sama, sedangkan koefisien 13 hanya mencapai 94,71%. Hal ini berarti informasi ciri pada koefisien 20 dan 26 lebih baik daripada koefisien 13 pada pengenalan fonem. Untuk semua koefisien beberapa fonem telah berhasil dikenali sebesar 100% sedangkan fonem yang dikenali paling kecil akurasinya sebesar 75%. 100% 90% 80% 70% 60% 50% rata-rata maksimum minimum 100% 100% 100% 97.12% 97.12% 94.71% 75% 75% 75% koefisien 13 koefisien 20 koefisien 26 Gambar 8 Perbandingan akurasi sistem pada koefisien 13, 20, dan 26. Hasil Akurasi Pengenalan Fonem Fonem yang teridentifikasi dengan benar oleh model PNN menghasilkan rata-rata akurasi yang paling baik pada peneltian ini yaitu sebesar 97,12%. Identifikasi yang salah hanya terdapat pada fonem /d/, /e/, /n/, dan /t/. Data uji fonem /d/ dan /e/ sebanyak empat namun hanya satu fonem /d/ dikenali sebagai fonem /g/ begitu pula dengan fonem /e/ yang dikenali sebagai fonem /c/. Data uji fonem /n/ dan /t/ sebanyak delapan namun hanya satu fonem /n/ dikenali sebagai fonem /w/ begitu pula dengan fonem /t/ yang dikenali sebagai fonem /i/. Hal ini disebabkan terdapat kesamaan pola dan karekteristik sehingga sistem salah mengenali fonem. Semua fonem pada overlap 50% akurasinya tidak ada yang di bawah overlap 25%. Overlap 50% akurasinya hampir semua fonem di atas overlap 0% kecuali pada fonem /d/ dan /t/. Pada overlap 0% terdapat tiga fonem yang memiliki selisih akurasi cukup jauh dengan overlap 50%, yaitu fonem /f/, /k/, dan /q/. Hal ini berarti informasi yang diambil dari tetangganya yang paling baik adalah overlap 50%. Grafik perbandingan tingkat akurasi per fonem pada overlap 0%, 25%, dan 50% dapat dilihat pada Lampiran 1. Akurasi untuk semua fonem koefisien 20 dan 26 sama persis sedangkan koefisien 13 pada fonem /p/, /t/ dan /y/ akurasinya selisih cukup jauh. Hal ini berarti bahwa fonem /p/, /t/, dan /y/ lebih cocok dengan jumlah matriks ciri 20 dan 26. Grafik perbandingan tingkat akurasi per fonem pada koefisien 13, 20, dan 26 dapat dilihat pada Lampiran 2. Hasil Pengujian dengan Noise Percobaan ini menambahkan noise jenis Gaussian white noise sebesar 30 db, 20 db, dan 10 db pada data uji. Pada Gambar 9 ditunjukkan bahwa MFCC dengan pemodelan PNN hasil akurasi pada data uji yang diberi noise 30 db terjadi penurunan yang tidak begitu 7

16 jauh dari akurasi fonem tanpa noise sedangkan jika ditambahkan noise 20 db dan 10 db terjadi penurunan sangat drastis. Dibandingkan teknik lain, dalam mengekstraksi sinyal suara yang bersifat low noise (>30 db) teknik MFCC relatif lebih baik (Buono 2009). Hal ini dikarenakan cara kerja MFCC didasarkan pada perbedaan frekuensi yang dapat ditangkap oleh telinga manusia sehingga mampu merepresentasikan sinyal suara sebagaimana manusia merepresentasikan. 100% 80% 60% 40% 20% 0% 97.12% Gambar 9 Perbandingan data uji tanpa noise dan dengan noise. Dari perbandingan yang telah dilakukan fonem /a/ merupakan fonem yang paling stabil karena data pelatihannya yang banyak. Pada Gambar 10 ditunjukkan perbedaan sinyal fonem /a/ tanpa noise dengan sinyal yang telah diberi noise 10 db. Fonem /w/ tidak dikenali pada noise 30 db. Pada noise 20 db Ada enam fonem yang tidak dapat dikenali yaitu /j/, /o/, /q/, /v/, /w/, dan /y/. Pada noise 10 db fonem yang tidak dikenali sebanyak 21 fonem. Sinyal suara asli 85.26% 58.75% 9.07% Tanpa noise Noise 30 db Noise 20 db Noise 10 db Perbandingan Koefisien, Overlap, dan Data Uji Perbandingan antara koefisien, overlap, dan data uji dengan noise dan tanpa noise dapat dilihat pada Gambar 11. Terlihat bahwa akurasi pada data uji tanpa noise dan data uji yang ditambah noise 30 db masih di atas 70% pada setiap overlap dan koefisien. 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Tanpa noise Noise 20 db overlap,koefisien Noise 30 db Noise 10 db Gambar 11 Perbandingan koefisien, overlap, dan jenis data uji. Pada Gambar 11 ditunjukkan bahwa akurasi pada data uji tanpa noise yang paling baik yaitu pada overlap 50% dan dengan koefisien 20 dan 26 sebesar 97,12%. Akurasi pada data uji yang ditambah noise 30 db yang paling baik adalah overlap 50% dan koefisien 26 sebesar 85,26%. Akurasi pada data uji yang ditambah noise 20 db yang paling baik adalah overlap 50% dan koefisien 26 sebesar 58,75%. Akurasi pada data uji yang ditambah noise 10 db yang paling baik adalah overlap 25% dan koefisien 26 sebesar 13,39%. Dari perbandingan ini dapat dilihat bahwa overlap 50% memperlihatkan akurasi yang paling baik karena baik pada data uji tanpa noise maupun data uji yang ditambah noise 30 db dan 10 db memiliki akurasi yang paling baik. Koefisien 26 memiliki akurasi yang paling baik pada data uji tanpa noise maupun data uji yang ditambah noise 30 db, 20 db, dan 10 db. Pada Lampiran 3 ditunjukkan secara detail hasil akurasi perbandingan koefisien, overlap, dan jenis data uji. Sinyal suara dengan noise 10 db Gambar 10 Sinyal suara asli dan sinyal suara dengan noise 10 db. Kesimpulan KESIMPULAN DAN SARAN Penelitian ini telah berhasil dalam pengenalan fonem menggunakan metode PNN. Dari perbandingan ketiga overlap, akurasi terbaik dihasilkan pada overlap 50% dengan akurasi sebesar 94,71%. Untuk perbandingan ketiga koefisien, akurasi yang lebih baik 8

17 dihasilkan pada koefisien 20 dan 26 dengan akurasi sebesar 97,12% pada overlap 50%. Setelah dilakukan perbandingan antara koefisien 20 dan 26 dengan overlap 25% maka didapatkan hasil bahwa koefisien 26 yang lebih baik akurasinya sebesar 94,23%. Hal ini menunjukkan bahwa pada penelitian ini koefisien 26 yang paling baik. Untuk perbandingan besarnya penambahan noise, akurasi terbaik dihasilkan pada noise 30 db karena akurasinya yang paling dekat dengan akurasi tanpa noise. Akurasi penambahan noise 30 db sebesar 85,3%. Dari hasil penelitian ini ditunjukkan bahwa jumlah data latih tidak harus sama untuk semua kelas karena akurasi yang dihasilkan sudah baik. Saran Penelitian ini memungkinkan untuk dikembangkan lebih baik lagi, saran untuk pengembangan selanjutnya ialah: 1. Jumlah kata yang lebih banyak agar dapat mewakili untuk tiap fonem yang berada di depan, di tengah, dan di belakang. 2. Jumlah pembicara yang lebih banyak. 3. Segmentasi secara otomatis menggunakan auto corelation. 4. Menggunakan noise removing agar tahan terhadap noise. 5. Dapat dikembangkan lagi lebih lanjut ke tahap pengenalan kata berbasis fonem. Pengenalan Kisaran Usia dan Jenis Kelamin Berbasis Suara [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Ganchev,T Dimitrov Speaker Recognition. University of Patras, Greece. Jurafsky D, Martin JH Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistic, and Speech Recognition. New Jersey:Prentice Hall. Kudang B, Buono A, Sukin TP Desain dan Uji Komputasi Paralel Penentuan Nilai Penghalus ( ) Algoritma Jaringan Syaraf Probabilistik (PNN) untuk Klasifikasi Bunga Iris [ulasan]. Jurnal Ilmiah Ilmu Komputer 2005;3(1): Pelton, GE Voice Processing. Singapore:McGraw Hill. DAFTAR PUSTAKA Buono, A Representasi Nilai HOS dan Model MFCC sebagai Ekstraksi Ciri pada Sistem Indentifikasi Pembicara di Lingkungan Ber-noise Menggunakan HMM. [disertasi]. Depok: Program Studi Ilmu Komputer, Universitas Indonesia. [Depdikbud] Departemen Pendidikan dan Kebudayaan, Pusat Pembinaan dan Pengembangan Bahasa Kamus Besar Bahasa Indonesia. Ed ke-3. Jakarta:Balai Pustaka. Do MN Digital Signal Processing Mini- Project: An Automatic Recognition System. Audio Visual Communication Laboratory, Swiss Federal Institute of Technology. Fausett L Fundamentals of Neural Networks Architectures, Algorithm, and Applications. New Jersey: Prentice Hall. Fransiswa RR Pengembangan Model Probabilistic Neural Network (PNN) pada 9

18 LAMPIRAN 10

19 Lampiran 1 Grafik perbandingan tingkat akurasi per fonem pada overlap 0%, 25%, dan 50% 100% 95% 90% 85% 80% 75% 70% 65% 60% 55% 50% a b c d e f g h i j k l m n o p q r s t u v w x y z overlap 0% overlap 25% overlap 50% 11

20 Lampiran 2 Grafik Perbandingan tingkat akurasi per fonem pada koefisien 13, 20, dan % 95% 90% 85% 80% 75% 70% 65% 60% a b c d e f g h i j k l m n o p q r s t u v w x y z koefisien 13 koefisien 20 koefisien 26 12

21 Lampiran 3 Perbandingan koefisien, overlap, dan jenis data uji Jenis data Tanpa noise overlap 0% 25% 50% koefisien Fonem a 100% 100% 100% 100% 100% 100% 100% 100% 100% b 100% 100% 100% 100% 100% 100% 100% 100% 100% c 87,5% 87,5% 87,5% 100% 100% 100% 100% 100% 100% d 100% 75% 75% 75% 75% 75% 75% 75% 75% e 75% 75% 75% 75% 75% 75% 75% 75% 75% f 50% 50% 50% 75% 75% 75% 100% 100% 100% g 100% 100% 100% 100% 100% 100% 100% 100% 100% h 100% 100% 100% 100% 100% 100% 100% 100% 100% i 75% 100% 100% 87,5% 75% 75% 100% 100% 100% j 100% 100% 100% 100% 100% 100% 100% 100% 100% k 50% 75% 75% 75% 75% 75% 100% 100% 100% l 75% 100% 100% 100% 100% 100% 100% 100% 100% m 100% 100% 100% 100% 100% 100% 100% 100% 100% n 87,5% 100% 100% 87,5% 87,5% 87,5% 87,5% 87,5% 87,5% o 100% 100% 100% 100% 100% 100% 100% 100% 100% p 75% 75% 75% 75% 88% 88% 75% 100% 100% q 50% 50% 50% 100% 100% 100% 100% 100% 100% r 100% 100% 100% 100% 100% 100% 100% 100% 100% s 100% 100% 100% 100% 100% 100% 100% 100% 100% t 100% 100% 88% 62,5% 87,5% 100% 75% 87,5% 87,5% u 100% 100% 100% 100% 100% 100% 100% 100% 100% v 100% 100% 100% 100% 100% 100% 100% 100% 100% w 75% 100% 100% 100% 100% 100% 100% 100% 100% x 100% 75% 75% 100% 100% 100% 100% 100% 100% y 75% 100% 100% 75% 100% 100% 75% 100% 100% z 100% 100% 100% 100% 100% 100% 100% 100% 100% Jumlah 2275% 2363% 2350% 2388% 2438% 2450% 2463% 2525% 2525% Rata-rata 87,5% 90,87% 90,38% 91,83% 93,75% 94,23% 94,71% 97,12% 97,12% Rata-rata=Jumlah/26 13

22 Lanjutan Jenis data Noise 30 db overlap 0% 25% 50% koefisien Fonem a 100% 100% 100% 100% 100% 100% 100% 100% 100% b 75% 100% 100% 100% 100% 100% 100% 100% 100% c 87,5% 75% 75% 100% 87,5% 100% 87,5% 87,5% 100% d 100% 75% 75% 75% 75% 75% 75% 75% 75% e 100% 75% 75% 75% 75% 75% 75% 75% 75% f 50% 50% 50% 75% 100% 100% 100% 100% 100% g 100% 100% 100% 100% 100% 100% 100% 100% 100% h 100% 100% 100% 100% 100% 100% 100% 100% 100% i 75% 75% 75% 50% 50% 62,5% 100% 100% 75% j 62,5% 100% 100% 25% 75% 87,5% 87,5% 100% 100% k 50% 75% 75% 50% 75% 75% 100% 100% 100% l 75% 100% 100% 100% 100% 100% 100% 100% 100% m 100% 100% 100% 100% 100% 100% 100% 100% 100% n 87,5% 88% 100% 100% 100% 100% 100% 100% 100% o 0% 50% 75% 0% 25% 25% 0% 0% 25% p 75% 62,5% 62,5% 75% 87,5% 87,5% 87,5% 87,5% 100% q 50% 50% 50% 50% 50% 50% 75% 50% 50% r 100% 100% 100% 100% 100% 100% 100% 100% 100% s 100% 100% 100% 100% 100% 100% 100% 100% 100% t 37,5% 75% 75% 50% 62,5% 75% 87,5% 87,5% 75% u 33,33% 41,7% 50% 33,3% 33,3% 33,3% 41,67% 41,67% 41,67% v 75% 100% 100% 100% 100% 100% 50% 100% 100% w 0% 0% 0% 0% 0% 0% 0% 0% 0% x 100% 75% 75% 100% 100% 100% 100% 100% 100% y 75% 100% 100% 100% 100% 100% 100% 100% 100% z 100% 100% 100% 100% 100% 100% 100% 100% 100% Jumlah 1908% 2067% 2113% 1958% 2096% 2146% 2167% 2204% 2217% Rata-rata 73,4% 79,49% 81,25% 75,32% 80,61% 82,53% 83,33% 84,78% 85,26% 14

23 Lanjutan Jenis data Noise 20 db overlap 0% 25% 50% koefisien Fonem a 100% 100% 100% 100% 100% 100% 100% 98,2% 98,2% b 0% 0% 25% 0% 25% 0% 0% 25% 50% c 25% 12,5% 0% 50% 37,5% 37,5% 37,5% 12,5% 37,5% d 100% 75% 75% 100% 75% 75% 75% 75% 75% e 75% 75% 75% 75% 75% 75% 75% 75% 75% f 25% 25% 25% 75% 75% 100% 100% 75% 100% g 75% 100% 100% 100% 100% 100% 75% 100% 100% h 50% 75% 100% 75% 100% 100% 100% 100% 100% i 87,5% 100% 75% 62,5% 75% 50% 50% 37,5% 37,5% j 0% 25% 37,5% 0% 0% 12,5% 0% 0% 0% k 25% 25% 25% 25% 75% 75% 25% 75% 75% l 100% 100% 100% 100% 75% 75% 100% 100% 100% m 100% 100% 100% 100% 100% 100% 100% 100% 100% n 37,5% 50% 50% 50% 50% 50% 37,5% 50% 50% o 0% 0% 0% 0% 0% 0% 0% 0% 0% p 50% 50% 50% 62,5% 62,5% 62,5% 50% 50% 75% q 0% 0% 0% 0% 0% 0% 0% 0% 0% r 25% 75% 50% 75% 75% 100% 75% 75% 100% s 100% 100% 100% 100% 100% 100% 100% 100% 100% t 37,5% 37,5% 50% 50% 50% 50% 37,5% 50% 62,5% u 41,67% 8,33% 8,33% 33,30% 41,67% 41,67% 41,67% 25% 41,67% v 0% 0% 0% 0% 0% 0% 0% 0% 0% w 0% 0% 0% 0% 0% 0% 0% 0% 0% x 100% 75% 75% 100% 100% 100% 100% 100% 100% y 75% 50% 100% 50% 75% 50% 0% 0% 0% z 0% 0% 25% 0% 50% 0% 0% 50% 50% Jumlah 1229% 1258% 1346% 1383% 1517% 1454% 1279% 1373% 1527% Rata-rata 47,28% 48,4% 51,76% 53,2% 58,33% 55,93% 49,2% 52,82% 58,75% 15

24 Lanjutan Jenis data Noise 10 db overlap 0% 25% 50% koefisien a 89,29% 87,5% 87,5% 83,9% 85,7% 85,7% 82,14% 85,7% 85,7% b 0% 0% 0% 0% 25% 0% 0% 0% 0% c 0% 0% 0% 0% 0% 0% 0% 0% 0% d 0% 0% 25% 0% 50% 75% 0% 75% 0% e 0% 0% 0% 0% 0% 0% 0% 0% 0% f 0% 0% 0% 0% 25% 25% 0% 0% 0% g 0% 0% 0% 0% 0% 0% 0% 0% 0% h 0% 0% 0% 0% 0% 0% 0% 0% 0% i 50% 62,5% 50% 0% 0% 0% 12,5% 12,5% 25% j 0% 0% 0% 0% 0% 0% 0% 0% 0% k 0% 0% 25% 0% 25% 25% 0% 0% 25% l 0% 0% 0% 0% 0% 0% 0% 0% 0% Fonem m 0% 0% 0% 0% 25% 25% 0% 0% 0% n 0% 0% 0% 0% 0% 0% 0% 0% 0% o 0% 0% 0% 0% 0% 0% 0% 0% 0% p 50% 50% 50% 62,5% 50% 50% 50% 50% 50% q 25% 25% 25% 75% 25% 25% 50% 50% 50% r 0% 0% 0% 0% 0% 0% 0% 0% 0% s 25% 50% 50% 50% 25% 25% 0% 0% 0% t 37,5% 37,5% 12,5% 0% 0% 12,5% 0% 0% 0% u 0% 0% 0% 0% 0% 0% 0% 0% 0% v 0% 0% 0% 0% 0% 0% 0% 0% 0% w 0% 0% 0% 0% 0% 0% 0% 0% 0% x 0% 0% 0% 0% 0% 0% 0% 0% 0% y 0% 0% 0% 0% 0% 0% 0% 0% 0% z 0% 0% 0% 0% 0% 0% 0% 0% 0% Jumlah 277% 313% 325% 271% 336% 348% 195% 273% 236% Rata-rata 10,65% 12,02% 12,5% 10,44% 12,91% 13,39% 7,49% 10,51% 9,07% 16

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia

Lebih terperinci

Karakteristik Spesifikasi

Karakteristik Spesifikasi Sinyal yang masuk difilter ke dalam sinyal frekuensi rendah (low-pass filter) dan sinyal frekuensi tinggi (high-pass filter) Lakukan downsampling pada kedua sinyal tersebut Low-pass frekuensi hasil downsampling

Lebih terperinci

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR PERNYATAAN

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar

Lebih terperinci

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi

Lebih terperinci

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre

Lebih terperinci

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar. BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun

Lebih terperinci

PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI

PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI DAPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI

vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI SKRIPSI

Lebih terperinci

SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI FAKULTAS MATEMATIKA DAN ILMU

SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI FAKULTAS MATEMATIKA DAN ILMU PERBANDINGAN METODE WAVELET DAUBECHI IES DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS

Lebih terperinci

TINJAUAN PUSTAKA. Pengenalan Suara

TINJAUAN PUSTAKA. Pengenalan Suara Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan

Lebih terperinci

PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER

PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER MUTIA FIJRI TAUFANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN

Lebih terperinci

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar PENDAHULUAN Latar Belakang Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit

Lebih terperinci

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi

Lebih terperinci

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA Oleh : VICKY ZILVAN G64103043 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR

Lebih terperinci

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Agustini, Biometrik Suara Dengan Transformasi Wavelet 49 BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Ketut Agustini (1) Abstract: Biometric as one of identification or recognition

Lebih terperinci

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan

Lebih terperinci

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: Perintah Suara Berbahasa Indonesia untuk Membuka dan Menutup Aplikasi dalam Sistem Operasi Windows Menggunakan Metode Mel Frequency Cepstrum Coefficient dan Metode Backpropagation Zakaria Ramadhan 1, Sukmawati

Lebih terperinci

PENERAPAN LEARNING VECTOR QUANTIZATION

PENERAPAN LEARNING VECTOR QUANTIZATION PENERAPAN LEARNING VECTOR QUANTIZATION (LVQ) DAN EKSTRAKSI CIRI MENGGUNAKAN MEL- FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) UNTUK TRANSKRIPSI SUARA KE TEKS LAKSMI NIRMALA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi

Lebih terperinci

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student

Lebih terperinci

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi. SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik

Lebih terperinci

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, 121-132 121 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Aplikasi Pengenalan Ucapan Dengan Ekstraksi Ciri Mel- Frequency Cepstrum Coefficients

Lebih terperinci

PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO

PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods Pemrosesan Sinyal DigitalUntuk Mengidentifikasi Akord Dasar Penyanyi Dengan Metode Mel Frequency Cepstral Coeficients (MFCC) Dan Jaringan Syaraf Tiruan Backpropagation Digital Signal Processing To Identify

Lebih terperinci

PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA

PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis

Lebih terperinci

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION DETECTION OF THE LEVEL OF YOUTH, ADULTS AND ELDERLY BY USING MFCC METHOD AND FUZZY

Lebih terperinci

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad

Lebih terperinci

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,

Lebih terperinci

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA SKRIPSI PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA MADE GDE JAYA HARRY KHESA S JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA BUKIT JIMBARAN

Lebih terperinci

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

Frekuensi Dominan Dalam Vokal Bahasa Indonesia Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan

Lebih terperinci

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

1. BAB I PENDAHULUAN 1.1. Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang 1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat

Lebih terperinci

PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO

PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Jaringan Syaraf Tiruan pada Robot

Jaringan Syaraf Tiruan pada Robot Jaringan Syaraf Tiruan pada Robot Membuat aplikasi pengenalan suara untuk pengendalian robot dengan menggunakan jaringan syaraf tiruan sebagai algoritma pembelajaran dan pemodelan dalam pengenalan suara.

Lebih terperinci

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 IDENTIFIKASI CAMPURAN

Lebih terperinci

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,

Lebih terperinci

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Oleh: Ahmad Irfan Abdul Rahman Tri Budi Santoso Titon Dutono Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Emosi Emosi adalah perasaan intens yang ditujukan kepada seseorang atau sesuatu dan juga merupakan reaksi terhadap seseorang atau kejadian.emosi dapat ditunjukkan ketika merasa

Lebih terperinci

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY Erni Seniwati 1), Ninik Tri Hartanti 2) 1 Sistem Informasi, STMIK Amikom erni.s@amikom.ac.id 2 Sistem Informasi, STMIK Amikom

Lebih terperinci

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Vicky Zilvan, S.Kom. UPT LPSN - LIPI v_q1e@yahoo.com Furqon Hensan Muttaqien, S.Komp. P2 Informatika - LIPI fh.muttaqien@informatika.lipi.go.id

Lebih terperinci

Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC

Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC Elghar Wisnudisastra, Agus Buono Departemen Ilmu Komputer, Institut Pertanian Bogor, Jl. Meranti Wing 20 Lv.V,

Lebih terperinci

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification Jurnal Telematika, vol. 11 no. 1, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker

Lebih terperinci

NTIFIKASI PEMBICARA DENGAN PEMODELAN IDENTIFIKASI PEMBICARA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN SVM SEBAGAI PENGENALAN POLA LUTHFAN ALMANFALUTHI

NTIFIKASI PEMBICARA DENGAN PEMODELAN IDENTIFIKASI PEMBICARA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN SVM SEBAGAI PENGENALAN POLA LUTHFAN ALMANFALUTHI NTIFIKASI PEMBICARA DENGAN PEMODELAN IDENTIFIKASI PEMBICARA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN SVM SEBAGAI PENGENALAN POLA LUTHFAN ALMANFALUTHI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014

Lebih terperinci

BAB I PENDAHULUAN I.1 Latar Belakang

BAB I PENDAHULUAN I.1 Latar Belakang BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring

Lebih terperinci

TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY

TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Genre Menurut Kamus Besar Bahasa Indonesia, genre adalah jenis, tipe, atau kelompok sastra atas dasar bentuknya. Jadi genre musik merupakan pengelompokan musik berdasarkan kemiripan

Lebih terperinci

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT DAN LINEAR VECTOR QUANTIZATION UNTUK PENGENDALIAN GERAK ROBOT Anggoro Wicaksono, Sukmawati NE, Satriyo Adhy,

Lebih terperinci

PENDETEKSIAN KATA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN CODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL

PENDETEKSIAN KATA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN CODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL PENDETEKSIAN KATA DENGAN MF SEBAGAI EKSTRAKSI IRI DAN ODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

Bab 3. Perancangan Sistem

Bab 3. Perancangan Sistem 34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 21 PERANGKAT LUNAK UNTUK MEMBUKA APLIKASI PADA KOMPUTER DENGAN PERINTAH SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENTS Anna Dara Andriana Program Studi Teknik Informatika Fakultas Teknik

Lebih terperinci

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan

Lebih terperinci

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker

Lebih terperinci

Available online at TRANSMISI Website TRANSMISI, 13 (3), 2011,

Available online at TRANSMISI Website  TRANSMISI, 13 (3), 2011, Available online at TRANSMISI Website http://ejournal.undip.ac.id/index.php/transmisi TRANSMISI, 13 (3), 2011, 82-86 Research Article Aplikasi Pengenalan Ucapan dengan Ekstraksi Mel-Frequency Cepstrum

Lebih terperinci

APLIKASI PENGENALAN SUARA DIGITAL NADA DASAR PIANO SKRIPSI M. ARDIANSYAH

APLIKASI PENGENALAN SUARA DIGITAL NADA DASAR PIANO SKRIPSI M. ARDIANSYAH APLIKASI PENGENALAN SUARA DIGITAL NADA DASAR PIANO SKRIPSI M. ARDIANSYAH 091402062 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2014

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium,

Lebih terperinci

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV Marianus Hendra Wijaya 1), Linggo Sumarno 2) 1) Program Studi Teknik Elektro Fakultas Sains dan Teknologi Universtas Sanata Dharma Yogyakarta

Lebih terperinci

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM) Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM) Inggih Permana 1, Benny Sukma Negara 2 1 Universitas Sultan Sarif Kasim Riau 2 Universitas Sultan Sarif

Lebih terperinci

Kata Kunci: Suara; Mel Frequency Cepstral Coefficient; K-NEAREST NEIGHBOUR

Kata Kunci: Suara; Mel Frequency Cepstral Coefficient; K-NEAREST NEIGHBOUR 120 Dielektrika, [P-ISSN 2086-9487] [E-ISSN 2579-650X] Vol. 4, No. 2 : 120-126, Agustus 2017 KLASIFIKASI SUARA BERDASARKAN USIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN K-NEAREST NEIGHBOUR

Lebih terperinci

ANALISIS DAN IMPLEMENTASI APLIKASI PENGENALAN SUARA MENJADI TEKS MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION

ANALISIS DAN IMPLEMENTASI APLIKASI PENGENALAN SUARA MENJADI TEKS MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION ANALISIS DAN IMPLEMENTASI APLIKASI PENGENALAN SUARA MENJADI TEKS MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION ANALYSIS AND IMPLEMENTATION OF SPEECH TO TEXT APPLICATION USING BACKPROPAGATION

Lebih terperinci

HASIL DAN PEMBAHASAN. Generalisasi =

HASIL DAN PEMBAHASAN. Generalisasi = 6 Kelas Target Sidik jari individu 5 0000100000 Sidik jari individu 6 0000010000 Sidik jari individu 7 0000001000 Sidik jari individu 8 0000000100 Sidik jari individu 9 0000000010 Sidik jari individu 10

Lebih terperinci

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength JURNAL FISIKA DAN APLIKASINYA VOLUME 12, NOMOR 1 JANUARI 2016 Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength Dody Kurniawan, Ahmad Syakir, Hana Afifah,

Lebih terperinci

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk 6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada

Lebih terperinci

PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA

PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Suara Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara

Lebih terperinci

INDEPT, Vol. 3, No.1, Februari 2013 ISSN

INDEPT, Vol. 3, No.1, Februari 2013 ISSN SISTEM SPEAKER RECOGNITION (PENGENAL PENGUCAP) UNTUK MENCARI KARAKTERISTIK UCAPAN SESEORANG DENGAN METODE MEL FREQUENCY CEPTRUM COEFFISIENT (MFCC) MENGGUNAKAN SOFTWARE MATLAB Andriana, ST., MT. Dosen Fakultas

Lebih terperinci

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 SPEAKER IDENTIFICATION DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF

Lebih terperinci

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang BAB 1 PENDAHULUAN 1.1 Latar Belakang Kecerdasan buatan (artificial intelligence) merupakan bidang yang berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang mengarah kepada bidang

Lebih terperinci

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO 02.50.0020 PROGRAM STUDI TEKNIK ELEKTRO FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS KATOLIK

Lebih terperinci

Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient

Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient 32 Jurnal Sistem Informasi Bisnis 0(207) On-line : http://ejournalundipacid/indexphp/jsinbis Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient Andi

Lebih terperinci

PENGENALAN KATA BERBASISKAN FONEM DENGAN PEMODELAN RESILIENT BACKPROPAGATION PRAMESWARI

PENGENALAN KATA BERBASISKAN FONEM DENGAN PEMODELAN RESILIENT BACKPROPAGATION PRAMESWARI PENGENALAN KATA BERBASISKAN FONEM DENGAN PEMODELAN RESILIENT BACKPROPAGATION PRAMESWARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 PENGENALAN

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan

Lebih terperinci

APLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW

APLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW APLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW,, [1] Jurusan Teknik Informatika, Fakultas Teknologi Industri, Itenas Bandung youllia@itenas.ac.id, sangkuriang69@gmail.com, adrianyuki16@gmail.com

Lebih terperinci

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition... DAFTAR ISI PERNYATAAN... i KATA PENGANTAR... ii UCAPAN TERIMA KASIH... iii ABSTRAK... v ABSTRACT... vi DAFTAR ISI... vii DAFTAR TABEL... ix DAFTAR GAMBAR... x DAFTAR LAMPIRAN... xii BAB I PENDAHULUAN...

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari

Lebih terperinci

PENERAPAN MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA TRANSKRIPSI SUARA KE TEKS DENGAN SELF ORGANIZING MAPS (SOM)

PENERAPAN MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA TRANSKRIPSI SUARA KE TEKS DENGAN SELF ORGANIZING MAPS (SOM) PENERAPAN MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA TRANSKRIPSI SUARA KE TEKS DENGAN SELF ORGANIZING MAPS (SOM) TINO AKBAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Tetris Tetris adalah sebuah tipe permainan yang dibuat oleh seorang programmer berkebangsaan Rusia yang bernama Alexey Pajitnov pada tahun 1984 dan semenjak saat itu game tetris

Lebih terperinci

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION TUGAS AKHIR Diajukan Untuk Memenuhi Sebagian Persyaratan Dalam Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun oleh : PAULA

Lebih terperinci

SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR

SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR Ali Mustofa Jurusan Teknik Elektro, Universitas Brawijaya Email: a_tofa@yahoo.com Abstrak - Pengenalan penutur adalah

Lebih terperinci

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength JURNAL FISIKA DAN APLIKASINYA VOLUME 12, NOMOR 1 JANUARI 2016 Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength Dody Kurniawan, Ahmad Syakir, Hana Afifah,

Lebih terperinci

PENGENALAN SUARA CHORD DENGAN TIGA NADA PENYUSUN PADA INSTRUMEN PIANO MENGGUNAKAN LEARNING VECTOR QUANTIZATION SARAH RAHMANIA HANIF

PENGENALAN SUARA CHORD DENGAN TIGA NADA PENYUSUN PADA INSTRUMEN PIANO MENGGUNAKAN LEARNING VECTOR QUANTIZATION SARAH RAHMANIA HANIF PENGENALAN SUARA CHORD DENGAN TIGA NADA PENYUSUN PADA INSTRUMEN PIANO MENGGUNAKAN LEARNING VECTOR QUANTIZATION SARAH RAHMANIA HANIF DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada masa sekarang, Digital Signal Processing (DSP) atau pemrosesan sinyal digital sudah banyak diterapkan di berbagai bidang karena data dalam bentuk digital

Lebih terperinci

Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW

Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW Darma Putra 1, Adi Resmawan 2 1 Staff pengajar Teknologi Informasi, Fakultas Teknik, Universitas Udayana 2 Alumni Teknik Elektro, Fakultas Teknik,

Lebih terperinci

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Ziaul Haq, Teknik Informatika S1,Universitas Dian Nuswantoro Semarang Abstract Pengenalan

Lebih terperinci

IMPLEMENTASI MEL FREQUENCY CEPSTRAL COEFFICIENT DAN DYNAMIC TIME WARPING UNTUK PENGENALAN NADA PADA ALAT MUSIK BELLYRA

IMPLEMENTASI MEL FREQUENCY CEPSTRAL COEFFICIENT DAN DYNAMIC TIME WARPING UNTUK PENGENALAN NADA PADA ALAT MUSIK BELLYRA IMPLEMENTASI MEL FREQUENCY CEPSTRAL COEFFICIENT DAN DYNAMIC TIME WARPING UNTUK PENGENALAN NADA PADA ALAT MUSIK BELLYRA Yusup Miftahuddin 1) Mira Musrini B 2) Muhammad Rifqi Hakim 3) 1) 2) 3) Teknik Informatika

Lebih terperinci

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization Neneng Nurhamidah 1, Esmeralda C. Djamal, Ridwan Ilyas Jurusan Informatika, Fakultas MIPA

Lebih terperinci

SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari

SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen Satya Wacana, Salatiga,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Suara (Wicara) Suara khususnya wicara merupakan cara yang natural bahkan paling penting dalam melakukan proses komunikasi. Dalam kehidupan sehari-hari, manusia melakukan berbagai

Lebih terperinci