PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G

Ukuran: px
Mulai penontonan dengan halaman:

Download "PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G"

Transkripsi

1 PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA Oleh : VICKY ZILVAN G DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2007

2 PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Oleh : VICKY ZILVAN G DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2007

3 v ABSTRAK VICKY ZILVAN. Pengembangan Model Probabilistic Neural Network Bertingkat Menggunakan Fuzzy C-Means untuk Identifikasi Pembicara. Dibimbing oleh AGUS BUONO dan SRI NURDIATI. Salah satu kajian dalam speech processing adalah identifikasi pembicara. Metode yang digunakan untuk identifikasi pembicara pada penelitian ini adalah Probabilistic Neural Network dengan data latih yang di-cluster-kan menggunakan Fuzzy C-Means dan untuk ekstraksi ciri sinyal suara menggunakan MFCC. Jenis identifikasi pembicara pada penelitian ini bersifat tertutup dan bergantung pada teks, dan kata yang digunakan dalam pelatihan dan pengujian adalah komputer. Hasil dari penelitian ini adalah suatu model Probabilistic Neural Network dengan data latih yang di-cluster-kan menggunakan Fuzzy C-Means untuk identifikasi pembicara yang bersifat tertutup dan bergantung pada teks. Tingkat akurasi tertinggi dari model yang menggunakan data asli diperoleh dengan data pelatihan sebanyak 40, dengan tingkat akurasi sebesar 96%. Di sisi lain, untuk model yang menggunakan data dengan SNR sebesar 30 db, nilai akurasi tertinggi diperoleh dengan data pelatihan sebanyak 40, dengan tingkat akurasi sebesar 89%. Tingkat akurasi tertinggi dari model yang menggunakan data dengan SNR sebesar 20 db diperoleh dengan data pelatihan sebanyak 30, dengan tingkat akurasi sebesar 60%. Untuk identifikasi dengan threshold, nilai akurasi dari model yang menggunakan data asli dengan 40 data pelatihan sebesar 91% untuk pembicara yang dikenal, sedangkan untuk pembicara yang tidak dikenal tingkat akurasi mencapai 80%. Kata kunci : Identifikasi Pembicara, MFCC, Probabilistic Neural Network, Fuzzy C-Means, Speech Processing

4 vi Judul : Pengembangan Model Probabilistic Neural Network Bertingkat Menggunakan Fuzzy C-Means untuk Identifikasi Pembicara Nama : Vicky Zilvan NRP : G Menyetujui: Pembimbing I, Pembimbing II Ir. Agus Buono, M.Si., M.Kom. Dr. Ir. Sri Nurdiati, M.Sc. NIP NIP Mengetahui: Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Prof. Dr. Ir. Yonny Koesmaryono, MS NIP Tanggal Lulus : Lulus :

5 vii RIWAYAT HIDUP Penulis dilahirkan di Cianjur pada tanggal 3 Oktober 1984 sebagai anak kesatu dari tiga bersaudara dari pasangan Agust Salfa dan Aziza M.B. Penulis menyelesaikan pendidikan menengah atas di SMU Negeri 1 Cianjur dan lulus pada tahun Pada tahun yang sama penulis diterima sebagai mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Penulis diterima melalui jalur Undangan Seleksi Masuk IPB (USMI). Penulis pernah melaksanakan praktek lapang selama dua bulan di Badan Penelitian dan Pengembangan Kehutanan, Departemen Kehutanan R.I. Tugas yang diberikan pada praktek lapang tersebut berkaitan dengan pembuatan Sistem Informasi Kawasan Hutan dengan Tujuan Khusus dan Pembuatan Sistem Informasi Hasil-Hasil Penelitian Kehutanan.

6 viii PRAKATA Puji dan syukur penulis panjatkan kepada Allah SWT atas limpahan nikmat dan hidayah- Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Sholawat dan salam semoga senantiasa tercurah kepada nabi besar Muhammad SAW, keluarganya, para sahabat, serta para pengikutnya yang tetap istiqomah mengemban risalah-nya. Melalui lembar ini, penulis ingin menyampaikan penghargaan dan terima kasih kepada semua pihak atas bantuan, dorongan, saran, kritik, serta koreksi yang ditujukan selama penulisan karya ilmiah ini. Ucapan terima kasih penulis ucapkan kepada : 1. Kedua orang tuaku tercinta, Adik-adikku, kedua Nenekku, dan seluruh keluargaku atas doa, kasih sayang, dan pengorbanan yang telah diberikan selama ini. 2. Bapak Ir. Agus Buono, M.Si., M.Kom. selaku pembimbing I, Ibu Dr. Ir. Sri Nurdiati, M.Sc. selaku pembimbing II dan Bapak Aziz Kustiyo, S.Si., M.Kom. selaku dosen penguji. 3. Eno, Thessi, Yustin, Ghoffar, Pandi, Mulyadi, Nanik, Vita yang telah menyumbangkan suaranya untuk data dalam penelitian ini. 4. Seluruh staf pengajar yang telah memberikan bekal ilmu dan wawasan selama penulis menuntut ilmu di Departemen Ilmu Komputer. 5. Seluruh staf administrasi dan perpustakaan atas bantuannya. 6. Komang, Dani, Gemma, Cuning, Bastut, Iqbal, Inang, Dona, Mulyadi dan Nacha yang sudah memberikan banyak sekali kenangan selama tinggal bersama. 7. Jemi dan Yayan yang telah bersedia meminjamkan laptopnya. 8. Rekan-rekan Departemen Ilmu Komputer angkatan 40. Sebagaimana manusia yang tidak luput dari kesalahan, penulis menyadari bahwa karya ilmiah ini jauh dari sempurna. Namun penulis berharap semoga karya ilmiah ini dapat bermanfaat bagi siapapun yang membacanya. Bogor, Mei 2007 Vicky Zilvan

7 v DAFTAR ISI Halaman DAFTAR TABEL...vi DAFTAR GAMBAR...vi DAFTAR LAMPIRAN...vi PENDAHULUAN...1 Latar Belakang...1 Tujuan...1 Ruang Lingkup...1 Manfaat...1 TINJAUAN PUSTAKA...2 Jenis Pengenalan Pembicara...2 Dijitalisasi Gelombang Suara...2 Signal to Noise Ratio (SNR)...2 Ekstraksi Ciri Sinyal Suara...3 MFCC (Mel-Frequency Cepstrum Coefficients)...3 Fuzzy C-Means (FCM)...4 Jaringan Saraf Tiruan...4 Probabilistic Neural Network...5 METODE PENELITIAN...5 Data Suara...6 Ekstraksi Ciri Sinyal Suara dengan MFCC...6 Probabilistic Neural Network Bertingkat Menggunakan Fuzzy C-Means (FCM)...7 Hasil Identifikasi...7 Penggunaan Threshold...8 Lingkungan Pengembangan...8 HASIL DAN PEMBAHASAN...8 Data Suara...8 Praproses dengan MFCC...8 Probabilistic Neural Network Bertingkat Menggunakan Fuzzy C-Means (FCM)...8 Pemilihan Nilai Smoothing Parameter...9 Hasil Identifikasi Menggunakan Nilai Smootihng Parameter yang Telah Dipilih...9 Pengaruh Penggunaan Threshold...11 KESIMPULAN DAN SARAN...12 Kesimpulan...12 Saran...12 DAFTAR PUSTAKA...12

8 vi DAFTAR TABEL Halaman 1 Kombinasi pembagian data pengujian dan data pelatihan setiap suara model untuk jumlah data yang sama Kombinasi proporsi data pelatihan dengan jumlah data pengujian yang sama untuk setiap setiap suara model Tingkat akurasi setiap model dengan jumlah data yang sama Tingkat akurasi setiap model dengan data pengujian yang sama Hasil identifikasi 40 data pelatihan untuk 10 data pengujian pada data asli dengan menggunakan threshold Hasil identifikasi 40 data pelatihan untuk 30 data pengujian non-model pada data asli dengan menggunakan threshold...12 DAFTAR GAMBAR Halaman 1 Diagram blok dari proses MFCC (Do 1994) Struktur Probabilistic Neural Network (Ganchev 2005) Blok diagram sistem identifikasi pembicara Struktur Probabilistic Neural Network Bertingkat Perbandingan tingkat akurasi setiap pembicara pada model yang menggunakan data asli Perbandingan tingkat akurasi untuk setiap model dengan jumlah data yang sama Perbandingan tingkat akurasi antara data yang ditambahkan SNR dengan data asli Perbandingan tingkat akurasi model dengan menggunakan threshold dan dengan model yang tidak menggunakan threshold...11 DAFTAR LAMPIRAN Halaman 1 Hasil peng-cluster-an 20 data pelatihan Hasil peng-cluster-an 30 data pelatihan Hasil peng-cluster-an 20 data pelatihan dengan SNR 30dB Hasil peng-cluster-an 30 data pelatihan SNR 30 db Hasil peng-cluster-an 20 data pelatihan dengan 20 db Hasil peng-cluster-an 30 data pelatihan dengan 20 db Tingkat akurasi model dengan nilai smoothing parameter yang berbeda pada data asli Tingkat akurasi model dengan nilai smoothing parameter yang berbeda pada data dengan SNR 30 db Tingkat akurasi model dengan nilai smoothing parameter yang berbeda pada data dengan SNR 20 db Hasil identifikasi 20 data pelatihan dengan 30 data pengujian untuk data asli Hasil identifikasi 30 data pelatihan untuk 20 data pengujian untuk data asli Hasil identifikasi 40 data pelatihan untuk 10 data pengujian untuk data asli Hasil identifikasi 20 data pelatihan untuk 30 data pengujian pada data dengan SNR 30 db Hasil identifikasi 30 data pelatihan untuk 20 data pengujian pada data dengan SNR 30 db Hasil identifikasi 40 data pelatihan untuk 10 data pengujian pada data dengan SNR 30 db Hasil identifikasi 20 data pelatihan untuk 30 data pengujian pada data dengan SNR 20 db Hasil identifikasi 30 data pelatihan untuk 20 data pengujian pada data dengan SNR 20 db Hasil identifikasi 40 data pelatihan untuk 10 data pengujian pada data dengan SNR 20 db Nilai threshold masing-masing pembicara dari 40 data pelatihan untuk data asli...27

9 1 Latar Belakang PENDAHULUAN Pengenalan pola masih menjadi kajian yang menarik bagi para peneliti. Hal ini dilakukan tidak hanya untuk keperluan penelitian maupun peningkatan produktifitas kerja saja, tetapi lebih mengarah pada kebutuhan di era high technology, di mana kemajuan di bidang elektronika dan teknologi informasi diharapkan secara sinergi memenuhi tuntutan kebutuhan manusia. Oleh karena itu, permasalahan pengenalan pola telah berkembang pesat dan digunakan dalam berbagai bidang. Di perkotaan maupun industri, suara, sidik jari, pola geometri telapak tangan, maupun wajah digunakan sebagai mesin absensi. Di dunia perbankan, suara digunakan untuk berbagai kepentingan seperti, layanan bank melalui telepon. Di dunia kedokteran, iris mata digunakan untuk mengidentifikasi adanya faal pada organ tubuh, serta pupil mata untuk mengidentifikasi tingkat kelelahan pada seseorang. Penelitian yang dilakukan dengan menggunakan data sinyal suara umumnya disebut dengan pemrosesan sinyal suara (speech processing). Speech processing sendiri memiliki beberapa cabang kajian. Salah satu kajian dalam speech processing adalah identifikasi pembicara. Identifikasi pembicara (speaker identification) adalah suatu proses mengenali seseorang berdasarkan suaranya (Campbell 1997). Banyak sekali metode yang dikembangkan para peneliti untuk melakukan identifikasi, antara lain Dynamic Time Warping (DTW), Model Markov Tersembunyi, Vector Quantization (VQ), Bayesian classifiers, Principal Components Analysis (PCA), algoritma K-Means clustering, jaringan syaraf tiruan maupun logika Fuzzy. Di samping itu, gabungan dari beberapa metode tersebut pun sering digunakan. Salah satu metode yang digunakan untuk identifikasi pembicara adalah Model Markov Tersembunyi yang telah dikembangkan oleh Purnamasari pada tahun Secara keseluruhan dari penelitian yang telah dilakukan, untuk pelatihan dengan 20 data menghasilkan tingkat akurasi 71,25%, untuk pelatihan dengan 30 data menghasilkan tingkat akurasi 77,92%, dan pelatihan dengan 40 data menghasilkan tingkat akurasi tertinggi yaitu sebesar 86,25%. Untuk mencoba meningkatkan akurasi identifikasi pembicara, pada penelitian ini akan dilakukan penelitian untuk identifikasi pembicara dengan Probabilistic Neural Network (PNN) bertingkat menggunakan Fuzzy C-Means (FCM). Metode Fuzzy C- Means (FCM) dipilih karena merupakan salah satu teknik peng-cluster-an yang sering diterapkan dalam langkah persiapan pada proses data mining dengan menghasilkan cluster-cluster yang digunakan sebagai input untuk berbagai teknik, seperti jaringan syaraf tirun. Di sisi lain, metode Probabilistic Neural Network (PNN) dipilih karena merupakan salah satu jenis jaringan syaraf tiruan yang telah terbukti memiliki tingkat akurasi yang cukup tinggi dalam mengidentifikasi pembicara, yaitu sebesar 96% (Sarimollaoglu et al. 2004). Tujuan Penelitian ini bertujuan untuk mengembangkan model Probabilistic Neural Network bertingkat menggunakan Fuzzy C- Means (FCM) untuk identifikasi pembicara. Pada penelitian ini juga, akan dilakukan pembandingan tingkat akurasi model antara suara yang diberi noise dan yang tidak diberi noise. Selain itu, dilakukan pembandingan tingkat akurasi model yang menggunakan threshold dan tingkat akurasi model yang tidak menggunakan threshold. Ruang Lingkup Pada penelitian ini : 1. pembahasan difokuskan pada tahap pemodelan pembicara dengan Probabilistic Neural Network bertingkat menggunakan Fuzzy C-Means (FCM), tidak pada pemrosesan sinyal analog sebagai praproses sistem. 2. parameter FCM yang akan dicobakan adalah : - Banyaknya cluster = 3, - Error terkecil yang diharapkan = , - Pangkat pembobot = 2, - Maksimum iterasi = ekstraksi ciri sinyal suara menggunakan Mel-Frequency Cepstrum Coefficients (MFCC). 4. identifikasi bersifat tertutup dan bergantung pada teks. Manfaat Penelitian ini diharapkan dapat memberikan informasi mengenai tingkat akurasi Probabilistic Neural Network

10 2 Bertingkat menggunakan Fuzzy C-Means (FCM) untuk Identifikasi Pembicara. Selain itu, model yang dihasilkan diharapkan dapat digunakan untuk mengembangkan sistem identifikasi yang bersifat tertutup dan bergantung pada teks. TINJAUAN PUSTAKA Jenis Pengenalan Pembicara Menurut Campbell (1997), pengenalan pembicara berdasarkan jenis aplikasinya dibagi menjadi: 1. Identifikasi pembicara adalah proses mengenali seseorang berdasarkan suaranya. Identifikasi pembicara dibagi dua, yaitu: Identifikasi tertutup (closed-set identification) di mana suara masukan yang akan dikenali merupakan bagian dari sekumpulan suara pembicara yang telah terdaftar atau diketahui. Identifikasi terbuka (open-set identification) di mana suara masukan boleh tidak ada pada kumpulan suara pembicara yang telah terdaftar 2. Verifikasi pembicara adalah proses menerima atau menolak permintaan identitas dari seseorang berdasarkan suaranya. Pengenalan pembicara berdasarkan aspek kebahasaan dibagi menjadi dua (Ganchev 2005), yaitu: 1. Pengenalan pembicara bergantung teks yang mengharuskan pembicara untuk mengucapkan kata atau kalimat yang sama baik pada pelatihan maupun pengujian. 2. Pengenalan pembicara bebas teks yang tidak mengharuskan pembicara untuk mengucapkan kata atau kalimat yang sama baik pada pelatihan maupun pengujian. Dijitalisasi Gelombang Suara Suara adalah gelombang longitudinal yang merambat melalui medium. Medium atau zat perantara ini dapat berupa zat cair, padat, atau gas. Manusia mendengar bunyi saat gelombang bunyi, yaitu getaran di udara atau medium lain, sampai ke gendang telinga manusia. Gelombang suara merupakan gelombang analog, sehingga agar dapat diolah dengan peralatan elektronik, gelombang suara harus direpresentasikan dalam bentuk dijital. Proses mengubah masukan suara dari gelombang analog menjadi representasi data dijital disebut digitalisasi suara. Proses dijitalisasi suara terdiri dari dua tahap yaitu sampling dan kuantisasi (Jurafsky & Martin 2000). Sampling adalah proses pengambilan nilai setiap jangka waktu tertentu. Nilai ini menyatakan amplitudo (besar/kecilnya) volume suara pada saat itu. Hasilnya adalah sebuah vektor yang menyatakan nilai-nilai hasil sampling. Panjang vektor data ini tergantung pada panjang atau lamanya suara yang didijitalisasikan serta sampling rate yang digunakan pada proses dijitalisasinya. Sampling rate itu sendiri adalah banyaknya nilai yang diambil setiap detik. Sampling rate yang biasa digunakan adalah 8000 Hz dan Hz (Jurafsky & Martin 2000). Hubungan antara panjang vektor data yang dihasilkan dengan sampling rate dan panjangnya data suara yang didijitalisasikan dapat dinyatakan secara sederhana sebagai berikut: S = F s * T, dengan S = panjang vektor, F s = sampling rate yang digunakan (Hertz), T = panjang suara (detik). Setelah melalui tahap sampling, proses dijitalisasi suara selanjutnya adalah kuantisasi yaitu menyimpan nilai amplitudo ini ke dalam representasi nilai 8 bit atau 16 bit (Jurafsky & Martin 2000). Signal to Noise Ratio (SNR) Signal-to-noise ratio (yang biasa disingkat menjadi SNR atau S/N) adalah suatu konsep yang mendefinisikan perbandingan antara kekuatan sinyal dengan kekuatan noise yang merusak sinyal. Secara sederhana, signal-to-noise ratio membandingkan level dari sinyal yang diinginkan (seperti suara piano dalam suatu konser) dengan level dari sinyal yang tidak diinginkan (seperti suara orang yang bercakap-cakap dalam suatu konser). Semakin kecil nilai SNR, semakin tinggi pengaruh noise dalam merusak sinyal asli. Secara umum, SNR didefinisikan sebagai berikut: 2 Psignal Asignal SNR = =, Pnoise Anoise dengan P adalah rata-rata dari daya (power) dan A adalah akar kuadrat rata-rata dari amplitudo. Pada umumnya, sinyal suara memiliki jangkauan dinamis yang sangat tinggi. Hal ini menyebabkan SNR akan lebih efisien jika diekspresikan dalam skala logarithmic decibel. Pada desibel, SNR didefinisikan sebagai 10 dikali logaritma dari

11 3 perbandingan daya. Jika sinyal dan noise dihitung dalam impedansi yang sama maka nilai SNR bisa didapatkan dengan menggunakan rumus berikut: Psignal ( ) SNR db = 10 log 10 Pnoise 20 Asignal log, 10 = Anoise sehingga semakin kecil nilai SNR dalam desibel, semakin tinggi pengaruhnya dalam merusak sinyal asli. Ekstraksi Ciri Sinyal Suara Sinyal suara merupakan sinyal bervariasi yang diwaktukan dengan lambat atau biasa disebut quasi-stationary (Do 1994). Ketika diamati dalam jangka waktu yang sangat pendek (5-100 ms), karakteristiknya hampir sama. Namun, dalam jangka waktu yang panjang (0,2 detik atau lebih) karakteristik sinyal berubah dan merefleksikan perbedaan sinyal suara yang diucapkan. Oleh karena itu, digunakan spektrum waktu pendek (short-time spectral analysis) untuk mengkarakterisasi sinyal suara. Beberapa fitur yang biasa digunakan antara lain Linear Predictive Coding, Perceptual Linear Prediction, dan Mel-Frequency Cepstrum Coefficients. MFCC (Mel-Frequency Cepstrum Coefficients) MFCC didasarkan pada variasi yang telah diketahui dari jangkauan kritis telinga manusia dengan frekuensi. Filter dipisahkan secara linear pada frekuensi rendah dan logaritmik pada frekuensi tinggi. Hal ini telah dilakukan untuk menangkap karakteristik penting dari sinyal suara. Tujuan utama MFCC adalah untuk meniru perilaku telinga manusia. Selain itu MFCC telah terbukti bisa menyebutkan variasi dari gelombang suara itu sendiri. Diagram blok dari proses MFCC dapat dilihat pada Gambar 1. Gambar 1 Diagram blok dari proses MFCC (Do 1994) Penjelasan tiap tahapan pada proses MFCC sebagai berikut (Do 1994): 1. Frame Blocking. Pada tahap ini sinyal suara (continous speech) dibagi ke dalam frame-frame. Tiap frame terdiri dari N sampel. 2. Windowing. Proses selanjutnya adalah melakukan windowing pada tiap frame untuk meminimalkan diskontinuitas sinyal pada awal dan akhir tiap frame. Konsepnya adalah meminimisasi distorsi spektral dengan menggunakan window untuk memperkecil sinyal hingga mendekati nol pada awal dan akhir tiap frame. Jika window didefinisikan sebagai w(n), 0 n N-1, dengan N adalah banyaknya sampel tiap frame, maka hasil dari windowing adalah sinyal dengan persamaan: Y t (n)=x 1 (n)w(n), 0 n N-1. Pada umumnya, window yang digunakan adalah hamming window, dengan persamaan: w(n)= cos(2πn/n-1), 0 n N Fast Fourier Transform (FFT). Tahap ini mengkonversi tiap frame dengan N sampel dari time domain menjadi frequency domain. FFT adalah suatu algoritma untuk mengimplementasikan Discrete Fourier Transform (DFT) yang didefinisikan pada himpunan N sampel {x n } sebagai berikut: N 1 2π jkn/ N X n = x e, n = 0,1,2,..., N 1 k= 0 k, j digunakan untuk menotasikan unit imajiner, yaitu j = 1. Secara umum X n adalah bilangan kompleks. Barisan {X n } yang dihasilkan diartikan sebagai berikut: frekuensi nol berkorespondensi dengan n = 0, frekuensi positif 0 < f < F s /2 berkorespondensi dengan nilai 1 n N/2-1, sedangkan frekuensi negatif F s /2 < f < 0 berkorespondensi dengan N/2+1 < n < N-1. Dalam hal ini Fs adalah sampling frequency. Hasil yang didapatkan dalam tahap ini biasa disebut dengan spektrum sinyal atau periodogram. 4. Mel-frequency Wrapping. Studi psikofisik menunjukkan bahwa persepsi manusia terhadap frekuensi sinyal suara tidak berupa skala linear. Oleh karena itu, untuk

12 4 setiap nada dengan frekuensi aktual f (dalam Hertz), tinggi subjektifnya diukur dengan skala mel. Skala mel-frequency adalah selang frekuensi di bawah 1000 Hz dan selang logaritmik untuk frekuensi di atas 1000 Hz, sehingga pendekatan berikut dapat digunakan untuk menghitung melfrequency untuk frekuensi f dalam Hz: Mel(f) = 2595*log 10 (1+f/700). 5. Cepstrum. Langkah terakhir, konversikan log mel spectrum ke domain waktu. Hasilnya disebut mel frequency cepstrum coefficients. Representasi cepstral spektrum suara merupakan representasi properti spektral lokal yang baik dari suatu sinyal untuk analisis frame. Mel spectrum coefficients (dan logaritmanya) berupa bilangan real, sehingga dapat dikonversikan ke domain waktu dengan menggunakan Discrete Cosine Transform (DCT). Fuzzy C-Means (FCM) Menurut Jang et al. (1997), Fuzzy C-Means merupakan algoritma clustering data di mana setiap titik data masuk dalam sebuah cluster dengan ditandai oleh derajat keanggotaan. FCM membagi sebuah koleksi dari n data vektor x j (j=1, 2,, n) menjadi c cluster, dan menemukan sebuah pusat cluster (center) untuk tiap kelompok dengan meminimalisasi ukuran dari fungsi objektif. Pada FCM hasil dari clustering adalah sebuah titik data dapat menjadi anggota untuk beberapa cluster yang ditandai oleh derajat keanggotaannya antara 0 dan 1. Berikut tahapan clustering menggunakan algoritma FCM: 1. Inisialisasi keanggotaan matriks U yang berisi derajat keanggotan terhadap cluster dengan nilai antara 0 dan 1, sehingga c i= 1 uij = 1, j = 1,..., n. 2. Penghitungan c sebagai pusat cluster, c i, i = 1,, c dengan menggunakan c n j= 1 i = n (( u ) j= 1 ij ij m ( u ) 3. Penghitungan fungsi objektif (J i ): c c n J ( U, c1,..., cc ) = J i = i= 1 i= 1 j x m j ). m 2 u ij d ij di mana: u ij adalah elemen matriks U yang bernilai antara 0 dan 1, d ij = c i - x j adalah jarak antara pusat cluster ke-i dan titik data ke-j, c i adalah pusat cluster ke-i, m [1, ] adalah parameter fuzzifikasi. Nomalnya, nilai m berada pada selang [1.25,2] (Cox 2005). Kemudian kondisi berhenti dicek: Jika ( J t J t-1 < nilai toleransi terkecil yang diharapkan) atau (t > maksimal iterasi) maka proses berhenti. Jika tidak : t = t Sebelum perhitungan diulangi kembali dari langkah 2, matriks U baru dihitung terlebih dahulu menggunakan formula berikut : u ij = c d k = 1 d Jaringan Saraf Tiruan 1 ij kj. 2 ( m 1 ) Jaringan saraf tiruan diinspirasi oleh cara kerja otak manusia dimana untuk berpikir, otak manusia mendapat rangsangan dari neuron-neuron yang terdapat pada indera manusia, kemudian hasil rangsangan tersebut diolah sehingga menghasilkan suatu informasi. Pada komputer, masukan yang diberikan diumpamakan sebagai neuronneuron dimana masukan tersebut dikalikan dengan suatu nilai dan kemudian diolah dengan fungsi tertentu untuk menghasilkan suatu keluaran. Pada saat pelatihan, pemasukan tersebut dilakukan berulang-ulang hingga dicapai keluaran seperti yang diinginkan. Setelah proses pelatihan, diharapkan komputer dapat mengenali suatu masukan baru berdasarkan data yang telah diberikan pada saat pelatihan. Dibandingkan dengan teknologi lainnya, pendekatan komputasi menggunakan jaringan saraf tiruan untuk beberapa bidang aplikasi jauh lebih baik dan dapat mempersingkat waktu. Kekuatan jaringan saraf tiruan ini dapat digunakan untuk aplikasi seperti pemrosesan sinyal kontrol, pengenalan pola, kesehatan, dan pengenalan suara (Fausett 1994).

13 5 Probabilistic Neural Network Probabilistic Neural Network diperkenalkan oleh Donald F. Specht tahun 1990 dalam tulisannya berjudul Probabilistic Neural Network yang merupakan penyempurnaan ide-ide sebelumnya yang telah dilakuannya sejak tahun Probabilistic Neural Network dirancang berdasarkan ide dari teori probabilitas klasik yaitu Bayesian dan estimator pengklasifikasi Parzen untuk Probability Density Function. Dengan menggunakan pengklasifikasi Bayesian dapat ditentukan bagaimana sebuah data masukan diklasifikasi sebagai anggota suatu kelas dari beberapa kelas yang ada, yaitu yang mempunyai nilai maksimum pada kelas tersebut. Adapun struktur dari PNN ini dapat dilihat pada Gambar 2, yang terdiri atas empat layer yaitu input layer, pattern layer, summation layer, dan decision layer. Dengan menerima vektor tes x dari input layer, keluaran dari pattern layer dapat dihitung melalui persamaan sebagai berikut : d x ( ) j xih f x = k, j= 1 hj dengan : d = dimensi vektor, z k(z) = e, x j = vektor input kolom ke-j, x ij = vektor bobot baris ke-i kolom ke-j, h j = smoothing parameter (a simpangan baku ke-j n 1/5 ). Di sisi lain, untuk summation layer dihitung dengan persamaan sebagai berikut : n 1 d x ( ) = ( ) nj xij p x = Πk, d / 2 j 1 2π h h h dn i= 1 h j dengan n adalah banyaknya observasi. Suatu vektor tes x diklasifikasikan pada desicion layer sebagai kelas Y jika nilai D Y (x) paling besar untuk kelas Y. Gambar 2 Struktur Probabilistic Neural Network (Ganchev 2005) METODE PENELITIAN Pada model yang akan dikembangkan ini, proses identifikasi terdiri atas dua fase, yaitu fase pelatihan dan fase pengujian. Pada fase pelatihan, contoh suara dari setiap pembicara dikumpulkan dan kemudian akan di-clusterkan menggunakan FCM. Hasil peng-clusteran ini lah yang akan digunakan sebagai data pelatihan pada PNN. Di sisi lain, pada fase pengujian diberikan contoh data suara hasil perekaman untuk diketahui pemilik suara tersebut. Untuk lebih jelasnya, kedua fase tersebut dapat dilihat pada Gambar 3. Gambar 3 Blok diagram sistem identifikasi pembicara

14 6 Data Suara Data yang digunakan pada penelitian ini adalah gelombang suara yang telah didijitasi dan direkam dari 10 pembicara (yang selanjutnya disebut dengan data suara model), yaitu 5 pembicara laki-laki dan 5 pembicara perempuan dengan rentang usia tahun. Masing-masing pembicara diambil suaranya dalam jangka waktu yang sama dan tanpa pengarahan (unguided). Yang dimaksud tanpa pengarahan adalah pembicara dapat menggunakan cara pengucapan, intonasi, dan logat apapun pada saat merekam data. Jenis identifikasi pembicara yang dilakukan bersifat bergantung pada teks, maka kata yang diucapkan baik untuk pelatihan maupun pengujian telah ditentukan yaitu komputer. Kata tersebut diucapkan sebanyak 60 kali oleh setiap pembicara, sehingga terdapat 600 file data. Di samping itu, diperlukan juga data ber-noise dengan jumlah yang sama untuk mengetahui pengaruh noise terhadap akurasi model yang dikembangkan. Selain itu, untuk menguji model yang dikembangkan terhadap identifikasi tertutup, maka dibutuhkan data tambahan yang berasal dari pembicara lainnya sebanyak 6 pembicara (yang selanjutnya disebut data suara nonmodel). Pada penelitian ini untuk melihat proporsi terbaik dengan jumlah data yang sama akan dicobakan 3 kombinasi proporsi pembagian data pelatihan dan data pengujian. Kombinasi ini juga dipakai untuk data yang diberi tambahan noise. Kombinasi proporsi tersebut dapat dilihat pada Tabel 1. Tabel 1 Kombinasi pembagian data pengujian dan data pelatihan setiap suara model untuk jumlah data yang sama Data pelatihan Data pengujian Jenis data Data asli Data dengan SNR 30 db Data dengan SNR 20 db Selain itu, untuk melihat pengaruh banyaknya proporsi data pelatihan terhadap tingkat akurasi model yang dihasilkan akan dicobakan 3 kombinasi proporsi pembagian data pelatihan. Kombinasi ini juga dipakai untuk data yang diberi tambahan noise. Kombinasi proporsi tersebut dapat dilihat pada Tabel 2. Tabel 2 Kombinasi proporsi data pelatihan dengan jumlah data pengujian yang sama untuk setiap suara model Data pelatihan Data pengujian Jenis data Data asli Data dengan SNR 30 db Data dengan SNR 20 db Ekstraksi Ciri Sinyal Suara dengan MFCC Ekstraksi ciri sinyal suara pada penelitian ini menggunakan MFCC. Pada implementasi MFCC ini, kecuali tahap frame blocking, digunakan fungsi dari Auditory Toolbox yang dikembangkan oleh Slanley pada tahun Fungsi ini menggunakan lima parameter, yaitu: 1. Input yaitu masukan suara yang berasal dari tiap pembicara. 2. Sampling rate yaitu banyaknya nilai yang diambil dalam satu detik. Dalam penelitian ini digunakan sampling rate sebesar Hz. 3. Time frame yaitu waktu yang diinginkan untuk satu frame (dalam milidetik). Time frame yang digunakan adalah 30 ms. 4. Lap yaitu overlaping yang diinginkan (harus kurang dari satu). Lap yang digunakan sebesar Cepstral coefficient yaitu jumlah cepstrum yang diinginkan sebagai output. Cepstral coefficient yang digunakan sebanyak 13. Setiap data suara dari setiap pembicarakan dibagi menjadi 66 frame dimana masing-masing frame berukuran 30 ms dengan overlap 50%. Hasil dari ekstraksi ciri ini merupakan masukan bagi model yang akan dikembangkan, yaitu PNN bertingkat menggunakan FCM.

15 7 Probabilistic Neural Network Bertingkat Menggunakan Fuzzy C-Means (FCM) Pada model yang akan dikembangkan ini, data untuk pelatihan dari masing-masing pembicara (data suara model) di-cluster-kan menggunakan Fuzzy C-Means (FCM), dengan parameter FCM yang akan dicobakan adalah: - Banyaknya cluster = 3, - Error terkecil yang diharapkan = , - Pangkat pembobot = 2, - Maksimum iterasi = 100. Kemudian, data setiap cluster yang terbentuk akan digunakan oleh PNN sebagai data setiap kelas. Pada bagian lain, input layer pada PNN merupakan matriks berukuran 13 x 66 yang berasal dari suara pembicara yang akan diidentifikasi yang telah mengalami proses analisis fitur suara. Pada pattern layer, dilakukan perhitungan dengan persamaan sebagai berikut : f ( x) dengan : d = dimensi vektor, d x j x = Π k j= 1 hj ij, z k(z) = e, x j = vektor input kolom ke-j, x ij = vektor bobot baris ke-i kolom ke-j, h ij = smoothing parameter (a simpangan baku ke-j n 1/5 ). Setiap keluaran dari pattern layer akan dijumlahkan dengan keluaran dari pattern layer lainnya yang satu kelas, di mana banyaknya kelas dalam penelitian ini adalah banyaknya cluster yang terbentuk dari 10 orang pembicara (data suara model). Proses ini termasuk dalam summation layer yang dihitung melalui persamaan sebagai berikut : n 1 d x ( ) ( ) = nj xij p x = Πk. d / 2 j 1 2π h h h dn i= 1 h j Dari summation layer inilah akan diperoleh nilai terbesar untuk suatu kelas. Nilai terbesar ini mencerminkan bahwa suara yang diujikan diidentifikasi sebagai pembicara kelas tersebut. Untuk lebih jelasnya, struktur Probabilistic Neural Network bertingkat menggunakan Fuzzy C-Means (FCM) dapat dilihat pada Gambar 4. Gambar 4 Struktur Probabilistic Neural Network Bertingkat Hasil Identifikasi Hasil identifikasi merupakan bagian akhir dari identifikasi pembicara yang berupa identifikasi pemilik suara berdasarkan input suara yang diujikan. Identifikasi yang dimaksud adalah apakah suara yang diujikan diidentifikasi sebagai pembicara 1, 2, 3, 4, 5, 6, 7, 8, 9, atau 10. Selain itu, dari hasil identifikasi ini juga dapat dihitung tingkat keberhasilan dari model. Tingkat keberhasilan model ini dapat dilihat dari besarnya tingkat akurasi identifikasi yang dihasilkan oleh model. Tingkat akurasi dihitung sebagai rasio antara jumlah data pembicara yang diidentifikasi secara benar dengan jumlah seluruh data pembicara yang diujikan.

16 8 Penggunaan Threshold Nilai threshold ini digunakan untuk melakukan seleksi yang lebih akurat dari hasil identifikasi setiap suara. Nilai threshold dari tiap pembicara berfungsi sebagai ambang batas nilai keluaran yang diterima untuk dapat diidentifikasikan sebagai pembicara tersebut. Apabila suatu data uji memiliki nilai terbesar pada suatu kelas, maka data uji tersebut tidak langsung diidentifikasi sebagai pembicara yang memiliki kelas tersebut, tetapi akan dilakukan pembandingan, yaitu pembandingan antara nilai keluaran terbesar pada suatu kelas untuk suatu data uji dengan nilai threshold suatu kelas di mana data uji tersebut memiliki nilai keluaran paling besar di kelas tersebut dibandingkan kelas lainnya. Jika nilainya lebih besar dari nilai threshold, maka suara yang diujikan diidentifikasi sebagai pembicara dari kelas tersebut. Sebaliknya jika lebih kecil, maka suara tersebut diidentifikasikan sebagai pembicara 0 (tidak terdaftar). Lingkungan Pengembangan Perangkat keras yang digunakan adalah microphone jenis headset dan komputer personal dengan prosesor AMD Duron 800 MHz, RAM sebesar 256 MB, serta kapasitas harddisk sebesar 40 GB. Sistem operasi yang digunakan adalah Windows XP Profesional. Perangkat lunak yang digunakan adalah Matlab dan untuk MFCC digunakan beberapa fungsi dari Auditory Toolbox. HASIL DAN PEMBAHASAN Data Suara Data suara yang digunakan berasal dari suara 10 orang pembicara (data suara model) yang direkam menggunakan fungsi wavrecord pada Matlab, dan disimpan menjadi file berekstensi WAV. Karena jenis pengenalan pembicara pada penelitian ini bersifat bergantung pada teks, maka setiap pembicara mengucapkan kata yang sama, yaitu komputer sebanyak 60 kali sehingga didapat 600 data suara. Setiap suara diambil tanpa pengarahan (unguided) dengan sampling rate Hz dan direkam selama 1 detik, yang kemudian masing-masing akan menghasilkan ukuran file 31,2 KB. Untuk mendapatkan data yang diberi noise secara manual, data hasil perekaman (sebanyak 600 file) disalin sebanyak dua kali, sehingga akan didapat 1200 file data hasil salinan. Kemudian, data suara hasil salinan tersebut, yaitu salinan pertama dan salinan kedua, masing-masing akan ditambahkan noise sesuai dengan besarnya SNR menggunakan fungsi awgn pada Matlab. Pada penelitian ini, besarnya SNR yang akan ditambahkan sebesar 20 db dan 30 db. Dengan demikian, total seluruh data suara yang didapat sebanyak 1800 file, yaitu 600 file data suara asli dan 600 file data suara yang dengan SNR sebesar 20 db dan 600 file data suara yang dengan SNR sebesar 30 db. Selain itu, untuk menguji model yang dikembangkan terhadap identifikasi tertutup, maka dibutuhkan data tambahan yang berasal dari pembicara lainnya (data suara nonmodel) yang diperoleh dengan cara yang sama sebagaimana yang telah dijelaskan sebelumnya. Pada penelitian ini, data suara non-model diambil dari 6 pembicara, di mana suara masing-masing pembicara direkam sebanyak lima kali. Praproses dengan MFCC Implementasi MFCC ini, kecuali tahap frame blocking, digunakan fungsi dari Auditory Toolbox yang dikembangkan oleh Slanley pada tahun Setiap data suara akan dibagi menjadi frame berukuran masing-masing 30 ms dengan overlap 50%, dengan demikian akan dihasilkan 66 frame. Hasil dari analisis fitur suara MFCC ini adalah 13 koefisien mel cepstrum untuk masing-masing frame. Pemilihan nilai time frame, lap, dan cepstral coefficient berturutturut sebesar 30 ms, 0.5, dan 13 didasarkan pada penelitian sebelumnya yang dilakukan Mandasari (2005) dan Purnamasari (2006). Dari hasil praproses ini, maka setiap data berubah dari matriks yang berukuran x 1 menjadi matriks 13 x 66. Hasil ini merupakan masukan untuk PNN. Probabilistic Neural Network Bertingkat Menggunakan Fuzzy C-Means (FCM) Untuk meng-cluster-kan data yang telah diekstraksi dengan MFCC digunakan Fuzzy C-Means (FCM). Pada awalnya banyaknya cluster untuk setiap data pembicara ditentukan sebanyak tiga cluster sesuai dengan batasan penelitian ini, tetapi apabila pada saat peng-cluster-an data suatu pembicara terdapat cluster dengan jumlah anggota cluster sebanyak 0, maka data pembicara tersebut akan di-cluster-kan dengan jumlah cluster sebanyak dua. Hasil peng-cluster-an baik untuk data asli, data yang ditambah noise dengan SNR 30 db, maupun data yang ditambah noise dengan

17 9 SNR 20 db untuk 20 data pelatihan, 30 data pelatihan, dan 40 data pelatihan dapat dilihat pada Lampiran 1 s.d Lampiran 6. Pada bagian lain, input bagi Probabilistic Neural Network merupakan data suara pelatihan dan data suara pengujian yang telah mengalami proses ekstraksi ciri sinyal suara dengan MFCC. Pada bagian pelatihan, data suara yang digunakan merupakan data dari setiap pembicara yang telah di-cluster-kan sebelumnya menggunakan Fuzzy C-Means. Cluster- cluster yang terbentuk ini lah yang akan menjadi kelas pada PNN. Pada penelitian ini, untuk menghitung nilai smoothing parameter (h = a simpangan baku ke-j n 1/5 ), akan dicobakan beberapa nilai a untuk mendapatkan model yang paling optimal untuk setiap proporsi data pelatihan yang berbeda. Pada bagian pattern layer akan dilakukan perhitungan antara data pelatihan dan data pengujian. Kemudian hasil dari pattern layer ini akan dijumlahkan dengan hasil pattern layer lainnya yang satu kelas. Proses penjumlahan ini terjadi pada bagian summation layer. Selanjutnya, dari summation layer ini lah diperoleh nilai terbesar untuk suatu kelas. Pemilihan Nilai Smoothing Parameter Tingkat akurasi model yang dikembangkan dengan nilai smoothing parameter yang berbeda dapat dilihat pada Lampiran 7 s.d Lampiran 9. Dari Lampiran 7 dapat dilihat untuk model yang menggunakan data asli dengan banyaknya data pelatihan sebesar 20 memiliki tingkat akurasi maksimum dengan memilih nilai a sebesar 8.3. Di sisi lain, model dengan banyaknya data pelatihan sebesar 30 memiliki tingkat akurasi maksimum dengan memilih nilai a yang berada pada selang [7.8,8.1] atau pada selang [10.5,11]. Model dengan banyaknya data pelatihan sebesar 40 memiliki tingkat akurasi maksimum dengan memilih nilai a yang berada pada selang [7.6,13.4]. Di sisi lain, untuk model yang menggunakan data dengan SNR sebesar 30 db, tingkat akurasi maksimum untuk data pelatihan sebanyak 20 didapat dengan memilih nilai a yang berada pada selang [11.4,11.6]. Model dengan banyaknya data pelatihan sebesar 30 memiliki tingkat akurasi maksimum dengan memilih nilai a yang berada pada selang [2.1,4.5], dan model dengan banyaknya data pelatihan sebesar 40 memiliki tingkat akurasi maksimum dengan memilih nilai a yang berada pada selang [2.1,5.2], sebagaimana yang terlihat pada Lampiran 8. Untuk model yang menggunakan data dengan SNR sebesar 20 db, tingkat akurasi yang dihasilkan dengan nilai smoothing parameter yang berbeda dapat dilihat pada Lampiran 9. Dari lampiran tersebut dapat dilihat bahwa model dengan banyaknya data pelatihan sebesar 20 memiliki tingkat akurasi maksimum dengan memilih nilai a yang berada pada selang [12.7,12.9] atau pada selang [13.5,14.3]. Di sisi lain, model dengan banyaknya data pelatihan sebesar 30 memiliki tingkat akurasi maksimum dengan memilih nilai a sebesar 8.4, sedangkan banyaknya data pelatihan sebesar 40 memiliki tingkat akurasi maksimum dengan nilai a yang berada pada selang [6.1,6.9] atau pada selang [9.9,10.5]. Hasil Identifikasi Menggunakan Nilai Smootihng Parameter yang Telah Dipilih Hasil identifikasi terkait erat dengan decision layer pada Probabilistic Neural Network. Dari decision layer akan diperoleh nilai maksimum untuk suatu kelas. Nilai terbesar ini mencerminkan bahwa suara yang diujikan diidentifikasi sebagai pembicara kelas tersebut. Setelah melalui Probabilistic Neural Network dapat diketahui identitas pemilik suara yang diujikan. Identitas yang dimaksud adalah apakah sebagai pembicara 1, 2, 3, 4, 5, 6, 7, 8, 9, atau pembicara 10. Hasil Identifikasi dengan nilai smoothing parameter yang telah dipilih untuk semua model dapat dilihat pada Lampiran 10 s.d Lampiran 18. Dari lampiran tersebut, dapat dihitung tingkat akurasi masing-masing model dengan cara yang telah dipaparkan sebelumnya. Pada Tabel 3 diberikan tingkat akurasi untuk setiap model dengan jumlah data yang sama, dan pada Tabel 4 diberikan tingkat akurasi untuk setiap model dengan data pengujian yang sama. Tabel 3 Tingkat akurasi setiap model dengan jumlah data yang sama Banyak Data Pelatihan Banyak Data Pengujian Tingkat Akurasi (%) Jenis Data Data asli

18 10 Tingkat akurasi (%) Pembicara 20 Pelatihan 30 Pelatihan 40 Pelatihan Gambar 5 Perbandingan tingkat akurasi setiap pembicara pada model yang menggunakan data asli Tabel 3 Lanjutan disebabkan gaya berbicara yang tidak sama setiap pengambilan data. Banyak Banyak Tingkat Dilihat dari tingkat akurasi yang Jenis Data Data Akurasi dihasilkan untuk jumlah data yang sama Data Pelatihan Pengujian (%) dengan menggunakan jenis data asli, model dengan banyaknya pelatihan sebesar 40 dan Data banyaknya pengujian sebesar 10 memiliki dengan tingkat akurasi tertinggi apabila SNR dibandingkan dengan proporsi lainnya pada db jenis data asli. Untuk jenis data lainnya pun Data dapat dilihat proporsi terbaik berdasarkan dengan tingkat akurasi yang dihasilkan, sebagaimana SNR yang terlihat pada Gambar 6. db Selain itu untuk melihat pengaruh Tabel 4 Tingkat akurasi setiap model dengan banyaknya data pelatihan, pada Gambar 7 data pengujian yang sama. diberikan hasil tingkat akurasi untuk masingmasing proporsi data pelatihan yang berbeda. Banyak Banyak Tingkat Jenis Dari Gambar 7 terlihat bahwa semakin Data Data Akurasi Data banyak data pelatihan maka tingkat akurasi Pelatihan Pengujian (%) juga akan semakin tinggi Data asli Data dengan SNR 30 db Data dengan SNR 20 db Berdasarkan hasil identifikasi yang dapat dilihat pada Lampiran 10 s.d Lampiran 12, tingkat akurasi setiap pembicara untuk proporsi yang berbeda dengan menggunakan data asli dapat dilihat Gambar 5. Dari gambar tersebut dapat dilihat bahwa tingkat akurasi tiap pembicara mengalami perubahan pada jumlah pelatihan yang berbeda. Perubahan ini Tingkat akurasi (%) Banyak data pelatihan Data asli Dengan SNR 30 Dengan SNR 20 Gambar 6 Perbandingan tingkat akurasi untuk setiap model dengan jumlah data yang sama

19 11 Tingkat akurasi (%) Banyak data pelatihan Data asli Dengan SNR 30 Dengan SNR 20 Gambar 7 Perbandingan tingkat akurasi antara data yang ditambahkan SNR dengan data asli. Pengaruh penambahan SNR dapat dilihat pada Gambar 6 dan Gambar 7. Dari kedua gambar tersebut terlihat bahwa semakin kecil nilai SNR yang diberikan mengakibatkan tingkat akurasi semakin mengecil. Hal ini terjadi karena dengan semakin mengecilnya nilai SNR, maka kekuatan noise dalam merusak sinyal semakin besar. Pengaruh Penggunaan Threshold Untuk melihat pengaruh threshold pada model yang telah dikembangkan, penggunaan threshold hanya akan dicobakan pada model PNN yang optimal atau memiliki tingkat akurasi tertinggi, yaitu model yang menggunakan data asli dengan data pelatihan sebanyak 40. Nilai threshold untuk tiap pembicara akan diambil dari 40 data pelatihan (data ke-1 s.d data ke-40 dari 60 data untuk setiap pembicara). Data keluaran yang diidentifikasi dari setiap kelas dari masing-masing pembicara dikumpulkan, lalu disimpan dalam suatu matriks. Dari matriks tersebut kemudian diambil nilai minimum untuk setiap pembicara yang diwakili oleh beberapa kelas. Nilai keluaran minimum tersebut adalah nilai yang digunakan sebagai threshold untuk setiap pembicara. Pada Lampiran 19 diberikan nilai threshold untuk masing-masing pembicara. Pada Tabel 5 dapat dilihat pengaruh threshold pada hasil identifikasi 40 data pelatihan untuk 10 data pengujian pada data asli. Di sisi lain, dari Tabel 6 dapat dilihat pengaruh penggunaan threshold apabila data pengujian yang digunakan berasal dari pembicara non-model. Perbandingan tingkat akurasi antara model yang menggunakan threshold dan dengan model yang tidak menggunakan threshold untuk 40 data pelatihan pada data asli dapat dilihat pada Gambar Dengan threshold Tanpa threshold Gambar 8 Perbandingan tingkat akurasi model dengan menggunakan threshold dan dengan model yang tidak menggunakan threshold Tabel 5 Hasil identifikasi 40 data pelatihan untuk 10 data pengujian pada data asli dengan menggunakan threshold Pembicara Diidentifikasi Sebagai Pembicara Tingkat akurasi (%)

20 12 Tabel 6 Hasil identifikasi 40 data pelatihan untuk 30 data pengujian non-model pada data asli dengan menggunakan threshold Pembicara NonModel Diidentifikasi Sebagai Pembicara Tingkat akurasi (%) KESIMPULAN DAN SARAN Kesimpulan Dari penelitian yang telah dilakukan, diperoleh suatu model Probabilistic Neural Network Bertingkat Menggunakan Fuzzy C- Means (FCM) untuk Identifikasi Pembicara. Tingkat akurasi dengan jumlah data yang sama untuk model yang menggunakan data asli mencapai nilai tertinggi pada proporsi data dengan 40 data pelatihan dan 10 data pengujian, yaitu sebesar 96%. Di sisi lain, tingkat akurasi untuk model yang menggunakan data dengan tambahan SNR sebesar 30 db mencapai nilai tertinggi pada proporsi data dengan 40 data pelatihan dan 10 data pengujian, yaitu sebesar 89%. Tingkat akurasi untuk model yang menggunakan data dengan tambahan SNR sebesar 20 db mencapai nilai tertinggi pada proporsi data dengan 30 data pelatihan dan 20 data pengujian, yaitu sebesar 60%. Di samping itu, tingkat akurasi antara model yang menggunakan threshold dan model yang tidak menggunakan threshold pun berbeda. Pada model yang menggunakan data asli dan tanpa threshold untuk 40 data pelatihan dan 20 data pengujian yang dikenal tingkat akurasi sebesar 96%, sedangkan untuk model yang menggunakan threshold tingkat akurasi sebesar 91%. Untuk pembicara yang tidak dikenal (30 data penngujian) tingkat akurasi tanpa threshold dengan 40 pelatihan sebesar 80%. Saran Pada penelitian ini, model yang dikembangkan belum cukup mampu menangani identifikasi pembicara dengan suara yang ber-noise cukup tinggi. Oleh karena itu, untuk penelitian selanjutnya disarankan untuk mencoba suatu metode ekstraksi ciri suara yang telah terbukti mampu memisahkan antara suara asli dari seorang pembicara dan noise yang merusak suara tersebut. DAFTAR PUSTAKA Campbell, Jr JP Speaker Recognition: A Tutorial. Proceeding IEEE, Vol 85 No.9, hal , September Cox, E Fuzzy Modelling and Genetic Algorithms for Data Mining and Exploration. USA: Academic Press. Do MN Digital Signal Processing Mini-Project: An Automatic Speaker Recognition System. Audio Visual Communications Laboratory, Swiss Federal Institute of Technology, Laussanne, Switzerland. ject.pdf [12 Juli 2006]. Fausett L Fundamentals of Neural Networks Architectures, Algorithm, and Applications. New Jersey: Prentice Hall. Ganchev, TD Speaker Recognition[Tesis]. Greece: Wire Communication Laboratory, Department of Computer and Electrical Engineering, University of Patras. v_phdthesis.pdf [16 November 2006]. Jang JSR, Sun CT, Mizutani Eiji Neuro-Fuzzy and Soft Computing. London: Prentice-Hall International, Inc. Jurafsky D, Martin JH Speech and Language Processing An Introduction to Natural Language Processing, Computational Linguistic, and Speech Recognition. New Jersey: Prentice Hall. Mandasari Y Pengembangan Model Markov Tersembunyi untuk Pengenalan kata Berbahasa Indonesia [Skripsi]. Bogor: Departemen Ilmu Komputer

21 13 Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Purnamasari W Pengembangan Model Markov Tersembunyi Untuk Identifikasi Pembicara. [Skripsi]. Bogor: Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Sarimollaoglu M, Serhan D, Kamran I, Coskun B A Text-independent Speaker Identification System Using Probabilistic Neural Network. s/ccct_2004.pdf [19 September 2006].

22 LAMPIRAN 14

23 15 Lampiran 1 Hasil peng-cluster-an 20 data pelatihan Pembicara Cluster Cluster Cluster ke-1 ke-2 ke Lampiran 2 Hasil peng-cluster-an 30 data pelatihan Pembicara Cluster Cluster Cluster ke-1 ke-2 ke Lampiran 3 Hasil peng-cluster-an 20 data pelatihan dengan SNR 30dB Pembicara Cluster Cluster Cluster ke-1 ke-2 ke Lampiran 4 Hasil peng-cluster-an 30 data pelatihan SNR 30 db Pembicara Cluster ke-1 Cluster ke-2 Cluster ke Lampiran 5 Hasil peng-cluster-an 20 data pelatihan dengan 20 db Pembicara Cluster ke-1 Cluster ke-2 Cluster ke

24 16 Lampiran 6 Hasil peng-cluster-an 30 data pelatihan dengan 20 db Pembicara Cluster Cluster Cluster ke-1 ke-2 ke Lampiran 7 Tingkat akurasi model dengan nilai smoothing parameter yang berbeda pada data asli a Tingkat Akurasi (%) 20 data pelatihan 30 data pelatihan 40 data pelatihan

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti

Lebih terperinci

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar

Lebih terperinci

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar. BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun

Lebih terperinci

Karakteristik Spesifikasi

Karakteristik Spesifikasi Sinyal yang masuk difilter ke dalam sinyal frekuensi rendah (low-pass filter) dan sinyal frekuensi tinggi (high-pass filter) Lakukan downsampling pada kedua sinyal tersebut Low-pass frekuensi hasil downsampling

Lebih terperinci

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi

Lebih terperinci

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR PERNYATAAN

Lebih terperinci

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Vicky Zilvan, S.Kom. UPT LPSN - LIPI v_q1e@yahoo.com Furqon Hensan Muttaqien, S.Komp. P2 Informatika - LIPI fh.muttaqien@informatika.lipi.go.id

Lebih terperinci

PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS

PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER CLARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan

Lebih terperinci

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan

Lebih terperinci

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar PENDAHULUAN Latar Belakang Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia

Lebih terperinci

PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA. Oleh : WINI PURNAMASARI G

PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA. Oleh : WINI PURNAMASARI G PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA Oleh : WINI PURNAMASARI G64102051 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Genre Menurut Kamus Besar Bahasa Indonesia, genre adalah jenis, tipe, atau kelompok sastra atas dasar bentuknya. Jadi genre musik merupakan pengelompokan musik berdasarkan kemiripan

Lebih terperinci

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI SKRIPSI

Lebih terperinci

TINJAUAN PUSTAKA. Pengenalan Suara

TINJAUAN PUSTAKA. Pengenalan Suara Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi

Lebih terperinci

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN

Lebih terperinci

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang BAB 1 PENDAHULUAN 1.1 Latar Belakang Kecerdasan buatan (artificial intelligence) merupakan bidang yang berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang mengarah kepada bidang

Lebih terperinci

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker

Lebih terperinci

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,

Lebih terperinci

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi. SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik

Lebih terperinci

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: Perintah Suara Berbahasa Indonesia untuk Membuka dan Menutup Aplikasi dalam Sistem Operasi Windows Menggunakan Metode Mel Frequency Cepstrum Coefficient dan Metode Backpropagation Zakaria Ramadhan 1, Sukmawati

Lebih terperinci

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PENERAPAN LEARNING VECTOR QUANTIZATION

PENERAPAN LEARNING VECTOR QUANTIZATION PENERAPAN LEARNING VECTOR QUANTIZATION (LVQ) DAN EKSTRAKSI CIRI MENGGUNAKAN MEL- FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) UNTUK TRANSKRIPSI SUARA KE TEKS LAKSMI NIRMALA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS

Lebih terperinci

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad

Lebih terperinci

Jaringan Syaraf Tiruan pada Robot

Jaringan Syaraf Tiruan pada Robot Jaringan Syaraf Tiruan pada Robot Membuat aplikasi pengenalan suara untuk pengendalian robot dengan menggunakan jaringan syaraf tiruan sebagai algoritma pembelajaran dan pemodelan dalam pengenalan suara.

Lebih terperinci

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Agustini, Biometrik Suara Dengan Transformasi Wavelet 49 BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Ketut Agustini (1) Abstract: Biometric as one of identification or recognition

Lebih terperinci

BAB I PENDAHULUAN I.1 Latar Belakang

BAB I PENDAHULUAN I.1 Latar Belakang BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring

Lebih terperinci

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student

Lebih terperinci

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan

Lebih terperinci

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION DETECTION OF THE LEVEL OF YOUTH, ADULTS AND ELDERLY BY USING MFCC METHOD AND FUZZY

Lebih terperinci

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Oleh: Ahmad Irfan Abdul Rahman Tri Budi Santoso Titon Dutono Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi

Lebih terperinci

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM) Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM) Inggih Permana 1, Benny Sukma Negara 2 1 Universitas Sultan Sarif Kasim Riau 2 Universitas Sultan Sarif

Lebih terperinci

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV Marianus Hendra Wijaya 1), Linggo Sumarno 2) 1) Program Studi Teknik Elektro Fakultas Sains dan Teknologi Universtas Sanata Dharma Yogyakarta

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz

Lebih terperinci

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis

Lebih terperinci

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT DAN LINEAR VECTOR QUANTIZATION UNTUK PENGENDALIAN GERAK ROBOT Anggoro Wicaksono, Sukmawati NE, Satriyo Adhy,

Lebih terperinci

PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO

PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN 4.1. Pengujian Perangkat Lunak Dalam mengetahui perangkat lunak yang dibuat bisa sesuai dengan metode yang dipakai maka dilakukan pengujian terhadap masin-masing komponen perangkat.

Lebih terperinci

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR

Lebih terperinci

PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER

PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER MUTIA FIJRI TAUFANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi

Lebih terperinci

Bab 3. Perancangan Sistem

Bab 3. Perancangan Sistem 34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara

Lebih terperinci

BAB 2 LANDASAN TEORI. Pengenalan suara (voice recognition) dibagi menjadi dua jenis, yaitu

BAB 2 LANDASAN TEORI. Pengenalan suara (voice recognition) dibagi menjadi dua jenis, yaitu BAB 2 LANDASAN TEORI 2.1 Pengenalan Suara. Pengenalan suara (voice recognition) dibagi menjadi dua jenis, yaitu speech recognition dan speaker recognition. Speech recognition adalah proses yang dilakukan

Lebih terperinci

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, 121-132 121 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Aplikasi Pengenalan Ucapan Dengan Ekstraksi Ciri Mel- Frequency Cepstrum Coefficients

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Indonesia

BAB 1 PENDAHULUAN. Universitas Indonesia BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai

Lebih terperinci

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification Jurnal Telematika, vol. 11 no. 1, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari

Lebih terperinci

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION TUGAS AKHIR Diajukan Untuk Memenuhi Sebagian Persyaratan Dalam Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun oleh : PAULA

Lebih terperinci

Available online at TRANSMISI Website TRANSMISI, 13 (3), 2011,

Available online at TRANSMISI Website  TRANSMISI, 13 (3), 2011, Available online at TRANSMISI Website http://ejournal.undip.ac.id/index.php/transmisi TRANSMISI, 13 (3), 2011, 82-86 Research Article Aplikasi Pengenalan Ucapan dengan Ekstraksi Mel-Frequency Cepstrum

Lebih terperinci

BAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian

BAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian BAB III METODE PENELITIAN 3.1 Model Penelitian Penelitian yang dilakukan dapat dijelaskan melalui blok diagram seperti yang terlihat pada Gambar 3.1. Suara Burung Burung Kacer Burung Kenari Pengambil an

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Emosi Emosi adalah perasaan intens yang ditujukan kepada seseorang atau sesuatu dan juga merupakan reaksi terhadap seseorang atau kejadian.emosi dapat ditunjukkan ketika merasa

Lebih terperinci

INDEPT, Vol. 3, No.1, Februari 2013 ISSN

INDEPT, Vol. 3, No.1, Februari 2013 ISSN SISTEM SPEAKER RECOGNITION (PENGENAL PENGUCAP) UNTUK MENCARI KARAKTERISTIK UCAPAN SESEORANG DENGAN METODE MEL FREQUENCY CEPTRUM COEFFISIENT (MFCC) MENGGUNAKAN SOFTWARE MATLAB Andriana, ST., MT. Dosen Fakultas

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan

Lebih terperinci

vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI

vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Model Penelitian Penelitian yang dilakukan dapat dijelaskan dengan lebih baik melalui blok diagram seperti yang terliat pada Gambar 3.1. Suara Manusia Rekam suara Hasil rekaman

Lebih terperinci

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk 6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada

Lebih terperinci

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Suara adalah suatu alat komunikasi paling utama yang dimiliki oleh manusia. Dengan suara, manusia dapat berkomunikasi dengan manusia lainnya. Melalui suara,

Lebih terperinci

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 SPEAKER IDENTIFICATION DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF

Lebih terperinci

Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient

Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient 32 Jurnal Sistem Informasi Bisnis 0(207) On-line : http://ejournalundipacid/indexphp/jsinbis Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient Andi

Lebih terperinci

TUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan Program Strata I Pada Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas

TUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan Program Strata I Pada Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI CONNECTED DIGIT RECOGNITION DENGAN METODE MEL FREQUENCY CEPSTRUM COEFFECIENT DAN HIDDEN MARKOV MODEL UNTUK VOICE DIALING PADA HANDPHONE TIGER C KF-828 Diajukan

Lebih terperinci

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,

Lebih terperinci

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

Frekuensi Dominan Dalam Vokal Bahasa Indonesia Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan

Lebih terperinci

PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI

PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI DAPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization Neneng Nurhamidah 1, Esmeralda C. Djamal, Ridwan Ilyas Jurusan Informatika, Fakultas MIPA

Lebih terperinci

EVALUASI PENGARUH FUNGSI AKTIFASI DAN PARAMETER KEMIRINGANNYA TERHADAP UNJUKKERJA PENGENALAN JARINGAN SYARAF TIRUAN

EVALUASI PENGARUH FUNGSI AKTIFASI DAN PARAMETER KEMIRINGANNYA TERHADAP UNJUKKERJA PENGENALAN JARINGAN SYARAF TIRUAN EVALUASI PENGARUH FUNGSI AKTIFASI DAN PARAMETER KEMIRINGANNYA TERHADAP UNJUKKERJA PENGENALAN JARINGAN SYARAF TIRUAN (Studi Kasus pada Pengenalan Karakter Angka Tulisan Tangan) Iwan Suhardi Jurusan Teknik

Lebih terperinci

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods Pemrosesan Sinyal DigitalUntuk Mengidentifikasi Akord Dasar Penyanyi Dengan Metode Mel Frequency Cepstral Coeficients (MFCC) Dan Jaringan Syaraf Tiruan Backpropagation Digital Signal Processing To Identify

Lebih terperinci

PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO

PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Ziaul Haq, Teknik Informatika S1,Universitas Dian Nuswantoro Semarang Abstract Pengenalan

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA 1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 21 PERANGKAT LUNAK UNTUK MEMBUKA APLIKASI PADA KOMPUTER DENGAN PERINTAH SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENTS Anna Dara Andriana Program Studi Teknik Informatika Fakultas Teknik

Lebih terperinci

PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA

PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 IDENTIFIKASI CAMPURAN

Lebih terperinci

EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON

EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON Nurmasyitah 1, Mursyidah 2, Jamilah 3 Program Studi Teknik Multimedia dan Jaringan, Jurusan Teknologi Informasi dan Komputer, Politeknik

Lebih terperinci

IDENTIFIKASI INSTRUMEN GAMELAN JAWA MENGGUNAKAN JARINGAN FUNGSI BASIS RADIAL DENGAN METODE PELATIHAN EXTENDED KALMAN FILTER

IDENTIFIKASI INSTRUMEN GAMELAN JAWA MENGGUNAKAN JARINGAN FUNGSI BASIS RADIAL DENGAN METODE PELATIHAN EXTENDED KALMAN FILTER Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014 283 IDENTIFIKASI INSTRUMEN GAMELAN JAWA MENGGUNAKAN JARINGAN FUNGSI BASIS RADIAL DENGAN METODE PELATIHAN EXTENDED KALMAN FILTER

Lebih terperinci

BAB 1 PENDAHULUAN. Sistem Pakar (Expert System), Jaringan Saraf Tiruan (Artificial Neural Network), Visi

BAB 1 PENDAHULUAN. Sistem Pakar (Expert System), Jaringan Saraf Tiruan (Artificial Neural Network), Visi BAB 1 PENDAHULUAN 1.1 Latar Belakang Di era yang semakin maju ini, teknologi telah memegang peranan penting dalam kehidupan manusia sehari-hari, sehingga kemajuannya sangat dinantikan dan dinikmati para

Lebih terperinci

Implementasi Jaringan Syaraf Tiruan Backpropagation dan Steepest Descent untuk Prediksi Data Time Series

Implementasi Jaringan Syaraf Tiruan Backpropagation dan Steepest Descent untuk Prediksi Data Time Series Implementasi Jaringan Syaraf Tiruan Backpropagation dan Steepest Descent untuk Prediksi Data Time Series Oleh: ABD. ROHIM (1206 100 058) Dosen Pembimbing: Prof. Dr. M. Isa Irawan, MT Jurusan Matematika

Lebih terperinci

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2006/2007

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2006/2007 UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2006/2007 ANALISIS DAN PERANCANGAN PERANGKAT LUNAK PENGENALAN JENIS ALAT MUSIK BERDASARKAN SUMBER SUARANYA

Lebih terperinci

BAB II LANDASAN TEORI. Konsep ini pertama kali diperkenalkan oleh Fritz Bauer, yang menerapkan

BAB II LANDASAN TEORI. Konsep ini pertama kali diperkenalkan oleh Fritz Bauer, yang menerapkan 6 BAB II LANDASAN TEORI 2.1 Konsep Dasar Rekayasa Piranti Lunak Konsep ini pertama kali diperkenalkan oleh Fritz Bauer, yang menerapkan beberapa syarat dalam merekayasa suatu piranti lunak yang kita buat

Lebih terperinci

APLIKASI PENGENALAN UCAPAN DENGAN EKSTRAKSI MEL-FREQUENCY CEPSTRUM COEFFICIENTS

APLIKASI PENGENALAN UCAPAN DENGAN EKSTRAKSI MEL-FREQUENCY CEPSTRUM COEFFICIENTS Makalah Seminar Tugas Akhir APLIKASI PENGENALAN UCAPAN DENGAN EKSTRAKSI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MELALUI JARINGAN SYARAF TIRUAN (JST) LEARNING VECTOR QUANTIZATION (LVQ) UNTUK MENGOPERASIKAN

Lebih terperinci

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA SKRIPSI PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA MADE GDE JAYA HARRY KHESA S JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA BUKIT JIMBARAN

Lebih terperinci

Warble Of Lovebird Classification Using Mel Frequency Cepstral Coefficient (MFCC)

Warble Of Lovebird Classification Using Mel Frequency Cepstral Coefficient (MFCC) ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 2968 KLASIFIKASI SUARA LOVEBIRD DENGAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN FUZZY LOGIC Warble Of Lovebird Classification

Lebih terperinci

SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR

SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR Ali Mustofa Jurusan Teknik Elektro, Universitas Brawijaya Email: a_tofa@yahoo.com Abstrak - Pengenalan penutur adalah

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Suara Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara

Lebih terperinci

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength JURNAL FISIKA DAN APLIKASINYA VOLUME 12, NOMOR 1 JANUARI 2016 Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength Dody Kurniawan, Ahmad Syakir, Hana Afifah,

Lebih terperinci

UJI DAN APLIKASI KOMPUTASI PARALEL PADA JARINGAN SYARAF PROBABILISTIK (PNN) UNTUK PROSES KLASIFIKASI MUTU BUAH TOMAT SEGAR

UJI DAN APLIKASI KOMPUTASI PARALEL PADA JARINGAN SYARAF PROBABILISTIK (PNN) UNTUK PROSES KLASIFIKASI MUTU BUAH TOMAT SEGAR UJI DAN APLIKASI KOMPUTASI PARALEL PADA JARINGAN SYARAF PROBABILISTIK (PNN) UNTUK PROSES KLASIFIKASI MUTU BUAH TOMAT SEGAR oleh: MOH. KHAWARIZMIE ALIM F14101030 2006 FAKULTAS TEKNOLOGI PERTANIAN INSTITUT

Lebih terperinci

SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI FAKULTAS MATEMATIKA DAN ILMU

SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI FAKULTAS MATEMATIKA DAN ILMU PERBANDINGAN METODE WAVELET DAUBECHI IES DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS

Lebih terperinci

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows 1 Muhammad Anggia Muchtar, 2 Raisha Ariani Sirait, 3 Romi Fadillah Rahmat 1,2,3 Program Studi S1 Teknologi Informasi

Lebih terperinci

Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC

Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC Elghar Wisnudisastra, Agus Buono Departemen Ilmu Komputer, Institut Pertanian Bogor, Jl. Meranti Wing 20 Lv.V,

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium,

Lebih terperinci

Pengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu

Pengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu 239 Pengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu Zulham Effendi *), Firdaus **), Tati Erlina ***), Ratna Aisuwarya

Lebih terperinci

ANALISIS HUBUNGAN ANTARA TINGKAT PENGENALAN JARINGAN SYARAF TIRUAN DENGAN BANYAKNYA JUMLAH KELAS POLA YANG DIKENALI DAN TINGKAT KERUMITAN POLANYA

ANALISIS HUBUNGAN ANTARA TINGKAT PENGENALAN JARINGAN SYARAF TIRUAN DENGAN BANYAKNYA JUMLAH KELAS POLA YANG DIKENALI DAN TINGKAT KERUMITAN POLANYA ISSN: 1693-6930 159 ANALISIS HUBUNGAN ANTARA TINGKAT PENGENALAN JARINGAN SYARAF TIRUAN DENGAN BANYAKNYA JUMLAH KELAS POLA YANG DIKENALI DAN TINGKAT KERUMITAN POLANYA Iwan Suhardi, Riana T. Mangesa Jurusan

Lebih terperinci

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY Erni Seniwati 1), Ninik Tri Hartanti 2) 1 Sistem Informasi, STMIK Amikom erni.s@amikom.ac.id 2 Sistem Informasi, STMIK Amikom

Lebih terperinci

Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW

Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW Darma Putra 1, Adi Resmawan 2 1 Staff pengajar Teknologi Informasi, Fakultas Teknik, Universitas Udayana 2 Alumni Teknik Elektro, Fakultas Teknik,

Lebih terperinci