PERBANDINGAN WAVELET DAUBECHIES DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM BERDASARKAN DISTRIBUSI NORMAL NI WAYAN SUDARMI
|
|
- Utami Jayadi
- 7 tahun lalu
- Tontonan:
Transkripsi
1 PERBANDINGAN WAVELET DAUBECHIES DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM BERDASARKAN DISTRIBUSI NORMAL NI WAYAN SUDARMI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
2 PERBANDINGAN WAVELET DAUBECHIES DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM BERDASARKAN DISTRIBUSI NORMAL NI WAYAN SUDARMI G Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
3 ABSTRACT NI WAYAN SUDARMI. Comparison between Wavelet Daubechies and Mel-frequency Cesptral Coeffisient (MFCC) with Feature Extraction Using Normal Distribution for Phoneme Recognition. Under the supervised of AGUS BUONO. Speech recognition is speech to text transcription. Speech to text transcription system is a system used to convert a voice signal from a microphone into a single or a set of words. Most research of speech to text transcription used technique which every word in corpus is modeled. It is not effective if we want to develop a large vocabulary speech recognition system which number of words in corpus are more than one thousand words. Therefore, this research developed phoneme recognition with early stage in speech recognition. This research used some stage proces, those are take data, feature extraction, and feature matching. Normal Distribution (Gaussian) is used for feature matching, Wavelet Daubechies and MFCC is used for feature extraction. Corpus on this research consist of 11 words in Indonesian which each word recorded 20 times, 15 times for data training and 5 times for data testing. This research used 13 cepstral coefficients. Phonemes are generated from the segmentation process, and then mhu and sigma be calculated to generate the model. This case produced 26 models. The best accuracy is 90% generated by feature extraction MFCC and 46.92% generated by the Wavelet Daubechies. Keyword: Mel-frequency Cesptral Coeffisient, Wavelet Daubechies, Distribusi Normal, speech to text transcription, phoneme.
4 Judul Skripsi Nama NRP : Perbandingan Wavelet Daubechies dan MFCC sebagai Ekstraksi Ciri pada Pengenalan Fonem Berdasarkan Distribusi Normal : Ni Wayan Sudarmi : G Menyetujui: Pembimbing, Dr. Ir. Agus Buono, M.Si., M.Kom. NIP Mengetahui: Ketua Departemen Ilmu Komputer, Dr. Ir. Sri Nurdiati, M.Sc. NIP Tanggal Lulus:
5 PRAKATA Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa yang telah melimpahkan rahmat dan karunia yang tak terbatas sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari bahwa keberhasilan penyelesaian tugas akhir ini tidak terlepas dari pihak-pihak yang telah banyak membantu. Oleh karena itu, penulis sampaikan terima kasih kepada Bapak Dr. Ir. Agus Buono, M. Si., M. Kom. sebagai pembimbing yang selalu sabar dalam memberikan arahan dan saran selama penyelesaian tugas akhir ini, serta Bapak Aziz Kustiyo, S.si, M.Kom. dan Bapak Mushthofa, S. Kom., M. Sc. yang telah bersedia menjadi moderator dan penguji dalam seminar dan sidang penulis. Penulis ucapkan terima kasih kepada seluruh keluarga khususnya orang tua penulis yang tiada henti-hentinya memberikan doa, dukungan, pendidikan dan kepercayaan penuh atas apa yang penulis kerjakan hingga saat ini, juga kepada adik-adikku yang selalu memberikan keceriaan, semangat, dan dukungan selama ini. Kepada teman-teman Ekstensi Ilkom angkatan 3 penulis ucapkan terima kasih karena telah memberikan keceriaan dan persahabatannya. Kepada Yuliana Suri, Rahim Rasyid dan Herman A. yang bersedia menjadi pembahas dalam seminar tugas akhir penulis ucapkan terima kasih. Kemudian penulis sampaikan terima kasih kepada seluruh staf dan karyawan Departemen Ilmu Komputer, teman-teman Ekstensi Ilkom serta seluruh pihak lainnya yang tidak dapat disebutkan satu persatu. Penulis menyadari bahwa dalam penelitian ini masih terdapat kekurangan, sehingga kritik dan saran yang membangun penulis harapkan dari semua pihak. Semoga penelitian ini dapat bermanfaat. Bogor, Maret 2011 Ni Wayan Sudarmi
6 RIWAYAT HIDUP Penulis dilahirkan pada tanggal 17 Juli 1984 di Lampung. Penulis merupakan anak pertama dari dua bersaudara pasangan Nyoman Arta dan Nengah Kundri. Pada tahun 2003 penulis lulus dari SMA Negeri 1 Seputih Banyak dan diterima di Program Studi Diploma Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor lulus pada tahun Pada tahun 2006 sampai 2008 penulis bekerja pada suatu perusahaan suasta, kemudian penulis melanjutkan program alih jenis dan diterima di Program Studi Alih Jenis Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor pada tahun 2008.
7 DAFTAR ISI Halaman DAFTAR TABEL... vii DAFTAR GAMBAR... vii DAFTAR PENDAHULUAN... 1 Latar Belakang... 1 Tujuan Penelitian... 1 Ruang Lingkup... 1 TINJAUAN PUSTAKA... 1 Fonem... 1 Akuisisi Data Sinyal Suara... 1 Ekstraksi Ciri... 2 Frame Blocking dan Windowing... 2 Fast Fourier Transform (FFT)... 2 Mel Frequency Wrapping... 3 Cepstrum... 3 Wavelet... 3 Transformasi Wavelet Diskret... 4 Transformasi Wavelet Daubenchies... 5 Distribusi Normal... 5 METODE PENELITIAN... 6 Pengambilan Data... 7 Praproses... 7 Pembagian Data... 7 Ekstraksi Ciri Sinyal... 7 Pemodelan... 8 Pencocokan Model... 8 Pengujian... 9 HASIL DAN PEMBAHASAN... 9 Praproses... 9 Hasil Pengujian dengan MFCC... 9 Hasil Pengujian dengan Wavelet Daubechies... 9 Hasil Pengujian MFCC dan Wavelet Daubechies dengan Noise KESIMPULAN DAN SARAN Kesimpulan Saran DAFTAR PUSTAKA... 12
8 DAFTAR TABEL Halaman 1 Tabel koefisien db Daftar Fonem dalam Penelitian Akurasi Nilai Perbandingan MFCC dan Wavelet Pengujian Data Uji dengan Noise DAFTAR GAMBAR Halaman 1 Grafik hubungan frekuensi dengan skala mel Dekomposisi Wavelet 3 Tingkat Bank Filter Daubechies Proses Pengenalan Fonem Diagram Proses Ekstraksi Ciri MFCC dan Wavelet Diagram proses pemodelan Grafik Hasil Pengujian dengan Ekstraksi Ciri MFCC Grafik Hasil Pengujian dengan Ekstraksi Ciri Wavelet Grafik Hasil Pengujian dengan Ekstraksi Ciri MFCC dan Wavelet Grafik Hasil Pengujian Data Uji Grafik Hasil Pengujian Data Latih Grafik Hasil Pengujian Data Uji dengan Noise... 11
9 Latar Belakang PENDAHULUAN Perkembangan teknologi informasi dapat mempermudah pekerjaan manusia dalam kehidupan sehari-hari. Pekerjaan manusia secara manual dapat digantikan dengan sistem otomatis. Salah satu sistem otomatis adalah sistem yang dapat membuat komputer mampu berkomunikasi dengan manusia. Dalam proses komunikasi ini diperlukan tahap konversi suara ke teks (speech to text transcription). Konversi suara ke teks, berawal dari pengenalan berbasiskan fonemberbasis fonem diterapkan karena, jika berbasiskan kata, yang mana setiap kata yang terdapat dalam kamus kata dimodelkan dengan suatu teknik pemodelan. Hal ini mengakibatkan kurang efektifnya sistem apabila akan dikembangkan untuk sistem pengenalan kata yang bersifat large vocabulary yang mana kata yang terdapat dalam kamus kata berjumlah sangat besar. Oleh karena itu, di dalam penelitian ini akan dikembangkan suatu sistem pengenalan fonem yang merupakan tahap awal dari pengenalan kata. Tahap awal pengenalan fonem dilakukan dengan praproses pada sinyal suara. Praproses merupakan proses penghapusan silent, normalisasi dan segmentasi manual. Data fonem yang dihasilkan dari praproses, dilanjutkan dengan pembuatan template untuk membangun model pengenalan fonem. Dengan demikian, komputer diharapkan mampu menerjemahkan ucapan ke dalam bentuk teks yang diucapkan. Teks yang dihasilkan merupakan gabungan dari beberapa fonem. Dengan demikian, sebelum ke tahap konversi suara ke teks diperlukan tahap pengenalan fonem. Data yang digunakan adalah sinyal suara manusia yang direkam dari satu pembicara. Digunakan sinyal suara sebagai masukan karena merupakan salah satu karakteristik fisiologis manusia yang unik. Suara juga sebagai sistem biometrik dan lebih efisien dibandingkan dengan biometrik yang lain. Penelitian ini membandingkan konsep berbasiskan transformasi Fourier dan transformasi Wavelet. Transformasi Wavelet diskret yang digunakan berbasis orthogonal yaitu Daubechies. Menurut (Agustini 2006) Daubechies merupakan tipe Wavelet yang memberikan tingkat pengenalan paling tinggi dibandingkan dengan Symlets dan Coiflets. Distribusi Normal digunakan sebagai pencocokan pola. Tujuan Penelitian ini bertujuan memberikan informasi nilai akurasi. Selain itu, juga membandingkan antara transformasi Fourier dan transformasi Wavelet sebagai ekstraksi ciri, pada pengenalan fonem dengan Distribusi Normal sebagai pencocokan pola. Ruang Lingkup Ruang lingkup penelitian ini adalah : 1. Penelitian difokuskan pada pemodelan pengenalan fonem, bukan pengenalan kata atau kalimat. 2. Fonem yang digunakan sebanyak 26 fonem dari /a/ sampai /z/. 3. Teks yang diucapkan berbahasa Indonesia. 4. Penelitian ini menerapkan transformasi Fourier dan transformasi Wavelet jenis orthogonal Daubechies sebagai ekstraksi ciri dengan orde 4 pada level Penelitian ini menerapkan Distribusi Normal sebagai pengenalan pola. 6. Data sinyal suara pada penelitian ini menggunakan satu pembicara. 7. Implementasi sistem pengenalan kata menggunakan software MATLAB 7.7. Fonem TINJAUAN PUSTAKA Fonem merupakan satuan bunyi terkecil yang mampu menunjukkan kontras makna (KBBI). Fonem dibagi menjadi dua, yaitu: 1. Fonem vokal merupakan bunyi ujaran akibat adanya udara yang ke luar dari paru-paru yang tidak terkena hambatan atau halangan. Jumlah fonem vokal ada lima yaitu: a, i, u, e, dan o. 2. Fonem konsonan merupakan bunyi ujaran akibat adanya udara yang ke luar dari paruparu mendapatkan hambatan atau halangan. Jumlah fonem konsonan ada 21 buah yaitu: b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, w, x, y, dan z. Akuisisi data suara digital Sinyal merupakan suatu kuantitas fisik yang bervariasi dengan waktu, ruang, maupun sembarang satu atau lebih peubah bebas lainnya (Proakis dan Manolakis 1996). Akuisisi data suara digital merupakan proses untuk mengakuisisi ucapan pembicara dalam sinyal analog dan mengubah menjadi sinyal digital. Sinyal digital yang terbentuk berupa suatu vektor (Agustini 2006). 1
10 Secara konsepsi, konversi analog to digital (A/D), melalui tiga tahapan proses yaitu: (Proakis dan Manolakis 1996) a) Proses sampling Sampling merupakan pengambilan nilainilai (sampling rate) dari sinyal kontinu pada setiap jangka waktu (T) yang ditentukan, sehingga sinyal yang awalnya kontinu berubah menjadi diskret. Menurut (Buono 2009) bahwa, karena sinyal analog dapat direpresentasikan sebagai penjumlahan dari gelombang sinus dengan amplitudo, frekuensi dan fase yang berbeda. Dengan demikian, nilai sampling rate yang dapat menangkap semua komponen sinyal haruslah minimal dua kali frekuensi maksimum yang ada dalam sinyal. Nilai sampling rate sebesar F s = 2 F max disebut sebagai Nyquist rate. Aturan teori Nyquist menyatakan bahwa frekuensi sinyal paling sedikit dua kali frekuensi sinyal yang akan di-sampling (sinyal analog) dan merupakan batas minimum dari frekuensi sample (Fs). Lebih besar tentunya lebih baik, karena menggambarkan sinyal aslinya. Sampling rate yang digunakan pada pengenalan suara adalah 8000 Hz sampai dengan Hz (Jurafsky dan Martin 2000). Hubungan antara panjang vektor data yang dihasilkan, sampling rate dan panjang data suara yang didigitalisasikan dinyatakan berdasarkan persamaan 1: Keterangan: S = Fs T (1) S = panjang vektor F s = sampling rate yang digunakan (Hertz) T = panjang suara (detik) b) Kuantisasi Kuantisasi merupakan konversi nilai amplitudo yang bersifat kontinu menjadi nilai diskret. Proses ini menyimpan nilai-nilai simpangan sinyal menjadi representasi nilai 8 bit atau 16 bit (Jurafsky dan Martin 2000). c) Pengkodean Pengkodean merupakan pemberian bilangan biner pada setiap level kuantisasi. Ekstraksi Ciri Tujuan ekstraksi ciri untuk mereduksi ukuran data tanpa mengubah karakteristik dari sinyal suara dalam setiap frame yang dapat digunakan sebagai penciri. Ekstraksi ciri didapat dari mengonversikan bentuk sinyal suara ke dalam bentuk representasi secara parameter (Agustini 2006). Ekstraksi ciri MFCC menghitung koefisien cepstral dengan mempertimbangkan pendengaran manusia. MFCC didasarkan pada variasi frekuensi batas pendengaran manusia yaitu sekitar 20 Hz Hz. Tahapan MFCC adalah sebagai berikut (Do 1994): 1. Frame Blocking dan Windowing 2. Fast Fourier Transform (FFT) 3. Mel FrequencyWrapping 4. Cepstrum Frame Blocking dan Windowing Frame blocking merupakan segmentasi frame dengan lebar tertentu yang saling tumpang tindih atau suara digital yang telah diakuisisi dengan durasi tertentu. Tiap-tiap hasil frame direpresentasikan dalam sebuah vektor. Proses frame blocking mengakibatkan terjadi distorsi (ketidakberlanjutan sinyal) antar frame. Dengan demikian, untuk meminimalisasi distorsi tersebut dilakukan proses windowing. Proses windowing yaitu proses filtering tiap frame dengan cara mengalikan setiap frame tersebut dengan fungsi window tertentu yang ukurannya sama dengan frame. Frame windowing bertujuan meminimalkan diskontinuitas (non-stationary) sinyal pada bagian awal dan akhir sinyal suara. Tahap pembuatan window menggunakan fungsi window Hamming. Window Hamming dapat dituliskan dengan persamaan 2 (Do 1994). d(u) = cos (2) Dalam hal ini, u = 0,1,,N-1 dan N merupakan jumlah samples tiap frame. Menurut (Buono 2009), fungsi window Hamming memiliki nilai J(bias) dan V(varian) moderat. Selain itu, window Hamming juga memiliki nilai mean squared error (MSE) berada ditengah-tengah dibanding dengan filter yang lain serta memiliki kesederhaan rumus. Oleh sebab itu, maka fungsi window Hamming ini digunakan. Fast Fourier Transform (FFT) Fast fourier transformation (FFT) bertujuan mendekomposisi sinyal menjadi sinyal sinusoidal, dan terdiri atas dua unit, yaitu unit real dan unit imajiner. FFT digunakan untuk analisis frekuensi, sehingga mempermudah pemrosesan suara karena sesuai dengan pendengaran manusia. FFT adalah algoritme yang mengimplementasikan discrete fouries transform (DFT). DFT 2
11 $ merupakan transformasi setiap frame dengan N sample dari domain waktu ke domain frekuensi yang didefinisikan pada persamaan 3 berikut (Do 1994). %'&( "!# ) *+,"-/. Keterangan: N = banyaknya segmen sekuen X k = nilai data ke k n = 0,1,2,3,,N-1 dan k= 0,1,2,3,,N-1 j = Secara umum Xn adalah bilangan yang kompleks. Hasil dari tahap ini disebut dengan spektrum sinyal atau periodogram. Mel FrequencyWrapping Proses wrapping menghitung nilai melfrequency dengan sejumlah filter yang saling overlap. Filter yang digunakan berbentuk segitiga dengan tinggi satu pada ruang frekuensi mel. Skala mel digunakan untuk mengikuti persepsi pendengaran manusia yang dikenal dengan Mel Wrapping (Buono 2009). Berdasarkan studi psikologi, telinga manusia mempunyai persepsi terhadap frekuensi suara secara tidak linear pada frekuensi di atas 1000 Hz. Persamaan berikut dapat digunakan untuk perhitungan melfrequency pada frekuensi 5 dalam satuan hertz (Nilsson dan Ejnarsson 2002). 687:9/;< C/D'EFHGJI4K F Hz 700LMONQP R F Hz SUTVV'V (4) F HzWYXQZ [ F Hz \U]^^'^ Dari persamaan 4, F Hz adalah frekuensi akustik, maka nilai frekuensi F Hz sebagai fungsi dari skala mel adalah: _ ` acbedffcgihj/kml8nio p qsr q tvujw (5) Gambar 1 Grafik hubungan frekuensi dengan skala mel (Buono 2009). Pada Gambar 1 terlihat bahwa untuk frekuensi rendah, filter yang digunakan menggunakan skala linear, sehingga lebarnya konstan. Dilain pihak, untuk frekuensi tinggi (>1000 Hz), filter dibentuk dengan skala logaritma. M filter selanjutnya digunakan untuk menghitung nilai mel-frequency atau wrapping pada persamaan 6 berikut: xzy{} ~/' " ƒ " îš Œ Žs š" œ Dengan i=1,2,3,m (M adalah jumlah filter segitiga) dan H i (k) adalah nilai filter segitiga ke i untuk frekuensi akustik sebesar k. Untuk N adalah banyaknya data, sedangkan X(k) merupakan nilai data ke k hasil dari proses FFT. Cepstrum Cepstrum merupakan hasil mel frequency yang diubah menjadi domain waktu menggunakan discrete cosine transform (DCT) dengan persamaan 7 (Do 1994): "žyÿ «ª ²± ³µ Q /¹º¼» ½ ¾ dengan j=1,2,3,,k (K adalah jumlah koefisien yang diiginkan dan M = jumlah filter, sedangkan X i adalah nilai data ke i hasil proses mel frequensy wrapping. Wavelet Wavelet dapat dibentuk dari satu fungsi (x) dikenal sebagai mother Wavelet dalam suatu interval berhingga. Wavelet merupakan gelombang singkat (small wave) yang energinya terkonsentrasi pada suatu selang waktu untuk memberikan kemampuan analisis transien, ketidakstasioneran, atau fenomena berubah terhadap waktu (time varying). Karakteristik dari Wavelet antara lain adalah berosilasi singkat, translasi (pergeseran), dan dilatasi (skala) (Burrus et al. 1998). Wavelet memiliki banyak famili, dibedakan berdasarkan pada bank filter yang digunakan. Famili Wavelet terdiri atas biorthogonal Wavelet, Meyer Wavelet, Morlet Wavelet, Shanon Wavelet, dan masih banyak lainnya. Wavelet Daubechies merupakan famili orthogonal Wavelet hasil pengembangan dari Wavelet Haar. "ÀJÁ 3
12 í Transformasi Wavelet menunjukkan frekuensi waktu yang baik untuk lokalisasi properti dan alat yang tepat untuk analisis sinyal diskontinu (non stationary) (Krishnan 1994). Wavelet merupakan fungsi variabel real t, diberi notasi t dalam ruang fungsi L²(R). Fungsi ini dihasilkan oleh parameter penskala (dilatasi) dan penggeseran (translasi) dari sebuah fungsi tunggal (induk) yang dinyatakan dalam persamaan (Burrus et al. 1998) : a,b (t) = a -1/2 ÂÄÃÆÅ Ç È É ; a>0,b ÊÌË (8) fungsi pada persamaan (8) dikenalkan pertama kali oleh Grossman dan Morlet, dengan a,b ÍÏÎ dan a 0, a merupakan parameter penskala dan b adalah parameter translasi. j,k (t) = a j/2 (2 j t-k) ; j,k Ð Z (9) fungsi pada persamaan (9) dikenalkan pertama kali oleh Daubechies. keterangan: a = parameter penskala dan a 0 2 j = parameter dilatasi k = parameter waktu atau lokasi ruang Wavelet berdasarkan pada pembangkitan sejumlah tapis (filter) dengan cara mengeser dan menskala mother Wavelet berupa tapis pelewat tengah (band-pass filter). Dengan demikian diperlukan pembangkit filter. Penambahan dan pengurangan skala akan mempengaruhi durasi waktu, lebar bidang (bandwith) dan nilai frekuensi (Burrus et al. 1998). Transformasi Wavelet dapat dibedakan menjadi dua, yaitu continous wavelet transform (CWT) dan discrete wavelet transform (DWT). Fungsi yang digunakan dalam transformasi CWT dan DWT diturunkan dari mother Wavelet melalui translasi/ pergeseran dan penskalaan/dilatasi. Transformasi Wavelet kontinu mempunyai dua kelemahan yaitu redudancy dan ketidakpastian (impracticality) (Mallat 1999). Masalah tersebut dapat diselesaikan dengan mendiskretkan parameter penskala dan penggeseran. Transformasi Wavelet Diskret Transformasi Wavelet merupakan teknik pemrosesan sinyal multiresolusi. Proses transformasi Wavelet dilakukan dengan mengkonvolusi sinyal dengan data tapis (filter) atau dengan proses perata-rataan dan pengurangan secara berulang, yang sering disebut dengan metode filter bank. Prinsip dasar dari DWT adalah bagaimana cara mendapatkan representasi waktu dan skala dari sebuah sinyal menggunakan teknik filter digital dan operasi sub-sampling. Transformasi Wavelet diskret bertujuan mengurangi redundansi yang terjadi pada transformasi Wavelet kontinu. Transformasi Wavelet diskret menganalisis suatu sinyal dengan skala yang berbeda. Sebuah sinyal dilewatkan dalam dua filter DWT yaitu highpass filter dan lowpass filter agar frekuensi dari sinyal tersebut dapat dianalisis. Pembagian sinyal menjadi frekuensi tinggi dan frekuensi rendah dalam proses highpass filter dan lowpass filter disebut sebagai dekomposisi. Proses dekomposisi ini dapat melalui satu atau lebih tingkatan. Dekomposisi satu tingkat ditulis dengan ekspresi matematika pada persamaan 10 dan 11. ÑÒ"ÓiÔJÕ Ö Ø Ù'ÚzÛÝÜßÞà á8âiãåä²æçéèëê ì ò óæô õ öäö/ôµ ø'ùìúýûýü þ ÿ îmïð/ñ Dalam hal ini y[k] tinggi dan y[k] rendah adalah hasil dari highpass filter dan lowpass filter, x[n] merupakan sinyal asal, h[n] adalah highpass filter, dan g[n] adalah lowpass filter. Contoh ilustrasi dekomposisi dipaparkan pada Gambar 2 dengan menggunakan dekomposisi tiga tingkat. Pada Gambar 2 y[k] tinggi dan y[k] rendah yang merupakan hasil dari highpass filter dan lowpass filter, y[k] tinggi disebut sebagai koefisien DWT. y[k] tinggi merupakan detail dari informasi sinyal, sedangkan y[k] rendah merupakan taksiran kasar dari fungsi penskalaan. Dengan menggunakan koefisien DWT ini maka dapat dilakukan proses inverse discrete wavelet transform (IDWT) untuk merekonstruksi menjadi sinyal asal. Gambar 2 Dekomposisi Wavelet 3 tingkat. Proses rekonstruksi diawali dengan menggabungkan koefisien DWT dari yang 4
13 < berada pada akhir dekomposisi dengan sebelumnya meng upsample oleh 2 ( 2) melalui highpass filter dan lowpass filter. Proses rekonstruksi ini sepenuhnya merupakan kebalikan dari proses dekomposisi sesuai dengan tingkatan pada proses dekomposisi. Dengan demikian, persamaan rekonstruksi pada masing-masing tingkatan dapat ditulis sebagai berikut: "!$#&%')()(*%,+ -/ /9;: =8>?A@CBEDGF$H I/JLKNM OP5QSR T/ULV Transformasi Wavelet Daubechies WX Y[Z Wavelet Daubechies secara historis berasal dari sistem Haar ditulis sebagai dbn dengan N menunjukkan orde dengan 2 koefisien (db2) memiliki scaling function dengan koefisien lowpass sebagai berikut (Burrus et al. 1998). \*] ^_ `ba;cnd$e feg/h i j*k&lnm oqpsrnt$u vew/x y z*{ } ~qs N $ ƒe / *ˆ GŠ bœ; NŽ$ E / Dengan h(n) merupakan koefisien low-pass. Nilai koefisien high-pass fungsi Wavelet dengan N=2 atau berorde 2 adalah g 0 = h 3, g 1 = -h 2, g 2 = h 1, g 3 = -h 0, dengan g= high-pass dan h = low-pass. Ingrid Daubechies telah mengklasifikasikan koefisien secara numerik untuk N=4 atau berorde 4 pada Tabel 1(Burrus et al. 1998). Tabel 1 Tabel koefisien db4. Low fass Koefisien N = 4 h(0) h(1) h(2) h(3) h(4) h(5) h(6) h(7) bank filter Wavelet Daubechies dengan 4 koefisien dapat dilihat pada Gambar 3 untuk n<0 dan n>4 nilai h(n)=0. h 0 h 1 h 2 h g 0 g 1 g 2 g h 0 h 1 h 2 h g 0 g 1 g 2 g 3 0 Gambar 3 Bank filter Daubechies. Tahapan ekstraksi ciri menggunakan transformasi Wavelet yaitu: a) Frame Blocking dan Windowing b) Discrete Wavelet Transform (DWT) menggunakan Daubechies c) Mel FrequencyWrapping d) Cepstrum Distribusi Normal Distribusi Normal sering disebut sebaran Gauss. Penulisan notasi dari peubah acak yang berdistribusi normal umum adalah N(x;µ, 2 ), artinya peubah acak X berdistribusi normal umum dengan mean µ dan varians 2. Peubah acak X yang berdistribusi normal dengan mean µ dan varians 2 disingkat X~N(µ, 2 ). Peubah acak X dikatakan berdistribusi normal umum, jika dan hanya jika fungsi densitasnya berbentuk seperti pada persamaan 13 (Herrhyanto dan Gantini 2009). " / š œ/ žÿ [ & n )ª «µ ) ± (13) Dengan -<X<, -<µ<, -< 2 <, dalam hal ini X merupakan data yang digunakan sebagai data uji, µ merupakan nilai rata-rata dari data latih. Distribusi Normal (Gauss) multivariate N(, ) didefinisikan sebagai: ² ³ µ) º»¼½A¾ ¹ À Á à ÄAÅnÆÈÇCÉNÊ Ë ÌÍÏÎ µð"ñ ÒnÓÔÕÏÖ µ LØ Ù&ÚÛGÜ Untuk kasus satu dimensi, disederhanakan menjadi: ÝnÞ*ßLà/áãâ ä å,æ*çèèé ê ëgì*í î$ïñð ò ó,ôöõ µ ø ù ú û ü ý8þÿ Dalam hal ini, d = dimensi dari variabel, X merupakan koefisien data uji hasil ekstraksi 5
14 ciri, µ adalah nilai rata-rata dari data latih dan merupakan nilai matriks kovarian dari data latih. Matriks kovarian didapat dengan menghitung nilai rata-rata dari data latih. Nilai rata-rata yang didapat selanjutnya dikurangi dengan matriks awal, dikali dengan matriks transform hasil pengurangan dan dibagi dengan banyak data. Misalkan, matriks data latih dengan banyak data 3, berukuran mxn dengan m = 3 (banyaknya baris) dan n = 2 (banyaknya kolom), maka matriks kovarian yang dihasilkan berukuran 2x2. Berikut Langkah - langkah menghitung matriks kovarian dan rata-rata dari matriks A: 1. Menghitung nilai rata-rata dari matriks A untuk menghasilkan matriks B., "!$#&% 2. Mengurangi matriks rata-rata dengan matriks A ')(+*-,.0/ $8:94;6<= >@?BA C0D2EGF6H I$J:KGLMON PRQBS T0UWV4XY Z$[]\4^`_&a 3. Menghitung nilai kovarian bcodfe&gohieojlklm)ǹ oqp)ros$tvu$w6xzy {R}f~ 0 fƒ& ƒf ˆ fš Dalam hal ini, A1 t merupakan transform dari matriks A1, B t merupakan transform dari matriks B, dan C t merupakan transform dari matriks C. Gambar 4 Proses pengenalan fonem. Pengambilan Data Data yang digunakan dalam penelitian ini adalah data dari sebelas kata (coba, fana, gajah, jaya, malu, pacu, quran, tip-x, visa, weda, dan zakat). Pemilihan kata dilakukan untuk memenuhi jumlah keseluruhan fonem yaitu sebanyak 26 fonem. Letak fonem dalam suatu kata tidak berpengaruh terhadap error rate yang dihasilkan. Letak fonem pada awal kata tidak selalu memberikan nilai error rate yang kecil, begitupun pada fonem yang terletak pada tengah maupun akhir kata (Resmiwati 2009). Daftar fonem dari kata yang digunakan dalam penelitian ini dapat dilihat pada Tabel 2. Tabel 2 Daftar fonem dalam penelitian. METODE PENELITIAN Penelitian ini dilakukan dengan beberapa tahapan, yaitu pengambilan data, pemodelan (feature extraction), dan pengenalan (feature matching). Feature extraction merupakan proses mengekstraksi data hasil akuisisi sehingga dihasilkan data yang berdimensi lebih kecil. Feature matching merupakan prosedur aktual mencocokkan pola dan membandingkan fitur ekstraksi suara yang dimasukkan dengan salah satu dari himpunan pembicara (Agustini 2006). Proses pengenalan fonem dapat dilihat pada Gambar 4. Kelompok fonem /a/, /j/, /y/ /b/, /c/, /o/ /d/, /e/, /w/ /f/ /g/, /h/ /i/, /v/, /s/ /k/, /z/ /l/, /m/, /u/ /n/, /r/, /q/ Asal kata Jaya Coba Weda fana Gajah Visa Zakat Malu Quran 6
15 Kelompok fonem /p/ /t/, /x/ Asal kata Pacu Tip-x Data berasal dari satu pembicara, masing- 20 kali masing kata direkam sebanyak pengulangan sehingga data yang dikumpulkan sebanyak 520 data suara. Pengambilan data dilakukan dengan menggunakan bit rate (banyaknya bit yang diproses per satuan waktu) sebesar 16 bit sampling rate sebesar Hz dan disimpan dalam file berekstensi WAV. Proses perekaman dilakukan di tempat hening untuk mengurangi noise dari lingkungan. Praproses Pengenalan 26 fonem padaa penelitian ini dilakukan beberapa tahapan yaitu: 1. Penghapusan silent dan normalisasi Penghapusan silent dilakukan agar suara yang disimpan hanyaa yang terdapat rekaman suara. Normalisasi dilakukan dengan membagi nilai setiap frekuensi sinyal dengan absolute maksimum dari sebuah frekuensi sinyal suara. Tujuan normalisasi untuk menghasilkan amplitudo maksimum dan minimum yang normal yaitu satu dan minus satu, sehingga dapat menormalkan tingkat kekerasan suara. 2. Segmentasi sinyal Data hasil penghapusan silent dan normalisasi dilakukan segmentasi secara manual sehingga dihasilkan 26 fonem dari sebelas kata yang direkam masing-masing sebanyak 20 kali pengulangan. Dengan demikian jumlah total data fonem yang dihasilkan sebanyak 520 data dari seluruh fonem. Pembagian Data Pembagian data dibagi menjadi dua bagian, yaitu data pelatihan dan pengujian dengan proporsi 75% untuk data latih dan 25% untuk data uji. Menurut Buono (2009) dengan menggunakan metode MFCC dan HMM pembagian data dengan proporsi 75%:25% lebih baik dibuat perbandingan dengan 50%:50% dan 25%:75% %. Ekstraksi Ciri Sinyal Data fonem hasil segmentasi selanjutnya dilakukan ekstraksi ciri dengan pemodelan transformasi Fourier dan transformasi Wavelet Daubechies (db4) pada level 1. Ekstraksi ciri dilakukan untuk menentukan nilai vektor yang digunakan sebagai penciri, dengan dimensi yang lebih kecil dalam setiap frame-nya sehingga diharapkan dapat mempercepat waktu pengenalan fonem. Dalam penggunaannya, fungsi MFCC dan Wavelet memerlukan beberapa parameter yaitu: 1. Input, merupakan sinyal tanpaa noise suara yang akan dianalisis ekstraksi cirinya. 2. Sampling rate yaitu banyaknya data yang akan diambil dalam satu detik. 3. Time frame lamanya waktu yang diinginkan dalam satu frame dalam milisekon. 4. Overlap yaitu overlapping yang diinginkan antara satu frame dan frame selanjutnya. 5. Cepstral coeffisient yaitu banyaknya koefisien cepstrum yang diinginkan sebagai output. 6. Level yaitu banyaknya tahapan dekomposisi yang digunakan pada fungsi DWT. MFCC yang diimplementasikan dalam sistem ini merupakan fungsi yang dikembangkan oleh Stanley pada tahun Alur proses MFCC dan Wavelet dapat dilihat pada Gambar 5. Penjelasan tahapan dari ekstraksi ciri MFCC dan DWT yaitu: a) Frame Blocking dan Windowing Penelitian ini menggunakan panjang frame pada lebar waktu 30 ms dan tiap frame menyimpan data sebanyak 360 data, overlap antar frame 50%. Windowing menggunakan Hamming window dengan panjang window sama dengan panjang frame yaitu 360 sample. Gambar 5 Diagram proses ekstraksi ciri MFCC dan Wavelet. b) Transformasi Wavelet Daubechies Data yang terbagi dalam bentuk frame hasil dari frame blocking dan windowing pada setiap fonem dilakukan proses dekomposisi dengan menggunakan transformasi Wavelet. 7
16 Hasil dekomposisi menghasilkan koefisienperkiraan). koefisien (koefisien detail dan Algoritme 1 adalah untuk mencari koefisien detail dan perkiraan pada proses multiple dekomposisi (Agustini 2006). Algoritme 1: Proses multiple dekomposisi. Input: sinyal yang akan di-filter Tahap 1: Pilih filter yang akan digunakan sebagai low-pass filter dan high- ke dalam pass filter. Tahap 2: Sinyal input di-filter low-pass filter dan high-pass filter. Tahap 3: Hasil Low-pass frekuensi dan high-pass frekuensi pada tahap 2, selanjutnya dilakukan proses downsampling. Tahap 4: Low-pass frekuensi hasil tahap 3 selanjutnya kembali ke tahap 2. Tahap 5: Dilakukan terus menerus dan berhenti pada level yang diharapkan. Output: Low-pass frekuensi pada level yang ditentukan. Analisis data transformasi Wavelet dilakukan dengan mendekomposisikan suatu sinyal ke dalam komponen-komponen frekuensi yang berbeda-beda. Selanjutnya masing-masing komponen frekuensi tersebut dapat dianalisis sesuai dengan skala resolusinya atau level dekomposisinya. Hal ini seperti proses filtering, sinyal dalam domain waktu dilewatkan ke dalam high pass filter dan low pass filter untuk memisahkan komponen frekuensi tinggi dan frekuensi rendah. Proses dekomposisi berdasarkan aturan Nyquist. Aturan Nyquist salah satunya mengatakan bahwa frekuensi komponen sample harus kurang atau sama dengan setengah dari frekuensi sampling. Oleh sebab itu maka, diambil frekuensi sample /2 dari frekuensi sampling dalam subsample oleh 2 pada dekomposisi Wavelet. c) Mel -Frequency Wrapping Dengan menggunakan algoritme yang disarankan oleh Davis dan Mermelstein 1980 untuk membentuk M filter. Dari M filter yang sudah dibentuk, selanjutnya dilakukan wrapping terhadap sinyal. Nilai koefisien yang diharapkan didapat dari hasil transformasi kosinus. Pemodelan Hasil ekstraksi ciri satu sinyal data memiliki hasil berupa matrikss ciri n k, n adalah jumlah frame dan k adalah koefisien.. Kemudian dilakukan perata-rataan koefisien pada setiap baris, sehingga setiap satu data sinyal dihasilkan matriks berukuran 1 k. Jumlah data latih untuk satu fonem ada 15 data, makaa dihasilkan matriks berukuran 15 k, dengan k banyaknya koefisien. Matriks 15 k yang dihasilkan dari satu fonem kemudian dihitung nilai mean dan sigma untuk fonem tersebut. Kumpulan Nilai mean dan sigma dari fonem /a// sampai /z/ inilah yang digunakan sebagai model untuk tahap pencocokan. Contoh alur proses pemodelan untuk menghitung nilai mean dan sigma dari satu fonem dapat dilihat pada Gambar 6. Gambar 6 Diagram proses pemodelan. Variabel n pada Gambar 6 menunjukkan banyaknya frame yang dihasilkan pada masing-masing sinyal. Banyak jumlah n yang dihasilkan pada proses ekstraksi ciri bergantung pada panjang pendeknya sinyal hasil segmentasi. Variabel x dan y adalah koefisien nilai hasil penggabungan matriks yang diperoleh dari hasil rata-rata. Pencocokan Model Model yang dihasilkan pada tahap pemodelan selanjutnya dilakukan pencocokan. Pencocokan dilakukan dengan data uji yang telah disiapkan sebelumnya. Penerapan Distribusi Normal (Gauss) multivariate N(, ) digunakan sebagai pencocokan model. 8
17 Pengujian Pengujian dilakukan pada data uji yang telah dipersiapkan. Setiap data uji dilihat apakah data tersebut terindentifikasi pada fonem yang semestinya. Presentase tingkat akurasi dihitung dengan fungsi berikut: Œ qž $ z ±z² šœ Ÿž` ³ µ Ÿ ` ¹ˆò ˆ ` 0 ª ¼½ ¾ ÀÁ ÃÅÄOÆfÆfÇ (16) Praproses HASIL DAN PEMBAHASAN Penelitian ini, data yang digunakan sebanyak 390 data latih dan 130 data uji. Data tersebut selanjutnya dilakukan praproses yaitu penghapusan silent, normalisasi, dan segmentasi manual. Dengan demikian, tahap praproses menghasilkan 26 fonem dari fonem /a/ sampai /z/. Masing-masing fonem memiliki 15 data latih dan 5 data uji. Setelah dilakukan praproses, dilanjutkan dengan proses ekstraksi ciri pada semua data dengan menerapkan MFCC dan Wavelet Daubechies. Pada proses ekstraksi ciri dengan MFCC terdapat beberapa parameter yaitu, input suara, sampling rate, time frame, overlap, cepstral coefficient. Parameter ekstraksi ciri Wavelet Daubechies sama dengan parameter pada MFCC hanya ditambah satu parameter lagi yaitu level. Data latih merupakan data hasil praproses dan ekstraksi ciri yang sudah dibuatkan model terlebih dulu. Pemodelan dilakukan dengan menghitung nilai mean dan sigma dari masing-masing fonem dengan 13 koefisien. Karena keterbatasan data latih yang digunakan penelitian ini menerapkan 13 koefisien. Jika koefisien yang digunakan lebih dari 13 maka nilai sigma () yang dihasilkan mendekati singular. Hal ini terjadi karena memiliki nilai determinan yang sangat kecil hingga mencapai 1e-128, oleh sistem dianggap sama dengan nol. Dengan demikian, akan mengakibatkan Distribusi Normal yang diperoleh bernilai infinitif atau NaN (not a number). Jumlah data latih yang digunakan mempunyai bobot yang sama untuk setiap kelasnya. Hal ini dilakukan, karena jika salah satu ada yang dominan akan berpengaruh terhadap nilai akurasi. Karena kelas yang dominan akan selalu mendominasi. Hasil Pengujian dengan MFCC Hasil pengujian fonem dengan ekstraksi ciri MFCC dan Distribusi Normal terhadap masingmasing fonem dapat dilihat pada Gambar 7. Pada grafik terlihat bahwa fonem yang dapat dikenali dengan baik oleh sistem ada 17 fonem. Fonem /a/,/b/, /d/, /e/, /g/, /h/, /i/, /j/, /l/, /m/, /n/, /o/, /s/, /t/, /w/, /x/, dan /z/ mencapai 100%. Akan tetapi, fonem /f/, /p/, /r/, /v/ kurang baik dikenali karena akurasinya hanya mencapai 60%. Namun demikian, untuk fonem /c/, /k/, /q/, /u/, dan /y/ lumayan baik dapat dikenali dengan akurasinya mencapai 80%. Nilai Akurasi 100% 80% 60% 40% 20% 0% Gambar 7 Grafik hasil pengujian dengan ekstraksi ciri MFCC. Hasil Pengujian dengan Wavelet Daubechies Hasil pengujian fonem dengan ekstraksi ciri Wavelet Daubechies terhadap masing-masing fonem dapat dilihat pada Gambar 8. Pada grafik terlihat bahwa fonem kurang dapat dikenali dengan baik oleh sistem. Fonem /a/, /b/, /c/, /g/, /h/, /j/, /k/, /n/, /o/, /p/, /q/, /y/ dapat dikenali di atas 50% dan untuk fonem lainnya hanya bisa dikenali kurang dari 50%. Nilai Akurasi 100% 80% 60% 40% 20% 0% a b c d e f g h i j k l m n o p q r s t u v w x y z Fonem a b c d e f g h i j k l m n o p q r s t u v w x y z Fonem Gambar 8 Grafik hasil pengujian dengan ekstraksi ciri Wavelet. Pada Gambar 9 terlihat bahwa pengujian fonem dengan ekstraksi ciri MFCC memiliki 9
18 kinerja yang cukup baik dibandingkan dengan ekstraksi ciri Wavelet. Hal ini, pada grafik terlihat bahwa dengan MFCC terdapat 25 fonem nilai akurasinya berada di atas grafik Wavelet. Akan tetapi, dari 26 fonem kecuali untuk fonem /p/ nilai akurasi MFCC berada di bawah Wavelet. Nilai akurasi untuk fonem /p/ dengan MFCC sebesar 60%, sedangkan pada Wavelet mencapai 80%. Jadi Wavelet di atas MFCC sebesar 20% hanya untuk fonem /p/. Nilai Akurasi 100% 80% 60% 40% 20% Gambar 9 Grafik hasil pengujian dengan ekstraksi ciri MFCC danwavelet. Nilai Akurasi 0% a b c d e f g h i j k l m n o p q r s t u v w x y z 100% 80% 60% 40% 20% 0% MFCC 90.00% MFCC Fonem Gambar 10 Grafik hasil pengujian data uji. Berdasarkan Tabel 3 dan Gambar 10 terlihat bahwa akurasi nilai perbandingan antara MFCC dan Wavelet menunjukkan perbedaan yang sangat signifikan. Rata-rata nilai akurasi MFCC memiliki keunggulan dibandingkan dengan Wavelet sebesar 43,08% dari seluruh fonem. Untuk MFCC akurasi rata-rata sebesar 90% sedangkan Wavelet jauh di bawah MFCC dengan rata-rata akurasinya hanya mencapai 46,92%. Tabel 3 Akurasi nilai perbandingan MFCC dan Wavelet. Fonem MFCC Wavelet A 100% 80% B 100% 60% WAVELET Ekstraksi Ciri 46.92% WAVELET Fonem MFCC Wavelet C 80% 60% D 100% 20% E 100% 40% F 60% 20% G 100% 60% H 100% 60% I 100% 40% J 100% 60% K 80% 60% L 100% 40% M 100% 40% N 100% 60% O 100% 80% P 60% 80% Q 80% 80% R 60% 20% S 100% 20% T 100% 20% U 80% 20% V 60% 40% W 100% 20% X 100% 20% Y 80% 80% Z 100% 40% Berdasarkan Gambar 11 terlihat bahwa hasil pengujian sangat baik, ketika menggunakan data latih sebagai data uji. Hal ini terlihat pada grafik bahwa, rata-rata nilai akurasi MFCC dan Wavelet cukup tinggi dengan rata-rata akurasi 100% untuk MFCC dan 99,74% untuk Wavelet. Jadi, pengujian dengan data latih MFCC lebih baik dibanding dengan Wavelet dengan selisih sebesar 0,26%. Nilai Akurasi 100% 80% 60% 40% 20% 0% % 99.74% MFCC Ekstraksi Ciri WAVELET Gambar 11 Grafik hasil pengujian data latih. 10
19 Hasil pengujiaan akan mengalami penurunan, jika menggunakan data uji dan Wavelet sebagai ekstrasi ciri. Hal ini dijelaskan dari perbedaan selisih nilai akurasi pengujian dengan data uji mengalami peningkatan yang cukup signifikan. Nilai awal selisih antara MFCC dan Wavelet 0,26% dengan data latih dan meningkat menjadi 43,08% dengan data uji. Maka berdasarkan selisih nilai akurasi, MFCC lebih baik dibanding dengan Wavelet dalam pengenalan fonem untuk sinyal tanpa gangguan. Penerapan ekstraksi ciri Wavelet baik, jika masih dalam ruang lingkup data latih yang diujikan untuk pengenalan fonem. Hasil akurasi pengenalan fonem kurang baik, ketika menggunakan data uji yang baru. Terlihat dari rata-rata pengujian dengan data uji pada Wavelet hanya mencapai 46,92% dan meningkat 99,74% dengan data latih. Hasil Pengujian MFCC dan Wavelet dengan Noise Penelitian ini dicoba dengan menambahkan noise pada data uji sebesar 10 db, 20 db, dan 30 db. Pemilihan noise 10 db, 20 db, dan 30 db karena berdasarkan fakta empiris, bahwa noise 20 db mulai terasa pengaruhnya terhadap sinyal suara (Buono 2009). Oleh karena itu, digunakan noise di bawah dan di atas 20 db untuk mengetahui kehandalan model yang sudah dibuat, jika sinyal uji diberi gangguan. Sinyal noise yang digunakan bersifat gaussian dengan menggunakan paket Matlab melalui instruksi AWGN(sinyal asli,level noise). Tabel 4 Pengujian data uji dengan noise. Sinyal MFCC Wavelet Asli 90,0% 46,9% noise 30 35,4% 26,9% noise 20 13,8% 11,5% noise 10 6,2% 5,4% Berdasarkan Tabel 4 dapat disimpulkan, bahwa model yang dibangun dengan menerapkan MFCC sebagai ekstraksi ciri, jika data uji ditambah noise, maka tidak dapat mengenali dengan baik dan hasil akurasinya mengalami penurunan. Namun demikian, nilai akurasi MFCC mengalami penurunan, akan tetapi akurasi MFCC selalu berada di atas Wavelet. Lebih jelasnya hasil akurasi yang didapat dapat dilihat pada Gambar 12. Pada grafik terlihat bahwa baik MFCC maupun Wavelet dengan menambahkan noise hasil akurasi mengalami penurunan. Nilai Akurasi 100% 80% 60% 40% 20% 0% Gambar 12 Grafik hasil pengujian data uji dengan noise. Perbedaan hasil pengujian yang sangat signifikan antara MFCC dan Wavelet, mungkin disebabkan oleh MFCC dalam mengekstraksi sinyal suara bersifat low noise sehingga teknik MFCC relatif lebih baik untuk sinyal tanpa noise. Selain itu, MFCC juga didasarkan pada perbedaan frekuensi yang dapat ditangkap oleh telinga manusia sehingga mampu merepresentasikan sinyal suara sebagaimana manusia merepresentasikan. Kesimpulan KESIMPULAN DAN SARAN Penelitian ini menghasilkan, bahwa ekstraksi ciri MFCC lebih baik 43,08% dibandingkan dengan Wavelet untuk sinyal tanpa noise. Rata-rata akurasi MFCC dengan data uji tanpa noise sebesar 90% untuk semua pengenalan fonem. Penerapan MFCC baik digunakan ketika data uji tidak ada gangguan dengan pemodelan Distribusi Normal. Nilai akurasi MFCC kurang baik, jika data uji ditambah dengan gangguan (noise). Ekstraksi ciri Wavelet masih baik dalam pengenalan fonem, jika menggunakan data latih sebagai data uji dengan akurasi sebesar 99,74%. Pada kasus ini, penerapan Wavelet Daubechies kurang baik, jika pengujian dilakukan pada data uji dengan akurasi rata-rata 46,92% dan kurang baik juga ketika ditambah noise. Saran Asli noise 30 noise 20 noise 10 MFCC Jenis Sinyal Wavelet Penelitian ini memungkinkan untuk dikembangkan lebih baik lagi, saran untuk pengembangan selanjutnya ialah: 1. Penelitian mengenai pengenalan fonem ini masih sangat memungkinkan untuk dikembangkan lebih lanjut ke tahap pengenalan kata, dengan melakukan 11
20 segmentasi secara otomatis menggunakan metode auto corelation. 2. Menggunakan jumlah kata yang bervariasi sehingga dapat mewakili untuk tiap fonem yang berada di depan, tengah, dan belakang untuk menghasilkan sistem yang lebih akurat. 3. Pengembangan dengan menggunakan jumlah pembicara yang lebih banyak yang bersifat speaker independent. 4. Analisis lebih lanjut mengenai penyebab akurasi yang kurang bagus pada Wavelet baik sebelum maupun sesudah diberikan noise. 5. Analisis penyebab MFCC yang turun drastis sesudah diberi noise dan memberikan solusi kesalahan pada proses pengenalan fonem. DAFTAR PUSTAKA Agustini, Ketut Perbandingan Metode Transformasi Wavelet sebagai Praproses pada Sistem Identifikasi Pembicara. [Tesis]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Buono, Agus Representasi Nilai HOS dan Model MFCC sebagai Ekstraksi Ciri pada Sistem Identifikasi Pembicara di Lingkungan Ber-Noise Menggunakan HMM. [Disertasi]. Depok: Fakultas Ilmu Komputer, Universitas Indonesia. Burrus, C.S. Gopinath R.A., dan Guo, H Introduction to Wavelets and Wavelet Transforms A Primer, International Edition. Prentice-Hall International, Inc. Do MN Digital Signal Processing Mini- Project: An Automatic recognition System. Audio Visual Communication Laboratory, Swiss Federal Institute of Technology, Switzerland. Herryhyanto, Nar, dan Gantini, Tuti Pengantar Statistika Matematis. Yrama Widya, Bandung. Jurafsky D, Martin JH Speech and Language Processing an Introduction to Natural Language Processing, Computational Linguistic, and Speech Recognition. New Jersey: Prentice Hall. Krishnan, M, Neophytou, CP, dan Prescott, G Wavelet Transform Speech Recognition Using Vector Quantization, Dynamic Time Warping and Artificial Neural Networks, Center for Excellence in Computer Aided Systems Engineering and Telecommunications dan Information Sciences Laboratory 2291 Irving Hill Drive, Lawrence, KS Mallat, Stephane A Wavelet Tour of Signal Processing. Second Edition, Academic Press 84 Theobald s Road, London WClX 8RR, UK. Nilsson, M, dan Ejnarsson, M Speech Recognition using Hidden Markov Model : Kinerjance Evaluation in Noisy Environment. Master Thesis, Departement Of Telecomunications and signal Processing, Blekinge Institute of technologi, Sweden. Proakis, L. R., dan Manolakis, D. G Digital Signal Processing. Principles, Algorithm, and Aplication. Edisi ke tiga, Prentice Hall, New Jersey. Resmiwati, Narcayaning U. D Pengenalan Kata Berbahasa Indonesia dengan Menggunakan Hidden Markov Models Berbasiskan Fonem. [Skripsi]. Bogor : Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Tim Penyusun Kamus Pusat Pembinaan dan Pengembangan Bahasa Kamus Besar Bahasa Indonesia. Ed ke-3. Jakarta : Balai Pustaka. 12
PENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Perkembangan teknologi informasi dapat mempermudah pekerjaan manusia dalam kehidupan sehari-hari. Pekerjaan manusia secara manual dapat digantikan dengan sistem otomatis. Salah
Lebih terperinciKarakteristik Spesifikasi
Sinyal yang masuk difilter ke dalam sinyal frekuensi rendah (low-pass filter) dan sinyal frekuensi tinggi (high-pass filter) Lakukan downsampling pada kedua sinyal tersebut Low-pass frekuensi hasil downsampling
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi
Lebih terperinciIDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar
Lebih terperinciTINJAUAN PUSTAKA. Pengenalan Suara
Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan
Lebih terperinciudara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.
BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun
Lebih terperinciPENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS
PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER CLARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA
Lebih terperinciPERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI
PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI DAPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciPerbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre
Lebih terperincivii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI
vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar
PENDAHULUAN Latar Belakang Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit
Lebih terperinciPERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER
PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER MUTIA FIJRI TAUFANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA
Lebih terperincii. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz
Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode
Lebih terperinciSEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI FAKULTAS MATEMATIKA DAN ILMU
PERBANDINGAN METODE WAVELET DAUBECHI IES DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS
Lebih terperinciBIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES
Agustini, Biometrik Suara Dengan Transformasi Wavelet 49 BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Ketut Agustini (1) Abstract: Biometric as one of identification or recognition
Lebih terperinciBAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk
6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada
Lebih terperinciSISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI
SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN
Lebih terperinciPENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO
PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI SKRIPSI
Lebih terperinciPENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI
PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR PERNYATAAN
Lebih terperinciPengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.
Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi
Lebih terperinciPENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO
PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU
Lebih terperinciFrekuensi Dominan Dalam Vokal Bahasa Indonesia
Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan
Lebih terperinciPEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA
PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciSistem Verifikasi Penutur menggunakan Metode Mel Frequensi.
SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik
Lebih terperinciSeminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:
Perintah Suara Berbahasa Indonesia untuk Membuka dan Menutup Aplikasi dalam Sistem Operasi Windows Menggunakan Metode Mel Frequency Cepstrum Coefficient dan Metode Backpropagation Zakaria Ramadhan 1, Sukmawati
Lebih terperinciPENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK
ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan
Lebih terperinciBAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari
BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi
Lebih terperinciPENERAPAN LEARNING VECTOR QUANTIZATION
PENERAPAN LEARNING VECTOR QUANTIZATION (LVQ) DAN EKSTRAKSI CIRI MENGGUNAKAN MEL- FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) UNTUK TRANSKRIPSI SUARA KE TEKS LAKSMI NIRMALA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS
Lebih terperinciPENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION
PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION DETECTION OF THE LEVEL OF YOUTH, ADULTS AND ELDERLY BY USING MFCC METHOD AND FUZZY
Lebih terperinciIdentifikasi Speech Recognition Manusia dengan Menggunakan Average Energy dan Silent Ratio Sebagai Feature Extraction Suara pada Komputer
Identifikasi Speech Recognition Manusia dengan Menggunakan Average Energy dan Silent Ratio Sebagai Feature Extraction Suara pada Komputer Identification Human speech recognition using Average energy and
Lebih terperinciPENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG
PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad
Lebih terperinciJurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau
Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, 121-132 121 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Aplikasi Pengenalan Ucapan Dengan Ekstraksi Ciri Mel- Frequency Cepstrum Coefficients
Lebih terperinciANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student
Lebih terperinci1. BAB I PENDAHULUAN 1.1. Latar Belakang
1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat
Lebih terperinciAplikasi Teknik Speech Recognition pada Voice Dial Telephone
Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Oleh: Ahmad Irfan Abdul Rahman Tri Budi Santoso Titon Dutono Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi
Lebih terperinciIMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION
IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION TUGAS AKHIR Diajukan Untuk Memenuhi Sebagian Persyaratan Dalam Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun oleh : PAULA
Lebih terperinciBIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES
Agustini, Biometrik Suara Dengan Transformasi Wavelet 49 BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Ketut Agustini (1) Abstract: Biometric as one of identification or recognition
Lebih terperinciDAFTAR ISI. Halaman LEMBAR PENGESAHAN SURAT PERNYATAAN ABSTRAK... i ABSTRACT... ii KATA PENGANTAR...iii DAFTAR ISI... v DAFTAR GAMBAR...
ABSTRAK Noise merupakan salah satu kendala yang mempengaruhi kualitas sinyal suara yang ditransmisikan. Noise tersebut dapat berasal dari peralatan komunikasi itu sendiri atau pengaruh dari sumber luar.
Lebih terperinciPENGENALAN KATA BERBASISKAN FONEM DENGAN PEMODELAN RESILIENT BACKPROPAGATION PRAMESWARI
PENGENALAN KATA BERBASISKAN FONEM DENGAN PEMODELAN RESILIENT BACKPROPAGATION PRAMESWARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 PENGENALAN
Lebih terperinciSISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari
SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen Satya Wacana, Salatiga,
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Isyarat tutur merupakan isyarat yang diproduksi oleh alat ucap manusia hingga menghasilkan informasi, baik berupa makna dari isyarat tutur yang diucapkan maupun yang
Lebih terperinciPENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV
PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV Marianus Hendra Wijaya 1), Linggo Sumarno 2) 1) Program Studi Teknik Elektro Fakultas Sains dan Teknologi Universtas Sanata Dharma Yogyakarta
Lebih terperinciBAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian
BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,
Lebih terperinciTeam project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP
Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis
Lebih terperinciBAB II DASAR TEORI. sebagian besar masalahnya timbul dikarenakan interface sub-part yang berbeda.
BAB II DASAR TEORI. Umum Pada kebanyakan sistem, baik itu elektronik, finansial, maupun sosial sebagian besar masalahnya timbul dikarenakan interface sub-part yang berbeda. Karena sebagian besar sinyal
Lebih terperinciJaringan Syaraf Tiruan pada Robot
Jaringan Syaraf Tiruan pada Robot Membuat aplikasi pengenalan suara untuk pengendalian robot dengan menggunakan jaringan syaraf tiruan sebagai algoritma pembelajaran dan pemodelan dalam pengenalan suara.
Lebih terperinciPENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI
PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Emosi Emosi adalah perasaan intens yang ditujukan kepada seseorang atau sesuatu dan juga merupakan reaksi terhadap seseorang atau kejadian.emosi dapat ditunjukkan ketika merasa
Lebih terperinciPENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO
PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari
Lebih terperinciDigital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods
Pemrosesan Sinyal DigitalUntuk Mengidentifikasi Akord Dasar Penyanyi Dengan Metode Mel Frequency Cepstral Coeficients (MFCC) Dan Jaringan Syaraf Tiruan Backpropagation Digital Signal Processing To Identify
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Indonesia
BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai
Lebih terperinciPENGEMBANGAN HIDDEN MARKOV MODELS UNTUK FONEM BERBAHASA INDONESIA PADA SISTEM KONVERSI SUARA KE TEKS SRI DANURIATI
PENGEMBANGAN HIDDEN MARKOV MODELS UNTUK FONEM BERBAHASA INDONESIA PADA SISTEM KONVERSI SUARA KE TEKS SRI DANURIATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciPERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA
PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,
Lebih terperinciUNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007
UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 SPEAKER IDENTIFICATION DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Genre Menurut Kamus Besar Bahasa Indonesia, genre adalah jenis, tipe, atau kelompok sastra atas dasar bentuknya. Jadi genre musik merupakan pengelompokan musik berdasarkan kemiripan
Lebih terperinciTRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY
TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciBAB I PENDAHULUAN I.1 Latar Belakang
BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring
Lebih terperinciPENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO
PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU
Lebih terperinciBab 3. Perancangan Sistem
34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul
37 BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil 4.1.1 Pengambilan Database Awalnya gitar terlebih dahulu ditala menggunakan efek gitar ZOOM 505II, setelah ditala suara gitar dimasukan kedalam komputer melalui
Lebih terperinciABSTRAK. Universitas Kristen Maranatha
ABSTRAK Perkembangan multimedia saat ini sangat cepat. Dengan multimedia, pengguna dapat menyerap informasi dengan lebih mudah, sehingga pemilihan informasi yang tepat menjadi penting. Pemilihan informasi
Lebih terperinciSISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE
SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan
Lebih terperinciPENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO
PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciAPLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT
APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT DAN LINEAR VECTOR QUANTIZATION UNTUK PENGENDALIAN GERAK ROBOT Anggoro Wicaksono, Sukmawati NE, Satriyo Adhy,
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Computer Vision Computer vision dapat diartikan sebagai suatu proses pengenalan objek-objek berdasarkan ciri khas dari sebuah gambar dan dapat juga digambarkan sebagai suatu deduksi
Lebih terperinciIDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 IDENTIFIKASI CAMPURAN
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan
Lebih terperinciCOMPARISON OF ONE DIMENSIONAL DCT AND LWT SPARSE REPRESENTATION
COMPARISON OF ONE DIMENSIONAL DCT AND LWT SPARSE REPRESENTATION Endra 1 ; Gusandy 2 ; Kurniawaty 3 ; Yenny Lan 4 Jurusan Sistem Komputer, Fakultas Ilmu Komputer, BINUS University, Jakarta Jln K.H. Syahdan
Lebih terperinciINDEPT, Vol. 3, No.1, Februari 2013 ISSN
SISTEM SPEAKER RECOGNITION (PENGENAL PENGUCAP) UNTUK MENCARI KARAKTERISTIK UCAPAN SESEORANG DENGAN METODE MEL FREQUENCY CEPTRUM COEFFISIENT (MFCC) MENGGUNAKAN SOFTWARE MATLAB Andriana, ST., MT. Dosen Fakultas
Lebih terperinciBAB 3 PERANCANGAN SISTEM
20 BAB 3 PERANCANGAN SISTEM 3.1 Rancangan Perangkat Keras Sistem ini hanya menggunakan beberapa perangkat keras yang umum digunakan, seperti mikrofon, speaker (alat pengeras suara), dan seperangkat komputer
Lebih terperinciBAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian
BAB III METODE PENELITIAN 3.1 Model Penelitian Penelitian yang dilakukan dapat dijelaskan melalui blok diagram seperti yang terlihat pada Gambar 3.1. Suara Burung Burung Kacer Burung Kenari Pengambil an
Lebih terperinciBAB 1 PENDAHULUAN. meruntuhkan bangunan-bangunan dan fasilitas umum lainnya.
BAB 1 PENDAHULUAN 1.1. Latar Belakang Gempa bumi merupakan fenomena alam yang sudah tidak asing lagi bagi kita semua, karena seringkali diberitakan adanya suatu wilayah dilanda gempa bumi, baik yang ringan
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN SISTEM
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Masalah Indera pendengaran manusia tidak dapat mengetahui secara pasti jenis nada apa yang didengar olehnya, terkecuali para pemusik profesional. Hal
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Noise Pada saat melakukan pengambilan gambar, setiap gangguan pada gambar dinamakan dengan noise. Noise dipakai untuk proses training corrupt image, gambarnya diberi noise dan
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
5 BAB 2 TINJAUAN PUSTAKA 2.1 Prinsip Dasar Identifikasi Pembicara Pengenalan pembicara dapat diklasifikasikan ke dalam tiga tahap yaitu identifikasi, deteksi dan verifikasi. Identifikasi pembicara merupakan
Lebih terperinciKOMPRESI SINYAL SUARA MENGGUNAKAN TRANSFORMASI WAVELET
KOMPRESI SINYAL SUARA MENGGUNAKAN TRANSFORMASI WAVELET Allen Dick Scott / 0222033 Jurusan Teknik Elektro, Fakultas Teknik, Universitas Kristen Maranatha Jl.Prof.Drg.Suria Sumantri 65, Bandung 40164, Indonesia
Lebih terperinciPERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA
SKRIPSI PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA MADE GDE JAYA HARRY KHESA S JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA BUKIT JIMBARAN
Lebih terperinciPENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI
PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI SKRIPSI I GEDE ARYA MAHARTA NIM. 1108605025 JURUSAN ILMU
Lebih terperinciSIMULASI REDUKSI DERAU SINYAL SUARA PADA GEDUNG KEBUN RAYA PURWODADI PASURUAN DENGAN METODE DWT
SIMULASI REDUKSI DERAU SINYAL SUARA PADA GEDUNG KEBUN RAYA PURWODADI PASURUAN DENGAN METODE DWT ( Kristiawan Purwanto, Tutug Dhanardono) Jurusan Teknik Fisika FTI ITS Surabaya Kampus ITS Keputih Sukolilo
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan
BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz
Lebih terperinciIDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY
IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY Erni Seniwati 1), Ninik Tri Hartanti 2) 1 Sistem Informasi, STMIK Amikom erni.s@amikom.ac.id 2 Sistem Informasi, STMIK Amikom
Lebih terperinciPencocokan Citra Digital
BAB II DASAR TEORI II.1 Pencocokan Citra Digital Teknologi fotogrametri terus mengalami perkembangan dari sistem fotogrametri analog hingga sistem fotogrametri dijital yang lebih praktis, murah dan otomatis.
Lebih terperinciJurnal Ilmiah Komputer dan Informatika (KOMPUTA)
21 PERANGKAT LUNAK UNTUK MEMBUKA APLIKASI PADA KOMPUTER DENGAN PERINTAH SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENTS Anna Dara Andriana Program Studi Teknik Informatika Fakultas Teknik
Lebih terperinciHASIL DAN PEMBAHASAN. Generalisasi =
6 Kelas Target Sidik jari individu 5 0000100000 Sidik jari individu 6 0000010000 Sidik jari individu 7 0000001000 Sidik jari individu 8 0000000100 Sidik jari individu 9 0000000010 Sidik jari individu 10
Lebih terperinciPERANCANGAN DAN PEMBUATAN PERANGKAT LUNAK KLASIFIKASI TEKSTUR DENGAN MENGGUNAKAN ANALISA PAKET WAVELET
PERANCANGAN DAN PEMBUATAN PERANGKAT LUNAK KLASIFIKASI TEKSTUR DENGAN MENGGUNAKAN ANALISA PAKET WAVELET Sarwosri, Rully Soelaiman, dan Esther Hanaya Jurusan Teknik Informatika, Fakultas Teknologi Informasi,
Lebih terperinciPenerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification
Jurnal Telematika, vol. 11 no. 1, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker
Lebih terperinciVerifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW
Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW Darma Putra 1, Adi Resmawan 2 1 Staff pengajar Teknologi Informasi, Fakultas Teknik, Universitas Udayana 2 Alumni Teknik Elektro, Fakultas Teknik,
Lebih terperinciBAB III METODE PENELITIAN DAN PERANCANGAN SISTEM
BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM 3.1 Metode Penelitian Database sinyal EKG Pengambilan data dari database Visual Basic 6.0 Discrete Wavelet Transform (DWT) Dekomposisi Daubechies Orde 2
Lebih terperinciPENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G
PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA Oleh : VICKY ZILVAN G64103043 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciBAB IV PEMBAHASAN. A. Hasil Model Radial Basis Function Neural Network (RBFNN) Langkah-langkah untuk menentukan model terbaik Radial Basis Function
BAB IV PEMBAHASAN A. Hasil Model Radial Basis Function Neural Network (RBFNN) Langkah-langkah untuk menentukan model terbaik Radial Basis Function Neural Network (RBFNN) untuk diagnosis penyakit jantung
Lebih terperinciKata kunci: Fourier, Wavelet, Citra
TRANSFORMASI FOURIER DAN TRANSFORMASI WAVELET PADA CITRA Oleh : Krisnawati Abstrak Tranformasi wavelet merupakan perbaikan dari transformasi Fourier. Transformasi Fourier hanya dapat menangkap informasi
Lebih terperinciBAB III METODE PENELITIAN DAN PERANCANGAN SISTEM
BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM 3.1 Metode Penelitian Sinyal PCG Denoising Dekomposisi Frekuensi cuplik 8Khz Frekuensi cuplik 44,1Khz Frekuensi cuplik 48Khz Coiflet Symlet Daubechies Biorthogonal
Lebih terperinciPENDETEKSIAN KATA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN CODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL
PENDETEKSIAN KATA DENGAN MF SEBAGAI EKSTRAKSI IRI DAN ODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinci