PENDAHULUAN. Latar Belakang

dokumen-dokumen yang mirip
PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang

TINJAUAN PUSTAKA. Pengenalan Suara

Karakteristik Spesifikasi

PENDAHULUAN. Latar Belakang

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI

PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS

Jaringan Syaraf Tiruan pada Robot

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI

BAB 2 TINJAUAN PUSTAKA

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

BAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI

SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER AYU GUSTIAWATI FAKULTAS MATEMATIKA DAN ILMU

BAB 2 LANDASAN TEORI. Pengenalan suara (voice recognition) dibagi menjadi dua jenis, yaitu

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

PENDAHULUAN. Latar Belakang

BAB IV JARINGAN SYARAF TIRUAN (ARTIFICIAL NEURAL NETWORK)

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

ANALISA DAN PENGENALAN SUARA JANTUNG MENGGUNAKAN WAVELET DAN JST DALAM MENGKLASIFIKASIKAN JENIS KELAINAN KATUP JANTUNG PADA MANUSIA

BAB III METODE PENELITIAN

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

Klasifikasi Burung Berdasarkan Suara Kicau Burung Menggunakan Jaringan Syaraf Tiruan Propagasi Balik

PENGENALAN KATA BERBASISKAN FONEM DENGAN PEMODELAN RESILIENT BACKPROPAGATION PRAMESWARI

Jaringan Syaraf Tiruan. Disusun oleh: Liana Kusuma Ningrum

Pengenalan Digit 0 Sampai 9 Menggunakan Ekstraksi Ciri MFCC dan Jaringan Syaraf Tiruan Backpropagation

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

Jaringan syaraf dengan lapisan tunggal

BAB I PENDAHULUAN 1.1 Latar Belakang

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA

KLASIFIKASI POLA HURUF VOKAL DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN BACKPROPAGATION. Dhita Azzahra Pancorowati

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

Pengenalan Pola Sinyal Suara Manusia Menggunakan Metode Back Propagation Neural Network

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

IMPLEMENTASI JARINGAN SYARAF TIRUAN MULTI LAYER FEEDFORWARD DENGAN ALGORITMA BACKPROPAGATION SEBAGAI ESTIMASI NILAI KURS JUAL SGD-IDR

ANALISIS DAN IMPLEMENTASI APLIKASI PENGENALAN SUARA MENJADI TEKS MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

DAFTAR ISI HALAMAN JUDUI HALAMAN PENGESAHAN PEMBIMBING HALAMAN PENGESAHAN PENGUJI HALAMAN PERSEMBAHAN MOTTO KATA PENGANTAR DAFTAR GAMBAR DAFTAR TABRI

PENERAPAN LEARNING VECTOR QUANTIZATION

HYBRID JARINGAN SYARAF TIRUAN DAN MODEL MARKOV TERSEMBUNYI UNTUK PENGENALAN BILANGAN BERBAHASA INDONESIA MENGGUNAKAN CSLU TOOLKIT

Available online at TRANSMISI Website TRANSMISI, 13 (3), 2011,

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BAB 2 LANDASAN TEORI

IDENTIFIKASI PEMBICARA DENGAN JARINGAN SYARAF TIRUAN DAN TRANSFORMASI WAVELET DISKRET SEBAGAI PRAPROSES

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...

BAB II LANDASAN TEORI

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)

PROGRAM PASCA SARJANA JURUSAN TEKNIK ELEKTRO ELEKTRONIKA

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

IDENTIFIKASI INSTRUMEN GAMELAN JAWA MENGGUNAKAN JARINGAN FUNGSI BASIS RADIAL DENGAN METODE PELATIHAN EXTENDED KALMAN FILTER

Pengenalan Suara Burung Menggunakan Mel Frequency Cepstrum Coefficient dan Jaringan Syaraf Tiruan pada Sistem Pengusir Hama Burung

PENGENALAN POLA SIDIK JARI BERBASIS TRANSFORMASI WAVELET DAN JARINGAN SYARAF TIRUAN BACKPROPAGATION

Identifikasi Otentifikasi Citra Tanda Tangan Menggunakan Wavelet dan Backpropagation

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA

METODOLOGI PENELITIAN

Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

BAB I PENDAHULUAN. 1.1 Latar Belakang

Journal of Control and Network Systems

BAB I PENDAHULUAN I.1 Latar Belakang

PENDAHULUAN TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI

ARTIFICIAL NEURAL NETWORK TEKNIK PERAMALAN - A

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model

Volume 1, Nomor 1, Juni 2007 ISSN

EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON

PENGENALAN POLA HURUF ROMAWI DENGAN JARINGAN SARAF TIRUAN PERSEPTRON LAPIS JAMAK

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV

BAB 1 PENDAHULUAN Latar Belakang

BABI PENDAHULUAN. Pada dunia elektronika dibutuhkan berbagai macam alat ukur dan analisa.

BAB II DASAR TEORI Suara. Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan

MODEL PEMBELAJARAN JARINGAN SYARAF TIRUAN UNTUK OTOMATISASI PENGEMUDIAN KENDARAAN BERODA TIGA

Transkripsi:

Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi dari beberapa bagian informasi pesan yang di dalamnya berisikan teks yang diucapkan. Teks yang diucapkan ini mengandung unit-unit linguistik terkecil yang disebut sebagai fonem yang akan dikenali melalui sinyal suara. Sinyal suara manusia mempunyai tingkat variabilitas yang sangat tinggi. Suatu sinyal suara yang mengucapkan teks yang berbedabeda akan menghasilkan pola ucapan yang berbeda-beda pula. Salah satu cara yang paling handal dalam pengenalan pola adalah Jaringan Syaraf Tiruan (JST). JST mampu menyelesaikan persoalan rumit yang sulit atau bahkan tidak mungkin jika diselesaikan dengan menggunakan komputasi konvensional. Salah satu jenis JST yang mampu memberikan unjuk kerja yang bagus adalah JST dengan arsitektur Multi-Layer Perceptron (MLP) dan pembelajaran Backpropagation (Fu,1994). Penelitian mengenai sinyal suara telah banyak dilakukan dengan berbagai metode pemrosesan sinyal, seperti Linier Prediction Coding (LPC), Mel Frequency Cepstrum Coefficients (MFCC), dan Neural Predictive Coding (NPC) yang mana keseluruhan metode di atas berbasiskan transformasi Fourier. Untuk itu, akan dilakukan perbandingan konsep atau pendekatan lain tanpa berbasiskan transformasi Fourier yaitu transformasi Wavelet. Transformasi Wavelet merupakan sarana yang mulai populer untuk pemrosesan sinyal, seperti citra dan suara. Penelitian sebelumnya yang menggunakan transformasi Wavelet pada analisis suara telah dilakukan oleh dan Ruhi Sarikaya (1998) dan Ketut Agustini (2006). Kedua penelitian tersebut menggunakan transformasi Wavelet sebagai ekstraksi ciri pada identifikasi pembicara. Maka dari itu, penelitian ini akan melakukan implementasi transformasi wavelet pada bidang analisis suara lainnya yaitu pengenalan fonem. Tujuan Penelitian Tujuan penelitian ini adalah untuk membandingkan dua metode ekstraksi ciri yang berbasis transformasi Fourier dan transformasi Wavelet pada pengenalan fonem serta penggunaan JST sebagai classifier. Ruang Lingkup Penelitian Ruang lingkup penelitian ini adalah : 1. Akuisisi data dilakukan dengan mikrofon. 2. Menggunakan sebelas kata yang telah mencakup fonem a-z, yaitu: coba, fana, gajah, jaya, malu, pacu, quran, tip-x, visa, weda, dan zakat. Serta tidak memperhatikan pemakaian kata homograf dan homofon. 3. Semua kata diucapkan oleh satu orang. 4. Menggunakan transformasi Wavelet Daubechies orde empat pada level satu. 5. Menggunakan JST dengan arsitektur multilayer perceptron dan pembelajaran backpropagation sebagai classifier. Manfaat Penelitian Penelitian ini diharapkan dapat memberikan informasi tingkat akurasi hasil perbandingan transformasi Wavelet dan MFCC sebagai ekstraksi ciri pada proses pengenalan fonem menggunakan teknik JST sebagai classifier. Suara dan sinyal TINJAUAN PUSTAKA Sinyal suara merupakan gelombang yang tercipta dari tekanan udara yang berasal dari paru-paru yang berjalan melewati lintasan suara menuju mulut dan rongga hidung dengan bentuk artikulator yang senantiasa berubah. Manusia mendengar bunyi saat gelombang bunyi, yaitu getaran di udara atau medium lain sampai ke gendang telinga manusia. Batas frekuensi bunyi yang dapat didengar oleh telinga manusia sekitar 20 Hz sampai 20 KHz atau sering disebut audiosonik. Secara matematika suatu sinyal dirumuskan sebagai fungsi dari satu atau lebih peubah bebas. Berdasarkan pada peubah bebas waktu (t) sinyal dibedakan menjadi dua jenis, yaitu: a. Sinyal Analog Sinyal analog adalah suatu besaran yang berubah dalam waktu dan atau dalam ruang dan yang memiliki semua nilai untuk setiap nilai waktu (dan atau setiap nilai ruang). Sinyal analog sering disebut sinyal kontinu untuk menggambarkan bahwa besaran itu memiliki nilai yang kontinu (tak terputus). Contoh grafik sinyal analog dapat dilihat pada Gambar 1. Gambar 1 Sinyal analog. 1

b. Sinyal Diskret Sinyal Diskret merupakan suatu besaran yang berubah dalam waktu dan atau dalam ruang dan yang memiliki nilai pada suatu titik-titik waktu tertentu. Jarak setiap titik waktu bisa saja berbeda-beda namun untuk kemudahan penurunan sifat matematikanya biasanya jarak antar titik waktu adalah sama. Contoh grafik sinyal diskret dapat dilihat pada Gambar 2. Gambar 2 Sinyal diskret. Digitalisasi gelombang suara Gelombang suara yang ditangkap berupa sinyal analog. Sinyal analog harus diubah menjadi sinyal digital yang disebut proses digitalisasi. Proses digitalisasi suara terdiri atas dua tahap, yaitu sampling dan kuantisasi (Jurafsky & Martin 2000). Sampling adalah pengambilan nilai-nilai dalam jangka waktu tertentu. Sampling rate yang biasanya digunakan pada pengenalan suara ialah 8000 Hz sampai dengan 16.000 Hz (Jurafsky & Martin 2000). Hubungan panjang vektor yang dihasilkan, sampling rate dan panjang data suara yang digitalisasikan dinyatakan dengan persamaan: S = F s x T (1) Keterangan: S = panjang vektor F s = sampling rate yang digunakan (Hertz) T = panjang suara (detik) Setelah tahap sampling maka proses selanjutnya adalah proses kuantisasi. Proses ini menyimpan nilai amplitudo ini ke dalam representasi nilai 8 bit atau 16 bit (Jurafsky & Martin 2000). Ekstraksi Ciri Ekstraksi ciri merupakan proses menentukan suatu nilai atau vektor yang dapat dipergunakan sebegai penciri objek atau individu. Banyak metode yang ada untuk ekstraksi ciri di antaranya Linier Predictive Coding (LPC), Mel Frequency Cepstrum Coefficients (MFCC), dan filter bank. Transform Wavelet Diskcet (TWD) adalah bagian dari filter bank selain Discret Fourier Transform (DFT), merupakan metode baru yang mempunyai karakteristik khusus yang sesuai untuk analisis sinyal, termasuk sinyal suara. Transformasi ini dapat digunakan untuk memberikan informasi mengenai sinyal secara bersamaan dalam domain waktu dan frekuensi. MFCC Salah satu teknik ekstraksi ciri sinyal suara adalah teknik MFCC yang menghitung koefisien cepstral dengan mempertimbangkan persepsi sistem pendengaran manusia terhadap frekuensi suara. Teknik MFCC dapat merepresentasikan sinyal lebih baik dibandingkan LPC, LPCC dan yang lainnya dalam pengenalan suara (Buono 2009). Teknik MFCC sebagai ekstraksi ciri dan teknik parameterisasi sinyal suara telah banyak digunakan pada berbagai bidang area pemrosesan suara. Gambar 6 merupakan diagram alur MFCC. Tahap-tahap dalam teknik MFCC lebih jelasnya yaitu sebagai berikut : Gambar 3 Diagram alur MFCC. (Buono 2009) a. Frame blocking Untuk keperluan pemrosesan, sinyal analog yang sudah melalui proses sampling dan kuantisasi (digitasi suara) dibaca dari frame demi frame dengan lebar tertentu yang saling tumpang tindih (overlap). Proses ini dikenal dengan frame blocking. b. Windowing Setiap frame mengandung satu unit informasi, sehingga barisan frame akan menyimpan suatu informasi yang lengkap 2

dari sebuah sinyal suara. Untuk itu, distorsi antar frame harus diminimalisasi. Salah satu teknik untuk meminimalkan distorsi antar frame adalah dengan melakukan proses filtering pada setiap frame. Pada penelitian kali ini jenis filter yang digunakan yaitu Windowing karena pemrosesan sinyal yang akan dilakukan dalam domain frekuensi. Proses windowing dilakukan pada setiap frame. Dalam hal ini sinyal digital dikalikan dengan fungsi window tertentu yang berukuran sama dengan ukuran frame. Jika sinyal digital frame ke-i adalah xi dan fungsi window yang digunakan adalah wi, maka output windowing frame ke-i adalah perkalian skalar antara vektor xi dengan wi. Fungsi window yang digunakan pada penelitian ini adalah Hamming karena memiliki ekspersi matematika yang cukup sederhana. c. Transformasi Fourier Analisis Fourier merupakan suatu teknik matematika untuk mendekomposisi sinyal menjadi sinyal-sinyal sinusoidal. Untuk dapat melihat perbedaan sinyal suara yang berbeda-beda maka harus dilihat dari domain frekuensi karena jika dilihat dari domain waktu sulit terlihat perbedaannya. Untuk itu dari sinyal suara yang berada pada domain waktu diubah ke domain frekuensi dengan Fast Fourier Transform (FFT). FFT merupakan suatu algoritme untuk mengimplementasikan Discrete Fourier Transform (DFT) (Do 1994). d. Mel frequency wrapping Persepsi sistem pendengaran manusia terhadap frekuensi sinyal suara ternyata tidak hanya bersifat linear. Oleh karena itu, untuk setiap nada dengan frekuensi aktual f (dalam Hertz) tinggi subjektifnya diukur dengan skala mel (Melody). Skala melfrequency adalah selang frekuensi di bawah 1000Hz bersifat linear dan untuk selang frekuensi di atas 1000Hz bersifat logaritmik (Do 1994). e. Transformasi Kosinus Langkah terakhir yaitu mengkonversikan log mel spectrum ke domain waktu. Hasilnya disebut mel frequency cepstrum coefficients. Cara untuk mengkonversikan log mel spectrum ke bentuk domain waktu yaitu dengan menggunakan Discrete Cosine Transform (DCT). Transformasi Wavelet Daubechies Transformasi adalah proses merepresentasikan suatu sinyal ke dalam domain atau kawasan lain. Tujuan dari transformasi adalah untuk lebih menonjolkan sifat atau karakteristik sinyal tersebut. Definisi Wavelet (secara harfiah berarti gelombang kecil ) adalah himpunan fungsi dalam ruang vektor L 2 I, yang mempunyai sifatsifat sebagai berikut (Burrus et al,1998): - berenergi terbatas - merupakan fungsi band-pass pada domain frekuensi - merupakan hasil penggeseran (translasi) dan penskala (dilatasi) dari sebuah fungsi tunggal (induk) yang ditujukan oleh persamaan berikut. (2) Dengan a,b R (bilangan nyata), dan a 0. dalam hal ini a adalah parameter penskala dan b adalah parameter penggeser posisi terhadap sumbu t. Pada dasarnya, transformasi Wavelet merupakan sebuah teknik pemrosesan sinyal multiresolusi. Dengan sifat penskalaannya, wavelet dapat memilah-milah suatu sinyal data berdasarkan komponen frekuensi yang berbedabeda. Dengan demikian tiap-tiap bagian dapat dipelajari berdasarkan skala resolusi yang sesuai, sehingga diperoleh gambaran data secara keseluruhan dan detail. Teori Wavelet didasari oleh pembangkitan sejumlah tapis (filter) dengan cara menggeser dan menskala suatu wavelet induk (mother wavelet) berupa tapis pelewat tengah (bandpass filter). Dengan demikian hanya diperlukan pembangkitan sebuah tapis. Tapis lain mengikuti aturan penskalaan, baik pada kawasan waktu maupun kawasan frekuensi. Penambahan skala Wavelet akan meningkatkan durasi waktu, mengurangi lebar bidang dan menggeser frekuensi pusat ke nilai frekuensi yang lebih rendah. Sebaliknya pengurangan skala menurunkan durasi waktu, menambah lebar bidang dan menggeser frekuensi ke nilai frekuensi yang lebih tinggi (Burrus et al, 1998) Secara garis besar, transformasi Wavelet dibedakan menjadi dua, yaitu Transformasi Wavelet Kontinu (Continuous Wavelet Transform atau Integrated Wavelet Transform) dan Wavelet Diskret (Discret Wavelet Transform). Transformasi Wavelet kontinu mempunyai dua kelemahan, yaitu redudancy 3

dan ketidakpraktisan (Mallat 1999). Transformasi Wavelet diskret bertujuan mengurangi redudansi yang terjadi dengan teknik yang efisien yaitu dengan teknik analisis resolusi jamak (multi resolution analysis) yang dikembangkan Mallat tahun 1998. Persamaan 3 merupakan hasil turunan dari persamaan transformasi Wavelet kontinu sehingga parameter skala kontinu adalah kebalikan (inversely) dari parameter skala binary dan hal inilah yang membuat muncul dalam persamaan di atas sebagai penyebut (denominator). Transformasi Wavelet Diskret yang digunakan adalah persamaan berikut (Gonzales 2000). (3) Sinyal masukan dilewatkan melalui 2 filter komplementer (low-pass H dan high-pass G), dan downsampling dengan membuang setiap data kedua, sehingga diperoleh koefisien pendekatan ca (komponen frekuensi rendah) dan koefisien detil cd (komponen frekuensi tinggi). Proses ini dapat diiterasi dengan cara melanjutkan dekomposisi terhadap koefisien ca. Dengan demikian suatu sinyal dapat dipecah (didekomposisi) menjadi komponenkomponen dengan resolusi yang lebih rendah. Wavelet Daubechies secara historis berasal dari sistem Haar. Wavelet Daubechies ini merupakan karya gemilang dari Ingrid Daubechies (Agustini 2006). (4) (5) (6) (7) Persamaan (4, 5, 6, dan 7) merupakan empat persamaan dengan empat bilangan yang tidak diketahui yaitu h 0, h 1, h 2, dan h 3. Persamaan tersebut pertama kalinya diperkenalkan dan diselesaikan oleh Ingrid Daubechies, ditunjukkannya bahwa persamaan-persamaan ini mempunyai penyelesaian tunggal. ; ; ; ; Matriks Transformasi ditemukan oleh Ingrid Daubechies yang memungkinkan melalui suatu sinyal dari resolusi 2 j ke resolusi 2 j+1. Untuk menyederhanakannya, matriks ini disebut matriks DAUB (Agustini 2006). (8) (9) Pada persamaan (8) dan (9) dimana H berkaitan dengan suatu filter low pass dan G berkaitan dengan filter high pass. H dan G disebut filter konjugasi kuadratur. (10) (11) Dari persamaan (10) dan (11), dapat dibentuk suatu matriks transformasi yang mempunyai elemen-elemen h(n) dan g(n). Yang dapat dihitung dengan persamaan g(n) = (-1) n h((2n-1)-n). Jika N = 2 maka akan diperoleh: g(0) = h(3); g(1) = -h(2); g(2) = h(1); g(3) = -h(0); Dengan mengganti variabel-variabel yang bersesuaian, akan diperoleh matriks DAUB4 dengan empat koefisien (Agustini 2006). Gambar 4 Matriks transformasi Jaringan Syaraf Tiruan Jaringan syaraf tiruan adalah sistem pemroses informasi yang memiliki karakteristik mirip dengan jaringan syaraf biologi (Siang 2005). JST dibentuk sebagai generalisasi model matematika dari jaringan syaraf biologi, dengan asumsi bahwa : Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron) Sinyal dikirimkan di antara neuron melalui penghubung-penghubung Penghubung antar neuron memiliki bobot yang akan memperkuat atau memperlemah sinyal Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi (biasanya bukan fungsi linear) yang dikenakan pada jumlah input yang diterima untuk menentukan keluarannya. 4

Jaringan syaraf tiruan juga dikenal sebagai black box technology atau tidak transparan karena tidak dapat menerangkan bagaimana suatu hasil didapatkan. Hal inilah yang membuat jaringan syaraf tiruan mampu digunakan untuk menyelesaikan persoalan yang tidak terstruktur dan sulit didefinisikan (Hermawan 2006). JST ditentukan oleh tiga hal: 1. Pola hubungan neuron (arsitektur jaringan) 2. Metode untuk menentukan bobot penghubung (metode training atau learning) 3. Fungsi Aktivasi Fungsi aktivasi akan menghitung input yang diterima oleh suatu neuron, kemudian neuron tersebut meneruskan hasil dari fungsi aktivasi ke neuron berikutnya, sehingga fungsi aktivasi berfungsi sebagai penentu kuat lemahnya sinyal yang dikeluarkan oleh suatu neuron. Salah satu fungsi aktivasi yang digunakan dalam JST propagasi balik adalah fungsi sigmoid biner, yaitu fungsi biner yang memiliki rentang nol sampai dengan satu dengan persamaan sebagai berikut : (12) Gambar 5 Sigmoid biner pada selang [0,1]. Backpropagation merupakan salah satu model JST untuk pencocokan pola yang menggunakan arsitektur multi layer perceptron dan pembelajaran terbimbing. Walaupun JST Backpropagation membutuhkan waktu yang lama untuk pembelajaran tetapi bila pembelajaran telah selesai dilakukan, JST akan dapat mengenali suatu pola dengan cepat. Jaringan Multi Layer adalah karakteristik dari JST Backpropagation yang mempunyai lapisan input, lapisan tersembunyi dan lapisan output dan setiap neuron pada satu lapisan menerima input dari semua neuron pada lapisan sebelumnya. Gambar 6 menunjukkan arsitektur multilayer perceptron. Secara garis besar proses backpropagation adalah sebagai berikut: ketika JST diberikan pola masukan sebagai pola pelatihan maka pola tersebut menuju ke unit-unit pada lapis tersembunyi untuk diteruskan ke unit-unit lapis keluaran. Kemudian unit-unit lapis keluaran memberikan tanggapan yang disebut sebagai keluaran JST. Saat keluaran JST tidak sama dengan keluaran yang diharapkan maka keluaran akan disebarkan mundur (backward) pada lapis tersembunyi diteruskan ke unit pada lapis masukan. Gambar 6 Arsitektur Multilayer Perceptron. Dalam pelatihan JST backpropagation ini terdapat algoritme pelatihan yang terdiri dari dua tahapan, yaitu feedforward dan backpropagtion. 1. Feedforward Pada lapisan input setiap elemen vektor input akan diterima oleh sebuah neuron sehingga jumlah neuron pada lapisan ini akan sama dengan banyaknya elemen vektor input. Lapisan input memiliki fungsi pengaktifan berupa fungsi identitas sehinggga hanya berfungsi meneruskan input yang diterima ke lapisan berikutnya. Lapisan tersembunyi akan menerima output yang dikeluarkan oleh lapisan input. Setiap neuron pada lapisan tersembunyi menerima input dari seluruh neuron pada lapisan input dikalikan dengan bobotnya. Input yang masuk dihitung dengan suatu fungsi pengaktifan dan hasil dari fungsi pengaktifan ini akan menjadi output tiap neuron pada lapisan tersembunyi. Banyaknya neuron pada lapisan tersembunyi dapat bervariasi dan dapat dianggap cukup jika JST dapat mengenali pola-pola yang ada dengan cukup baik. Lapisan output akan menerima output yang dikeluarkan oleh lapisan tersembunyi. Setiap neuron pada lapisan output menerima input dari seluruh neuron pada lapisan tersembunyi dikalikan dengan bobotnya. Input yang masuk juga dihitung dengan suatu fungsi pengaktifan dan hasil dari fungsi pengaktifan ini akan menjadi output tiap neuron. Untuk kemudahan dan hasil yang lebih baik jumlah neuron pada lapisan output dapat ditentukan sama dengan jumlah pola yang ada. Fase dari pertama kali 5

masuk dalam lapisan input sampai lapisan output memberikan hasil merupakan fase feedforward (Fu 1994). 2. Backpropagation Jika telah diperoleh hasil pada lapisan output maka hasil ini akan dibandingkan dengan target pasangan untuk data yang masuk. Dari perbedaan nilai antara target yang diinginkan dengan hasil saat ini dapat dihitung suatu nilai kesalahan. Untuk seluruh data yang ada dapat dihitung suatu nilai total kesalahan. Fase ini merupakan fase kalkulasi error. Nilai error yang diperoleh akan digunakan untuk memperbaiki nilai bobot-bobot pada JST sehingga JST akan semakin baik mengenali pola-pola yang ada. Fase ini disebut dengan fase penyesuaian bobot. Setelah bobot-bobot diperbaiki data pembelajaran kembali di-input-kan dalam jaringan dan kembali diperoleh nilai error dan bobot akan kembali diperbaiki sehingga pembelajaran akan bersifat iteratif. Fase pembelajaran yang di-input-kan kembali dengan bobot yang telah diperbaiki ini disebut fase backpropagation (Fu 1994). Iterasi dapat dihentikan jika kriteria error tertentu dipenuhi atau jumlah epoch (satu cycle seluruh data pembelajaran melewati jaringan) tertentu dipenuhi. Kriteria henti dengan menggunakan suatu nilai error tertentu mengimplikasikan jika nilai error cukup kecil maka jaringan akan cukup baik untuk mengenali pola-pola yang ada. Namun nilai error yang terlalu kecil akan membuat jaringan terlalu spesifik mengenali pola-pola pembelajaran (overtrained) dan kemampuannya mengenali pola-pola baru yang serupa tetapi tdak identik dengan pola pembelajaran akan menurun (Fu 1994). Fonem Fonem merupakan satuan bunyi terkecil yang mampu menunjukkan kontras makna (Depdikbud 2003). Fonem dibagi menjadi dua, yaitu: 1. Fonem vokal merupakan bunyi ujaran akibat adanya udara yang keluar dari paru-paru tidak terkena hambatan atau halangan. Jumlah fonem vokal ada lima yaitu: a, i, u, e, dan o. 2. Fonem konsonan merupakan bunyi ujaran akibat adanya udara yang keluar dari paruparu mendapatkan hambatan atau halangan. Jumlah fonem konsonan ada 21 buah yaitu: b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, w, x, y, dan z. METODOLOGI Pada bab ini akan dijelaskan mengenai tahapan-tahapan yang akan dilakukan dalam penelitian. Tahapan akan dimulai dari proses pencarian dan pengumpulan data, kemudian mempelajari data yang ada untuk digunakan pada tahap pelatihan dan pengujian. Gambar 7 adalah ilustrasi tahapan metodologi penelitian yang digambarkan dengan diagram alur penelitian. Data Suara Gambar 7 Diagram alur penelitian. Penelitian ini dilakukan dengan mengambil data suara dari satu orang (speaker dependent) dengan satu kata sebanyak 16 kali ( coba, fana, gajah, jaya, pacu, malu, 6