Journal of Control and Network Systems

dokumen-dokumen yang mirip
BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian

BAB II LANDASAN TEORI

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN. perangkat. Alat dan bahan yang digunakan sebelum pengujian:

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

BAB II LANDASAN TEORI

Pengembangan Aplikasi Prediksi Pertumbuhan Ekonomi Indonesia dengan Jaringan Syaraf Tiruan Backpropagation

VOL. 01 NO. 02 [JURNAL ILMIAH BINARY] ISSN :

Jaringan Syaraf Tiruan pada Robot

IMPLEMENTASI JARINGAN SYARAF TIRUAN MULTI LAYER FEEDFORWARD DENGAN ALGORITMA BACKPROPAGATION SEBAGAI ESTIMASI NILAI KURS JUAL SGD-IDR

BAB 3 METODOLOGI PENELITIAN

PREDIKSI CURAH HUJAN DI KOTA MEDAN MENGGUNAKAN METODE BACKPROPAGATION NEURAL NETWORK

JARINGAN SYARAF TIRUAN UNTUK MEMPREDIKSI CURAH HUJAN SUMATERA UTARA DENGAN METODE BACK PROPAGATION (STUDI KASUS : BMKG MEDAN)

KLASIFIKASI POLA HURUF VOKAL DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN BACKPROPAGATION. Dhita Azzahra Pancorowati

T 11 Aplikasi Model Backpropagation Neural Network Untuk Perkiraan Produksi Tebu Pada PT. Perkebunan Nusantara IX

BAB II LANDASAN TEORI

BAB 2 KONSEP DASAR PENGENAL OBJEK

APLIKASI JARINGAN SYARAF TIRUAN PADA PENGENALAN POLA TULISAN DENGAN METODE BACKPROPAGATION

METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB II LANDASAN TEORI. titiktitik penyusun citra itu sendiri. Titik-titik tersebut disebut dengan pixel. Banyaknya

BACKPROPAGATION NEURAL NETWORK AS A METHOD OF FORECASTING ON CALCULATION INFLATION RATE IN JAKARTA AND SURABAYA

APLIKASI JARINGAN SYARAF TIRUAN DALAM PENGHITUNGAN PERSENTASE KEBENARAN KLASIFIKASI PADA KLASIFIKASI JURUSAN SISWA DI SMA N 8 SURAKARTA

Aplikasi yang dibuat adalah aplikasi untuk menghitung. prediksi jumlah dalam hal ini diambil studi kasus data balita

Perbaikan Metode Prakiraan Cuaca Bandara Abdulrahman Saleh dengan Algoritma Neural Network Backpropagation

PREDIKSI PENDAPATAN ASLI DAERAH KALIMANTAN BARAT MENGGUNAKAN JARINGAN SYARAF TIRUAN BACKPROPAGATION

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

PENGENALAN POLA GARIS DASAR KALIMAT PADA TULISAN TANGAN UNTUK MENGETAHUI KARAKTER SESEORANG DENGAN MENGGUNAKAN ALGORITMA RESILIENT BACKPROPAGATION

BAB II DASAR TEORI Jaringan Syaraf Tiruan. Universitas Sumatera Utara

BAB I PENDAHULUAN. kicauan salah satunya adalah burung Anis Merah (zootheracitrina), CucakHijau

PENGENALAN PLAT NOMOR KENDARAAN DALAM SEBUAH CITRA MENGUNAKAN JARINGAN SARAF TIRUAN ABSTRAK

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

TINJAUAN PUSTAKA. Pengenalan Suara

IMPLEMENTASI JARINGAN SYARAF TIRUAN METODE BACKPROPAGATION UNTUK MEMPREDIKSI HARGA SAHAM

Penerapan Jaringan Saraf Tiruan Metode Backpropagation Menggunakan VB 6

BAB III METODOLOGI PENELITIAN

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) IMPLEMENTASI JARINGAN SYARAF TIRUAN BACKPROPAGATION UNTUK MENGENALI MOTIF BATIK

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

IDENTIFIKASI TANDA TANGAN MENGGUNAKAN ALGORITMA DOUBLE BACKPROPAGATION ABSTRAK

MODEL PEMBELAJARAN JARINGAN SYARAF TIRUAN UNTUK OTOMATISASI PENGEMUDIAN KENDARAAN BERODA TIGA

DETEKSI JENIS KAYU CITRA FURNITURE UKIRAN JEPARA MENGGUNAKAN JST BACKPROPAGATION

JARINGAN SARAF TIRUAN DENGAN BACKPROPAGATION UNTUK MENDETEKSI PENYALAHGUNAAN NARKOTIKA

APLIKASI JARINGAN SYARAF TIRUAN UNTUK MENGENALI TULISAN TANGAN HURUF A, B, C, DAN D PADA JAWABAN SOAL PILIHAN GANDA

APLIKASI JARINGAN SYARAF TIRUAN UNTUK MEMPREDIKSI PENYAKIT SALURAN PERNAFASAN DENGAN METODE BACKPROPAGATION

IDENTIFIKASI VARIETAS UNGGUL BENIH KEDELAI BERDASARKAN WARNA DENGAN JARINGAN SARAF TIRUAN

Klasifikasi Pola Huruf Vokal dengan Menggunakan Jaringan Saraf Tiruan

BAB 2 LANDASAN TEORI. Pengenalan suara (voice recognition) dibagi menjadi dua jenis, yaitu

ANALISIS ALGORITMA INISIALISASI NGUYEN-WIDROW PADA PROSES PREDIKSI CURAH HUJAN KOTA MEDAN MENGGUNAKAN METODE BACKPROPAGATION NEURAL NETWORK

SISTEM PENGENALAN BARCODE MENGGUNAKAN JARINGAN SYARAF TIRUAN BACKPROPAGATION

ANALISA JARINGAN SARAF TIRUAN DENGAN METODE BACKPROPAGATION UNTUK MENGETAHUI LOYALITAS KARYAWAN

BAB IV JARINGAN SYARAF TIRUAN (ARTIFICIAL NEURAL NETWORK)

BAB 3 PERANCANGAN SISTEM. untuk pengguna interface, membutuhkan perangkat keras dan perangkat lunak.

PEMANFAATAN NEURAL NETWORK PERCEPTRON PADA PENGENALAN POLA KARAKTER

MEMPREDIKSI KECERDASAN SISWA MENGGUNAKAN JARINGAN SYARAF TIRUAN BERBASIS ALGORITMA BACKPROPAGATION (STUDI KASUS DI LP3I COURSE CENTER PADANG)

BAB 2 LANDASAN TEORI. fuzzy logic dengan aplikasi neuro computing. Masing-masing memiliki cara dan proses

PREDIKSI PERHITUNGAN DOSIS RADIASI PADA PEMERIKSAAN MAMMOGRAFI MENGGUNAKAN ALGORITMA JARINGAN SYARAF TIRUAN PROPAGASI BALIK

BAB 3 PERANCANGAN SISTEM PENGENAL SUARA

ANALISA DAN PENGENALAN SUARA JANTUNG MENGGUNAKAN WAVELET DAN JST DALAM MENGKLASIFIKASIKAN JENIS KELAINAN KATUP JANTUNG PADA MANUSIA

PENGENALAN POLA HURUF ROMAWI DENGAN JARINGAN SARAF TIRUAN PERSEPTRON LAPIS JAMAK

BAB 2 TINJAUAN PUSTAKA

BAB IV IMPLEMENTASI DAN EVALUASI. Bab ini menguraikan proses implementasiuntuk tahap pelatihanneural networks,

KOMPRESI CITRA DIGITAL DENGAN MENGGUNAKAN HEBBIAN BASED PRINCIPAL COMPONENT ANALYSIS

PENERAPAN JARINGAN SYARAF TIRUAN DALAM MEMPREDIKSI TINGKAT PENGANGGURAN DI SUMATERA BARAT

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

APLIKASI JARINGAN SYARAF TIRUAN UNTUK MEMPREDIKSI VOLUME PEMAKAIAN AIR BERSIH DI KOTA PONTIANAK

BACK PROPAGATION NETWORK (BPN)

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

Prediksi Pergerakan Harga Harian Nilai Tukar Rupiah (IDR) Terhadap Dollar Amerika (USD) Menggunakan Metode Jaringan Saraf Tiruan Backpropagation

BAB 2 LANDASAN TEORI

Jaringan Syaraf Tiruan Menggunakan Algoritma Backpropagation Untuk Memprediksi Jumlah Pengangguran (Studi Kasus DiKota Padang)

BAB 2 TINJAUAN PUSTAKA

IDENTIFIKASI POLA IRIS MENGGUNAKAN METODE BACKPROPAGATION

APLIKASI JARINGAN SYARAF TIRUAN UNTUK MEMPREDIKSI PENJUALAN OBAT Pada PT. METRO ARTHA PRAKARSA MENERAPKAN METODE BACKPROPAGATION

Estimasi Suhu Udara Bulanan Kota Pontianak Berdasarkan Metode Jaringan Syaraf Tiruan

METODOLOGI PENELITIAN

SISTEM PAKAR DIAGNOSA PENYAKIT DEMAM BERDARAH DENGUE BERBASIS ANDROID MENGGUNAKAN JARINGAN SARAF TIRUAN

POSITRON, Vol. IV, No. 2 (2014), Hal ISSN :

JARINGAN SARAF TIRUAN DENGAN METODE BACKPROPAGATION UNTUK MENDETEKSI GANGGUAN PSIKOLOGI


Deteksi Kanker Paru-Paru Dari Citra Foto Rontgen Menggunakan Jaringan Saraf Tiruan Backpropagation

Analisis Jaringan Saraf Tiruan dengan Metode Backpropagation Untuk Mendeteksi Gangguan Psikologi

Jl. Telekomunikasi, Dayeuh Kolot, Bandung Indonesia

APLIKASI JARINGAN SARAF TIRUAN UNTUK INVENTARISASI LUAS SUMBER DAYA ALAM STUDI KASUS PULAU PARI

Architecture Net, Simple Neural Net

Presentasi Tugas Akhir

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI

Metode Jaringan Saraf Tiruan Propagasi Balik Untuk Estimasi Curah Hujan Bulanan di Ketapang Kalimantan Barat

ANALISA JARINGAN SARAF TIRUAN DENGAN METODE BACKPROPAGATION UNTUK MEMPREDIKSI PRODUKTIVITAS PEGAWAI. Jasmir, S.Kom, M.Kom

JURNAL INFORMATIKA PENGENALAN PLAT NOMOR KENDARAAN DALAM SEBUAH CITRA MENGUNAKAN JARINGAN SARAF TIRUAN

BAB 2 LANDASAN TEORI

BAB III METODE EGARCH, JARINGAN SYARAF TIRUAN DAN NEURO-EGARCH

ANALISIS PENAMBAHAN NILAI MOMENTUM PADA PREDIKSI PRODUKTIVITAS KELAPA SAWIT MENGGUNAKAN BACKPROPAGATION

PERBANDINGAN ANTARA MODEL NEURAL NETWORK DAN MODEL DUANE UNTUK EVALUASI KETEPATAN PREDIKSI WAKTU KERUSAKAN SUATU KOMPONEN

Pengendalian Posisi Mobile Robot Menggunakan Metode Neural Network Dengan Umpan Balik Kamera Pemosisian Global

BAB III ANALISIS DAN PERANCANGAN

SISTEM PENGENALAN KARAKTER DENGAN JARINGAN SYARAF TIRUAN ALGORITMA PERCEPTRON

PENDAHULUAN. Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Model Arsitektur Backpropogation Dalam Memprediksi Faktor Tunggakan Uang Kuliah (Studi Kasus AMIK Tunas Bangsa)

Transkripsi:

JCONES Vol. 5, No. 1 (2016) 177-183 Journal of Control and Network Systems Situs Jurnal : http://jurnal.stikom.edu/index.php/jcone IDENTIFIKASI SUARA MANUSIA BERDASARKAN JENIS KELAMIN MENGGUNAKAN EKSTRAKSI FITUR SHORT TIME FOURIER TRANSFORM Joseph Masarani Tandiallo 1) Susijanto Tri Rasmana 2) Ira Puspasari 3) Program Studi/Jurusan Sistem Komputer Institut Bisnis dan Informatika Stikom Surabaya Jl. Raya Kedung Baruk 98 Surabaya, 60298 Email: 1) josemasarani@gmail.com., 2) susyanto@stikom.edu, 3) ira@stikom.edu Abstract: Human voice is one of the many kind of signals. Technology development these days has made a tools or computer able to identify human voice. one of the calculation method that commonly used to analyze the signal is Fourier Transform. Short Time Fourier Transform (STFT), is a development from the Fourier transform, which adding the window function, so the signal can be represented in time domain and frequency domain. In this research, STFT method is used to extract features in human voice such as amplitude/magnitude, frequency and time. These features will be trained, and then will be tested to identify the gender/sex using one of neural network model, backpropagation. The result of this research is system has able to identify 6 voices from 7 male voices with 86% successful percentage, and also able to identify 6 out of 7 female voices with 86% successful percentage. Keywords: Short Time Fourier Transform, Backpropagation, Voice Recognition, Suara Manusia, Neural-Network, Matlab Suara adalah suatu alat komunikasi paling utama yang dimiliki oleh manusia. Dengan suara, manusia dapat berkomunikasi dengan manusia lainnya. Melalui suara, manusia juga dapat melakukan banyak hal. Suara manusia pun dapat berkembang atau berubah seiring pertumbuhan usia. Suara manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka melalui suara dapat diketahui usia maupun jenis kelamin seseorang. Suara yang diucapkan manusia berbentuk gelombang sinyal. Oleh karena berbentuk sinyal, maka suara tersebut dapat diolah secara digital, dan juga sering digunakan pada dunia teknologi maupun dunia hiburan. Seperti merekam suara bernyanyi, merekam pidato, atau dapat digunakan untuk membuat aplikasi pengenal suara. LANDASAN TEORI Short Time Fourier Transform Salah satu metode yang digunakan untuk mengolah sinyal suara adalah short time fourier transform (STFT) yang juga digunakan dalam penelitan ini. Menurut Tulus Hayadi (2013), STFT merupakan metode transformasi yang mengembangkan metode Fourier Transform dengan kelebihan pada kemampuan untuk mentransformasi non-stationary signal. Adapun ide dibalik metode ini adalah membuat nonstationary signal menjadi suatu representasi stationary sinyal dengan memasukkan suatu window function. Dalam hal ini, sinyal yang ada dibagi menjadi beberapa segmen dimana segmen yang didapatkan, diasumsikan terdiri dari stationary signal. Adapun rumus yang digunakan dapat dilihat pada persamaan : (1) Keterangan: [n]= sinyal masukan n = waktu w [n] = windows ω = kecepatan sudut (2πƒ) m = panjang windows JCONES Vol. 5, No. 1 (2016) Hal: 177

Dari rumus di atas, dapat diketahui bahwa x[n], merupakan sinyal masukan dalam domain waktu, dan STFT adalah sinyal dengan domain waktu dan frekuensi sehingga akan merepresentasikan sinyal dalam waktu-frekuensi. Dari rumus di atas, w[n] adalah suatu fungsi window. Penelitian ini menggunakan fungsi window Hann dengan rumus: (2) Keterangan: n = waktu N = panjang windows Hann window atau juga disebut jendela kosinus yang ditinggikan biasanya dipakai sebagai fungsi window dalam pemrosesan sinyal digital untuk menjalankan transformasi fourier dimana ujung dari kosinus menyentuh nilai nol, sehingga sidelobe berada pada 18 db per oktaf.. Adapun keunggulan dari hann window adalah sangat rendahnya artifak distorsi atau aliasing dan lebarnya main-lobe. Permasalahan yang muncul di sini adalah bahwa STFT menggunakan kernel window pada suatu interval waktu tertentu. Berbeda dengan Fourier Transform, sehingga tidak ada permasalahan dalam hal resolusi frekuensi. Dari ulasan yang singkat ini dapat diambil kesimpulan seperti ditunjukkan pada gambar 1: Window sempit (gambar 1, kiri): mempunyai resolusi waktu yang bagus, tetapi resolusi frekuensi yang tidak bagus Window lebar (gambar 1, kanan): mempunyai resolusi frekuensi yang bagus, tetapi resolusi waktu yang tidak bagus Sumber: Tulus Hayadi, 2013 Gambar 1. Window sempit (kiri) dan Window lebar (kanan) Backpropagation Agar sebuah sistem dapat mengenali suatu jenis atau pola tertentu, maka digunakan metode jaringan saraf tiruan (JST). Salah satu metode JST yang sering dipakai adalah perambatan galatmundur atau backpropagation. Backpropagation menurut Kiki (2004) adalah sebuah metode sistematik untuk pelatihan multilayer jaringan saraf tiruan. Metode ini memiliki dasar matematis yang kuat, obyektif dan algoritma ini mendapatkan bentuk persamaan dan nilai koefisien dalam formula dengan meminimalkan jumlah kuadrat galat error melalui model yang dikembangkan (training set). Backpropagation menurut Wirda Ayu Utari (2010), memiliki beberapa unit yang ada dalam satu atau lebih layar tersembunyi. Gambar 2 adalah arsitektur backpropagation dengan n buah masukan (ditambah sebuah bias), sebuah layar tersembunyi yang terdiri dari p unit (ditambah sebuah bias), serta m buah keluaran. Gambar 2. Arsitektur Model Backpropagation Pada gambar 2, V ji merupakan bobot garis dari unit masukan X i ke unit layar tersembunyi Z j (V j0 merupakan bobot garis yang menghubungkan bias di unit masukan ke unit layar tersembunyi zj). W kj merupakan bobot dari unit layar tersembunyi Z j ke unit keluaran V k (w k0 merupakan bobot dari bias di layar tersembunyi ke unit keluaran Z k ). Pada saat perambatan maju, neuronneuron diaktifkan dengan menggunakan fungsi aktivasi yang dapat dideferensiasikan, seperti sigmoid, tansig atau purelin. Salah satu jenis fungsi aktivasi yang dipakai adalah sigmoid biner yang memiliki range (0,1) Grafik fungsinya seperti gambar 3: f(x)=1/(1+e -x ) dengan turunan f (x)=f(x) (1-f(x)) Gambar 3. Grafik fungsi aktivasi sigmoid biner JCONES Vol. 5, No. 1 (2016) Hal: 178

Adapun pelatihan standar backpropagation menurut Jong, J.S., (2005) adalah: - Meliputi 3 fase, maju, mundur, dan modifikasi bobot - Fase I Propagasi maju, sinyal masukan (x i ) dipropagasikan ke layar tersembunyi menggunakan fungsi aktivasi yang ditentukan. Keluaran dari setiap unit tersembunyi (z j ) kemudian dipropagasikan maju lagi ke layar tersembunyi berikutnya menggunakan fungsi aktivasi yang ditentukan, demikian seterusnya hingga menghasilkan keluaran jaringan (y k ). Berikutnya, keluaran jaringan dibandingkan dengan target yang harus dicapai (t k ). Selisih t k - y k adalah kesalahan atau error yang terjadi. Iterasi dihentikan jika kesalahan ini lebih kecil dari batas toleransi, tetapi bila kesalahan lebih besar maka bobot setiap garis dalam jaringan akan dimodifikasi untuk mengurangi kesalahan yang terjadi - Fase II Propagasi mundur, Berdasarkan kesalahan t k - y k, dihitung faktor δ k (k=1,2,3,..,m) yang dipakai untuk mendistribusikan kesalahan di unit y k ke semua unit hidden yang terhubung langsung dengan y k. δ k juga dipakai untuk mengubah bobot garis yang berhubungan langsung dengan unit keluaran. Dengan cara yang sama, dihitung faktor δ j di setiap unit di hidden layer sebagai dasar perubahan bobot semua garis yang berasal dari unit tersembunyi di layar di bawahnya. Demikian seterusnya hingga semua faktor δ di unit hidden yang berhubungan langsung dengan unit masukan dihitung - Fase III Perubahan bobot, bobot semua garis dimodifikasi bersamaan. Perubahan bobot suatu garis didasarkan atas faktor δ neuron di layar atasnya. Sebagai contoh, perubahan bobot garis yang menuju ke layar keluaran didasarkan atas δ k yang ada di unit keluaran. Fase tersebut diulang hingga penghentian terpenuhi. Umumnya kondisi penghentian yang dipakai adalah jumlah iterasi atau kesalahan (Jong, J.S., 2005). Gambar 4. Blok Diagram Penelitian Suara Manusia Pada blok ini, suara manusia (laki-laki dan perempuan) yang direkam adalah saat pengucapan huruf vokal (a, e, i, o, u) dan individu tersebut berusia 17-30 tahun. Kondisi pita suara manusia harus dalam keadaan sehat dan tidak serak pada saat pengucapan sehingga suara dapat terdengar dengan jelas. Huruf vokal diucapkan dengan nada datar atau tanpa nada, yaitu nada normal pada saat manusia berbicara, ini untuk memudahkan proses analisa suara tersebut. Begitu juga intonasi dan volume pengucapan huruf harus seragam dari awal perekaman sampai akhir, atau tidak boleh berubah-ubah. Perekaman Suara Suara direkam menggunakan smartphone berbasis Android. Supaya kualitas suara lebih baik maka smartphone dapat dikoneksikan dengan earphone, headset, ataupun microphone yang menggunakan 3.5mm 4-conductor TRRS phone connector. Situasi perekaman adalah di ruangan sepi dan bebas noise untuk menghindari adanya suara-suara yang tidak diinginkan. Waktu maksimal untuk merekam suara adalah 3 detik. Hasil Rekaman Suara yang direkam adalah saat pengucapan 5 huruf vokal (a, e, i, o, u) dimana satu huruf adalah satu file rekaman. File rekaman menggunakan format (.wav) dan sample rate 44100 Hz Mono 16-bit. Masing masing huruf direkam dengan waktu maksimal 3 detik. File tersebut kemudian diubah atau dipotong secara manual menggunakan perangkat lunak pada komputer (PC) untuk menghilangkan rekaman kosong seperti terlihat pada gambar 5. METODE Blok Diagram Tujuan dari penelitian ini adalah menganalisa sinyal suara manusia dan mengidentifikasi jenis kelamin dari suara tersebut, saat mengucapkan huruf vokal (a, e, i, o, u) dengan kondisi suara manusia sehat (tidak serak) dan suara dari manusia yang berusia 17-30 tahun. Penelitian yang dilakukan dijelaskan pada blok diagram gambar 4.. JCONES Vol. 5, No. 1 (2016) Hal: 179

(.wav). kemudian nilai karakteristik dari file tersebut di-input-kan ke dalam perhitungan STFT untuk mendapatkan nilai rata-rata STFT, nilai waktu frekuensi saat amplitudo maksimal, dan rata-rata dari nilai amplitudo. Kemudian nilai-nilai tersebut digunakan untuk perhitungan pada jaringan saraf tiruan, maupun dapat ditampilkan sebagai spektrogram. Gambar 5. Bagian sinyal yang dipotong/dihilangkan Terkadang pada saat rekaman, seseorang baru mulai berbicara pada waktu tertentu sehingga terdapat waktu jeda. Untuk mendapatkan sinyal yang diinginkan, maka perlu dilakukan cropping atau menghilangkan waktu jeda tersebut atau bagian sinyal yang tidak perlu (dalam hal ini suara hembusan nafas maupun noise lainnya) seperti terlihat pada gambar 5. Panjang waktu rekaman setelah crop hanya dibatasi sampai 1 detik. Sehingga untuk satu orang memiliki 5 file berformat (.wav). Ekstraksi Ciri Pada bagian ini, file suara yang telah di potong dan di ubah akan dianalisa menggunakan perangkat lunak Matlab untuk mendapatkan nilai STFT. Adapun alur proses dari STFT digambarkan pada diagram alur di gambar 6. Gambar 6. Diagram alir proses STFT Pada gambar 6, file yang diinputkan akan dibaca oleh Matlab dan di ekstraksi karakteristik dari file Pengujian Sistem Pengujian yang dilakukan adalah menggunakan metode jaringan saraf tiruan backpropagation dengan input nilai STFT, nilai frekuensi dan waktu saat amplitude, dan nilai rata-rata amplitudo pada sebuah sinyal suara. Neuron input berjumlah sebanyak 20 untuk satu data pelatihan, dan banyaknya responden adalah sebanyak 30 (laki-laki 15, perempuan 15) seperti terlihat pada gambar 7: Gambar 7. Arsitektur backpropagation Pada gambar 7. Nilai X1, X2, X3, X4, adalah nilai untuk fitur suara a pada data responden pertama, kemudian X5, X6, X7, X8, adalah nilai fitur suara e pada data responden pertama demikian seterusnya untuk huruf vokal i, o, dan u. Variabel j adalah banyaknya data pelatihan pada backpropagation. Nilai awal bobot B1, B2, B3, dan nilai W pada masing masing layer adalah nilai random dari -1 sampai 1. Nilai target adalah nilai 1 sebanyak 15 (untuk input perempuan), dan nilai 0 sebanyak 15 (untuk input laki-laki). Output dari gambar 7 adalah sebuah nilai antara 0 sampai 1. Nilai tersebut kemudian di threshold untuk membatasi data pelatihan suara perempuan atau data pelatihan suara laki-laki. Nilai yang lebih besar atau sama dengan 0.5 (>=0.5) akan dianggap sebagai perempuan, dan nilai yang lebih kecil dari 0.5 akan dianggap sebagai laki-laki (<0.5). setiap input Xnj dan bias B1 akan dikalikan dengan Wi pada layer input, dan kemudian hasilnya akan menjadi input bagi masing-masing neuron Zi, begitu juga dengan bias; dan diulang sebanyak jumlah data pelatihan JCONES Vol. 5, No. 1 (2016) Hal: 180

(30). Kemudian hasil inputan pada Zi akan diaktivasi dengan fungsi sigmoid biner untuk menghasilkan nilai antara 0 sampai 1. Setelah masing-masing neuron diaktivasi, maka output dari Zi akan menjadi input ZZi. Untuk melanjutkan perhitungan ke hidden layer 2, dan output, maka output dari Zi dan juga bias B2 dikalikan pada W pada hidden layer 1 untuk dimasukkan pada hidden layer 2 (ZZi). Masukkan dari Hidden layer 1 (Zi) nantinya akan diaktivasi dahulu sebelum menjadi input ZZi. Input pada ZZi nantinya akan digunakan untuk menghitung nilai keluaran pada alur maju dengan cara mengalikan ZZi dan bias B3 dengan bobot Wi pada hidden layer 2. Hasil dari perkalian ini akan menghasilkan nilai output Y yang nilainya akan diaktivasi untuk perhitungan alur mundur. Setelah menghasilkan keluaran Y yang telah diaktivasi, maka akan dicari selisih (error) dari target awal dengan Y, dan kemudian menghitung koreksi bobot dan bobot bias dan mengubah bobot garis yang berhubungan langsung dengan unit keluaran. Dengan cara yang sama, dihitung faktor error di setiap unit di hidden layer sebagai dasar perubahan bobot semua garis yang berasal dari unit tersembunyi di layer di bawahnya. Demikian seterusnya hingga semua faktor error di unit hidden yang berhubungan langsung dengan unit masukan dihitung. Umumnya kondisi penghentian yang dipakai adalah jumlah iterasi atau kesalahan. Toleransi kesalahan yang digunakan di penelitian ini adalah 0.01. Nilai learning rate (α) adalah adalah laju pembelajaran, semakin besar learning rate akan berpengaruh pada semakin besarnya langkah pembelajaran. Sehingga dalam penelitian ini, learning rate yang digunakan adalah 0.1 HASIL DAN PEMBAHASAN Data rekaman suara akan diinputkan ke dalam Matlab untuk kemudian di ekstraksi ciri-cirinya. Yaitu nilai STFT, nilai waktu dan frekuensi saat amplitudo terbesar /, dan nilai rata-rata amplitudo pada satu file. Data-data tersebut dinormalisasi terlebih dahulu sebelum dilakukan pengujian. Tabel 1 dan 2 adalah hasil nilai ekstraksi STFT, yang diambil dari 1 responden laki-laki dan perempuan. Tabel 1. Hasil Ekstraksi Ciri STFT dari satu responden laki-laki Amplitudo Huruf STFT Vokal Value (db) (s) (Hz) A 193.01-8.4734 0.255 678.295 E 211.73-7.6694 0.116 882.861 I 152.85-10.4998 0.290 678.295 O 195.34-8.3693 0.185 732.128 U 142.95-11.0811 0.116 785.961 Tabel 2. Hasil Ekstraksi Ciri STFT dari satu responden perempuan Amplitudo Huruf STFT Vokal Value (db) (s) (Hz) A 129.75-11.9230 0.058 979.760 E 212.33-7.6450 0.104 1001.293 I 247.82-6.3027 0.069 968.994 O 116.52-12.8567 0.352 1015.625 U 185.75-8.8066 0.069 1152.026 Pada tabel 1 dan 2 dapat dilihat hasil ekstraksi fitur suara menggunakan STFT. Terdapat nilai STFT value saat amplitudo, kemudian nilai amplitudo dalam desibel, dan nilai waktu dan frekuensi saat amplitudo. Dapat dilihat bahwa nilai-nilai tersebut tidak seragam, sehingga tidak dapat dijadikan masukan untuk backprogagation. Cara untuk menseragamkan nilai tersebut adalah menormalisasikan menjadi sebuah bilangan antara 0 sampai 1 dengan cara membagi bilangan tersebut dengan bilangan terbesarnya. Adapun nilai terbesar dari hasil normalisasi selalu menunjukkan angka 1, dan nilai terkecil adalah nilai 0, hal ini dikarenakan data dinormalisasi menjadi nilai antara 0 sampai 1. Dalam hal ini, penggunaan nilai maksimal atau nilai terbesar tidak berlaku untuk nilai STFT dan nilai amplitudo, karena pada perhitungan sebelumnya nilai yang digunakan adalah nilai terbesar dari matriks STFT, dan nilai terbesar dari nilai amplitudo. Sehingga untuk alternatifnya adalah merata-rata nilai yang sudah dinormalisasi untuk mendapatkan nilai yang berbeda setiap rekaman sinyal suara. Hasil normalisasi tabel 1 dan 2 ditunjukkan pada tabel 3 dan 4 JCONES Vol. 5, No. 1 (2016) Hal: 181

Tabel 3. Hasil Ekstraksi Ciri STFT dari satu responden laki-laki Huruf STFT Average Vokal Value amplitude A 0.0061 0.4819 0.2985 0.0308 E 0.0074 0.5181 0.6000 0.0205 I 0.0068 0.5519 0.6324 0.0127 O 0.0042 0.4419 0.5541 0.0210 U 0.0035 0.4521 0.6290 0.0146 Tabel 4. Hasil Ekstraksi Ciri STFT dari satu responden perempuan Huruf STFT Average Vokal Value amplitude A 0.0068 0.5473 0.2857 0.0522 E 0.0075 0.5562 0.4872 0.0313 I 0.0084 0.5143 0.4286 0.1416 O 0.0043 0.4676 0.3077 0.0317 U 0.0045 0.5172 0.4889 0.0327 Data pada tabel 3 dan 4 sudah seragam atau tidak terdapat nilai yang selisihnya terlalu besar dengan nilai yang lainnya. Data tersebut kemudian dapat ditampilkan kedalam bentuk spektrogram seperti dibawah berikut sebanyak 20, yaitu banyaknya fitur suara pada kelima huruf vokal, dengan nilai target adalah 0 untuk laki-laki dan 1 untuk perempuan. Hasil dari pengujian data yang digunakan sebagai training adalah sebagai berikut: Gambar 9. Grafik error pada setiap iterasi Pada gambar 9, dapat terlihat bahwa sistem akan berusaha meminimalkan nilai mean square error yang dihasilkan pada setiap iterasi. Error sudah mencapai dibawah 0.1 saat iterasi ke 1000 dan seterusnya. Saat error sudah sama dengan nilai threshold, dalam hal ini dibatasi sampai 0.01, atau jumlah iterasi sudah terpenuhi, maka bobot terakhir yang dipakai untuk pelatihan akan disimpan kedalam file (.mat) untuk nantinya akan digunakan dalam pengujian. Tabel 5 adalah hasil persentase keberhasilan pengenalan 30 data training dimana n adalah banyak data training, dan z adalah data training yang berhasil dikenali, dengan nilai MSE = 0.0107, dengan iterasi sebanyak 10000. Gambar 7. Spektrogram huruf a pada salah seorang responden laki-laki. Tabel 5. Persentase keberhasilan pengenalan pada data training Jenis kelamin n z error (%) Laki-laki 15 15 0 100% Perempuan 15 15 0 100% Jumlah persentase total 100% Gambar 8. Spektrogram huruf a pada salah seorang responden perempuan. Setelah didapat nilai-nilai STFT tersebut, kemudian akan dilakukan pengujian dengan backpropagation, dengan jumlah neuron input JCONES Vol. 5, No. 1 (2016) Hal: 182

15 10 5 0 Laki-laki Perempuan Banyak data pelatihan Banyak data yang berhasil dikenali Gambar 10. Grafik keberhasilan pengenalan pada data training Saat proses pengujian atau identifikasi, sistem sudah dapat mengenali data yang dilatihkan dengan baik dengan persentase keberhasilan total 100% seperti ditunjukkan pada table 5 dan gambar 10. Dengan nilai bobot optimal yang sudah tersimpan tadi, maka akan diuji sebuah data baru dengan harapannya, data tersebut dapat langsung diidentifikasi jenis kelaminnya. Perlu diketahui bahwa pada pengujian, algoritma backpropagation cukup hanya dilakukan proses feed forward, sehingga nilai yang dikeluarkan langsung diidentifikasi. Saat pengujian pada data baru, sistem juga dapat mengidentifikasi suara laki-laki dan perempuan, namun terjadi kesalahan pada masing masing suara seperti terlihat pada tabel 6. Hal ini dapat terjadi karena ada kemiripan suara laki-laki pada perempuan saat perekaman suara, sehingga akan menghasilkan fitur-fitur suara hampir sama dengan laki-laki, maupun kemiripan suara perempuan pada suara laki-laki. Hal ini juga dapat dipengaruhi dari kurang banyaknya data pelatihan, sehingga untuk bisa mengenali, sistem perlu banyak mengenali banyak data untuk memahami berbagai macam pola. Dari tabel 4. dapat dibuat dalam bentuk grafik seperti pada gambar 11 Tabel 6. Persentase keberhasilan pengenalan pada data baru Jenis kelamin n z error (%) Laki-laki 7 6 1 86% Perempuan 7 6 1 86% Jumlah persentase total 86% 7 6.5 6 5.5 Laki-laki Perempuan Banyak data baru Berhasil dikenali Gambar 11. Grafik keberhasilan pengenalan pada data baru Gambar 11. dan tabel 6. menunjukkan bahwa presentase pengujian 14 data baru yang belum pernah dilatih, yaitu sebanyak 7 data laki-laki dan 7 data perempuan. Terjadi kesalahan pengenalan satu data training pada masing-masing data uji laki-laki dan perempuan, sehingga yang berhasil dikenali adalah 6 data laki-laki dan 6 data perempuan dengan tingkat keberhasilan masingmasing adalah 86%. SIMPULAN Berdasarkan penelitian diatas, dapat diambil kesimpulan sebagai berikut: 1. Penelitian ini berhasil mengekstraksi fitur-fitur pada suara manusia saat mengucapkan huruf vokal dengan menggunakan metode short time fourier transform. 2. Dari hasil identifikasi yang telah dilakukan, persentase keberhasilan pengenalan data suara pada laki-laki adalah sebesar 86% dan pada perempuan 86%. DAFTAR PUSTAKA Hayadi, Tulus., Suprapto, Yoyon K., Sumpeno, Surya. 2012. Estimasi Sinyal Gamelan Menggunakan Kalman Filter untuk transkripsi. Jurusan Teknik Elektro FTI ITS. Jong, J.S., 2005. Jaringan Syaraf Tiruan dan Pemrogramannya Menggunakan Matlab. Yogyakarta, Andi Kiki., Kusumadewi, Sri. 2004. Analisis Jaringan Saraf Tiruan dengan Metode Backpropagation Untuk Mendeteksi Gangguan Psikologi. Universitas Islam Indonesia. Utari, Wirda Ayu. 2010. Pengenalan Pola Dengan Menggunakan MetodeBackpropagation Menggunakan Matlab. Universitas Gunadarma. JCONES Vol. 5, No. 1 (2016) Hal: 183