Pengenalan Gender Melalui Suara dengan Algoritma Support Vector Machine (SVM)

dokumen-dokumen yang mirip
udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

PENDAHULUAN. Latar Belakang

SISTEM PENGOLAHAN SUARA MENGGUNAKAN ALGORITMA FFT (FAST FOURIER TRANSFORM)

Speaker Recognition Menggunakan MFCC dan Algoritma DTW

PENDAHULUAN. Latar Belakang

APLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY

Pengenalan Wajah Manusia dengan Hidden Markov Model (HMM) dan Fast Fourier Transform (FFT)

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

BAB II LANDASAN TEORI

Implementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC)

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BAB I PENDAHULUAN 1.1 Latar Belakang

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification

PENDAHULUAN. Latar Belakang

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

Available online at TRANSMISI Website TRANSMISI, 13 (3), 2011,

Model Arsitektur Backpropogation Dalam Memprediksi Faktor Tunggakan Uang Kuliah (Studi Kasus AMIK Tunas Bangsa)

PenerapanHidden Markov Model (HMM) pada Pengenalan Penutur

IMPLEMENTASI MEL FREQUENCY CEPSTRAL COEFFICIENT DAN DYNAMIC TIME WARPING UNTUK PENGENALAN NADA PADA ALAT MUSIK BELLYRA

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

APLIKASI PENGENALAN UCAPAN DENGAN EKSTRAKSI MEL-FREQUENCY CEPSTRUM COEFFICIENTS

APLIKASI PENGENALAN GENDER MENGGUNAKAN SUARA

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

BAB 1 PENDAHULUAN. Universitas Indonesia

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI

Deteksi Mobil pada Citra Digital Menggunakan C-HOG dan Support Vector Machine

Kata Kunci: Suara; Mel Frequency Cepstral Coefficient; K-NEAREST NEIGHBOUR

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

BAB 1 PENDAHULUAN. berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition

Rancang Bangun Sistem Pembuatan Surat Keputusan dan Sertifikat di STMIK GI MDP

IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: PENERAPAN ALGORITMA KALMAN FILTER UNTUK PELACAKAN WAJAH

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...

INDEPT, Vol. 3, No.1, Februari 2013 ISSN

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

TINJAUAN PUSTAKA. Pengenalan Suara

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

Identifikasi Jenis Buah Jeruk Menggunakan Metode Jaringan Syaraf Tiruan Berdasarkan Tekstur Kulit

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Pengenalan Suara Burung Menggunakan Mel Frequency Cepstrum Coefficient dan Jaringan Syaraf Tiruan pada Sistem Pengusir Hama Burung

Klasifikasi Burung Berdasarkan Suara Kicau Burung Menggunakan Jaringan Syaraf Tiruan Propagasi Balik

Gambar 2.1. Katak Sawah (Djatmiko, 2005)

Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW

DETEKSI SLEEP APNEA MELALUI ANALISIS SUARA DENGKURAN DENGAN METODE MEL FREKUENSI CEPSTRUM COEFFICIENT

EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON

Bab 3. Perancangan Sistem

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

PENERAPAN ALGORITMA DIJKSTRA DAN FUZZY LOGIC SUGENO PADA GAME ZOMBIE SHOOTER

Pengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu

Analisis Koefisien Cepstral Emosi Berdasarkan Suara

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

Jaringan Syaraf Tiruan pada Robot

Identifikasi Suara Pengontrol Lampu Menggunakan Mel-Frequency Cepstral Coefficients dan Hidden Markov Model

Pengenalan Karakter Suara Laki-Laki Aceh Menggunakan Metode FFT (Fast Fourier Transform)

Warble Of Lovebird Classification Using Mel Frequency Cepstral Coefficient (MFCC)

Verifikasi Tanda Tangan Dengan Algoritma K-Nearest Neighbor dan Ekstraksi Ciri Harris Corner

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

BAB I PENDAHULUAN ! <!!!!!

ANALISIS PERFORMA DAN KUALITAS CITRA BERBASIS ANDROID MENGGUNAKAN ALGORITMA KRIPTOGRAFI RIJNDAEL, DAN SERPENT

Bab 1. Pendahuluan. aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi

PENERAPAN LEARNING VECTOR QUANTIZATION

Perbandingan Estimasi Selubung Spektral dari Bunyi Voiced Menggunakan Metoda Auto-Regressive (AR) dengan Weighted-Least-Square (WLS) ABSTRAK

Jony Sitepu/ ABSTRAK

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model

PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA

Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient

PENERAPAN METODE HISTOGRAM OF ORIENTED GRADIENT (HOG) PADA OBJECT COUNTING BERBASIS RASBERRY PI

IMPLEMENTASI PENGENALAN WAJAH MENGGUNAKAN ALGORITMA PRINCIPAL COMPONENT ANALYSIS(PCA) DAN IMPROVED BACKPROPAGATION

Penerapan Algoritma K-Means Clustering Untuk Pengelompokkan Citra Digital Dengan Ekstraksi Fitur Warna RGB

SISTEM PENGAMBILAN KEPUTUSAN KREDIT RUMAH DENGAN METODE FUZZY SAW MADM

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

PENGEMBANGAN SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN KARYAWAN TERBAIK DENGAN METODE PROFILE MATCHING DI PT SUARA MERDEKA

1. BAB I PENDAHULUAN 1.1. Latar Belakang

APLIKASI PENGENALAN SUARA DIGITAL NADA DASAR PIANO SKRIPSI M. ARDIANSYAH

BAB I PENDAHULUAN I.1 Latar Belakang

Perancangan Sistem Informasi Manajemen Pemasangan Dan Pembayaran Iklan Pada Sumeks Cindo

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI

BAB I PENDAHULUAN. menggunakan voice recognition dapat membantu user memilih produk buah

PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS

Desain Model Fuzzy Gejala Penyakit Untuk Sistem Pakar Pendiagnosa Penyakit Anak

ANALISIS DAN SIMULASI IDENTIFIKASI JUDUL LAGU MELALUI SENANDUNG MANUSIA MENGGUNAKAN EKSTRAKSI CIRI LPC (LINEAR PREDICTIVE CODING)

Perbandingan Ekstraksi Ciri Full, Blocks, dan Row Mean Spectrogram Image Dalam Mengidentifikasi Pembicara

Rancang Bangun Aplikasi Pendeteksi Suara Tangisan Bayi

PENERAPAN ALGORITMA FLOYD WARSHALL DAN METODE FINITE STATE MACHINE PADA APLIKASI PERMAINAN MAZE TREASURE

Transkripsi:

IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 1 Pengenalan Gender Melalui Suara dengan Algoritma Support Vector Machine (SVM) Adi Rinaldi *1, Hendra 2, Derry Alamsyah 3 1,2 STMIK GI MDP; Jl. Rajawali No.14,+62(711)376400/376360 3 Program Studi Teknik Informatika, STMIK GI MDP Palembang e-mail: *1 adi.rinaldi@mhs.mdp.ac.id, 2 henforterviau@mhs.mdp.ac.id, 3 derry@mdp.ac.id Abstrak Suara merupakan salah satu ciri biometric yang dimiliki oleh manusia, sama halnya seperti sidik jari, DNA, retina mata, dan lain sebagainya tidak ada dua manusia yang memiliki suara yang sama. Beberapa penelitian terkait mengenai suara bertujuan untuk melakukan proses pengenalan identitas maupun penyempurnaan HCI (Human Computer Interaction). Pada penelitian ini, penulis melakukan penelitian mengenai pengenalan gender melalui suara, salah satu alasan pengenalan gender sendiri dilakukan adalah untuk membantu mempercepat proses identifikasi pada saat melakukan pengenalan identitas. Algoritma yang digunakan dalam penelitian ini adalah SVM (Support Vector Machine) dengan bantuan algoritma MFCC (Melfrequency cepstral coefficient) untuk ekstraksi dimana didalamnya terdapat proses filtering yang telah disesuaikan dengan pendengaran manusia. Hasil dari proses implementasi kedua algoritma sendiri memberikan tingkat akurasi sebesar 90,90% untuk identifikasi laki-laki dan 81,81% untuk identifikasi perempuan. Kata kunci : SVM, MFCC, Pengenalan Gender, Suara Abstract Voice is one of the biometric characteristic from human, similar to fingerprint, DNA, retina, etcetera there s no human with the same voice. Some related experiments about voice have purposes for identity recognition also improving HCI also known as Human Computer Interaction. In this experiment, the author performs gender recognition from human s voice, one of the reasons why gender recognition been performed is to fasten identification processes on identity recognition. Algorithm that been implemented on this experiment are SVM (Support Vector Machine) with the help of MFCC (Mel-frequency Cepstral Coefficient) algorithm for extraction which there s filtering process to adjusting human s hearing. The result from implementation of both algorithm are 90,90% for male identification and 81,81% for female identification. Keywords : SVM, MFCC, Gender Recognition, Voice P 1. PENDAHULUAN roses identifikasi merupakan salah satu bidang teknologi yang sedang banyak dikembangkan, alasannya sendiri bermacam-macam beberapa diantara adalah untuk pengembangan sistem keamanan, marketing, Human and Computer Interaction (HCI), autentikasi biometrik, dan lain-lainnya. Salah satu cara dalam proses identifikasi seseorang adalah dengan cara mengidentifikasi ciri biometriknya (identitas manusia) yang dilakukan karena fitur-fitur yang terdapat di dalamnya bersifat unik dalam artian berbeda antara setiap manusia, salah satu contohnya adalah suara. Suara laki-laki dan perempuan memiliki ciri khas masing-masing dikarenakan resonansi dalam tenggorokan yang berbeda-beda, dengan melakukan pengolahan sinyal suara akan Received June1 st,2012; Revised June25 th, 2012; Accepted July 10 th, 2012

2 ISSN: 1978-1520 didapatkan ciri khas tersebut dalam bentuk yang dapat dikenali oleh komputer. Dengan ciri khas tersebut komputer dapat mengidentifikasi gender melalui sinyal suara. Ekstraksi fitur terhadap sinyal merupakan cara untuk mengetahui nilai dari pitch dan formant yang terdapat dalam sinyal. Proses ekstraksi fitur dianggap paling penting dalam sistem pengenalan suara yang mempunyai tujuan menangkap fitur untuk membedakan suara yang satu dengan suara yang lain. Ada beberapa kendala mungkin dihadapi dalam proses ekstraksi fitur. Kendala tersebut muncul dari variabilitas suara seperti kondisi seseorang sakit, emosi, dialog asing dan lingkungan. Lingkungan melatarbelakangi kebisingan, gema, mikrofon dan saluran tranmisi[1]. Berdasarkan penelitian-penelitian terhadap pengenalan gender yang telah ada sebelumnya, teknik ekstraksi ciri yang digunakan untuk sinyal suara antara lain Linear Predictive Coding (LPC)[ 2], Mel Frequency Cepstral Coefficients (MFCC)[3], dan lainnya. Dari penelitian terdahulu, dapat dilihat bahwa algoritma Mel Frequency Cepstral Coefficients (MFCC) merupakan algoritma dengan akurasi yang paling mendekati 100% dalam hal ekstraksi sinyal suara. Lalu untuk beberapa teknik klasifikasi yang digunakan antara lain Back Propagation Algorithm (BPA)[4], Learning Vector Quantization (LVQ)[2], dan Support Vector Machine (SVM)[5]. Dari penelitian-penelitian tersebut diketahui bahwa algoritma Support Vector Machine (SVM) dengan menggunakan kernel Radial Basis Function (RBF) memiliki tingkat akurasi diatas 90%. 2. METODE PENELITIAN 2.1 Studi Literatur 1. Penelitian Terkait Pada penelitian [6] dibuat program aplikasi dari pengenalan ucapan dengan ekstraksi Mel-Frequency Cepstrum Coefficients (MCFF) melalui Jaringan Syaraf Tiruan (JST) Learning Vector Quantization (LVQ) untuk mengoperasikan kursor komputer. Hasil penelitian menunjukkan tingkat akurasi dengan data latih 88,89% sedangkan dengan data uji 83,99%. Pada penelitian[7] dibuat program aplikasi untuk mengetahui emosi seseorang melalui ucapannya menggunakan Mel Frequency Cepstrum Coefficient (MFCC) dan Linear Prediction Cepstral Coefficients (LPCC) untuk ekstraksi ciri dan Support Vector Machine (SVM) untuk melakukan pengklasifikasian. Hasil penelitian menunjukkan tingkat akurasi dengan data latih 88,59%. Pada penelitian[8] dilakukan ekstraksi informasi melalui speech signal dan menampilkannya dalam set vector yang disebut ciri khas. Ciri khas itu kemudian diekstraksi menggunakan First Fourier Transform (FFT). Hasil penelitian menunjukkan tingkat akurasi rata-rata 80%. Pada penelitian[9] dilakukan pembuatan aplikasi pengenalan suara paru-paru normal dan abnormal menggunakan Mel Frequency Cepstrum Coefficient (MFCC) sebagai ekstraksi cirinya dan Backpropagation sebagai classifier-nya. Hasil penelitian menunjukkan tingkat akurasi mencapai 93,97% untuk data latih dan 92,66% untuk data uji. a) Mel Frequency Cepstral Coefficients (MFCC) Mel Frequency Cepstral Coefficients (MFCC) adalah salah satu jenis ekstraksi fitur yang didasari atas variasi bandwidth kritis terhadap frekuensi pada telinga manusia yang merupakan filter yang bekerja secara linier pada frekuensi rendah dan bekerja secara logaritmik pada frekuensi tinggi untuk menangkap karakteristik fonetis penting dari sinyal ucapan[6]. M(f) = 1125 ln (1 + f 700 ) (1) MFCC adalah persepsi yang didasari oleh pendengaran manusia dimana pendengaran manusia tidak dapat mendengar frekuensi lebih dari 1 KHz. Dengan kata lain MFCC didasarai variasi batas pendengaran telinga manusia dengan frekuensi. Keseluruhan IJCCS Vol. x, No. x, July201x : first_page end_page

IJCCS ISSN: 1978-1520 3 proses MFCC adalah pre-emphasis, framing, windowing, DFT, mel filter bank, DCT, dan delta energy[10]. 1. Pre-Emphasis Pre-emphasis merupakan proses yang dilakukakan untuk memperbaiki kualitas sinyal sehingga dapat meningkatkan akurasi pada saat ekstraksi ciri didapatkan. S 2 (n) = S(n) a S(n 1)... (2) S(n) = value sinyal index ke n S(n 1) = value sinyal index ke (n 1) a = konstanta 0,95 < a < 1 2. Frame Blocking Frame blocking adalah proses dimana sinyal-sinyal dibagi menjadi frame-frame N sampel dengan frame-frame berdekatan dengan spasi M dimana M lebih kecil daripada N. Proses ini berlanjut hingga semua sinyal suara dapat terproses. Gambar 1 Proses Frame Blocking Untuk menghitung sample point digunakan rumus : N = sample rate waktu perinterval...(3) Dimana terdapat irisan antara sample point : M = N 2 (3.1) 3. Windowing Windowing adalah proses untuk meminimalisir diskontinuitas sinyal pada permulaan dan akhir setiap frame. Hamming window dihitung dengan persamaan (4) untuk setiap n sampel pada setiap frame. w(n) = 0.54 0.46 cos ( 2πn n 1 ) 0 n N 1 (4) Kemudian proses windowing dihitung dengan persamaan (4.1). y(n) = x(n). w(n), 0 n N 1... (4.1) dengan y(n) = sinyal hasil windowing sampel ke n x(n) = nilai sampel ke n w(n) = nilai window ke n N = jumlah sampel dalam frame Title of manuscript is short and clear, implies research results (First Author)

4 ISSN: 1978-1520 4. FFT FFT adalah sebuah algoritma cepat untuk implementasi DFT yang dioperasikan pada sebuah sinyal waktu-diskrit dengan memanfaatkan sifat periodikal dari transformasi fourier. FFT dihitung dengan persamaan (5). f(n) = N 1 y k e 2πjkn/N K=0, n=0,1,2,,n 1 (5) 5. Filterbank Filterbank adalah teknik filter yang menggunakan representasi konvolusi. Konvolusi dapat dilakukan dengan melakukan multiplikasi antara spectrum sinyal dengan koefisien filterbank. Gambar 2 Proses Mel-spaced filter bank Formula yang umum digunakan untuk mengkonversi frekuensi ke mel-scale dapat dilihat pada persamaan (2.7): M(f) = 2595 log 10 (1 + f )...(6) 700 Selain formula di atas, terdapat formula lain yang dapat digunakan untuk mengkonversi frekuensi ke mel-scale, salah satunya pada persamaan (2.8) : M(f) = 1125 ln (1 + f )...(6.1) 700 Mel filterbank merupakan koleksi filter segitiga yang ditentukan dengan f c (m), tertulis seperti : f(k) < f c (m 1) H(k, m) = 0...(6.2) f c (m 1) f(k) < f c (m) H(k, m) = f(k) f c (m 1)...(6.3) f c (m) f c (m 1) f c (m) f(k) < f c (m + 1) H(k, m) = f(k) f c (m+1)...(6.4) f c (m) f c (m+1) f(k) f c (m + 1) H(k, m) = 0...(6.5) Nilai f c dihitung dengan : f c (m) = 700 e ( c(m)/1125) 1... (6.6) Hasil keluaran dari Mel Filterbank diperoleh dengan persamaan : IJCCS Vol. x, No. x, July201x : first_page end_page

IJCCS ISSN: 1978-1520 5 N 1 X (m) = ln( k=0 X(k). H(k, m) )...(6.7) 6. DCT DCT mengimplementasikan fungsi yang sama seperti FFT dengan lebih efisien melalui pengambilan keuntungan dari redudansi yang terdapat dalam sinyal sebenarnya. cn = K (log Sk) cos[n(k 1 ) π k 1 ], n = 1,2,, K...(7) 2 K 7. Delta Delta digunakan untuk menghitung jarak antara koefisien yang dihasilkan oleh MFCC. Hasil delta juga akan digunakan untuk proses pengklasifikasian sehingga akurasi pengklasifikasian dapat meningkat. Delta dihitung dengan menggunakan rumus : d(t) = N n=1 n(c t+n c t n ) 2 N n=1 n 2... (8) b) Support Vector Machine (SVM) Support Vector Machine adalah algoritma machine learning yang berasal dari teori pembelajaran statistik. Ide atau inti utama dari SVM adalah untuk mentransformasi input asli ke dimensi fitur yang lebih tinggi dengan menggunakan fungsi kernel dan untuk mencapai tingkat klasifikasi optimum di feature space yang baru dimana terdapat pemisah yang jelas antar fitur yang didapatkan dari penempatan optimal hyperplane pemisah[5]. Feature Space Feature Generation Gambar 3 Transformasi dari Feature Space ke Feature Generation Gambar 3 menunjukan metode untuk mengklasifikasikan data yang tidak dapat dipisahkan secara linear dengan cara mentranformasikan data ke dalam dimensi feature space sehingga nantinya dapat dipisahkan secara linier melalui proses pemetaan atau transformasi. Dengan menggunakan fungsi transformasi, maka fungsi hasil pembelajaran yang dihasilkan adalah m f(x) = wx + b atau f(x) = i=1 α i y i K(x, x i ) + b... (9) N Dengan w = i=1 α i y i x i...(9.1) Title of manuscript is short and clear, implies research results (First Author)

6 ISSN: 1978-1520 N Ld = α i 1 i=1 α 2 iα j y i y j K(x i x j )...(9.2) syarat 0 α i C dan α i y i = 0 i=1 Ld = Min 1 2 αt Hα + c T α... (9.3) H(i, j) = y i y j k(x i x j )... (9.4) b = 1 2 (w. x+ + w. x )... (9.5) Nilai x pada fungsi diatas menyatakan input vector, sedangkan b adalah skalar yang disebut sebagai bias. Asumsikan ada dua label kelas data y yang memiliki anggota nilai [+1,-1] yang menyatakan kelas negatif dan positif dimana nilai i =1 hingga N dengan nilai N merupakan panjang dari ukuran matriks. Untuk menghitung titik bobot w digunakan persamaan (9.1) dimana α i adalah nilai bobot setiap titik data, x i adalah vektor, dan y i adalah kelas data. Untuk mendapatkan nilai bobot setiap data (α i ) didapatkan dengan mendapatkan nilai maksimal dari Dualitas Lagrange Multipier (Ld) dari persamaan (9.2). Untuk menghitung Dualitas Lagrange Multipier digunakan Quadratic Programming pada persamaan (9.3). Dalam Quadratic Programming nilai yang dihasilkan adalah nilai minimum sehingga untuk memenuhi Dualitas Lagrange Multipier maka nilai dari Dualitas Lagrange Multipier dinegatifkan (-Ld) sehingga bisa didapatkan nilai maksimal dari persamaan Quadratic Programming. Untuk mendapatkan Quadratic Programming diperlukan Hessian Matrix yang dihitung dengan persamaan (9.4) dan c yang merupakan vektor dengan anggota konstanta bernilai 1. Nilai bias (b) akan didapatkan dengan persamaan (9.5) dimana bias merupakan setengah dari hasil perkalian titik bobot (w) dengan vector x + dan x -. Kemudian fungsi pengklasifikasian akan didapatkan dengan persamaan (9) dimana nilai titik bobot (w) dikalikan dengan fungsi kernel K(x i x j ) lalu ditambah dengan nilai bias (b). 2.2 Pengumpulan Data Data rekaman yang digunakan bersumber dari Telecommunications & Signal Processing Laboratory database dengan 24 pembicara (12 laki-laki dan 12 perempuan). Penulis mengambil 132 suara untuk training dari 22 pembicara (11 laki-laki dan 11 perempuan), diambil masing-masing 6 suara untuk setiap pembicara. Untuk data test diambil 66 suara dari 22 pembicara (11 laki-laki dan 11 perempuan), diambil masing-masing 3 suara untuk setiap pembicara. 2.3 Perancangan Rancangan sistem pada penelitian ini terdiri dari proses input suara, pre-emphasis, ekstraksi ciri suara dengan algoritma MFCC, dan pengklasifikasian suara dengan algoritma SVM. Proses ekstraksi ciri suara dengan algoritma MFCC terdiri dari proses framing, windowing, FFT, filter bank, DCT dan delta. Rancangan sistem pada penelitian ini dapat dilihat pada Gambar 4. N Gambar 4 Diagram Alir Perancangan IJCCS Vol. x, No. x, July201x : first_page end_page

IJCCS ISSN: 1978-1520 7 3. HASIL DAN PEMBAHASAN Gambar 5 menunjukkan proses pengekstraksian ciri suara yang di-input dan proses pengklasifikasian suara tersebut dan Gambar 6 menunjukkan hasil pengklasifikasian. Gambar 5 Tampilan Proses Ekstraksi Ciri dan Pengklasifikasian Gambar 6 Tampilan Hasil Pengklasifikasian 3.1 Analisa Hasil Pengujian Data rekaman yang digunakan pada penelitian ini bersumber dari Telecommunications & Signal Processing Laboratory database. Terdiri dari 24 pembicara (12 laki-laki dan 12 perempuan) yang membacakan Harvard Lists. Rekaman pembicara lakilaki diberi kode nama MA, MB, MC,, ML. Rekaman pembicara perempuan diberi kode nama FA, FB, FC,, FL. Setiap pembicara membaca 6 grup naskah, setiap naskah terdiri dari 10 kalimat. Pembicara MA dan FA membaca 1-6 Harvard lists, pembicara MB dan FB membaca 7-12 Harvard lists, dan seterusnya. Setiap kalimat direkam sebagai setiap file yang berbeda. Untuk contohnya, file dengan nama FB08_07 adalah kalimat ke 7 dari Harvard list ke 8 dengan pembicara perempuan kedua (FB). Semua rekaman pembicara ME dan beberapa rekaman pembicara FE Title of manuscript is short and clear, implies research results (First Author)

8 ISSN: 1978-1520 hilang ketika pihak Telecommunications & Signal Processing Laboratory database melakukan pengumpulan data, sehingga pada penelitian ini tidak menggunakan data rekaman dari pembicara ME dan FE. Untuk melakukan pengujian dilakukan proses training terlebih dahulu untuk mengenali gender melalui suara dengan baik. Pada training akan dipisahkan antara kelas positif dan kelas negatif. Data training ini akan digunakan sebagai bahan pembelajaran sistem untuk dapat melakukan proses klasifikasi pada saat pengujian. Pegujian dilakukan dengan cara melakukan proses ekstraksi ciri suara dan proses klasifikasi ciri. Ekstraksi ciri suara dilakukan dengan menggunakan algoritma MFCC dan untuk proses klasifikasi menggunakan algoritma SVM. Hasil ekstraksi ciri suara akan diklasifikasikan dengan algoritma SVM sehingga diketahui akurasi yang didapatkan dari data yang diujikan. Pengujian data training menggunakan data training sebanyak 132 suara dimana terdiri dari 66 suara laki-laki dan 66 suara perempuan. Pengujian dilakukan dengan menguji kembali suara yang dijadikan sebagai data training. Untuk pengujian akurasi pengenalan gender melalui suara dilakukan pengujian akurasi untuk masing-masing gender yaitu akurasi untuk laki-laki dan perempuan, sementara untuk proses training suara laki-laki dan perempuan digabung dengan ketentuan laki-laki merupakan kelas positif dan perempuan merupakan kelas negatif. Data training merupakan hasil ekstraksi ciri yang didapatkan dari algoritma MFCC yang akan digunakan untuk proses pembelajaran sistem. Algoritma MFCC akan menghasilkan 12 koefisisen mel dan 12 koefisien delta sehingga dihasilkan 24 koefisien. Dimana 12 koefisien pertama merupakan koefisien mel dan 12 koefisien selanjutnya merupakan koefisien delta. Setiap koefisien memiliki nilai pada setiap framenya, sehingga untuk satu koefisien terdapat nilai sebanyak frame nilai. Data yang diujikan untuk laki-laki dan perempuan masing-masing 66 suara. Suara yang diambil merupakan kalimat pertama dari setiap Harvard list dimana kalimat yang diucapkan pada file MA01_01 dan FA01_01 merupakan kalimat yang sama. Untuk pengenalan gender laki-laki, sistem berhasil mengenali 61 suara laki-laki dengan benar dari 66 suara sedangkan untuk pengenalan gender perempuan sistem berhasil mengenali 43 suara perempuan dengan benar dari 66 suara. Berdasarkan data tersebut, didapatkan akurasi sebesar 92,42% untuk pengenalan gender laki-laki dan 65,15% untuk pengenalan gender perempuan dengan menguji kembali data training. Pengujian data testing menggunakan suara yang berbeda dengan suara yang digunakan pada proses training. Pada pengujian ini training tetap menggunakan 132 suara yang terdiri dari 66 suara laki-laki dan 66 suara perempuan. Sementara untuk data yang diuji menggunakan data suara sebanyak 66 suara yang terdiri dari 33 suara laki-laki dan 33 suara perempuan. Suara yang terdapat pada data testing tidak terdapat pada data training, dan antara MA01_07 dan FA01_07, MB07_07 dan FB07_07, MC13_07 dan FC13_07, dan seterusnya adalah kalimat yang sama. Kalimat yang diucapkan pada data testing tidak ada di dalam data training. Sistem akan diuji untuk mengenali gender saat mengucapkan kalimat yang sama antara data testing yang diucapkan oleh pembicara laki-laki dan pembicara perempuan. sistem berhasil mengenali 30 suara laki-laki dengan benar dari 33 suara sedangkan untuk pengenalan gender perempuan sistem berhasil mengenali 27 suara perempuan dengan benar dari 33 suara. Berdasarkan data tersebut, didapatkan akurasi sebesar 90,90% untuk pengenalan gender laki-laki dan 81,81% untuk pengenalan gender perempuan dengan menggunakan data testing. IJCCS Vol. x, No. x, July201x : first_page end_page

IJCCS ISSN: 1978-1520 9 4. KESIMPULAN Dari hasil penelitian dan pembahasan yang dilakukan, maka dapat disimpulkan bahwa: 1. Algoritma klasifikasi fitur SVM (Support Vector Machine) dapat diterapkan untuk mengenali gender melalui suara dengan bantuan algoritma MFCC (Mel-Frequency Cepstral Coefficient) untuk ekstraksi ciri. 2. Pada pengujian data testing sebanyak 66 suara, terdiri dari 33 suara laki-laki dan 33 suara perempuan didapatkan akurasi sebesar 90,90% untuk pengenalan gender laki-laki dan 81,81% untuk pengenalan gender perempuan. 5. SARAN Saran untuk penelitian selanjutnya adalah gunakan feature selection untuk mereduksi fitur dari data. DAFTAR PUSTAKA [1] Riyanto, Eko 2013, Sistem Pengenalan Pengucap Manusia Dengan Ekstraksi Ciri Mfcc dan Algoritma Jaringan Saraf Tiruan Perambatan Balik Sebagai Pengenalanya, JSIB. [2] Bhaskoro, S. B., Altedzar Riedho W. D 2012, Aplikasi Pengenalan Gender Menggunakan Suara, Seminar Nasional Aplikasi Teknologi Informasi, h. 16-23, Yogyakarta. [3] Chavhan, Y., M. L. Dhore dan Pallavi Yesaware 2010, Speech Emotion Recognition Using Support Vector Machine, International Journal of Computer Applications, Vol. 1, No. 20, h. 6-9, India. [4] Sharma, S., Anupam Shukla dan Pankaj Mishra 2014, Speaker and Gender Identification on Indian Languages Using Multilingual Speech, International Journal of Innovative Science, Engineering & Technology, Vol. 1, No. 4, h. 522-525, India. [5] Kumar S. S., T. Ranga Babu 2015, Emotion and Gender Recognition of Speech Signals Using SVM, International Journal of Engineering Science and Innovative Technology, Vol. 4, No. 3, h. 128-137, India. [6] Setiawan, A., Achmad Hidayatno dan R. Rizal Isnanto 2011, Aplikasi Pengenalan Ucapan dengan Ekstraksi Mel-Frequency Cepstrum Coefficients (MFCC) Melalui Jaringan Syaraf Tiruan (JST) Learning Vector Quantization (LVQ) untuk Mengoperasikan Kursor Komputer, Transmisi, Vol. 13, No. 3, h. 82-86, Semarang. [7] Bera, S., Shanthi Therese dan Madhuri Gedam 2015, Emotion Recognition Using Combination of MFCC and LPCC with Supply Vector Machine, IOSR Journal of Computer Engineering, Vol. 17, No. 4, h. 1-8, India. [8] Ali, Md. S., Md. Shariful Islam dan Md. Alamgir Hossain 2012, Gender Recognition System Using Speech Signal, International Journal of Computer Science, Engineering and Information Technology, Vol. 2, No. 1, h. 1-9, Bangladesh. Title of manuscript is short and clear, implies research results (First Author)

10 ISSN: 1978-1520 [9] Syafria, F., Agus Buono dan Bib Paruhum Silalahi 2014, Pengenalan Suara Paru-Paru dengan MFCC sebagai Ekstraksi Ciri dan Backpropagation sebagai Classifier, Jurnal Ilmu Komputer Agri-Informatika, Vol. 3, No. 1, h. 28-37, Bogor. [10] Muda, L., Mumtaj Begam dan I. Elamvazuthi 2010, Voice Recognition Algorithms Using Mel Frequency Cepstral Coefficient (MFCC) and Dynamic Time Warping (DTW) Techniques, Journal of Computing, Vol. 2, No. 3, h. 138-143, Malaysia. IJCCS Vol. x, No. x, July201x : first_page end_page