BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

dokumen-dokumen yang mirip
BAB 3 PERANCANGAN SISTEM

BAB I PENDAHULUAN. waktu adalah suatu deret observasi yang berurut dalam waktu. Analisis data

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI)

BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM. penelitian laboratorium. Studi kepustakaan dilakukan untuk mencari teori atau

BAB II TINJAUAN PUSTAKA. terjadi karena bergetarnya suatu benda, yang menyebabkan udara di sekelilingnya

BAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul

BAB 1 PENDAHULUAN. Sistem Pakar (Expert System), Jaringan Saraf Tiruan (Artificial Neural Network), Visi

BABI PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

IMPLEMENTASI TEMU KEMBALI CITRA TEKSTUR MENGGUNAKAN ROTATED WAVELET FILTER

BAB IV HASIL DAN PEMBAHASAN. database dan database query, secara keseluruhan menggunakan cara yang sama.

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM

BAB 1 PENDAHULUAN. meruntuhkan bangunan-bangunan dan fasilitas umum lainnya.

BAB 2 LANDASAN TEORI

BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM. Metode penelitian yang digunakan pada penelitian ini adalah denoising

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

BAB I PENDAHULUAN. 1.1 Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang

PENGENALAN POLA SIDIK JARI BERBASIS TRANSFORMASI WAVELET DAN JARINGAN SYARAF TIRUAN BACKPROPAGATION

geofisika yang cukup popular. Metode ini merupakan metode Nondestructive Test yang banyak digunakan untuk pengamatan dekat

BAB I PENDAHULUAN. Suara merupakan salah satu media komunikasi yang paling sering dan

BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM

BAB 2 LANDASAN TEORI

BAB III PROTEKSI TRANSFORMATOR DAYA MENGGUNAKAN TRANSFORMASI WAVELET. 1980, dalam bahasa Prancis ondelette, yang berarti gelombang kecil.

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BAB III WAVELET. yang memenuhi

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

PENERAPAN METODE WAVELET TRANSFORM DALAM PEMBELAJARAN SOLMISASI NADA

Aplikasi Transformasi Wavelet Untuk Menghilangkan Derau Pada Sinyal Peluahan Sebagian

Pengolahan Citra untuk Bidang Pertanian(Menentukan Kematangan Buah) Oleh Nama:Wahyu Abid A. NRP : Kelas :2D4 IT(B)

Karakteristik Spesifikasi

PENDAHULUAN. Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN. 1 Universitas Kristen Maranatha

BAB I PENDAHULUAN Latar Belakang Masalah

BAB II STUDI PUSTAKA. T. C. Ling, dkk., (2008) dalam penelitiannya Automated Pavement

Jaringan Syaraf Tiruan pada Robot

BAB I PENDAHULUAN. Penyakit jantung merupakan salah satu penyebab kematian terbesar di

Ringkasan Tugas Akhir/Skripsi

Training. Level Transformasi Wavelet. Banyak Fitur. Ukuran Dimensi. 0 40x x30 600

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

Akurasi. Perangkat Lunak: Sistem operasi: Windows Vista Home Premium Aplikasi pemrograman: Matlab 7.0

SIMULASI REDUKSI DERAU SINYAL SUARA PADA GEDUNG KEBUN RAYA PURWODADI PASURUAN DENGAN METODE DWT

ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO

Analisa Suara Jantung Normal Menggunakan Discrete Wavelet Transform (DWT) dan Fast Fourier Transform (FFT)

BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM

PROGRAM BANTU PREDIKSI PENJUALAN BARANG MENGGUNAKAN METODE KNN Studi Kasus: U.D. ANANG

KOMPRESI CITRA MEDIS MENGGUNAKAN METODE WAVELET

Seminar Nasional APTIKOM (SEMNASTIKOM), Hotel Lombok Raya Mataram, Oktober 2016

BAB I PENDAHULUAN 1.1 Latar Belakang Penelitian terkait Gunung Merapi merupakan hal yang menarik untuk dilakukan. Berbagai metode digunakan untuk

TRANSFORMASI WAVELET DISKRIT PADA SINTETIK PEMBANGKIT SINYAL ELEKTROKARDIOGRAM

BAB 3 METODOLOGI PENELITIAN

BAB IV PEMBAHASAN. A. Hasil Model Radial Basis Function Neural Network (RBFNN) Langkah-langkah untuk menentukan model terbaik Radial Basis Function

DAFTAR ISI. Halaman LEMBAR PENGESAHAN SURAT PERNYATAAN ABSTRAK... i ABSTRACT... ii KATA PENGANTAR...iii DAFTAR ISI... v DAFTAR GAMBAR...

BAB III METODOLOGI PENELITIAN. Alat yang digunakan dalam penelitian ini adalah: b. Memori : 8192 MB. c. Sistem Model : Lenovo G40-45

Analisis Wavelet 2D untuk Citra Photo

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

BAB IV HASIL DAN PEMBAHASAN

MATERI PENGOLAHAN SINYAL :

Penyusun Tugas Akhir Alvian Adi Pratama [ ] Dosen Pembimbing Diana Purwitasari, S.Kom, M.Sc. Dr. Eng. Nanik Suciati, S.Kom., M.Kom.

Analisa Hasil Perbandingan Metode Low-Pass Filter Dengan Median Filter Untuk Optimalisasi Kualitas Citra Digital

TEKNIK PENGOLAHAN CITRA. Kuliah 8 Transformasi Fourier. Indah Susilawati, S.T., M.Eng.

Implementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC)

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN I.1 Latar Belakang

BAB II LANDASAN TEORI

LAMPIRAN PEDOMAN PENGGUNAAN ALAT

BAB I PENDAHULUAN 1.1 Latar Belakang

PERAMALAN DATA SAHAM DENGAN TRANSFORMASI WAVELET HAAR

EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON

BAB 1 PENDAHULUAN. berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition

BAB IV HASIL DAN PEMBAHASAN

KOMPRESI IMAGE DALAM SOURCE CODING MENGGUNAKAN METODE TRANSFORMASI WAVELET

PROGRAM PASCA SARJANA JURUSAN TEKNIK ELEKTRO ELEKTRONIKA

ANALISA IMAGE SIDIK JARI DIGITAL MENGGUNAKAN METODE WAVELET PAKET Oleh: Suparti Staf Pengajar Jurusan Matematika, FMIPA, Undip

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

ABSTRAK. Universitas Kristen Maranatha

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

Analisa Multiwavelet untuk Kompresi Suara

PENDAHULUAN. Latar Belakang

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA BAB I PENDAHULUAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

MATEMATIKA DI BALIK CITRA DIGITAL

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

yaitu dalam ketepatan pengenalan pola berdasarkan kelas untuk menampilkan genre.

APLIKASI METODE TRANSFORMASI WAVELET DISKRIT UNTUK KOMPRESI CITRA PADA PENGOLAHAN CITRA DIGITAL

1. Pendahuluan Latar Belakang

BAB 1 PENDAHULUAN. seperti isyarat dan tulisan. Suara yang dihasilkan oleh setiap orang pada dasarnya

Identifikasi Tanda Tangan Menggunakan Transformasi Gabor Wavelet dan Jarak Minskowski

BAB III METODOLOGI. dari suara tersebut dapat dilihat, sehingga dapat dibandingkan, ataupun dicocokan dengan

COMPARISON OF ONE DIMENSIONAL DCT AND LWT SPARSE REPRESENTATION

Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan

Transkripsi:

6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada dasarnya, fungsi dari speaker recognition merupakan contoh klasik dari masalah pattern recognition, yang pada umumnya berguna untuk menemukan jenis pola tertentu dari data-data yang diperoleh dari sensor. Proses training / pelatihan diperlukan untuk semua kasus pattern recognition. Misalnya pada speaker authentication system, suara pengguna sistem perlu didaftarkan. Selama proses tersebut, sistem mempelajari suara pengguna yang akan dikenali. Pengenalan pembicara (speaker recognition) dapat dilakukan dengan bergantung teks (text dependent) ataupun tidak bergantung teks (text independent). Istilah teks yang dimaksud disini adalah kata-kata yang diucapkan oleh pembicara. (Heinz, Heirtlein. 28. Definitions. The Speaker Recognition Homepage, (Online), (http://speaker-recognition.org, accessed on December 26, 28)) Perlu diingat dan ditekankan bahwa pengertian dari speaker recognition berbeda dengan pengertian speech recognition. Istilah speech recognition lebih 6

7 mengarah kepada proses mengetahui frasa apa yang diucapkan oleh pembicara, sedangkan istilah speaker recognition lebih mengarah kepada proses mengenali pembicara. 2.1.2 MatLab (Matrix Laboratory) Matlab merupakan salah satu perangkat lunak (program) yang banyak digunakan dalam perhitungan teknikal. Program Matlab mengintegrasikan komputasi, visualisasi dan pemrograman dalam suatu lingkungan program yang mudah digunakan, dimana masalah dan solusi diekspresikan ke dalam suatu notasi matematika yang mudah dipahami. Matlab adalah sebuah program berbasiskan operasi matematika, yang dalam hal ini berupa matriks. (The MathWorks, 25) Dalam pengoperasiannya, Matlab memiliki banyak toolbox guna mempermudah pengguna menggunakan perangkat lunak ini, termasuk membantu pengguna dalam mengimplementasikan metode atau algoritma tertentu. Toolbox Matlab yang digunakan untuk membantu penelitian ini adalah : o Wavelet Toolbox Wavelet toolbox adalah salah satu toolbox yang terintegrasi dalam Matlab. Wavelet toolbox menyediakan komponen untuk menganalisa dan mensintesis sinyal dan gambar, serta komponen untuk pengolahan aplikasi statistik dengan menggunakan teori wavelet. Wavelet toolbox merupakan toolbox untuk mengembangkan algoritma berbasis wavelet untuk melakukan proses analisa, sintesa, denoising, dan

8 kompresi sinyal. Analisa menggunakan teknik wavelet menghasilkan informasi yang lebih presisi mengenai suatu sinyal dibandingkan dengan teknik algoritma analisa sinyal lainnya, misalnya fourier. Dengan menggunakan wavelet toolbox ini, teknik transformasi wavelet dapat dilakukan dengan mudah dan cepat. (Misiti et al, 22).4.3.2.1 -.1 -.2 -.3 -.4 2 4 6 8 1 12 Gambar 2.1 Contoh Sinyal Yang Telah Diproses Oleh Wavelet Toolbox Meskipun banyak keuntungan yang dapat diperoleh dari program Matlab, tapi tetap saja terdapat kelemahan / kekurangannya. Salah satu kekurangan dari pengimplementasian teknik-teknik pengolahan sinyal digital menggunakan Matlab adalah pengolahan sinyal yang tidak real time. Matlab perlu menyimpan semua data dan informasi terlebih dahulu di dalam memori. Setelah data dan

9 informasi terkumpul lengkap di dalam memori, barulah Matlab akan mulai melakukan operasi perhitungan sesuai deretan instruksi / perintah yang telah diberikan. Matlab tidak bisa bekerja secara langsung (real time) seperti halnya prosesor prosesor DSP yang ada sekarang ini. 2.2 Teori-teori Khusus Landasan teori khusus yang digunakan dalam penelitian ini mencakup teori fourier transform, wavelet transform, dynamic time warping, dan k-nearest neighbor. 2.2.1 Fourier Transform (Transformasi Fourier) Dengan bantuan transformasi fourier, dapat diketahui frekuensi-frekuensi apa saja yang terkandung dalam sinyal tersebut (Spiegel, Murray R., 1974). Tetapi lama kelamaan, akhirnya disadarilah bahwa transformasi fourier masih memiliki kelemahan pula. Transformasi fourier hanya baik digunakan untuk menganalisa sinyal stasioner, tetapi sangat tidak efektif jika digunakan untuk menganalisa sinyal non-stasioner. Hal tersebut dikarenakan transformasi fourier menganalisa sinyal dalam keseluruhan waktu (dari awal sampling hingga akhir sampling), alhasil muncul asumsi bahwa informasi frekuensi sinyal yang didapatkan terjadi dalam setiap waktu pada sinyal tersebut. Padahal belum tentu fekuensi-frekuensi tersebut terjadi dalam setiap waktu pada sinyal tersebut. Dengan kata lain, informasi waktu kapan terjadinya frekuensi-frekuensi tersebut tidak dapat diketahui dengan jelas dan tepat. (Stein et al, 22)

1 Seiring berkembangnya teknik-teknik analisa sinyal, muncullah sebuah konsep baru yang dapat mengatasi kelemahan dari transformasi fourier tersebut, teknik analisa sinyal tersebut bernama Wavelet Transform. 2.2.2 Wavelet Transform (Transformasi Wavelet) Teori wavelet merupakan suatu konsep yang relatif baru dikembangkan. Kata wavelet sendiri diberikan oleh Jean Morlet dan Alex Grossmann pada awal tahun 198-an, dan berasal dari bahasa Perancis, ondelette yang berarti gelombang kecil. Kata onde yang berarti gelombang kemudian diterjemahkan ke bahasa inggris menjadi wave, lalu digabungkan dengan kata aslinya sehingga terbentuklah kata baru wavelet. Dengan menggunakan wavelet transform, informasi frekuensi berikut informasi waktu kapan terjadinya frekuensi tersebut pada sinyal dapat diketahui dengan presisi. Fungsi dari mother wavelet (fungsi window wavelet) adalah sebagai berikut : 1 t b Ψa, b () t = Ψ (1) a a,dimana a adalah bilangan positif yang menunjukkan parameter skala (scale) dan b adalah bilangan real yang menyatakan pergeseran waktu (shift). Berdasarkan jenis sinyal yang diprosesnya, transformasi wavelet dapat dibagi menjadi dua bagian besar, yaitu Continuous Wavelet Transform (CWT) dan Discrete Wavelet Transform (DWT).

11 2.2.2.1. Discrete Wavelet Transform (Transformasi Wavelet Diskrit) Sesuai dengan namanya, discrete wavelet transform bekerja mentransformasikan sinyal yang telah berbentuk diskrit. Discrete wavelet transform dapat diaplikasikan dalam penelitian pengenalan speaker ini. Hal ini sangat mendukung mengingat bahwa penelitian ini melibatkan data dan informasi input berupa sinyal suara yang nantinya akan diubah ke dalam bentuk diskrit. Dibandingkan dengan continuous wavelet transform (CWT), discrete wavelet transform (DWT) dianggap relatif lebih mudah dalam hal pengimplementasiannya. Prinsip dasar dari discrete wavelet transform adalah bagaimana cara mendapatkan representasi waktu dan skala dari sebuah sinyal menggunakan teknik pemfilteran digital dan operasi sub-sampling atau downsampling. (Mallat, Stephane, 1999) Sinyal pertama-tama dilewatkan pada rangkain high-pass filter dan lowpass filter, kemudian setengah dari masing-masing keluaran diambil sebagai sampel melalui operasi down-sampling. Proses ini disebut sebagai proses dekomposisi satu tingkat. Keluaran dari low-pass filter digunakan sebagai masukkan di proses dekomposisi tingkat berikutnya. Proses ini diulang sampai tingkat proses dekomposisi yang diinginkan. Gabungan dari keluaran-keluaran high-pass filter dan satu keluaran low-pass filter yang terakhir disebut sebagai koefisien wavelet, yang berisi informasi sinyal hasil transformasi yang telah terkompresi. Penjelasan tersebut dapat diwakili oleh 2 diagram berikut :

12 Gambar 2.2 Proses Dekomposisi Discrete Wavelet Transform Gambar 2.3 Proses Down-Sampling

13 Pasangan high-pass filter dan low-pass filter yang digunakan harus merupakan quadrature mirror filter (QMF), yaitu pasangan filter yang memenuhi persamaan berikut : n h[ n] ( 1). g[ L + 1 n] = (2) dengan h [n] adalah high-pass filter, g[n] adalah low-pass filter dan L adalah panjang masing-masing filter. Berkat operasi down-sampling yang menghilangkan informasi sinyal yang berlebihan, transformasi wavelet telah menjadi salah satu metode kompresi data yang paling handal. Biro investigasi federal (FBI) Amerika Serikat menggunakan metode ini dalam proses kompresi data sidik jari mereka. 2.2.3 Dynamic Time Warping (DTW) Dynamic time warping merupakan sebuah metode untuk mengukur jarak antara 2 koefisien data yang mungkin berbeda dalam hal waktu atau kecepatan. Jarak tersebut merepresentasikan seberapa besar kemiripan antara 2 koefisien data tersebut. Sebagai contoh, dalam proses perekaman pertama, pengguna berbicara dengan kecepatan yang cepat sedangkan dalam proses perekaman kedua, pengguna berbicara lebih lambat dibandingkan dengan proses perekaman pertama. Pada kedua proses perekaman tersebut, pengguna mengucapkan kata yang sama tapi dengan kecepatan yang berbeda sehingga menghasilkan data yang panjangnya berbeda pula. Dengan menggunakan metode dynamic time

14 warping, jarak (kemiripan) antara kedua rekaman tersebut dapat diketahui. Hal inilah yang menjadi kelebihan utama dari metode dynamic time warping. (Berndt dan Clifford, 1996) Secara umum, dynamic time warping merupakan sebuah metode yang memungkinkan komputer untuk mendapatkan jarak (kemiripan) yang optimal antara 2 koefisien data yang diberikan. Koefisien-koefisien data tersebut di warp secara non-linear dalam dimensi waktu untuk mengetahui jarak (kemiripan) antara 2 koefisien tersebut. 1 12 2 3 1 1 2 3 1 9 2 3 7 Sam ples 1 2 3 5 Distance 1 2 3 3 1 2 3 1 1 2 3 -.2.2.4 Amp.4.2 Amp 5 1 15 2 25 Sam ples -.2 Gambar 2.4 Mencari Kemiripan 2 Sinyal dengan Dynamic Time Warping

15 Original signals Warped signals.5.5 signal 1 signal 2 signal 1 signal 2.4.4.3.3.2.2 Amplitude.1 Amplitude.1 -.1 -.1 -.2 -.2 5 1 15 2 25 Sam ples 5 1 15 2 25 3 35 Sam ples Gambar 2.5 Sinyal Sebelum (kiri) dan Sesudah (kanan) di-dtw 2.2.3.1 DTW Grid Koefisien-koefisien data yang ingin diukur jarak atau kemiripannya dapat diatur pada sisi-sisi sebuah grid, seperti pada gambar 2.6 berikut : Gambar 2.6 DTW Grid

16 Gambar 2.6 di atas menggambarkan koefisien data suara yang ingin dikenali (sisi bawah grid) dan koefisien data suara referensi yang tersimpan di dalam database (sisi kiri grid). Awal dari kedua koefisien data tersebut dimulai dari bagian kiri bawah grid. Total jarak (kemiripan) terdekat diwakili oleh jalur grid berwarna biru. Setelah jalur tersebut ditemukan, maka akan didapatkan jarak (kemiripan) terdekat antara koefisien data input dengan koefisien data referensi database. Pada dasarnya, prosedur perhitungan dari algoritma DTW adalah menemukan semua jalur yang memungkinkan di dalam grid. Karena itu dalam sejumlah koefisien data yang diberikan akan menghasilkan jumlah kemungkinan jalur yang sangat banyak. Metode DTW akan menghasilkan proses perbandingan antara 2 koefisien data yang lebih efisien. 2.2.4 k-nearest Neighbor Metode k-nearest neighbor (k-nn) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran. Sebuah titik pada ruang ini ditandai kelas c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat titik tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Euclidean yang persamaannya adalah sebagai berikut :

17 Untuk P = p, p,..., p ) dan Q = q, q,..., q ), maka ( 1 2 n ( 1 2 n Jarak = (3) 2 2 2 ( p1 q1) + ( p2 q2 ) +... + ( p n qn ) Jarak = n i= 1 2 ( p i q i ) (4) Pada fase pembelajaran, metode ini hanya melakukan penyimpanan vektorvektor fitur dan klasifikasi dari data pembelajaran. Pada fase klasifikasi, fiturfitur yang sama dihitung untuk data pengujian (yang klasifikasinya tidak diketahui). Jarak dari vektor yang baru ini terhadap seluruh vektor data pembelajaran dihitung, dan sejumlah k buah yang paling dekat diambil. Titik yang baru klasifikasinya diprediksikan termasuk pada klasifikasi terbanyak dari titik-titik tersebut. Nilai k yang terbaik untuk algoritma ini tergantung pada data, secara umumnya, nilai k yang tinggi akan mengurangi efek noise pada klasifikasi, tetapi membuat batasan antara setiap klasifikasi menjadi lebih kabur. Nilai k yang bagus dapat dipilih dengan optimasi parameter, misalnya dengan menggunakan cross-validation. Kasus khusus dimana klasifikasi diprediksikan berdasarkan data pembelajaran yang paling dekat (dengan kata lain, k = 1) disebut metode nearest neighbor. (Belur V, 1991)

18 Gambar 2.7 Contoh Klasifikasi Dengan Metode k-nearest Neighbor Gambar 2.7 di atas merupakan gambaran sekilas mengenai klasifikasi pada metode k-nearest Neighbor (k-nn). Lingkaran kecil yang berwarna hijau di tengah itu merupakan sampel, sedangkan simbol yang berbentuk kotak menunjuk pada klasifikasi kelas pertama (first class) atau speaker 1 dan simbol yang berbentuk segitiga merupakan klasifikasi kelas kedua (second class) atau speaker 2. Jika nilai resolusi dari algoritma k-nn yang digunakan adalah 3, maka hasil algoritma k-nn akan menghasilkan klasifikasi kelas kedua (second class) atau speaker 2 karena terdapat 2 buah segitiga dan hanya 1 buah kotak di dalam lingkaran resolusi pada gambar 2.7. Sedangkan jika resolusi dari metode ini diganti menjadi 5, maka metode ini akan menghasilkan klasifikasi kelas pertama (first class) atau speaker 1 karena terdapat 3 buah kotak dan hanya 2 buah segitiga di dalam lingkaran resolusi luar pada gambar 2.7. (Belur V, 1991) Ketepatan metode k-nn ini sangat dipengaruhi oleh ada atau tidaknya fitur-fitur yang tidak relevan, atau jika bobot fitur tersebut tidak setara dengan

19 relevansinya terhadap klasifikasi. Riset terhadap metode ini sebagian besar membahas bagaimana memilih dan memberi bobot terhadap fitur, agar performa klasifikasi menjadi lebih baik. Metode k-nn ini memiliki konsistensi yang kuat. Ketika jumlah data mendekati tak hingga, metode ini menjamin error rate yang tidak lebih dari dua kali Bayes error rate (error rate minimum untuk distribusi data tertentu). (Belur V, 1991)