BAB 1 PENDAHULUAN. berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition

BAB 1 PENDAHULUAN 1.1 Latar Belakang Speaker recognition adalah salah satu bidang pengenalan pola yang berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition yang mengenali kata atau kalimat apa yang diucapkan, speaker recognition mengenali siapa pembicara yang mengucapkan kata atau kalimat tersebut. Dalam speaker recognition, data penting yang terkandung dalam sinyal suara diekstrak untuk kemudian diolah menjadi informasi yang dapat digunakan untuk proses lebih lanjut. Salah satu cabang dari bidang speaker recognition adalah speaker idenfitication. Sebuah sistem speaker identification mampu mengenali pemilik suara dari kumpulan data karakteristik suara yang sebelumnya telah disimpan. Berbagai teknik speaker identification berkembang lantaran meningkatnya kebutuhan idenfitikasi biometrik yang dapat bekerja efisien dan memiliki tingkat akurasi tinggi. Biometrik adalah sinyal yang dihasilkan seseorang yang menjadikannya unik dan berbeda dengan orang lain seperti sidik jari, karakteristik wajah, dan suara. Karena sifatnya yang alamiah dan bawaan, biometrik mulai banyak dilirik untuk diterapkan pada sistem keamanan dan proteksi. Sebuah sistem speaker identification yang baik harus dapat mengambil fitur-fitur yang menjadi ciri khas suara seseorang, kemudian memproses fitur- 1

2 fitur tersebut agar dapat diklasifikasikan ke dalam kelompok-kelompok tertentu untuk kemudian dikenali. Dalam beberapa penelitian mengenai pengenalan pola lainnya seperti pengenalan citra wajah, salah satu kombinasi metode pengambilan fitur dan klasifikasi yang sudah teruji adalah transformasi wavelet diskrit dan jaringan saraf tiruan. Dalam hubungannya dengan sinyal suara, transformasi wavelet diskrit dapat memisahkan sebuah sinyal menjadi sinyal berfrekuensi tinggi dan rendah untuk mendapatkan informasi yang menjadi ciri khas suara seseorang, sementara jaringan saraf tiruan memiliki kemampuan untuk mempelajari beragam karakteristik dalam suara seseorang. Dari permasalahan di atas, timbul gagasan untuk membuat sebuah sistem speaker identification yang menggunakan model wavelet sebagai ekstraksi fitur dan jaringan saraf tiruan sebagai metode klasifikasi. 1.2 Ruang Lingkup Batasan permasalahan pada skripsi ini adalah : Data suara yang dimasukkan berupa kata, frase, atau kalimat yang lama pengucapannya dibatasi hanya satu detik dengan sampling rate 8000 kbps. Jika data suara lebih dari satu detik, data suara harus dimasukkan ulang. Data suara yang dimasukkan untuk dilatih dan evaluasi berasal dari file audio atau hasil tangkapan menggunakan mikrofon. Data suara dianalisa dan dikenali berdasarkan tingkat kemiripannya dengan data yang sudah dimasukkan sebelumnya dan tidak bisa digunakan untuk mengenali kata atau frase apa yang dimasukkan.

3 Metode ekstraksi fitur yang digunakan adalah transformasi wavelet diskrit dengan menggunakan fungsi wavelet induk Daubechies-2. Metode klasifikasi yang digunakan adalah jaringan saraf tiruan dengan pendekatan back-propagation. Program dikembangkan dengan menggunakan bahasa pemrograman Delphi sebagai alat bantu pemrosesan data suara sekaligus sebagai alat bantu untuk merealisasikan konsep jaringan saraf tiruan. 1.3 Tujuan dan Manfaat Tujuan dari skripsi ini adalah : Merancang sebuah sistem speaker identification yang menerapkan transformasi wavelet diskrit sebagai pengekstrak fitur dan jaringan saraf tiruan sebagai teknik klasifikasi dengan tingkat akurasi tinggi. Mengevaluasi efektivitas penggunaan kombinasi transformasi wavelet diskrit dan jaringan saraf tiruan dalam sebuah sistem speaker identification. Manfaat yang didapat dari skripsi ini adalah : Aplikasi yang dibuat dapat dimanfaatkan lebih lanjut dalam sistem otentikasi identitas yang menerapkan speaker identification untuk melapisi proteksi konvensional menggunakan password. Sebagai referensi untuk membangun sistem yang lebih kompleks seperti sistem pengendalian akses kontrol, bidang forensik, ataupun sistem pengawasan keamanan yang melibatkan speaker identification.

Hasil skripsi dapat digunakan sebagai bahan untuk penelitian lebih lanjut mengenai speaker identification. 4 1.4 Metodologi Metodologi yang digunakan dalam skripsi ini meliputi empat bagian pokok, yaitu metode analisis, metode perancangan, metode pengujian, dan metode evaluasi. Metode analisis Dalam skripsi ini dilakukan beberapa cara untuk melakukan analisis. Yang pertama adalah dengan membaca literatur, buku, dan artikel yang berkaitan dengan speaker identification, jaringan saraf tiruan, serta teori- teori lain yang terkait. Konsultasi dengan dosen pembimbing dan beberapa rekan yang cukup ahli di bidang ini juga dilakukan. Setelah mendapat konsep dan landasan teori yang cukup kuat, proses dilanjutkan dengan menganalisa proses ekstraksi fitur dari masing-masing karakter yang bersangkutan. Terakhir, dilakukan analisis yang lebih mendalam tentang konsep dasar jaringan saraf tiruan agar dapat diterapkan dalam program yang bersangkutan. Metode perancangan Dari hasil analisis dan studi pustaka yang diperoleh, dibuat sebuah rancangan sistem speaker identification yang dapat menerapkan transformasi wavelet serta jaringan saraf tiruan back-propagation.

5 Metode pengujian Pengujian dilakukan terhadap kinerja speaker identification, sejauh mana program dapat mengenali suara seseorang dengan tepat. Pengujian dilakukan dengan mengambil sampel suara dari beberapa responden dengan menggunakan mikrofon. Metode evaluasi Hasil pengujian yang diperoleh dianalisa lebih lanjut dan dibandingkan dengan setting-an konfigurasi lain untuk ditarik simpulan mengenai kinerja sistem. Jika hasil evaluasi belum memadai, maka dilakukan pengujian tambahan. 1.5 Sistematika Penulisan Untuk mempermudah dan memperjelas penyampaian materi, maka dalam skripsi ini menggunakan sistematika sebagai berikut : BAB 1. PENDAHULUAN Bab ini menjelaskan tentang latar belakang, ruang lingkup sistem, tujuan dan manfaat dari penulisan skripsi dan perancangan aplikasi speaker identification, metodologi penelitian, dan sistematika penulisan. BAB 2. LANDASAN TEORI Bab ini menjelaskan teori-teori pendukung dan algoritma yang digunakan dalam penelitian ini, yaitu suara, pengenalan pola, speaker recognition, beberapa metode ekstraksi fitur, dan jaringan saraf tiruan.

6 BAB 3. PERANCANGAN SISTEM Bab ini menjelaskan mengenai perancangan sistem speaker identification dengan menggunakan jaringan saraf tiruan metode back-propagation. BAB 4. IMPLEMENTASI DAN EVALUASI Bab ini berisi spesifikasi dan prosedur pengimplementasian dan pengujian sistem terhadap responden, dilanjutkan dengan evaluasi terhadap sistem terkait dengan kinerjanya setelah diimplementasikan. BAB 5. SIMPULAN DAN SARAN Bab ini berisi rangkuman singkat dari keseluruhan bab-bab sebelumnya, rangkuman hasil evaluasi dari pengujian sistem, serta saran-saran untuk penelitian selanjutnya.