Aplikasi Teknik Speech Recognition pada Voice Dial Telephone

dokumen-dokumen yang mirip
TUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan Program Strata I Pada Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas

Implementasi Filter FIR secara Real Time pada TMS 32C5402

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

ANALISIS KLASIFIKASI SUARA BERDASARKAN GENDER DENGAN FORMAT WAV MENGGUNAKAN ALGORITMA K-MEANS

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV

Karakteristik Spesifikasi

MODUL 2 PENGHITUNGAN ENERGI PADA SINYAL WICARA

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

MODUL 4 PEMFILTERAN PADA SINYAL WICARA

LAPORAN PRAKTIKUM DSP

MODUL 2 PENGHITUNGAN ENERGI PADA SINYAL WICARA

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

Implementasi Filter IIR secara Real Time pada TMS 32C5402

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

LAPORAN PRAKTIKUM DSP

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO

1. BAB I PENDAHULUAN 1.1. Latar Belakang

PENDAHULUAN. Latar Belakang

BAB 1 PENDAHULUAN. kehandalannya. Komputer terus dikembangkan. Komputer dituntut memiliki kecepatan

MODUL 5 EKSTRAKSI CIRI SINYAL WICARA

LAPORAN APLIKASI DIGITAL SIGNAL PROCESSING EKSTRAKSI CIRI SINYAL WICARA. Disusun Oleh : Inggi Rizki Fatryana ( )

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

MODUL 4 SAMPLING SINYAL

INDEPT, Vol. 3, No.1, Februari 2013 ISSN

MODUL 3 REPRESENTASI SINYAL DALAM DOMAIN WAKTU DAN DOMAIN FREKUENSI

BAB I PENDAHULUAN. pengenalan terhadap gelombang suara. Pengenalan gelombang suara yang sudah

1. Pendahuluan Latar Belakang

LAPORAN PRAKTIKUM DSP

Rancang Bangun Sistem Sensor Untuk Aplikasi Voice Recognition Pada Ayunan Bayi Otomatis

APLIKASI PENGENALAN SUARA UNTUK SIMULASI PENGUNCI PINTU ABSTRAK

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

MODUL 1 PROSES PEREKAMAN DAN PENGEDITAN SINYAL WICARA

BAB I PENDAHULUAN I.1 Latar Belakang

BAB 1 PENDAHULUAN. seperti isyarat dan tulisan. Suara yang dihasilkan oleh setiap orang pada dasarnya

PENGATURAN POSISI KAMERA CCTV DENGAN PERINTAH SUARA

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENGGOLONGAN SUARA BERDASARKAN USIA DENGAN MENGGUNAKAN METODE K MEANS

IDENTIFIKASI GENDER MELALUI SUARA DENGAN METODE STATISTIK CIRI ORDE PERTAMA

Perancangan dan Implementasi Percobaan Pengolahan Sinyal Digital Secara Online

Identifikasi Gender Melalui Suara Dengan Metode Statistik Ciri Orde Pertama

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

MODUL 4 SAMPLING DAN ALIASING

BAB 2 LANDASAN TEORI

Verifikasi Citra Wajah Menggunakan Metode Discrete Cosine Transform Untuk Aplikasi Login

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BAB I PENDAHULUAN 1.1 Latar Belakang

Jaringan Syaraf Tiruan pada Robot

BAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

BAB IV SIMULASI DAN ANALISA DATA

PENENTUAN AKOR GITAR DENGAN MENGGUNAKAN ALGORITMA SHORT TIME FOURIER TRANSFORM

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY

PENGGUNAAN METODE TEMPLATE MATCHING UNTUK MENDETEKSI CACAT PADA PRODUKSI PELURU

PROGRAM PASCA SARJANA JURUSAN TEKNIK ELEKTRO ELEKTRONIKA

ABSTRACT. Nowadays, speech coding technology that encode speech with a minimum

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

SPECTRUM ANALYZER BERBASIS MIKROKONTROLER DENGAN PENCUPLIKAN SECARA PARALEL

KLASTERING SUARA BERDASARKAN GENDER DENGAN EKSTRAKSI CIRI BERBASIS DOMAIN WAKTU

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB 1 PENDAHULUAN 1.1 Latar Belakang

APLIKASI PENGENALAN GENDER MENGGUNAKAN SUARA

BAB III METODOLOGI PENELITIAN. Penelitian dilaksanakan pada Laboratorium Jurusan Teknik Informatika

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

PENERAPAN METODE POWER SPEKTRUM PADA PROSES KONVERSI SUARA UCAPAN MENJADI TEKS

BAB 1 PENDAHULUAN. sesamanya dalam kehidupan sehari hari untuk menunjang kebutuhan hidup mereka.

UNJUK KERJA NOISE RISE BASED CALL ADMISSION CONTROL (NB-CAC) PADA SISTEM WCDMA. Devi Oktaviana

APLIKASI SPECTRUM ANALYZER UNTUK MENGANALISA LOUDSPEAKER

Rencana Pembelajaran Departemen Teknik Elektro Fakultas Teknologi Elektro INSTITUT TEKNOLOGI SEPULUH NOPEMBER

Simulasi Sistem Pengacak Sinyal Dengan Metode FFT (Fast Fourier Transform)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Implementasi Real Time Digital Audio Equalizer 4 Band menggunakan DSK TMS320C6713

BAB I PENDAHULUAN. 1.1 Latar Belakang

Identifikasi Suara Vokal Suku Banjar Berdasarkan Frekuensi Formant

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...

BAB I PENDAHULUAN. Tugas Akhir yang berjudul Sistem Penyama Adaptif dengan Algoritma Galat

3.1.2 Analisis Kebutuhan... Error! Bookmark not defined Perancangan... Error! Bookmark not defined Pengujian... Error!

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

BAB 3 PERANCANGAN SISTEM

Deteksi Titik Awal dan Titik Akhir Sinyal Untuk Pemisahan Sinyal Voice dan Unvoice

APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM)

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX

NASKAH PUBLIKASI SISTEM PENGENALAN SUARA BERDASARKAN FORMANT SUARA MANUSIA DENGAN METODE AUTOCORELATION

Rancang Bangun Modul EEG Untuk Menentukan Posisi Otak Saat Melakukan Aktivitas Tertentu Menggunakan Metoda Filter Digital IIR

Aplikasi Jaringan Saraf Tiruan Sebagai Penterjemah Karakter Braille Ke Bentuk Abjad

MODUL 6 ANALISA SINYAL DALAM DOMAIN FREKUENSI

Jl. Telekomunikasi, Dayeuh Kolot, Bandung Indonesia

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Jony Sitepu/ ABSTRAK

Pengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

Implementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC)

Seminar Nasional APTIKOM (SEMNASTIKOM), Hotel Lombok Raya Mataram, Oktober 2016

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

Transkripsi:

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Oleh: Ahmad Irfan Abdul Rahman Tri Budi Santoso Titon Dutono Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi Sepuluh Nopember (ITS) E-mail: tribudi@eepis-its.edu

1. Pendahuluan: Speech Recognition? Merupakan salah satu dari aplikasi proses digital signal processing (pengolahan sinyal digital) Aplikasi Speech Recognition voice dialing banking by telephone telephone shopping data base access service security control

Penelitian Oleh Min Do [1] telah dikembangkan sebuah mini project Automatic Speaker Recognition System, simulai off-line menggunakan perangkat lunak Matlab. Darren Ellis [2], sebuah rancangan speaker recognition. Disini simulasi pengkondisian lingkungan disajikan dalam bentuk munculnya noise gaussian. Maria Ulfa [3] telah berhasil membangun sebuah aplikasi sederhana pada layanan perbankan berbasis voice recognition. Paper [4] dan [5] disajikan bentuk aplikasi teknologi digital signal processing secara real time.

Pada paper ini... membangun sebuah voice dial telephone menggunakan perintah sinyal wicara. sistem yang dibangun masih pada tingkatan independet speaker Tujuan: Secara keseluruhan tujuan penelitian ini adalah untuk membangun sebuah Modul Praktikum Speech Processing di Laboratorium Sinyal, PENS-ITS.

2. Prinsip Pengenal Wicara Perancangan sistem pengolah wicara: 1. Fase pertama adalah pada pembuatan sebuah sistem pengenal wicara adalah enrollment session (fase pembelajaran) atau yang dikenal juga sebagai training phase. 2. Sedangkan fase kedua adalah operating session atau testing phase (fase pengujian).

Fase Pembelajaran Sinyal Suara Sampling Frame Blocking Windowing Setiap perintah yang masuk dilakukan ekstraksi ciri (feature extraction) suaranya. DFT Code Book

Fase Pengujian Sinyal Suara Sampling Frame Blocking Windowing Perintah Decision Maximum likelihood DFT Threshold Code Book

Fase pengujian diawali dengan ekstraksi ciri suara (perintah) yang masuk. Ciri dari suara yang masuk selajutnya di cocokkan dengan yang ada pada code book. Ini juga dikenal sebagai proses feature matching (pencocokan ciri). Proses matching menggunakan algoritma maximum likelihood, yaitu ciri perintah yang masuk dicari yang paling mirip dengan ciri perintah yang ada pada code book

Teori Pendukung Proses Sampling Nyquist mempersyaratan frekuensi sampling minimal dua kali frekuensi sinyal. fs 2 x fmax dimana: fs : frekuensi sampling fmax: frekuensi tertinggi sinyal yang disampel

Pre Emphassis Spectrum sinyal wicara akan diperhalus dengan filter pre-empahsis 1-az-1, dengan nilai a=0,95

Frame Blocking dan Windowing

Discrete Fourier Transform (DFT) Untuk mendapatkan ciri sinyal dalam domain frekuensi N X ( k) = n= 1 0 x( n) e jkω 0n 0 k N 1 dimana: ω 0 = frekuensi fundamental = 2π/sampling rate = 2π/N Maximum Likelihood Maximum likelihood atau maximum of posterior merupakan prosedur untuk mendapatkan nilai atau parameter yang memiliki bentuk terdekat dengan cara membandingkan suatu parameter masukan dengan parameter pilihan tersedia.

3. Perancangan Sistem Voice Dial Telephone Sinyal suara Microphone Sound card CPU (PC) PBX Telephone Untukfasepembelajarandanpengujian

Kerja Sistem Fase Pembelajaran Suara dari pembicara akan ditangkap microphone Sinyal elektrik disampling dan dikonversi ke dalam bentuk sinyal digital oleh sound card. Dilanjutkan dengan Pre-emphasis, frame blocking, dan windowing untuk menghaluskan spektral sinyal. Setiap sinyal dicirikan oleh bentuk spektral frekuensinya dan disipan sebagai code book untuk masing-masing jenis perintah.

Kerja Sistem Fase Pembelajaran fase pengujian proses dari sampling sampai ekstraksi ciri sama dengan yang terjadi pada fase pembelajaran. Setelah ciri sebuah sinyal uji didapatkan dilanjutkan dengan proses matching dengan ciri-ciri sinyal perintah yang tersipan dalam code book. Dengan menggunakan algorithma maximum likelihood bentuk perintah yang masuk akan dapat diterjemahkan.

4. Analisa Hasil Pengujian

Hasil DFT Sinyal Input DFT 100 80 60 40 Series1 20 0 0 42 2 84 4 12 66 16 88 21 09 25 31 29 53 33 75 37 97 42 19 46 41 50 63 54 84 59 06 Frekuensi (Hz)

Pentuan Jenis Perintah dengan Maximum Likelihood Konsep ini dapat direalisasikan dalam bentuk persamaan dasar sederhana yang kita kenal sebagai least squares error (LSE). Secara formal LSE dapat dibentuk dengan mencari nilai sum squares error (SSE) dari dua nilai masukan terhadap nilai standar yang digunakan untuk menguji.

Formulasinya: SSE( X ) = m ( X ) k c( X ) k = 1 2 Dimana: X k = nilai ciri kata yang masuk dalam domain frekuensi c(x) = nilai ciri dari kata standar dalam code book contoh pengujian kata optik yang masuk didapatkan hasil seperti berikut: - Optik : 0.220744 - Multimedia : 1.076151 - Telkom : 0.710211 - Jarkom : 0.850238 - Digital : 1.049321 kata optik, karena memiliki nilai error terkecil yaitu 0.220744.

Hasil Pengujian Sistem 3 pengujian, pertama diambil sampel data dari orang pria yang sama kedua orang pria yang berbeda ketiga adalah wanita. 120 100 80 60 40 20 0 Optik Multimedia Telkom Jarkom Digital

5. Kesimpulan sistem yang telah dirancang dengan menggunakan sistem pengucap bebas ini memiliki prosentase keberhasilan yang tinggi Diharapkan untuk melakukan penelitian lanjut dengan menggunakan sistem pengucap tak bebas

Referensi: [1] Min N. Do, An Automatic Speaker Recognition System, Audio Visual Communication Laboratory, Swiss Federal Institute of Technology, Lausanne, Switzerland, 2001. [2] Darren Ellis, Design of a Speaker Recognition Code using Matlab, Department of Computer and Elektrical Engineering, University of Tennesse, 2001. [3] Maria Ulfa, Prima K, Titon Dutono, Aplikasi Speech Recognition sebagai Fungsi Layanan pada Sistem Perbankan, Seminar SNTE, Jogjakarta 2003. [4] Bima Sena, Linda Indra, Titon Dutono, Aplikasi Pengenalan Wicara untuk Perintah pada Micromouse Robot Nirkabel, Seminar IES 2004. [5] Anas, Wahyudin, Tri Budi, Titon Dutono, Pengenalan Nada- Nada Tunggal pada Gitar dengan Menggunakan Teknik Pengolahan Sinyal Digital, EEPIS Journal, Volume 10, Juli 2005. [6] Titon Dutono, Moh Nuh, Dasar-Dasar Pengolahan Sinyal, EEPIS Press 2000. [7] Rabiner, Juang, An Introduction to Speech Recognition, Prentice Hall, USA, 1993.