Rekognisi Pengucap Forensik Forensic Speaker Recognition

dokumen-dokumen yang mirip
BAB 1 PENDAHULUAN. Universitas Indonesia

Analisis Pengaruh Sampling Rate Dalam Melakukan Identifikasi Pembicara Pada Rekaman Audio

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

BAB I PENDAHULUAN 1.1 Latar Belakang

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

INDEPT, Vol. 3, No.1, Februari 2013 ISSN

PENGUKURAN SPEKTRUM SUARA MANUSIA LANSIA BERDASARKAN JENIS KELAMIN DAN SUKU MENGGUNAKAN SOFTWARE PRAAT

Pembuatan Prototype Speaker Diarization

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

BAB I PENDAHULUAN. pengenalan terhadap gelombang suara. Pengenalan gelombang suara yang sudah

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

BAB I PENDAHULUAN. seseorang, ataupun takut terhadap sesuatu (Frieda, 1993). Kondisi

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

PEMBUATAN PERANGKAT BASIS DATA UNTUK SINTESIS UCAPAN (NATURAL SPEECH SYNTHESIS) BERBAHASA INDONESIA BERBASIS HIDDEN MARKOV MODEL (HMM)

DESAIN MESIN PRESENSI BERBASIS IDENTIFIKASI SUARA PENUTUR

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification

BAB II LANDASAN TEORI

1. BAB I PENDAHULUAN 1.1. Latar Belakang

ANALISA PENGARUH PENYAKIT FLU DAN BATUK TERHADAP SUARA PENDERITA DENGAN MENGGUNAKAN KOMPUTER

PENENTUAN FREKUENSI FUNDAMENTAL DAN FORMANT SUARA MANUSIA DEWASA BERDASARKAN PERBEDAAN SUKU DAN GENDER MENGGUNAKAN SOFTWARE PRAAT

BAB 2 LANDASAN TEORI

MODEL ACQUISISI REKAMAN SUARA DI AUDIO FORENSIK

BAB I PENDAHULUAN 1.1 Latar Belakang

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO

BAB 1 PENDAHULUAN. mengenali penggunanya lebih tepat. Beberapa aplikasi biometrik antara lain retinal

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM)

BAB 1 PENDAHULUAN. berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition

BAB III METODOLOGI PENELITIAN

IMPLEMENTASI PENDIKTEAN BAHASA INDONESIA. Hari Bagus Firdaus dan Ayu Purwarianti

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN SKRIPSI NADIA WIDARI NASUTION

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

Identifikasi Speech Recognition Manusia dengan Menggunakan Average Energy dan Silent Ratio Sebagai Feature Extraction Suara pada Komputer

DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti

BAB 1 PENDAHULUAN. misalnya untuk mendeteksi ketidakpuasan pelanggan pada sistem call center otomatis,

Implementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC)

BAB I PENDAHULUAN. Suara merupakan salah satu media komunikasi yang paling sering dan

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

BAB I Pendahuluan 1 BAB I PENDAHULUAN

Bab 1. Pendahuluan. aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi

BAB I PENDAHULUAN I.1 Latar Belakang

UNIVERSITAS BINA NUSANTARA

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

Speaker Recognition Menggunakan MFCC dan Algoritma DTW

PENDAHULUAN TINJAUAN PUSTAKA

Identifikasi Suara Pengontrol Lampu Menggunakan Mel-Frequency Cepstral Coefficients dan Hidden Markov Model

ANALISIS SPEKTRUM SUARA MANUSIA BERDASARKAN JENIS KELAMIN (GENDER) DAN KELOMPOK UMUR MENGGUNAKAN KOMPUTER. Widia Rahim*, Erwin, Usman Malik

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

Analisis Koefisien Cepstral Emosi Berdasarkan Suara

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari

Dielektrika, ISSN Vol. 2, No. 2 : , Agustus 2015

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 2 LANDASAN TEORI

TUGAS TEORI INFORMASI & PENGKODEAN DIGITAL FORENSIC VOICE

Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW

Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient

BAB 1 PENDAHULUAN. peranan yang sangat penting pada organisasi tersebut. Peningkatan kinerja para

PENDAHULUAN. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI

RANCANGAN APLIKASI BIOMETRIK BERDASARKAN FACIAL EMG

BAB I PENDAHULUAN 1.1. Latar Belakang

Pengembangan Model HMM Berbasis Maksimum Lokal Menggunakan Jarad Euclid Untuk Sistem Identifikasi Pembicara -,,

HUBUNGAN SPEECH INTELLIGIBILITY SUARA PRIA TERHADAP TINGKAT TEKANAN BUNYI BISING LATAR

APLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW

IDENTIFIKASI SESEORANG BERDASARKAN CITRA SILUET ORANG BERJALAN MENGGUNAKAN SUDUT SETENGAH KAKI

TEKNIK FORENSIKA AUDIO UNTUK ANALISA SUARA PADA BARANG BUKTI DIGITAL

Pengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu

PENGENALAN EMOSI BERDASARKAN SUARA MENGGUNAKAN ALGORITMA HMM

SISTEM PENGOLAHAN SUARA MENGGUNAKAN ALGORITMA FFT (FAST FOURIER TRANSFORM)

NTIFIKASI PEMBICARA DENGAN PEMODELAN IDENTIFIKASI PEMBICARA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN SVM SEBAGAI PENGENALAN POLA LUTHFAN ALMANFALUTHI

Akustik. By: Dian P.E. Laksmiyanti, ST. MT

MODUL II : SPEECH AND AUDIO PROCESSING

RANCANG BANGUN APLIKASI PENGENAL PENUTUR MENGGUNAKAN METODE HIDDEN MARKOV MODEL (HMM)

Manipulasi suara ucapan (speech morphing)

BAB I PENDAHULUAN SIMULASI DAN ANALISIS PEMANTAUAN KAMAR PASIEN RAWAT INAP DENGAN DETEKSI DAN KLASIFIKASI SINYAL AUDIO 1

IMPLEMENTASI FUSI INFORMASI HIRARKIS PADA PENGENALAN CITRA WAJAH MULTI-SPECTRAL

Pengenalan Karakter Suara Laki-Laki Aceh Menggunakan Metode FFT (Fast Fourier Transform)

SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR

TRANSFORMASI SUARA BERBASIS PEMETAAN SELUBUNG SPEKTRAL DAN PREDIKSI RESIDU

TTG3B3 - Sistem Komunikasi 2 MAP & ML Detection

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

Unnes Physics Journal

Pengenalan Gender Melalui Suara dengan Algoritma Support Vector Machine (SVM)

BAB I PENDAHULUAN. dikeluarkan dari mulut manusia (Seperti pada waktu bercakap-cakap, menyanyi,

Suara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur

ANALISIS SPEKTRUM SUARA MANUSIA BERDASARKAN SUKU PADA KELOMPOK USIA ANAK-ANAK DENGAN MENGGUNAKAN SOFTWARE PRAAT

IDENTIFIKASI BUNYI DALAM PEMBELAJARAN NADA DASAR PERMAINAN SULING BATAK MENGGUNAKAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT SKRIPSI

BAB I PENDAHULUAN. yang telah digunakan secara luas oleh orang orang di dunia saat ini adalah

PENGENALAN WAJAH MENGGUNAKAN METODE INDEPENDENT COMPONENT ANALYSIS ABSTRAK

Transkripsi:

Rekognisi Pengucap Forensik Forensic Speaker Recognition Untuk Komunitas: Lingkar Soca 28 Februari 2016 Oleh: Miranti Indar Mandasari, ST., MT. Institut Teknologi Bandung, Indonesia Radboud University Nijmegen, the Netherlands

SISTEM REKOGNISI PENGUCAP

Berbagai Informasi pada Suara Ucap Dari daerah mana dia berasal? Bahasa apa yang dia gunakan? Apakah kata yang dia ucapkan? Accent Recognition Language Recognition Speech Recognition Sistem Rekognisi Pengucap Emotion Recognition Apakah dia sedih/ senang? Gender Recognition Apakah dia pria/ wanita? Speaker Recognition Siapakah dia?

Sistem Rekognisi Pengucap Dalam Bahasa Inggris dikenal dengan Speaker recognition, atau Voiceprint recognition. Definisi: Speaker recognition is a process of recognizing the identity of a speaker from a given speech segment. Rekognisi Pengucap adalah sebuah proses dalam merekognisi (mengenali) identitas seorang pengucap dari suatu segmen suara ucap.

Mengapa Rekognisi? Operating modes: Rekognisi Pengucap Verifikasi pengucap Identifikasi pengucap Klasifikasi atau diarisasi pengucap Speaker recognition Speaker verification Speaker identification Speaker classification or diarization

Mengapa Rekognisi? unknown known Speaker Verification Same speaker (or) Different speaker? Speaker recognition Speaker verification Speaker identification Speaker classification or diarization

Mengapa Rekognisi? known(s) unknown Speaker Identification Speaker recognition Speaker verification Speaker identification Speaker classification or diarization Who is speaking?

Mengapa Rekognisi? Who is speaking here? Who is speaking here? Speaker recognition Speaker verification Speaker identification Speaker classification or diarization Who is speaking here?

APLIKASI DARI SISTEM REKOGNISI PENGUCAP

Komersial Forensik Akses pada Perangkat elektronik Akun Bank Ruangan rahasia Verifikasi pengucap Verifikasi suara tersangka Diarisasi pengucap untuk: Notulensi otomatis saat rapat Identifikasi pengucap Mencari identitas tersangka Aplikasi dari Sistem Rekognisi Pengucap Diarisasi pengucap Pembuatan transkrip otomatis

FORENSIK SUARA UCAP

Forensik Suara Ucap Aplikasi sistem rekognisi pengucap untuk aplikasi forensik: Speaker profiling: Sistem rekognisi aksen Sistem rekognisi bahasa Sistem rekognisi gender Mengetahui konten percakapan Sistem rekognisi suara ucap (speech recognition) Identitas pengucap Siapa yang berbicara? Sistem rekognisi pengucap (speaker recognition)

BERBAGAI MACAM SISTEM REKOGNISI PENGUCAP

Tipe-tipe Sistem Rekognisi Pengucap Pendekatan fonetik-akustik biasanya menggunakan metode manual Sistem rekognisi pengucap otomatis Sistem hybrid Gabungan antara manual-otomatis

SISTEM REKOGNISI PENGUCAP BERBASIS FONETIK-AKUSTIK

Rekognisi Pengucap Berbasis Fonetik-Akustik Fitur berdasarkan properti akustik dari suara ucap Pitch (Frekuensi Fundamental) Formant & Bandwidth Formant Intensitas sinyal (Energi) Durasi Analisis: Menggunakan pendekatan statistik dasar Level: kalimat, kata/frase, suku-kata, dan fonem Biasanya: text-dependent

Ekstraksi Fitur Akustik Segmen suara ucap Dalam domain waktu Ekstraktor Fitur (Mesin FFT/ LPC) Segmen suara ucap Dalam doman frekuensi

Ekstraksi Fitur Akustik: Pitch dan Formant FORMANT 1 (F1) F2 F2 F2 PITCH: fundamental frequency.

Ekstraksi Fitur Akustik Energi/ intensitas Pitch/ frekuensi fundamental Formants

Analisis Statistik 1 Pengucap

Analisis Statistik N Pengucap Pengucap 1 Pengucap 2 Pengucap 3 Pengucap 4 Pengucap 5 Pengucap 6

SISTEM REKOGNISI PENGUCAP OTOMATIS

Setup Sistem Rekognisi Pengucap Otomatis Background Data Training known Ekstraksi Fitur Pemodelan Pengucap Skor Testing unknown Ekstraksi Fitur Pemodelan Pengucap

Setup Sistem Rekognisi Pengucap Otomatis Ekstraksi fitur: MFCC (Mel), LPC, LPCC, CFCC (cochlear), etc. Metode pemodelan: GMM-UBM, i-vector, JFA, HMM, ANN, SVM, LDA, PLDA, etc.

Ekstraksi Fitur MFCC

Setup Sistem Rekognisi Pengucap Otomatis Background Data Training known Ekstraksi Fitur Pemodelan Pengucap Skor Testing unknown Ekstraksi Fitur Pemodelan Pengucap Decision?

Membuat Keputusan Binary Reject Accept Non-target scores Target scores Threshold

Tipe Error: Yes No False alarm Miss rejection Target trial Non-target/ impostor

Membuat Keputusan Forensik Menggunakan kerangka likelihood ratio Posterior knowledge Evidence Prior knowledge P(H 0 E) P(H 1 E) = P(E H 0 ) P(E H 1 ) x P(H 0 ) P(H 1 ) Posterior odds Likelihood ratio Prior odds Wewenang Pengadilan Wewenang Expert Wewenang Pengadilan

Likelihood Ratio Likelihood ratio (LR) adalah probabilitas relatif dari suatu bukti/skor E terhadap kedua hipotesis: - H 0 : suara unknown dan known berasal dari pengucap yang sama, dan - H 1 : suara unknown dan known berasal dari pengucap yang berbeda Hipotesis Prosecution Likelihood Ratio LR = P(E H 0) P(E H 1 ) Bukti/ skor Hipotesis Defense

Menghitung LR dari Distribusi Skor

PERKEMBANGAN SISTEM REKOGNISI PENGUCAP OTOMATIS

Kondisi Saat ini Kebanyakan: text- dan channel-independent Beberapa: gender- dan language-independent Pada kondisi terkontrol: Performa baik, equal error rate 1.00% Cara meningkatkan performa: Fusion pada saat ekstraksi fitur, pemodelan, atau pada level skor Menggunakan multi-modal biometrics (face, fingerprints, etc.) Aplikasi pada dunia forensik: Masih terbatas Memerlukan proses kalibrasi likelihood ratio

Tantangan Tantangan utama: kondisi mismatched antara segmen suara ucap known dan unknown: Channel atau media perekaman, Level noise, Durasi, Kata dan/atau bahasa yang terucap, Kondisi emosi dan kesehatan pengucap, Gaya berbicara, dan etc. Tantangan lainnya: noise robustness, suara ucap yang tersamarkan (disguised speech: whisper, vocal effort, etc.) & voice aging

Sistem Rekognisi Pengucap Otomatis di Radboud University Nijmegen Equal error rate pada database: NIST SRE 08 : 1.33 % NIST SRE 10 : 1.87 % NIST SRE 12 : 2.85 % (terdapat variasi noise dan durasi)

SISTEM REKOGNISI PENGUCAP FORENSIK DI TEKNIK FISIKA ITB

Sistem Rekognisi Pengucap Forensik di Teknik Fisika ITB Merupakan kolaborasi antara 2 kelompok keahlian (KK) di lingkungan Fakultas Teknologi Industri (FTI) ITB: KK Teknik Fisika, dan KK Instrumentasi & Kontrol. Pendekatan: hybrid Berbasis fonetik-akustik Ekstraksi fitur akustik secara otomatis Analisis dengan menggunakan metode statistik

Peta Jalan Penelitian Menuju otomatisasi sistem

Thank You! Bandung, 28 Februari 2016 Miranti Indar Mandasari, ST., MT. Email: miranti.indar.mandasari@gmail.com