Ekstraksi Ciri Ucapan Menggunakan Analisis Komponen Utama (Principal Components Analysis - PCA) Matakuliah Speech Recognition (Pertemuan ke-6 dan ke-7) Dr. R. Rizal Isnanto, S.T., M.M., M.T. Program Studi Sistem Komputer Universitas Diponegoro Semarang, Indonesia
Pendahuluan Pada proses pengenalan ucapan, langkah yang dilakukan setelah pengambilan data atau sampel ucapan adalah EKSTRAKSI CIRI. Ekstraksi ciri bertujuan mengambil ciri-ciri utama dari data dengan mengambil informasi yang dominan dan membuang informasi lain. Ciri bersifat unik, seringkali hanya memiliki sejumlah kecil nilai, namun mewakili satu entitas yang besar. Dengan ekstraksi ciri, maka pengenalan, pembandingan, ataupun analisis dilakukan pada sejumlah nilai terbatas, misal vektor yang terdiri atas beberapa nilai, bukan pada keseluruhan nilai pada data. Dengan ekstraksi ciri diharapkan proses pengenalan dapat dilakukan dengan lebih cepat. 9-2 2
Contoh makalah 3 9-3
Background Mathematics 4 Statistika 1. Rerata (mean) 9-4
2. Simpangan Baku (Standard Deviation) 5 9-5
3. Varians 6 9-6
4. Kovarians (covariance) (1) 7 9-7
Kovarians (covariance) (2) 8 9-8
Kovarians (covariance) (3) 9 9-9
5. Matriks Kovarians (1) 10 9-10
Matriks Kovarians (2) 11 9-11
PR (2) 12 9-12
6. Aljabar Matriks 13 9-13
Eigenvector dan Eigenvalues (1) 14 9-14
Eigenvector dan Eigenvalues (2) 15 9-15
Eigenvector dan Eigenvalues (2) 16 9-16
9-17 17
Penutup 18 Page Minggu depan: baru PCA-nya!! Demikian paparan saya sampaikan Terima kasih 2015 R. Rizal Isnanto, All rights reserved.
PCA (Pertemuan ke-7) Pada pengolahan sinyal ucapan, satu gelombang ucapan dibagi menjadi blok-blok berukuran sama. Blok 1 dimensi (vektor) dibuat sebagai matriks bujursangkar (n x n) Setiap blok dicari nilai-nilai eigen-nya (ada n nilai eigen) Setelah semua blok dicari nilai-nilai eigen-nya, maka semua nilai eigen tersebut diurutkan dari yang terbesar sampai yang terkecil (l 1, l 2, l 3, l 4, dst.) Nilai-nilai eigen itulah yang disebut sebagai komponenkomponen utama (principal components) 9-19
Lanjutan PCA (2) Setelah itu, diambil beberapa komponen utama terbesar, misalnya 75 terbesar, 50 terbesar, atau 10 terbesar. Komponen-komponen utama tersebut dimasukkan ke dalam vektor ciri. Vektor ciri dari sinyal ucapan uji dibandingkan dengan vektor ciri dari sinyal ucapan data latih menggunakan model similarity measures, misalnya Jarak Euclidean, Jarak Minkowski dan sebagainya. 9-20
Lanjutan PCA (3) Jarak yang paling kecil (minimum) terhadap satu vektor ciri data latih menunjukkan bahwa data uji dikenali sebagai paling dekat kemiripannya dengan data latih tersebut, atau dikenali sebagai data latih tersebut Untuk implementasi, sering digunakan nilai ambang (threshold) untuk menentukan suatu data uji bisa dikenali atau tidak bisa dikenali. Jika jarak > nilai ambang, maka akan diperoleh keluaran TIDAK DIKENALI. Jika jarak <= nilai ambang, maka data uji dikenali sebagai salah satu dari data latih yang menghasilkan jarak (selisih) minimum. 9-21
Efisiensi komputasi dengan PCA Misal dari seluruh komponen utamanya diambil 25% terbesarnya Dari n x n ciri (atau dalam sinyal ucapan adalah n 2 ciri dalam baris yang sama) akan diperoleh n komponen utama Maka jumlah ciri uji yang harus dicocokkan dengan ciri pada data latih = 0,25n. Sehingga efisiensi komputasi = 1 [(0,25n) / n 2 ] = 1 [0,25 / n] = {1 [1/(4n)]} x 100% 9-22
Penutup Ada pertanyaan? Kita lanjutkan dengan Everything about UTS 9-23
Everything about UTS (1) Buka ringkasan 1 lbr double folio asli (tulis tangan) Tutup buku, laptop, HP, dan sejenisnya Boleh buka kalkulator Waktu: 90 menit 9-24
Everything about UTS (2) Materi yang harus dipersiapkan: 1. Konversi analog ke digital 2. Speaker Recognition vs Speech Recognition 3. Teknologi Text-To-Speech (TTS) dan Speech-To-Text (STT) 4. Similarity measures: Jarak Euclidean, Minkowski, dsb. 5. PCA: mean, varians, kovarians, nilai dan vektor eigen. 6. Sistem Biometrika: iris, sidik-jari, dsb., selain suara 9-25
Selamat Belajar Semoga sukses 9-26