BAB I PENDAHULUAN. 1.1 Latar Belakang

dokumen-dokumen yang mirip
BAB 1 PENDAHULUAN. kehandalannya. Komputer terus dikembangkan. Komputer dituntut memiliki kecepatan

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BAB 1 PENDAHULUAN. Universitas Indonesia

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

BAB I. PENDAHULUAN Latar Belakang Masalah

1. BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. dengan proses pengolahan citra digital (digital image processing), dimana data berupa

BAB III METODOLOGI PENELITIAN

DAFTAR ISI. KATA PENGANTAR... Error! Bookmark not defined. DAFTAR ISI... i. DAFTAR TABEL... vi. DAFTAR GAMBAR... vii

BAB I PENDAHULUAN I-1

BAB III ANALISIS DAN PERANCANGAN

BAB 1 PENDAHULUAN. Sistem Pakar (Expert System), Jaringan Saraf Tiruan (Artificial Neural Network), Visi

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 2012). Penelitian yang dilakukan oleh Bosma dkk. (1965), menemukan bahwa

PENDAHULUAN. Latar Belakang

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

PENDAHULUAN. Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Saat ini teknologi berkembang sangat cepat dan semakin banyak perangkat

BAB I PENDAHULUAN. yang dikenal sebagai antarmuka pengguna grafis atau Graphical User Interface. yakni ucapan, untuk meningkatkan kemudahannya.

BAB I PENDAHULUAN. digunakan untuk identitas citra adalah nama file, tanggal pengambilan,

1. PENDAHULUAN 1.1 Latar belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah. Meter air merupakan alat untuk mengukur banyaknya air yang digunakan oleh


udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

BAB I PENDAHULUAN. Pengenalan pola merupakan permasalahan kecerdasan buatan yang secara

BAB 1 PENDAHULUAN. Perkembangan pengetahuan dibidang kecerdasan buatan sedemikian

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Rancang Bangun Modul Pengenalan Suara Menggunakan Teknologi Kinect

BAB I PENDAHULUAN. pernah tepat, dan sedikitnya semacam noise terdapat pada data pengukuran.

BAB I PENDAHULUAN. diwilayah jawa timur. Dengan jumlah penduduk pada tahun 2010 sebanyak

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

BAB I PENDAHULUAN. yang telah digunakan secara luas oleh orang orang di dunia saat ini adalah

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB IV PREPROCESSING DATA MINING

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX

BAB I PENDAHULUAN. Suara merupakan salah satu media komunikasi yang paling sering dan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. bit serta kualitas warna yang berbeda-beda. Semakin besar pesat pencuplikan data

BAB I PENDAHULUAN 1.1. Latar Belakang

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO

UNIVERSITAS BINA NUSANTARA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. mengkonversikan tulisan / teks ke dalam bentuk ucapan dengan menggunakan

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. bagi setiap individu manusia yang ada dimuka bumi. Tidak mengherankan jika

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

BAB III ANALISA DAN PERANCANGAN SISTEM

Suara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur

APLIKASI PENGENALAN SUARA MENGGUNAKAN MICROSOFT SAPI SEBAGAI PENGENDALI PERALATAN ELEKTRONIK

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

1. Pendahuluan 1.1 Latar Belakang

yaitu dalam ketepatan pengenalan pola berdasarkan kelas untuk menampilkan genre.

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

1. Pendahuluan Latar Belakang

MILIK UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang Permasalahan

PENDAHULUAN TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. tersebut dibuktikan dengan semakin canggihnya perangkat keras seperti prosesor,

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1 Universitas Kristen Maranatha

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III PERANCANGAN PERANGKAT LUNAK MENENTUKAN JENIS KAWANAN IKAN, JARAK KAWANAN IKAN, DAN POSISI KAPAL

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

BAB 1 PENDAHULUAN. Wiley & Sons, 2003, Hal : 1. 1 Poe Vidette, Klauer Patricia dan Brobst Stephen, Building A Data WareHouse for Decision Support

BAB III METODOLOGI PENELITIAN

BAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul

BAB 1 PENDAHULUAN Pengantar

BAB I PENDAHULUAN. ke karakteristik tertentu pada manusia yang unik dan berbeda satu sama lain.

BAB I PENDAHULUAN. 1.1 Latar Belakang. Komunikasi memegang suatu peranan yang sangat penting di abad ini

INDEPT, Vol. 3, No.1, Februari 2013 ISSN

BAB 1 PENDAHULUAN. berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

3.1.2 Analisis Kebutuhan... Error! Bookmark not defined Perancangan... Error! Bookmark not defined Pengujian... Error!

III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1 Pendahuluan 1.1 Latar Belakang Masalah Grafologi atau analisis tulisan tangan adalah metode ilmiah untuk mengidentifikasi,

Karakteristik Spesifikasi

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

BAB I PENDAHULUAN. telinga, wajah, infrared, gaya berjalan, geometri tangan, telapak tangan, retina,

Proses memperbaiki kualitas citra agar mudah diinterpretasi oleh manusia atau komputer

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari sistem berupa ucapan manusia dan kemudian sistem akan mengidentifikasi kata atau kalimat yang diucapkan sehingga dapat menghasilkan keluaran berupa teks dari kata atau kalimat yang diucapkan [SAB06]. Proses pengenalan ucapan terdiri dari beberapa tahap, yaitu [SOE01]: 1. Digitalisasi sinyal Tahapan ini mengubah sinyal analog menjadi sinyal digital. Sinyal ucapan masukan yang merupakan sinyal akustik analog diubah menjadi sinyal listrik analog melalui microphone. Soundcard melakukan konversi sinyal listrik analog menjadi sinyal listrik digital kemudian sinyal tersebut disimpan dalam file dengan format tertentu. 2. Analisis sinyal Tahapan ini melakukan analisis terhadap sinyal masukan sehingga didapatkan feature (ciri/karakteristik) dari sinyal tersebut. Analisis sinyal terdiri dari beberapa proses, yaitu: a. Tracking Proses tracking adalah memotong sinyal menjadi frame-frame kecil berdasarkan rentang waktu tertentu. Frame merupakan potongan dari sinyal ucapan yang terdiri dari sejumlah sample yang sama. b. Windowing Windowing dilakukan untuk menghilangkan efek sisi (bagian dari frame yang tidak dibutuhkan dalam proses pengambilan feature) dan untuk menghindari sinyal diskontinyu pada setiap frame. c. Analisis spektral Analisis spektral merupakan metode untuk mendapatkan feature vector dari setiap potongan sinyal. I-1

I-2 3. Pengelompokan dan Pelabelan Sinyal Setelah dihasilkan kumpulan feature vector dari beberapa frame sebagai hasil analisis sinyal kemudian feature vector tersebut dikelompokkan berdasarkan karakteristik phonetic tertentu. Karakteristik phonetic direpresentasikan oleh nilai spectral envelop dari setiap feature vector. Karakteristik phonetic tersebut merepresentasikan label bagi setiap feature. Pengelompokan dan pelabelan sinyal dapat dilakukan dengan dua cara yaitu secara manual dan otomatis. Proses secara manual dilakukan dengan memberikan nomor feature dan fonemnya secara manual oleh pengguna kepada sistem. Proses secara otomatis pemisahan dan pengelompokan sinyal dilakukan oleh sistem. Pengguna hanya perlu memberikan urutan dari fonem yang ada pada sinyal masukan. Proses pelabelan secara manual membutuhkan waktu yang relatif lebih lama daripada proses pelabelan secara otomatis. Penentuan kelas phonetic/label terhadap suatu sinyal pada umumnya dilakukan secara manual oleh seorang pakar dengan menggunakan tools grafis yang dapat memodelkan bentuk gelombang sinyal tersebut. Hasil pelabelan dari beberapa pakar menunjukkan bahwa terdapat perbedaan label untuk gelombang yang sama [COS06], sehingga dapat dikatakan bahwa pelabelan secara manual dapat memberikan hasil yang tidak akurat. Hal ini disebabkan oleh variasi visualisasi, kemampuan persepsi akustik dan sulitnya menemukan strategi pelabelan yang dapat digunakan sebagai standard. Proses pelabelan secara otomatis dapat mengakibatkan proses pembelajaran oleh sistem pengenal ucapan menjadi lebih baik karena lebih akurat [SOE01]. Teknik yang sering digunakan adalah clustering dengan menggunakan algoritma tertentu, diantaranya Gaussian mixture models (GMM) [JUR00], Algoritma Forward- Backward [DEM06], dan K-Means [NEE05]. Selain teknik clustering, pelabelan otomatis juga dapat dilakukan menggunakan HMM dengan algoritma Viterbi [DEM06] dan jaringan saraf tiruan [CHE06]. Gambar I-1 Vector Quantization

I-3 Pelabelan menggunakan K-Means clustering dilakukan berdasarkan metode kuantisasi vektor (vector quantization). Kuantisasi vektor merupakan metode untuk mengelompokkan semua feature yang merepresentasikan ciri/karakteristik sinyal yang sama pada satu kelompok kelas phonetic. Hasil kuantisasi vektor adalah phonetic model yang terdiri dari beberapa kelompok kelas phonetic sinyal. Setiap satu kelompok direpresentasikan oleh sebuah feature [Gambar I-1]. Ketepatan hasil kuantisasi vektor memegang peranan yang penting pada sistem pengenal ucapan. Hal ini disebabkan oleh beberapa alasan, yaitu: a. Pemilihan vektor yang merepresentasikan ciri phonetic tertentu dalam setiap kelompok kelas phonetic sangat menentukan ketepatan hasil pengenalan b. Hasil yang akurat dari proses pengelompokan dan pelabelan sinyal mengakibatkan proses pembelajaran oleh sistem pengenal ucapan menjadi lebih baik [SOE01]. c. Proses segmentasi sangat berguna untuk mereduksi kebutuhan memori dan meminimalkan kompleksitas komputasi pada sistem pengenalan ucapan untuk data yang besar seperti sistem large vocabulary continuous speech recognition (LVCSR) [HSI98]. 4. Pelatihan Sistem Pengenalan Ucapan Tahapan pelatihan sistem pengenal ucapan dilakukan dengan menggunakan algoritma tertentu. Pada tahap ini feature vector beserta label digunakan sebagai masukan pada algoritma yang digunakan. 5. Pengenalan sinyal ucapan Tahapan untuk mengenali sinyal ucapan masukan dengan menggunakan hasil dari tahap pelatihan. 6. Evaluasi hasil pengenalan Setelah didapatkan hasil pengenalan per kata, jika hasil pengenalan belum memuaskan maka akan dilakukan pencocokan dengan kata-kata yang ada pada basisdata. Tugas akhir ini membahas mengenai pelabelan feature dengan sebuah fonem. Pelabelan dilakukan menggunakan metode kuantisasi vektor. Pengelompokkan sinyal pada proses kuantisasi vektor menggunakan algoritma K-Means. Algoritma K-Means merupakan algoritma dasar yang mudah dan dapat dengan cepat melakukan pemusatan data (convergence) pada proses clustering. Penelitian mengenai pengelompokkan sinyal pada kelas phonetic tertentu pada sistem pengenalan ucapan menunjukkan bahwa

I-4 clustering menggunakan algoritma K-Means memberikan hasil keakuratan 70% dalam menentukan cluster yang tepat untuk setiap sinyal [NEE05]. 1.2 Rumusan Masalah Berdasarkan latar belakang yang telah disebutkan, rumusan masalah yang dikaji dalam Tugas Akhir ini adalah: 1. Bagaimana melakukan analisis sinyal terhadap sinyal ucapan sehingga didapatkan sekumpulan feature vector 2. Bagaimana melakukan kuantisasi vektor untuk mengelompokkan feature vector terhadap fonem dari file label sehingga terbentuk cluster model setiap fonem 3. Bagaimana memberikan label untuk setiap kelompok feature masukan terhadap cluster model yang terbentuk sehingga dihasilkan output yang dapat digunakan sebagai masukan algoritma pembelajaran dalam tahap pelatihan sistem pengenalan ucapan (tahap 4). 1.3 Tujuan Tujuan yang ingin dicapai dalam pembuatan tugas akhir ini adalah 1. Melakukan analisis sinyal terhadap sinyal ucapan hingga dihasilkan sekumpulan feature vector 2. Melakukan kuantisasi vektor terhadap sekumpulan feature vector kemudian memberikan label setiap kelompok yang dihasilkan sehingga terbentuk cluster model. Algoritma yang dipakai untuk pengelompokkan dalam kuantisasi vektor adalah algoritma K-Means 3. Melakukan klasifikasi feature hasil analisis file uji pada cluster model yang terbentuk. Hasil klasifikasi ini ditujukan sebagai masukan classfier dalam tahap pelatihan sistem pengenalan ucapan (tahap 4) 4. Melakukan analisis perbandingan terhadap ketepatan hasil pelabelan suatu file masukan yang dilakukan pada tugas akhir ini terhadap file labelnya. 1.4 Batasan Masalah Dalam tugas akhir ini terdapat beberapa batasan masalah, yaitu: 1. Proses pengelompokkan dan pelabelan sinyal ucapan dilakukan untuk sinyal ucapan dalam bahasa Indonesia

I-5 2. Sinyal ucapan masukan diasumsikan sudah mempunyai kualitas yang cukup memadai sehingga tidak diperlukan proses lain yang digunakan untuk mengurangi pengaruh noise 3. Proses pengolahan sinyal masukan tidak dilakukan secara real-time. 1.5 Metodologi Tugas Akhir yang dilakukan adalah berupa penelitian dan mengimplementasikannya dalam sebuah perangkat lunak. Metodologi yang akan digunakan selama pengerjaan Tugas Akhir ini adalah: 1. Studi Pustaka Studi pustaka akan dilakukan pada seluruh proses pengerjaan Tugas Akhir. Studi pustaka meliputi studi tentang teknologi pada Speech Recognition, Vector Quantization, Digital Speech Processing terutama sinyal ucapan, metode clustering dan nasalisasi dalam bahasa Indonesia. 2. Analisis Permasalahan Kegiatan analisis permasalahan meliputi analisis file sinyal ucapan, proses analisis sinyal ucapan, metode dan algoritma clustering, karakteristik untuk setiap fonem (kelas phonetic) untuk bahasa Indonesia, dan spesifikasi, lingkungan pengembangan serta fungsionalitas perangkat lunak. 3. Perancangan perangkat lunak Perancangan perangkat lunak meliputi yang terdiri dari identifikasi fungsi yang dibutuhkan oleh sistem menggunakan usecase. 4. Implementasi perangkat lunak Implementasi perangkat lunak yang dibangun menggunakan tools pemrograman. 5. Pengujian perangkat lunak Pengujian dilakukan untuk menunjukkan apakah label (fonem) yang dihasilkan untuk setiap sinyal sesuai dengan ucapan masukan. 6. Evaluasi dan penarikan kesimpulan Melakukan evaluasi terhadap hasil percobaan, melakukan analisis perbandingan terhadap ketepatan hasil pelabelan suatu file masukan yang dilakukan pada tugas akhir ini terhadap file labelnya.

I-6 1.6 Sistematika Pembahasan Laporan tugas akhir ini terdiri dari beberapa bab yang terdiri dari Pendahuluan, Dasar Teori, Analisis dan Perancangan, Implementasi dan Pengujian dan Penutup. Penjelasan untuk setiap bab adalah sebagai berikut: 1. Bab Pendahuluan Bab ini berisi penjelasan mengenai latar belakang ide judul, rumusan masalah, tujuan, batasan masalah, metodologi, dan sistematika pembahasan. Bab ini bertujuan untuk memudahkan pemanfaatan laporan tugas akhir ini. 2. Bab Dasar Teori Bab ini berisi penjelasan umum dan dasar teori mengenai sistem, cara penyelesaian persoalan dan teknik-teknik yang digunakan dalam tugas akhir ini berdasarkan referensi yang ada. 3. Bab Analisis dan Perancangan Bab ini berisi analisis dan perancangan sistem yang akan menjadi dasar implementasi. Bab ini bertujuan untuk mempermudah memahami hasil implementasi. 4. Bab Implementasi dan Pengujian Bab ini berisi implementasi hasil rancangan, penjelasan mengenai fungsi-fungsi yang diimplementasikan, hasil pengujian perangkat lunak dan analisis pengujian. 5. Bab Penutup Bab ini berisi kesimpulan dan saran selama pelaksanaan tugas akhir.