TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY
|
|
- Ari Tanuwidjaja
- 7 tahun lalu
- Tontonan:
Transkripsi
1 TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
2
3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Transkripsi Suara ke Teks Bahasa Indonesia Berbasis Suku Kata Menggunakan Codebook dan 2-level Dynamic Programming adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juli 2014 Sintya Rosdwianty NIM G
4 ABSTRAK SINTYA ROSDWIANTY. Transkripsi Suara ke Teks Bahasa Indonesia Berbasis Suku Kata Menggunakan Codebook dan 2-level Dynamic Programming. Dibimbing oleh AGUS BUONO dan MUHAMMAD ASYHAR AGMALARO. Transkripsi suara ke teks sangat berguna karena memudahkan manusia berinteraksi dengan sistem secara lebih cepat. Akan tetapi, sistem sulit mengenali suara berupa rangkaian kata. Penelitian ini mengembangkan sistem yang dapat mengenali rangkaian kata dengan menggunakan metode MFCC sebagai teknik ekstraksi ciri, codebook sebagai metode pengenalan pola, dan 2-level dynamic programming sebagai metode pengenalan rangkaian kata. Teknik cluster yang digunakan pada penelitian ini adalah K-means. Parameter yang digunakan pada teknik MFCC adalah overlap, time frame, dan jumlah koefisien cepstral. Adapun parameter pada teknik K-means adalah jumlah cluster. Penelitian ini menggunakan 900 data suara suku kata yang terdiri atas 18 kelas dan 120 data suara berisi rangkaian kata yang terdiri atas 60 data uji hasil gabungan data latih dan 60 data uji sebenarnya. Hasil penelitian menunjukkan bahwa nilai K optimum adalah 15, dan nilai word error rate terendah yang diperoleh adalah 0.1, diperoleh pada rangkaian kata kelas Ide Anda hasil gabungan suku kata data latih, saat overlap 0.25, time frame 25 ms, koefisien cepstral 13, dan jumlah cluster 20. Kata kunci: codebook, connected word, dynamic programming, K-means, MFCC ABSTRACT SINTYA ROSDWIANTY. Voice to Text Transcription based on Indonesian Syllable using Codebook and 2-level Dynamic Programming. Supervised by AGUS BUONO and MUHAMMAD ASYHAR AGMALARO. Voice to text transcription is very useful because it allows people to interact with a system more quickly. However, it is hard for a system to recognize a speech which contains of connected words. This research aims to develop a system that recognize a connected word speech. The proposed approach uses MFCC as a feature extraction, codebook as pattern recognition method, and 2-level dynamic programming as connected words recognition method. The parameters used in feature extraction using MFCC are overlap, time frame, and number of cepstral coefficients. Moreover the parameter used in K-means clustering is the number of clusters. This research uses 900 syllable s speech data from 18 classes, and 120 connected word s speech data which consist of 60 testing data joined from training data and 60 real testing data. The results showed that the optimum value of K was 15, with the minimum word error rate of 0.1 for the Ide Anda words resulted from joining words of training data with the overlap value of 0.25, the time frame value of 25 ms, the number of cepstral coefficients of 13, and the number of clusters of 20. Keywords: codebook, connected word, dynamic programming, K-means, MFCC
5 TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
6 Penguji: Auzi Asfarian, SKomp, MKom
7 Judul Skripsi : Transkripsi Suara ke Teks Bahasa Indonesia Berbasis Suku Kata Menggunakan Codebook dan 2-level Dynamic Programming Nama : Sintya Rosdwianty NIM : G Disetujui oleh Dr Ir Agus Buono, MSi MKom Pembimbing I Muhammad Asyhar Agmalaro, SSi MKom Pembimbing II Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:
8 PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta ala atas segala karunia-nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Januari 2014 ini ialah pemrosesan bahasa alami, dengan judul Transkripsi Suara ke Teks Bahasa Indonesia Berbasis Suku Kata Menggunakan Codebook dan 2-level Dynamic Programming. Penulis menyadari bahwa penelitian ini masih memiliki kekurangan. Adapun penulis mengucapkan terima kasih kepada: 1 Kedua orangtua dan kakak yang telah memberikan perhatian, doa, dan dukungan sehingga penulis dapat menyelesaikan penelitian ini. 2 Bapak Dr Ir Agus Buono, MSi MKom dan Bapak Muhammad Ashyar Agmalaro, SSi MKom, selaku pembimbing yang telah memberikan arahan dan saran kepada penulis. 3 Bapak Auzi Asfarian, SKom MKom, selaku penguji yang telah banyak memberi saran dan masukan kepada penulis. 4 Teman-teman Ilmu Komputer 47 atas segala dukungan, ilmu, perhatian dan kasih sayangnya. 5 Teman-teman UKM MAX!! IPB dan kelas TPB A atas segala pengalaman yang diberikan selama kuliah. Semoga karya ilmiah ini bermanfaat. Bogor, Juli 2014 Sintya Rosdwianty
9 DAFTAR ISI DAFTAR TABEL viii DAFTAR GAMBAR viii DAFTAR LAMPIRAN viii PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 1 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 METODE 2 Pengambilan Suara 3 Praproses 4 Ekstraksi Ciri MFCC 4 Perangkaian Kata 5 Codebook 5 Time Alignment 6 2-level Dynamic Programming 6 Lingkungan Pengembangan 7 Pengujian 7 HASIL DAN PEMBAHASAN 8 Pengambilan Suara 8 Praproses 8 Ekstraksi Ciri MFCC 8 Perangkaian Kata 8 Codebook 8 Time Alignment 9 2-level Dynamic Programming 9 Pengujian 9 Implementasi Sistem 12 SIMPULAN DAN SARAN 13
10 Simpulan 13 Saran 13 DAFTAR PUSTAKA 14 LAMPIRAN 15 RIWAYAT HIDUP 17
11 DAFTAR TABEL 1 Daftar suku kata sebagai data latih 3 2 Daftar rangkaian kata sebagai data uji 4 3 Word error rate untuk kelas data uji sebenarnya 9 4 Word error rate untuk kelas data uji hasil gabungan data latih 10 DAFTAR GAMBAR 1 Diagram alur penelitian 3 2 Blok diagram MFCC 4 3 Perbedaan data suara asli, setelah pemotongan silent, setelah dinormalisasi 8 4 Rata-rata WER setiap kelas data uji untuk semua nilai K 10 5 Pengaruh nilai K terhadap rata-rata WER untuk semua kelas data uji 11 6 Tingkat akurasi suku kata pada kelas data uji gabungan data latih 12 7 Tingkat akurasi suku kata pada kelas data uji sebenarnya 12 8 Antarmuka program transkripsi suara ke teks berbasis suku kata 13 DAFTAR LAMPIRAN 1 Matriks konfusi tingkat akurasi suku kata pada data uji gabungan data latih 15 2 Matriks konfusi tingkat akurasi suku kata pada data uji sebenarnya 16
12
13 PENDAHULUAN Latar Belakang Perkembangan penelitian tentang pemrosesan suara dan bahasa alami saat ini telah meningkat pesat. Hal tersebut disebabkan karena penelitian di bidang ini dapat diimplementasikan untuk kemudahan berbagai aktivitas manusia. Salah satu contohnya ialah penelitian tentang transkripsi suara ke teks (speech to text recognition), yang memungkinkan suatu sistem komputer berinteraksi dengan manusia selayaknya interaksi antarmanusia. Proses penting dalam transkripsi suara ke teks adalah proses pengenalan suara yang mengambil suatu gelombang sebagai data input dan menghasilkan sebuah deretan string kata sebagai data output (Jurafsky dan Martin 2007). Sistem transkripsi suara ke teks sangat berguna karena memudahkan manusia untuk berinteraksi dengan sistem secara lebih cepat. Contoh aplikasi terapan yang banyak ditemui sehari-hari adalah fungsi voice dial pada telepon genggam. Penelitian tentang transkripsi suara ke teks pun sudah banyak dilakukan, misalnya penelitian yang dilakukan oleh Luthfi (2013). Penelitian tersebut mendeteksi kata dengan MFCC sebagai ekstraksi ciri dan codebook sebagai pengenalan pola. Pada penelitian tersebut, Luthfi berhasil membangun codebook yang terdiri atas hasil klustering K-means untuk data latih berupa kata, dengan nilai codeword pada codebook 16 dan 32, dan parameter MFCC yang digunakan ialah time frame 23.7 ms, overlap 0.5, dan koefisien cepstral 13. Penelitian tersebut mendapatkan akurasi rata-rata 98%, dan berhasil mengenali input rangkaian kata yang diproses secara isolated words, atau pemrosesan tiap unit kata. Atas dasar tersebut, penelitian ini membangun sistem transkripsi suara menggunakan model codebook, yang dapat mengenali rangkaian kata berbasis suku kata, dan diproses secara connected words. Suku kata dipilih sebagai unit transkripsi karena suatu suku kata dapat divariasikan menjadi banyak kata sehingga sistem dapat mentranskripsi lebih banyak kemungkinan kata dibandingkan dengan transkripsi dengan unit berupa kata. Penelitian ini akan dikombinasikan dengan metode 2-level dynamic programming (DP), yaitu salah satu metode yang dapat mengatasi transkripsi suara untuk rangkaian kata/connected words (Juang dan Rabiner 1993). Perumusan Masalah Transkripsi sinyal suara ke teks membutuhkan proses yang tidak mudah, karena membutuhkan suatu metode tertentu agar dapat mengenali struktur suara dengan tepat. Atas dasar tersebut, muncul pertanyaan penelitian sebagai berikut: 1 Bagaimana proses membangun metode codebook untuk sistem transkripsi rangkaian kata berbasis suku kata? 2 Bagaimana proses transkripsi suku kata untuk data input yang terdiri atas rangkaian beberapa kata dengan metode 2-level DP? 3 Bagaimana tingkat akurasi yang dihasilkan dari sistem tersebut?
14 2 Tujuan Penelitian Tujuan dari penelitian ini, yaitu: 1 Membangun codebook suku kata yang akan digunakan sebagai model referensi untuk sistem transkripsi. 2 Menerapkan metode 2-level DP untuk transkripsi rangkaian kata berbasis suku kata. 3 Mengetahui tingkat akurasi transkripsi suara ke teks dengan metode codebook dan 2-level DP. Manfaat Penelitian Penelitian ini diharapkan mampu memberikan informasi tentang pengolahan suara untuk rangkaian kata/connected words dan tingkat akurasi transkripsi suara ke teks bahasa Indonesia berbasis suku kata. Selain itu, hasil penelitian ini diharapkan dapat dikembangkan untuk pengenalan semua suku kata dalam bahasa Indonesia dan dikembangkan menjadi sistem yang bersifat speaker independent sehingga sistem yang dikembangkan dapat dimanfaatkan oleh masyarakat umum. Ruang Lingkup Penelitian Ruang lingkup penelitian ini adalah: 1 Jumlah suku kata yang mampu dikenali dalam sistem berjumlah 18 suku kata. Daftar suku kata tersebut mengacu pada 18 suku kata yang memiliki frekuensi kemunculan terbanyak pada teks penelitian Buono dan Kusumoputro (2007) berjudul Pengembangan Model HMM Berbasis Maksimum Lokal Menggunakan Jarak Euclid Untuk Sistem Identifikasi Pembicara pada halaman 1 sampai 3. 2 Sistem yang dikembangkan bersifat speaker dependent karena sistem hanya dapat mengenali suara yang menjadi data latih (Jurafsky dan Martin 2007) yaitu suara penulis berjenis kelamin wanita. 3 Parameter MFCC yang digunakan pada penelitian ini adalah time frame 25 ms, overlap 0.25, dan koefisien cepstral sebesar Rangkaian kata yang mampu dikenali hanya rangkaian kata yang terdiri atas deretan 4 suku kata. METODE Penelitian ini dikembangkan dengan metode yang terdiri atas beberapa tahap, seperti disajikan pada Gambar 1.
15 3 Pengambilan Suara Mulai Pengambilan suara 18 suku kata x 50 = 900 suara suku kata 6 rangkaian kata x 10 = 60 suara rangkaian kata Praproses Ekstraksi Ciri MFCC Data Latih Data Uji Perangkaian Kata Codebook Time Alignment 2-Level Dynamic Programming Pengujian Selesai Gambar 1 Diagram alur penelitian Data suara yang digunakan dalam penelitian ini berasal dari satu pembicara yaitu suara penulis, dengan rincian 18 kelas suku kata dan 6 kelas rangkaian kata. Masing-masing data suku kata direkam selama 1 detik dengan pengulangan tiap kelas sebanyak 50 kali sehingga total data suku kata berjumlah 900 data. Suku kata tersebut digunakan sebagai data latih untuk pembangunan codebook seperti disajikan pada Tabel 1, yang diurutkan berdasarkan jumlah kemunculan suku kata terbanyak pada teks yang diacu. Tabel 1 Daftar suku kata sebagai data latih Suku Kata Si A Da Di An Se I Kan Ra De Ma Ni Ti Ter Pe Lah Ka Ta Data suara berupa rangkaian kata disusun berdasarkan kombinasi suku kata dari data latih yang tersedia, dan direkam selama 3 detik dengan pengulangan tiap kelas 10 kali. Total data yang direkam sebanyak 60 data dan akan digunakan untuk data uji sebenarnya. Data tersebut berjumlah 6 kelas karena keenam kelas kata
16 4 tersebut sudah mewakili setiap suku kata yang terdapat pada data latih, seperti disajikan pada Tabel 2. Rangkaian Kata Ide anda Peti tani Sesi makan Dia kalah Terka ini Ada rasi Tabel 2 Daftar rangkaian kata sebagai data uji Suku Kata i, de, an, da pe, ti, ta, ni se, si, ma, kan di, a, ka, lah ter, ka, i, ni a, da, ra, si Praproses Setiap data suara memiliki silent pada awal dan akhir kata. Pada tahap ini dilakukan penghapusan silent agar data suara murni hanya terdiri atas data yang akan diproses. Selain itu, suara memiliki range amplitudo yang berbeda-beda. Oleh karena itu proses normalisasi amplitudo dilakukan agar setiap suara memiliki range amplitudo yang sama. Ekstraksi Ciri MFCC Ekstraksi ciri merupakan proses untuk mencari suatu nilai atau vektor yang menjadi ciri khusus dari suatu variabel atau objek. Salah satu teknik ekstraksi ciri yang banyak digunakan dan sesuai dengan persepsi sistem pendengaran manusia adalah Mel Frequency Cepstrum Coefficient (MFCC). Tahapan MFCC disajikan pada Gambar 2. Continuous Speech Frame Blocking Frame Windowing Mel Spectrum Mel-frequency Wrapping Spectrum FFT Cepstrum Mel Cepstrum Gambar 2 Blok diagram MFCC Tahap pertama MFCC adalah frame blocking yaitu teknik pembagian sinyal menjadi blok-blok (frame) dengan ukuran/lebar tertentu, dan di antara kedua blok yang berdekatan terdapat overlap. Overlap adalah keadaan suatu sinyal yang saling tumpang tindih untuk mencegah adanya informasi yang hilang. Tahap selanjutnya adalah windowing, yaitu proses mengalikan sinyal digital dengan suatu fungsi window tertentu. Tujuan windowing adalah untuk mengurangi distorsi antar frame yang berdekatan. Formula windowing yang digunakan pada penelitian ini adalah Hamming window karena formula ini memiliki kinerja yang baik dan perhitungan sederhana (Buono et al. 2009), seperti disajikan pada Persamaan 1.
17 w(n) = cos ( 2πn ), 0 n N-1 (1) N - 1 Tahap selanjutnya adalah Fast Fourier Transform (FFT), yaitu salah satu algoritme untuk mengimplementasikan Discrete Fourier Transform (DFT) untuk mentransformasi frame dari domain waktu ke domain frekuensi. Hasil dari tahap ini dinamakan spektrum. Fungsi FFT disajikan pada Persamaan 2. N - 1 x k = n = 0 x n e -j2πkn N (2) dengan k = 0, 1, 2,..., N-1 Xk = nilai-nilai sampel yang akan diproses ke dalam domain frekuensi Xn = magnitudo frekuensi N = jumlah data pada domain frekuensi j = bilangan imajiner Secara umum, Xk adalah bilangan kompleks dan hanya dilihat bilangan absolutnya. Setelah itu, dilakukan mel-frequency wrapping, yaitu proses pemfilteran spektrum setiap frame menggunakan sejumlah M filter segitiga dengan tinggi satu. Filter ini dibuat berdasarkan persepsi manusia terhadap suatu suara. Hubungan skala mel dengan frekuensi (Hz) dinyatakan pada Persamaan 3. Fmel = 2595 log 10 (1+ F Hz 700 ) (3) Cepstrum adalah tahap terakhir yang berfungsi mengubah log mel hasil proses sebelumnya kembali menjadi domain waktu. Hasil dari tahap ini disebut MFCC dengan jumlah koefisien MFCC tertentu yang diinginkan. Pada penelitian ini proses MFCC menggunakan auditary toolbox Matlab yang dikembangkan oleh Slaney (1998). 5 Perangkaian Kata Perangkaian kata dilakukan dengan cara merangkaikan data latih berupa suku kata menjadi rangkaian kata seperti data uji. Hal ini dilakukan untuk membandingkan kinerja sistem terhadap data yang terdiri atas gabungan data latih dan data uji sebenarnya. Codebook Codebook adalah barisan simbol yang merepresentasikan suatu objek tertentu (Jurafsky dan Martin 2007). Codebook merupakan salah satu metode pengenalan pola yang menghasilkan sebuah cetakan suara. Setiap titik pada codebook dinamakan codeword. Nilai pada codeword diambil dari hasil pengelompokkan/clustering semua data latih berupa vektor ciri masing-masing suara. Algoritme clustering yang digunakan pada penelitian ini adalah K-means, karena algoritme ini memiliki kinerja cepat dan perhitungan sederhana. Ide dasar K-means adalah membuat kluster untuk data yang memiliki karakteristik mirip, dan memisahkan data yang memiliki karakteristik berbeda. Langkah pertama dalam K-means adalah menentukan nilai K, yaitu initial centroid yang merepresentasikan jumlah kluster yang diinginkan. Setelah itu, semua data pada data latih akan dimasukkan pada kluster yang memiliki jarak terdekat dengan data tersebut.
18 6 Time Alignment Time alignment merupakan metode untuk mengatasi pencarian jarak antara sinyal suara input dan sinyal suara pada model referensi dengan panjang vektor berbeda. Time alignment bekerja dengan cara mencari pasangan frame untuk sebuah sinyal suara input, dan mencari jarak totalnya dengan frame-frame pada sebuah kelas referensi. Karena kemampuannya dalam mengatasi perbedaan panjang vektor frame, time alignment cocok untuk diterapkan pada pengenalan rangkaian kata/connected words, dengan cara diterapkan untuk pencarian jarak di setiap kemungkinan lebar frame. Pencarian jarak pada time alignment dilakukan dengan fungsi squared euclidian distance, seperti disajikan pada Persamaan 4. dist(p,q) = n (Qi-Pi) 2 i = 1 (4) 2-level Dynamic Programming Sebuah sistem transkripsi suara yang menggunakan metode dynamic programming (DP), harus bisa mendeteksi jumlah kata pada sebuah kalimat, ending point sebuah kata, dan klasifikasi setiap kata (Morgan dan Silverman 1990). Salah satu metode DP adalah 2-level DP. Metode ini dipilih karena 2-level DP merupakan metode pengenalan rangkaian kata yang sederhana, dan dapat dikembangkan lebih lanjut dengan menambahkan metode lainnya. Ide dasar dari 2-level DP adalah mencari jarak dan jalur/path terbaik dari sebuah matriks data. Level pertama adalah pencarian jarak minimum dari sebuah barisan vektor input dengan semua vektor pada model referensi (Juang dan Rabiner 1993). Pencarian tersebut direpresentasikan dengan matriks jarak berukuran NxN, N menunjukkan jumlah frame hasil ekstraksi ciri. Nilai jarak ini dicari untuk setiap kemungkinan barisan frame tertentu dengan tiap kelas suku kata pada codebook, dengan asumsi tidak ada suku kata yang direpresentasikan dalam panjang 1 frame. Oleh karena itu, jarak sepanjang 1 frame tidak disertakan dalam penelitian ini. Setelah itu, perbandingan nilai antara satu kelas suku kata dan kelas lainnya dilakukan dan hasil yang memiliki nilai paling kecil diambil. Level kedua adalah mencari jarak total dan melakukan backtrack terhadap jarak total tersebut. Jarak total dicari dengan perhitungan rekursif sebanyak jumlah suku kata yang akan dikenali. Langkah-langkah pencarian jarak total dan backtrack jalur terbaik disajikan pada persamaan berikut. 1 Inisialisasi D(0)=0, Dc(0)=, 1 c Cmax (5) 2 Loop pada e untuk c=1 D1(e)=D(1,e), 2 e M (6) 3 Rekursi pada e untuk c=2, 3,..., Cmax D2(e)= min[d(b,e)+d1(b-1)], 1 b e, 3 e M (7) D3(e)= min[d(b,e)+d2(b-1)], 1 b e, 4 e M (8) Dc(e)= min[d(b,e)+dc-1(b-1)], 1 b e, c+1 e M (9) 4 Solusi akhir D* = min [Dc (M)], 1 c Cmax (10) dengan D = matriks jarak yang diperoleh dari level 1
19 b = awal frame pada data uji e = akhir frame pada data uji c = jumlah suku kata yang ada pada suatu rangkaian kata M = jumlah frame pada data uji. Algoritme backtrack pada penelitian ini diterapkan dengan langkah awal menyimpan semua indeks kelas pada matriks jarak yang memiliki nilai paling kecil. Setelah itu, pencarian path diselesaikan dengan menyusuri hasil indeks dari indeks suku kata terakhir, dan berlanjut mundur untuk mencari jarak terkecil berikutnya untuk pencarian suku kata lainnya. Kompleksitas algoritme 2-level DP menurut Juang dan Rabiner (1993) disajikan pada Persamaan 11. Kompleksitas total = VMN (2R+1), (11) dengan V = jumlah data referensi M = jumlah starting frame data referensi N = range frame data uji R = rata-rata banyaknya jumlah frame data uji. 7 Lingkungan Pengembangan Pada penelitian ini lingkungan pengembangan yang digunakan ialah perangkat keras CPU Intel-Core i5, 4 GB RAM, dan microphone frekuensi Hz, dengan sensitivitas 103 db, sedangkan untuk perangkat lunak menggunakan Windows 7 Professional, Microsoft Excel 2013, dan Matlab R2010a 64 bit. Pengujian Pengujian dilakukan dengan cara mencocokan hasil output sistem dengan hasil transkripsi seharusnya. Setelah itu, tingkat akurasi dihitung dengan menggunakan word error rate (WER). WER adalah salah satu metode untuk menghitung jarak antara barisan kata pada model referensi dengan keluaran/output sistem transkripsi (Bourlard et al. 2005). Semakin kecil nilai WER, semakin baik kinerja sistem transkripsi. WER didefinisikan pada Persamaan 12. Word Error Rate = S+D+I (12) N dengan S = banyaknya terjadi output substitution D = banyaknya terjadi output deletion I = banyaknya terjadi output insertion N = jumlah kata yang diuji.
20 8 HASIL DAN PEMBAHASAN Pengambilan Suara Semua data direkam langsung pada perangkat lunak Matlab dengan sampling rate Hz dan disimpan dalam format *.wav. Perekaman data dilakukan di tempat yang hening untuk meminimumkan noise dari lingkungan sekitar. Praproses Penghapusan silent dilakukan secara manual untuk 900 data latih dengan cara menghapus langsung data yang terdiri atas data suara silent, dan untuk data uji dilakukan dengan cara menetapkan nilai ambang batas/threshold untuk setiap kelas. Selanjutnya, dilakukan normalisasi amplitudo, yaitu pembagian setiap nilai amplitudo dengan nilai maksimumnya sehingga diperoleh data suara yang lebih seragam. Contoh plot data uji Ide Anda sebelum dan sesudah dinormalisasi disajikan pada Gambar 3. Gambar 3 Perbedaan data suara asli, setelah pemotongan silent, setelah dinormalisasi Ekstraksi Ciri MFCC Parameter-parameter MFCC yang digunakan dalam penelitian ini di antaranya: time frame 25 ms, sampling rate Hz, overlap 0.25, dan jumlah koefisien yang digunakan pada setiap frame ialah 13. Nilai-nilai ini dipilih agar jumlah frame data yang dihasilkan tidak terlalu besar. Perangkaian Kata Perangkaian kata dilakukan dengan cara menyatukan vektor suku kata yang diinginkan sebanyak 10 kali untuk masing-masing kelas data uji sehingga total rangkaian kata yang diperoleh ialah 60 data untuk semua kelas data uji. Codebook Pembangunan codebook dilakukan dengan menggabungkan setiap vektor data latih dari tahapan sebelumnya untuk setiap kelas, lalu dilakukan clustering
21 dengan algoritme K-means. K yang digunakan sebagai intitial centroid pada penelitian ini adalah 5, 10, 15, 20, 25, dan 30. Nilai-nilai ini dipilih karena nilai K yang biasa digunakan pada penelitian pengenalan suara berkisar antara 5 sampai 32. Hasil klustering inilah yang dijadikan sebagai nilai-nilai codeword pada codebook. Time Alignment Time alignment dilakukan dengan perhitungan euclid untuk setiap kemungkinan lebar frame antara data uji dengan data referensi pada codebook. Hasil time alignment direpresentasikan dalam bentuk matriks jarak. 9 2-level Dynamic Programming Level pertama DP adalah matriks jarak minimum untuk setiap kemungkinan panjang frame data uji dengan semua suku kata pada codebook. Level kedua yaitu pencarian rekursif jarak total menghasilkan matriks berukuran 4xN yang berarti pencarian jarak terbaik untuk 4 suku kata dari N jumlah frame data uji. Tahap terakhir yaitu backtrack jalur terbaik untuk setiap data uji akan menghasilkan path dengan total jarak paling minimum. Pengujian Pada hasil pengujian dilakukan percobaan dengan nilai K 5, 10, 15, 20, 25, dan 30 untuk setiap kelas data uji. Parameter MFCC yang digunakan pada pengujian ini sama dengan parameter pada data latih. Data uji sendiri terbagi menjadi data uji sebenarnya berjumlah 60 data, dan data uji hasil gabungan data latih berjumlah 60 data, sehingga total data uji untuk semua kelas adalah 120 data. Word error rate berdasarkan nilai K untuk setiap kelas data uji pada data uji sebenarnya dan data uji hasil gabungan data latih, disajikan pada Tabel 3 dan 4. Tabel 3 Word error rate untuk kelas data uji sebenarnya K Ide Anda Peti Tani Sesi Makan Dia Kalah Terka Ini Ada Rasi Dari Tabel 3 terlihat bahwa kelas data uji Ide Anda mendapatkan WER terendah yaitu 0.23 saat nilai K 15, sedangkan WER tertinggi didapatkan kelas data uji Dia Kalah pada saat K 5 dan 20 yaitu 1. Di sisi lain, pada kelas data uji hasil gabungan data latih, nilai WER terendah didapatkan kelas Ide Anda saat K 20 yaitu 0.1, sedangkan nilai WER tertinggi didapatkan kelas Dia Kalah saat K 10 yaitu Hal ini dapat disebabkan oleh pengucapan suatu kata. Pada kelas data uji sebenarnya, pengucapan kata seperti intonasi yang digunakan dan rentang waktu
22 10 pengucapan suatu suku kata memiliki variasi lebih tinggi dibandingkan dengan kelas data uji hasil gabungan data latih. Oleh karena itu, sistem lebih sulit mengenali suku kata pada kelas data uji sebenarnya. Tabel 4 Word error rate untuk kelas data uji hasil gabungan data latih K Ide Anda Peti Tani Sesi Makan Dia Kalah Terka Ini Ada Rasi Gambar 4 menunjukkan nilai rata-rata WER setiap kelas data uji hasil gabungan data latih dan data uji sebenarnya untuk semua nilai K. Dari gambar tersebut dapat disimpulkan bahwa pada penelitian ini, kelas data uji Ide Anda merupakan kelas yang paling mudah dikenali, dengan nilai rata-rata WER sebesar 0.51 untuk semua kelas data dan nilai K. Sementara itu, kelas data uji Dia Kalah merupakan kelas yang paling sulit dikenali, dengan nilai rata-rata WER sebesar untuk semua kelas data dan nilai K. Hal ini dapat disebabkan karena ada beberapa pengucapan suku kata yang tidak mirip dengan data latih, seperti suku kata a pada kelas data uji Dia Kalah cenderung terdengar seperti ya, sehingga tidak mirip dengan suku kata a pada data latih. Word Error Rate Ide Anda Peti Tani Sesi Makan Dia Kalah Terka Ini Ada Rasi Kelas Data Uji Gabungan Data Latih Data Uji Sebenarnya Gambar 4 Rata-rata WER setiap kelas data uji untuk semua nilai K Selain itu, kelas data uji hasil gabungan data latih mendapatkan rata-rata WER sebesar 0.58, sedangkan kelas data uji sebenarnya mendapatkan rata-rata WER sebesar 0.72 untuk semua kelas data dan nilai K. Hal ini menunjukkan bahwa kelas data uji hasil gabungan data latih lebih mudah dikenali oleh sistem dibandingkan dengan kelas data uji sebenarnya. Gambar 5 menggambarkan pengaruh nilai K terhadap nilai rata-rata WER untuk semua kelas data. Dari grafik tersebut, kurva nilai WER cenderung menurun pada nilai K 5 sampai 15, sedangkan pada nilai K 15 sampai 30 nilai WER cenderung stabil dan memiliki nilai yang berdekatan. Oleh karena itu, pada
23 penelitian ini dapat disimpulkan bahwa semakin besar nilai K nilai rata-rata WER akan semakin kecil dan mengartikan bahwa kinerja sistem semakin baik. Nilai K terbaik pada penelitian ini adalah 15, dengan rata-rata nilai WER sebesar 0.59, sedangkan nilai K dengan rata-rata WER tertinggi adalah 5 ialah sebesar Gabungan Data Latih Data Uji Sebenarnya Word Error Rate Nilai K Gambar 5 Pengaruh nilai K terhadap rata-rata WER untuk semua kelas data uji Gambar 6 dan 7 menunjukkan tingkat akurasi suku kata yang berhasil dikenali sistem pada kelas data uji hasil gabungan data latih dan kelas data uji sebenarnya. Tingkat akurasi dihitung berdasarkan jumlah kemunculan suku kata hasil transkripsi dan dibagi dengan kemunculan suku kata tersebut seharusnya. Pada kelas data uji hasil gabungan data latih, rata-rata akurasi untuk semua kelas suku kata adalah 43.24%, lebih baik dibandingkan dengan rata-rata akurasi pada kelas data uji sebenarnya yaitu 27.31%. Akan tetapi, terdapat perbedaan signifikan antara nilai akurasi tiap suku kata pada kedua kelas data uji tersebut. Hal ini menunjukkan bahwa tingkat akurasi sangat bergantung kepada data suara itu sendiri. Suku kata yang berhasil dikenali paling baik dari semua kelas data uji adalah ta dengan ratarata akurasi sebesar 65.83% dan paling sulit dikenali adalah suku kata ter dengan rata-rata akurasi sebesar 8.33%. Nilai WER dan tingkat akurasi suku kata sangat bergantung kepada hasil backtracking path pada algoritme DP. Berdasarkan hasil penelitian ini, sistem masih memiliki kekurangan dalam menentukan path terbaik untuk suatu rangkaian kata/connected words. Hal ini menyebabkan output sistem belum sepenuhnya tepat dalam transkripsi suara tersebut dan menghasilkan error yang cukup tinggi, misalnya terjadi substitusi suatu suku kata dengan suku kata lainnya. Kesalahan backtracking tersebut dapat disebabkan oleh beberapa faktor, seperti penetapan threshold untuk pemotongan silent yang dilakukan terhadap kelas data uji sebenarnya. Apabila silent dapat dihilangkan dengan baik, output sistem yang dihasilkan juga akan lebih baik karena mendekati data pada model codebook yang tidak memiliki model silent. Faktor lainnya ialah pengucapan kata itu sendiri, seperti intonasi yang digunakan dan lamanya pengucapan kata tersebut. Pengucapan yang semakin mirip dengan data pada model codebook akan menghasilkan nilai WER yang semakin rendah dan akurasi suku kata semakin tinggi. Penggunaan parameter-parameter lain seperti time frame, overlap, koefisien
24 12 cepstral, dan pemilihan nilai K juga dapat berpengaruh terhadap nilai error rate sistem secara keseluruhan pada penelitian ini. Tingkat Akurasi (%) i pe ta an ti kan de da ma si se a di ka ra lah ni ter Suku Kata Gambar 6 Tingkat akurasi suku kata pada kelas data uji gabungan data latih Tingkat Akurasi (%) ni de ta si ma lah ra an a se pe i ter di da kan ti ka Suku Kata Gambar 7 Tingkat akurasi suku kata pada kelas data uji sebenarnya Implementasi Sistem Gambar 8 menunjukkan tampilan antarmuka program pada penelitian ini. Terdapat tombol cari untuk memilih data uji yang akan ditranskripsi, tombol mainkan untuk mendengarkan data uji yang dipilih, dan tombol transkripsi yang disertai dengan radio button 5, 10, 15, 20, 25, dan 30 untuk memilih nilai K pada initial centroid K-means. Tombol reset digunakan untuk menghapus hasil transkripsi sebelumnya. Grafik di kiri bawah berfungsi untuk menunjukkan plot suara data uji, jarak total menunjukkan jumlah jarak untuk satu data uji dengan semua kemungkinan lebar frame yang tidak lain merupakan hasil rekursif level 2
25 DP, sedangkan hasil transkripsi akan menunjukkan hasil backtrack jalur terbaik yang merupakan hasil akhir dari DP. 13 Gambar 8 Antarmuka program transkripsi suara ke teks berbasis suku kata SIMPULAN DAN SARAN Simpulan Penelitian ini sudah berhasil diselesaikan dengan menerapkan codebook sebagai pengenalan pola dan 2-level DP sebagai metode pengenalan rangkaian kata. Penelitian ini menunjukkan bahwa data uji hasil gabungan data latih lebih mudah dikenali dibandingkan dengan data uji sebenarnya karena memiliki tingkat kemiripan pengucapan kata yang lebih tinggi. Penggunaan nilai K pada clustering K-means juga memiliki pengaruh tinggi terhadap nilai WER. Selain itu, pemilihan nilai parameter lainnya seperti time frame, overlap, koefisien cepstral, dan threshold untuk pemotongan silent juga penting untuk diperhatikan. Nilai K paling optimum pada penelitian ini didapatkan saat K 15. Nilai WER terendah berhasil didapatkan kelas data uji hasil gabungan data latih pada kelas Ide Anda dengan nilai K 20 ialah sebesar 0.1. Saran Penelitian ini memungkinkan untuk dikembangkan lebih baik lagi. Saran untuk pengembangan selanjutnya adalah: 1 Menggunakan parameter time frame, overlap, koefisien cepstral, threshold untuk pemotongan silent, dan K initial centroid yang berbeda untuk membandingkan nilai WER yang dihasilkan. 2 Menambahkan suku kata lain agar kamus kata menjadi lebih lengkap. 3 Melakukan percobaan dengan panjang suku kata berbeda untuk mengetahui tingkat keberhasilan algoritme dynamic programming.
26 14 4 Menambahkan metode pemrosesan bahasa alami dalam bidang linguistik agar hasil transkripsi sesuai dengan kaidah tata bahasa Indonesia. 5 Menggunakan metode pengenalan connected words lainnya seperti level building atau one stage DP untuk mengetahui kinerja metode tersebut. DAFTAR PUSTAKA Buono A, Jatmiko W, Kusumo P Perluasan Metode MFCC 1D ke 2D sebagai ekstraksi ciri pada sistem identifikasi pembicara menggunakan hidden markov model (HMM). Jurnal Makara Sains 13(1): Buono A, Kusumoputro B Pengembangan Model HMM Berbasis Maksimum Lokal Menggunakan Jarak Euclid Untuk Sistem Identifikasi Pembicara. Di dalam: Proceeding of National Conference on Computer Science & Information Technology; 2007 Januari 29-30; Depok, Indonesia. Bourlard H, Dines J, Flynn M, McCowan I, Moore D, Perez D, Wellner P On the Use of Information Retrieval Measures for Speech Recognition Evaluation. Switzerland: IDIAP Research Institute. Juang BH, Rabiner L Fundamentals of Speech Recognition. New Jersey (US): Prentice Hall. Jurafsky D, Martin JH Speech and Language Processing An Introduction to Natural Language Processing, Computational Linguistic, and Speech Recognition. Ed ke-2. New Jersey (US): Prentice Hall. Luthfi MS Pendeteksian Kata dengan MFCC sebagai Ekstraksi Ciri dan Codebook sebagai Pengenalan Pola [skripsi]. Bogor (ID): Institut Pertanian Bogor. Morgan DP, Silverman HF The Application of Dynamic Programming to Connected Speech Recognition. Di dalam: IEEE ASSP Magazine; 1990 Juli. Slaney Malcolm Auditory Toolbox [Internet]. [Diakses pada 2014 Maret 1]. Tersedia pada
27 Lampiran 1 Matriks konfusi tingkat akurasi suku kata pada data uji gabungan data latih Suku Kata Si A Da Di An Se I Kan Ra De Ma Ni Ti Ter Pe Lah Ka Ta Si A Da Di An Se I Kan Ra De Ma Ni Ti Ter Pe Lah Ka Ta
28 16 Lampiran 2 Matriks konfusi tingkat akurasi suku kata pada data uji sebenarnya 16 Suku Kata Si A Da Di An Se I Kan Ra De Ma Ni Ti Ter Pe Lah Ka Ta Si A Da Di An Se I Kan Ra De Ma Ni Ti Ter Pe Lah Ka Ta
29 17 RIWAYAT HIDUP Penulis dilahirkan di Bandung pada tanggal 1 Januari 1992 dari pasangan Asep Roswanda dan Asih Setiawaty. Penulis adalah putri kedua dari dua bersaudara. Tahun 2010 penulis lulus dari SMA Negeri 1 Bogor dan pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) melalui Undangan Seleksi Masuk IPB dan diterima di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama mengikuti perkuliahan, penulis pernah melaksanakan Praktik Kerja Lapang (PKL) di Kementerian Pekerjaan Umum Indonesia selama 35 hari. Penulis juga pernah menjadi asisten praktikum mata kuliah struktur data dan metode kuantitatif. Dalam bidang organisasi, penulis menjadi anggota Himpunan Profesi Ilmu Komputer tahun Penulis juga aktif menjadi pengurus UKM MAX!! IPB tahun , dan anggota komunitas Public Relation Community IPB tahun Kegiatan lain penulis adalah mengikuti pelatihan-pelatihan nonformal yang ada, seperti pelatihan jurnalistik, pelatihan desain menggunakan Adobe Flash dan Adobe Indesign, pelatihan web developing dengan framework YII, dan pertemuan komunitas UI/UX Indonesia.
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar
Lebih terperinciPerbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan
Lebih terperinciPENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar
PENDAHULUAN Latar Belakang Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit
Lebih terperinciPengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.
Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi
Lebih terperinciPENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO
PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI SKRIPSI
Lebih terperinciSISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI
SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN
Lebih terperinciPENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO
PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU
Lebih terperinciPENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI
PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR PERNYATAAN
Lebih terperincii. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz
Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode
Lebih terperinciPEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA
PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciPENERAPAN LEARNING VECTOR QUANTIZATION
PENERAPAN LEARNING VECTOR QUANTIZATION (LVQ) DAN EKSTRAKSI CIRI MENGGUNAKAN MEL- FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) UNTUK TRANSKRIPSI SUARA KE TEKS LAKSMI NIRMALA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS
Lebih terperinciudara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.
BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun
Lebih terperinciANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre
Lebih terperinciSeminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:
Perintah Suara Berbahasa Indonesia untuk Membuka dan Menutup Aplikasi dalam Sistem Operasi Windows Menggunakan Metode Mel Frequency Cepstrum Coefficient dan Metode Backpropagation Zakaria Ramadhan 1, Sukmawati
Lebih terperinciPENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI
PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciPENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK
ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan
Lebih terperinciSistem Verifikasi Penutur menggunakan Metode Mel Frequensi.
SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik
Lebih terperinciPENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS
PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER CLARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA
Lebih terperinciINDEPT, Vol. 3, No.1, Februari 2013 ISSN
SISTEM SPEAKER RECOGNITION (PENGENAL PENGUCAP) UNTUK MENCARI KARAKTERISTIK UCAPAN SESEORANG DENGAN METODE MEL FREQUENCY CEPTRUM COEFFISIENT (MFCC) MENGGUNAKAN SOFTWARE MATLAB Andriana, ST., MT. Dosen Fakultas
Lebih terperinciKarakteristik Spesifikasi
Sinyal yang masuk difilter ke dalam sinyal frekuensi rendah (low-pass filter) dan sinyal frekuensi tinggi (high-pass filter) Lakukan downsampling pada kedua sinyal tersebut Low-pass frekuensi hasil downsampling
Lebih terperinciIDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 IDENTIFIKASI CAMPURAN
Lebih terperinciPENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV
PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV Marianus Hendra Wijaya 1), Linggo Sumarno 2) 1) Program Studi Teknik Elektro Fakultas Sains dan Teknologi Universtas Sanata Dharma Yogyakarta
Lebih terperinciIDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO
IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO 02.50.0020 PROGRAM STUDI TEKNIK ELEKTRO FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS KATOLIK
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Suara Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN
BAB IV HASIL DAN PEMBAHASAN 4.1. Pengujian Perangkat Lunak Dalam mengetahui perangkat lunak yang dibuat bisa sesuai dengan metode yang dipakai maka dilakukan pengujian terhadap masin-masing komponen perangkat.
Lebih terperinciPENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO
PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR
Lebih terperinciBAB 3 PERANCANGAN SISTEM
20 BAB 3 PERANCANGAN SISTEM 3.1 Rancangan Perangkat Keras Sistem ini hanya menggunakan beberapa perangkat keras yang umum digunakan, seperti mikrofon, speaker (alat pengeras suara), dan seperangkat komputer
Lebih terperinciJaringan Syaraf Tiruan pada Robot
Jaringan Syaraf Tiruan pada Robot Membuat aplikasi pengenalan suara untuk pengendalian robot dengan menggunakan jaringan syaraf tiruan sebagai algoritma pembelajaran dan pemodelan dalam pengenalan suara.
Lebih terperinciBAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari
BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker
Lebih terperinciTINJAUAN PUSTAKA. Pengenalan Suara
Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan
Lebih terperinciFrekuensi Dominan Dalam Vokal Bahasa Indonesia
Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan
Lebih terperinciPEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA
PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciAplikasi Teknik Speech Recognition pada Voice Dial Telephone
Aplikasi Teknik Speech Recognition pada Voice Dial Telephone Oleh: Ahmad Irfan Abdul Rahman Tri Budi Santoso Titon Dutono Laboratorium Sinyal, Politeknik Elektronika Negeri Surabaya (PENS) Institut Teknologi
Lebih terperinciPENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO
PENERAPAN LEARNING VECTOR QUANTIZATION UNTUK IDENTIFIKASI PEMBICARA DENGAN MENGGUNAKAN EKSTRAKSI CIRI PRINCIPAL COMPONENT ANALYSIS ENDRIK SUGIYANTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU
Lebih terperinciTUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan Program Strata I Pada Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas
TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI CONNECTED DIGIT RECOGNITION DENGAN METODE MEL FREQUENCY CEPSTRUM COEFFECIENT DAN HIDDEN MARKOV MODEL UNTUK VOICE DIALING PADA HANDPHONE TIGER C KF-828 Diajukan
Lebih terperinciBab 3. Perancangan Sistem
34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara
Lebih terperinciPERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI
PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI DAPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian
BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,
Lebih terperincivii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI
vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. spesifikasi perangkat keras dan perangkat lunak yang menunjang.
26 BAB III ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1 Spesifikasi yang Dibutuhkan Untuk dapat menjalankan Voice Recognition Program ini dibutuhkan beberapa spesifikasi perangkat keras dan perangkat
Lebih terperinciBAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian
BAB III METODE PENELITIAN 3.1 Model Penelitian Penelitian yang dilakukan dapat dijelaskan melalui blok diagram seperti yang terlihat pada Gambar 3.1. Suara Burung Burung Kacer Burung Kenari Pengambil an
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Genre Menurut Kamus Besar Bahasa Indonesia, genre adalah jenis, tipe, atau kelompok sastra atas dasar bentuknya. Jadi genre musik merupakan pengelompokan musik berdasarkan kemiripan
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1. Model Penelitian Penelitian yang dilakukan dapat dijelaskan dengan lebih baik melalui blok diagram seperti yang terliat pada Gambar 3.1. Suara Manusia Rekam suara Hasil rekaman
Lebih terperinciIDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY
IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY Erni Seniwati 1), Ninik Tri Hartanti 2) 1 Sistem Informasi, STMIK Amikom erni.s@amikom.ac.id 2 Sistem Informasi, STMIK Amikom
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi
Lebih terperinciDigital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods
Pemrosesan Sinyal DigitalUntuk Mengidentifikasi Akord Dasar Penyanyi Dengan Metode Mel Frequency Cepstral Coeficients (MFCC) Dan Jaringan Syaraf Tiruan Backpropagation Digital Signal Processing To Identify
Lebih terperinciIdentifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)
Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM) Inggih Permana 1, Benny Sukma Negara 2 1 Universitas Sultan Sarif Kasim Riau 2 Universitas Sultan Sarif
Lebih terperinciPENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION
PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION DETECTION OF THE LEVEL OF YOUTH, ADULTS AND ELDERLY BY USING MFCC METHOD AND FUZZY
Lebih terperinciSISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE
SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia
Lebih terperinciJurnal Ilmiah Komputer dan Informatika (KOMPUTA)
21 PERANGKAT LUNAK UNTUK MEMBUKA APLIKASI PADA KOMPUTER DENGAN PERINTAH SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENTS Anna Dara Andriana Program Studi Teknik Informatika Fakultas Teknik
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul
37 BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil 4.1.1 Pengambilan Database Awalnya gitar terlebih dahulu ditala menggunakan efek gitar ZOOM 505II, setelah ditala suara gitar dimasukan kedalam komputer melalui
Lebih terperinciIMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION
IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION TUGAS AKHIR Diajukan Untuk Memenuhi Sebagian Persyaratan Dalam Memperoleh Gelar Sarjana Komputer Jurusan Teknik Informatika Disusun oleh : PAULA
Lebih terperinci1. BAB I PENDAHULUAN 1.1. Latar Belakang
1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat
Lebih terperinciPENDETEKSIAN KATA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN CODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL
PENDETEKSIAN KATA DENGAN MF SEBAGAI EKSTRAKSI IRI DAN ODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciWarble Of Lovebird Classification Using Mel Frequency Cepstral Coefficient (MFCC)
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 2968 KLASIFIKASI SUARA LOVEBIRD DENGAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN FUZZY LOGIC Warble Of Lovebird Classification
Lebih terperinciSISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM. Ivanna K. Timotius, Danie Kurniawan. Intisari
SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM SISTEM PENGENALAN WICARA BERDASARKAN CEPSTRUM Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro, Universitas Kristen Satya Wacana, Salatiga,
Lebih terperinciSISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR
SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR Ali Mustofa Jurusan Teknik Elektro, Universitas Brawijaya Email: a_tofa@yahoo.com Abstrak - Pengenalan penutur adalah
Lebih terperinciPengembangan Model HMM Berbasis Maksimum Lokal Menggunakan Jarad Euclid Untuk Sistem Identifikasi Pembicara -,,
-- -- roceedings of NATIONAL CONFERENCE ON COMPUTER SCIENCE & INFORMATION TECHNOLOGY 200 anuary 29-30.2007, Faculty of Computer Science, University of Indonesia * Pengembangan Model HMM Berbasis Maksimum
Lebih terperinci2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...
DAFTAR ISI PERNYATAAN... i KATA PENGANTAR... ii UCAPAN TERIMA KASIH... iii ABSTRAK... v ABSTRACT... vi DAFTAR ISI... vii DAFTAR TABEL... ix DAFTAR GAMBAR... x DAFTAR LAMPIRAN... xii BAB I PENDAHULUAN...
Lebih terperinciPengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC
Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC Elghar Wisnudisastra, Agus Buono Departemen Ilmu Komputer, Institut Pertanian Bogor, Jl. Meranti Wing 20 Lv.V,
Lebih terperinciPENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG
PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad
Lebih terperinciSuara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur
PEMBENTUKAN BASIS DATA UCAPAN DALAM BAHASA INDONESIA DAN PENGKODEANNYA BERDASARKAN LINEAR PREDICTIVE CODING (LPC) Elly Oktarina zonalee_cho@yahoo.com Universitas Gunadarma Jl. Margonda Raya No. 100 Pondok
Lebih terperinciBAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka
BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Suara adalah suatu alat komunikasi paling utama yang dimiliki oleh manusia. Dengan suara, manusia dapat berkomunikasi dengan manusia lainnya. Melalui suara,
Lebih terperinciPENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G
PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA Oleh : VICKY ZILVAN G64103043 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciPENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI
PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI SKRIPSI I GEDE ARYA MAHARTA NIM. 1108605025 JURUSAN ILMU
Lebih terperinciAPLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT
APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT DAN LINEAR VECTOR QUANTIZATION UNTUK PENGENDALIAN GERAK ROBOT Anggoro Wicaksono, Sukmawati NE, Satriyo Adhy,
Lebih terperinciPENENTUAN AKOR GITAR DENGAN MENGGUNAKAN ALGORITMA SHORT TIME FOURIER TRANSFORM
PENENTUAN AKOR GITAR DENGAN MENGGUNAKAN ALGORITMA SHORT TIME FOURIER TRANSFORM Agustina Trifena Dame Saragih 1, Achmad Rizal 2, Rita Magdalena 3 Departemen Teknik Elektro Institut Teknologi Telkom Jl.
Lebih terperinciPENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA. Oleh : WINI PURNAMASARI G
PENGEMBANGAN MODEL MARKOV TERSEMBUNYI UNTUK IDENTIFIKASI PEMBICARA Oleh : WINI PURNAMASARI G64102051 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006
Lebih terperinciBAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk
6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada
Lebih terperinciPENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA
PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB I PENDAHULUAN I.1 Latar Belakang
BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring
Lebih terperinciPenerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows
Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows 1 Muhammad Anggia Muchtar, 2 Raisha Ariani Sirait, 3 Romi Fadillah Rahmat 1,2,3 Program Studi S1 Teknologi Informasi
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Indonesia
BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai
Lebih terperinciTeam project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP
Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis
Lebih terperinciUNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV
UNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV SKRIPSI YUNANTO WIDYATMAJI 0404030881 FAKULTAS TEKNIK
Lebih terperinciANALISIS DAN IMPLEMENTASI APLIKASI PENGENALAN SUARA MENJADI TEKS MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION
ANALISIS DAN IMPLEMENTASI APLIKASI PENGENALAN SUARA MENJADI TEKS MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION ANALYSIS AND IMPLEMENTATION OF SPEECH TO TEXT APPLICATION USING BACKPROPAGATION
Lebih terperinciMETODE PENELITIAN. Gambar 1 Alur metode penelitian.
akan menggunakan bantuan aplikasi pemrosesan audio (Rochesso 2007). Penambahan Derau Derau merupakan suara-suara yang tidak diinginkan. Munculnya derau dapat menurunkan kualitas suatu berkas audio. Penambahan
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. perangkat. Alat dan bahan yang digunakan sebelum pengujian:
BAB IV HASIL DAN PEMBAHASAN 4.1 Pengujian Perangkat Lunak Dalam mengetahui perangkat lunak yang dibuat bisa sesuai dengan metode yang dipakai maka dilakukan pengujian terhadap masing-masing komponen perangkat.
Lebih terperinciPenerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification
Jurnal Telematika, vol. 11 no. 1, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker
Lebih terperinciPENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA
PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB I PENDAHULUAN 1.1 LATAR BELAKANG
BAB I PENDAHULUAN 1.1 LATAR BELAKANG Informasi tentang pemasangan iklan di suatu radio (antara lain mengenai, jam berapa suatu iklan ditayangkan, dalam sehari berapa kali suatu iklan ditayangkan dan berapa
Lebih terperinciBAB 3 PERANCANGAN SISTEM. yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk
BAB 3 PERANCANGAN SISTEM 3.1 Gambaran Umum Sistem Voice Command pada demonstrasinya merupakan aplikasi pengenalan suara yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk menampung
Lebih terperinciBAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Kecerdasan buatan (artificial intelligence) merupakan bidang yang berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang mengarah kepada bidang
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Suara (Wicara) Suara khususnya wicara merupakan cara yang natural bahkan paling penting dalam melakukan proses komunikasi. Dalam kehidupan sehari-hari, manusia melakukan berbagai
Lebih terperinciBIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES
Agustini, Biometrik Suara Dengan Transformasi Wavelet 49 BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Ketut Agustini (1) Abstract: Biometric as one of identification or recognition
Lebih terperinciPENGENALAN LAFAL HUKUM NUN MATI MENGGUNAKAN HIDDEN MARKOV MODEL
Jurnal LOG!K@, Jilid 6, No. 1, 2016, Hal. 1-10 ISSN 1978 8568 PENGENALAN LAFAL HUKUM NUN MATI MENGGUNAKAN HIDDEN MARKOV MODEL Agus Jamaludin, Arief Fatchul Huda, dan Rini Sahyandari Program Studi Matematika
Lebih terperinciJurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau
Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, 121-132 121 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Aplikasi Pengenalan Ucapan Dengan Ekstraksi Ciri Mel- Frequency Cepstrum Coefficients
Lebih terperinciPENGENALAN UCAPAN DENGAN METODE FFT PADA MIKROKONTROLER ATMEGA32. Disusun Oleh : Nama : Rizki Septamara Nrp :
PENGENALAN UCAPAN DENGAN METODE FFT PADA MIKROKONTROLER ATMEGA32 Disusun Oleh : Nama : Rizki Septamara Nrp : 0622034 Jurusan Teknik Elektro, Fakultas Teknik, Universitas Kristen Maranatha, Jl. Prof.Drg.Suria
Lebih terperinciAPLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM)
APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM) Eko Widiyanto, Sukmawati Nur Endah, Satriyo Adhy, Sutikno Jurusan Ilmu Komputer/Informatika,
Lebih terperinciUNIVERSITAS BINA NUSANTARA
UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006 PERANCANGAN SISTEM PROTEKSI FILE DENGAN PASSWORD SUARA Rendy Sesario 0600615431 Samanta Limbrada
Lebih terperinciPERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA
PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,
Lebih terperinciPENGENALAN NADA PIANIKA MENGGUNAKAN JENDELA SEGITIGA, DCT, DAN FUNGSI JARAK EUCLEDIAN
PEGEALA ADA PIAIKA MEGGUAKA JEDELA SEGITIGA, DCT, DA FUGSI JARAK EUCLEDIA Linggo Sumarno Jurusan Teknik Elektro, Universitas Sanata Dharma Kampus III, Paingan, Maguwoharjo, Depok, Sleman, Yogyakarta 558
Lebih terperinciIdentifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri
Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Vicky Zilvan, S.Kom. UPT LPSN - LIPI v_q1e@yahoo.com Furqon Hensan Muttaqien, S.Komp. P2 Informatika - LIPI fh.muttaqien@informatika.lipi.go.id
Lebih terperinci