IDENTIFIKASI JENIS TANGIS BAYI MENGGUNAKAN CODEBOOK UNTUK PENGENAL POLA DAN MFCC UNTUK EKSTRAKSI CIRI MEDHANITA DEWI RENANTI
|
|
- Ari Kusuma
- 7 tahun lalu
- Tontonan:
Transkripsi
1 IDENTIFIKASI JENIS TANGIS BAYI MENGGUNAKAN CODEBOOK UNTUK PENGENAL POLA DAN MFCC UNTUK EKSTRAKSI CIRI MEDHANITA DEWI RENANTI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2013
2
3 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa tesis berjudul Identifikasi Jenis Tangis Bayi menggunakan Codebook untuk Pengenal Pola dan MFCC untuk Ekstraksi Ciri adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juli 2013 Medhanita Dewi Renanti NIM G
4 RINGKASAN MEDHANITA DEWI RENANTI. Identifikasi Jenis Tangis Bayi menggunakan Codebook untuk Pengenal Pola dan MFCC untuk Ekstraksi Ciri. Dibimbing oleh AGUS BUONO dan WISNU ANANTA KUSUMA. Software yang dibuat ini merupakan otomatisasi dari Dunstan Baby Language. Software ini menggunakan MFCC untuk ekstraksi ciri dan codebook untuk pengenalan suara bayi. Pembentukan codebook berasal dari hasil clustering semua data tangis bayi dengan menggunakan k-means clustering. Ruang lingkup penelitian ini adalah: 1) klasifikasi arti tangis bayi yang digunakan adalah versi Dunstan Baby Language, 2) software ini digunakan untuk identifikasi arti tangis bayi usia 0-3 bulan. Metode penelitian ini terdiri atas beberapa tahapan proses yaitu pengambilan data, preprocessing, pemodelan codebook tangis bayi, pengujian dan analisis, serta pembuatan antarmuka. Data tangis bayi ini diambil dari video Dunstan Baby Language yang sudah diolah. Data dibagi menjadi dua yaitu data latih dan data uji. Terdapat 140 data latih yang masing-masing mewakili 28 tangis bayi lapar, 28 tangis bayi mengantuk, 28 tangis bayi ingin bersendawa, 28 tangis bayi mengalami nyeri (ada angin) di perut, dan 28 tangis bayi tidak nyaman (bisa karena popoknya basah/udara yang terlalu panas/dingin atau hal lainnya). Data uji sebanyak 35, masing-masing 7 tangis bayi untuk setiap jenis tangis bayi. Pada tahap preprocessing dilakukan pemotongan silence dan ekstraksi ciri menggunakan MFCC. Pembuatan antarmuka identifikasi arti tangis bayi dibuat berdasarkan data latih yang menghasilkan tertinggi. Penelitian ini dibuat menggunakan software Matlab R2010b version Penelitian ini memvariasikan panjang frame: 25 ms/panjang frame = 275, 40 ms/panjang frame = 440, 60 ms/ panjang frame = 660; overlap frame: 0%, 40%, 60%; dan jumlah codeword: 1 sampai 18, untuk panjang frame = 275 dan overlap frame = 0% menggunakan jumlah codeword 1 sampai 29. Identifikasi jenis tangis bayi menggunakan jarak terkecil dari jarak euclid dan mahalanobis. Akurasi menggunakan jarak euclid berkisar antara 37% sampai 94%. Sedangkan nilai menggunakan jarak mahalanobis berkisar antara 9% sampai 83%. Model codebook dan MFCC yang menghasilkan tertinggi adalah: panjang frame = 440, overlap frame = 0.4, k=18. Sedangkan penggunaan jarak yang menghasilkan tertinggi adalah penggunaan jarak euclid. Model tersebut mampu menghasilkan pengenalan jenis tangis bayi tertinggi sebesar 94%. Suara eh merupakan suara yang sering benar dikenali sedangkan suara owh merupakan suara yang sering salah dikenali dan biasanya kesalahannya dikenali sebagai suara neh dan eairh. Kelemahan penelitian ini adalah pemotongan silence hanya dilakukan di awal dan di akhir. Penelitian selanjutnya diharapkan melakukan pemotongan silence di setiap segmen suara supaya data yang dihasilkan lebih mencirikan suara tersebut. Hal ini diharapkan mempunyai dampak terhadap yang lebih tinggi. Kata kunci: Codebook, Dunstan baby language, Infant cries, K-means clustering, MFCC
5 SUMMARY MEDHANITA DEWI RENANTI. The Identification of Infant Cries by Using Codebook as Feature Matching, and MFCC as Feature Extraction. Supervised by AGUS BUONO and WISNU ANANTA KUSUMA. In this paper, we focused on automation of Dunstan Baby Language. This software uses MFCC as feature extraction and codebook as feature matching. The codebook of clusters is made from the proceeds of all the baby s cries data, by using the k-means clustering. The scope of this research are: 1) the infant cries classification used is the version of the Dunstan Baby Language, 2) this software is used to identify the meaning of 0-3 month old infant cries. The methodology of this research consists of several stages of process: data collection, preprocessing, codebook modeling of infant cries, testing and analysis, and interface manufacturing. The data is taken from Dunstan Baby Language videos that has been processed. The data is divided into two, training data and testing data. There are 140 training data, each of which represents the 28 hungry infant cries, 28 sleepy infant cries, 28 wanted to burp infant cries, 28 in pain infant cries, and 28 uncomfortable infant cries (could be because his diaper is wet/too hot/cold air or anything else). The testing data is 35, respectively 7 infant cries for each type of infant cry. Silence cutting is in the preprocessing stage and the feature extraction uses MFCC method. The interface making of the infant cries identification is made based on the training data that produces the highest accuracy. The making of this research is using Matlab R2010b version software. The research varying frame length: 25 ms/frame length = 275, 40 ms/frame length = 440, 60 ms/ frame length = 660; overlap frame: 0%, 25%, 40%; the number of codewords: 1 to 18, except for frame length 275 and overlap frame = 0% using 1 to 29 clusters. The identification of this type of infant cries uses the minimum distance of euclidean and mahalanobis distance. Accuracy value using euclidean distance is between 37% and 94%. Whereas, accuracy value using mahalanobis distance is between 9% and 83%. Codebook model and MFCC with the higher accuracy is: frame length = 440, overlap frame = 0.4, k = 18. Eventhough the distance using that produce the higher accuracy is euclidean distance. That model can produce accuracy recognition of infant cries with the higher about 94%. Sound eh is the most familiar, whereas sound owh is always missunderstood and generally it is known as neh and eairh. The weakness point of this research is the silence is only be cut at the beginning and at the end of speech signal. Hopefully, in the next research, the silence can be cut in each sound segment so that it can produce more specific sound. It has impact on the bigger accuracy as well. Keywords: Codebook, Dunstan baby language, Infant cries, K-means clustering, MFCC
6 Hak Cipta Milik IPB, Tahun 2013 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB
7 IDENTIFIKASI JENIS TANGIS BAYI MENGGUNAKAN CODEBOOK UNTUK PENGENAL POLA DAN MFCC UNTUK EKSTRAKSI CIRI MEDHANITA DEWI RENANTI Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Komputer pada Program Studi Ilmu Komputer SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2013
8 Penguji pada Ujian Tertutup: Dr Ir Bib Paruhum Silalahi, MKom
9 Judul Tesis : Identifikasi Jenis Tangis Bayi menggunakan Codebook untuk Pengenal Pola dan MFCC untuk Ekstraksi Ciri Nama : Medhanita Dewi Renanti NIM : G Disetujui oleh Komisi Pembimbing Dr Ir Agus Buono, MSi, MKom Ketua Dr Eng Wisnu Ananta Kusuma, ST, MT Anggota Diketahui oleh Ketua Program Studi Ilmu Komputer Dekan Sekolah Pascasarjana Dr Yani Nurhadryani, SSi, MT Dr Ir Dahrul Syah, MScAgr Tanggal Ujian: 17 Juli 2013 Tanggal Lulus:
10
11 PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta ala atas segala karunia-nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan November 2012 ini ialah speech recognition, dengan judul Identifikasi Jenis Tangis Bayi menggunakan Codebook untuk Pengenal Pola dan MFCC untuk Ekstraksi Ciri. Terima kasih penulis ucapkan kepada Bapak Dr Ir Agus Buono, MSi, MKom dan Bapak Dr Eng Wisnu Ananta Kusuma, ST, MT selaku pembimbing yang telah banyak memberi saran, kepada Bapak Dr Ir Bib Paruhum Silalahi, MKom selaku penguji, kepada DIKTI atas beasiswa selama menempuh pendidikan dan Program Diploma IPB atas bantuan biaya penelitian. Selain itu, penghargaan penulis sampaikan kepada semua dosen dan staf Departemen Ilmu Komputer IPB, dosen dan staf Program Diploma IPB yang telah membantu selama proses penelitian. Ungkapan terima kasih juga disampaikan kepada suami Soni Trison, ananda Shofia Dzakka Hanifa, ayah Totok Darussalam dan Didin Kasrudin, ibu Lilik Hertantini dan Mimin Rohaeti, serta seluruh keluarga, atas segala doa dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat. Bogor, Juli 2013 Medhanita Dewi Renanti
12 DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN 1 PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 2 Ruang Lingkup Penelitian 2 2 TINJAUAN PUSTAKA 3 Dunstan Baby Language 3 Ruang Lingkup Pemrosesan Suara 4 Speech Recognition 4 Sinyal 5 Transformasi Sinyal menjadi Informasi 5 Dijitalisasi Gelombang Suara 6 Ekstraksi Ciri Mel Frequency Cepstrum Coefficients 6 Codebook 8 K-means Clustering 10 3 METODE 11 4 HASIL DAN PEMBAHASAN 15 5 SIMPULAN DAN SARAN 26 Simpulan 26 Saran 26 DAFTAR PUSTAKA 27 LAMPIRAN 29 RIWAYAT HIDUP 41 x x xi
13 DAFTAR TABEL 1 Faktor dan level penelitian 11 2 Hasil pengujian data uji saat k = 18, panjang frame = 440, dan overlap frame = 0.4 menggunakan jarak euclid 16 3 Hasil pengujian data uji saat k = 18, panjang frame = 660, dan overlap frame = 0.25 menggunakan jarak euclid 16 4 Hasil pengujian data uji saat k = 18, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak euclid 16 5 Kisaran nilai menggunakan jarak euclid dan mahalanobis 20 6 Hasil pengujian data latih saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis 20 7 Confusion matrix saat k = 18, panjang frame = 440, dan overlap frame = 0.4 menggunakan jarak euclid 25 8 Confusion matrix saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis 25 DAFTAR GAMBAR 1 Perbedaan kategori recognition (Reynolds 2002) 4 2 Contoh sinyal suara 5 3 Tahapan transformasi sinyal suara menjadi informasi (Jurafsky & Martin 2007, dimodifikasi oleh Buono 2009) 6 4 Diagram Alur MFCC (Buono 2009) 9 5 Ilustrasi diagram konseptual dari formasi codebook VQ 9 6 Metodologi penelitian identifikasi jenis tangis bayi 11 7 Sinyal suara owh 12 8 Sinyal owh yang dipotong 12 9 Ilustrasi identifikasi jenis tangis bayi Grafik perbandingan menggunakan jarak euclid pengujian data uji Ilustrasi codebook eh dan owh Ilustrasi codebook eairh, eh, dan owh Grafik perbandingan menggunakan jarak euclid pengujian data latih Grafik perbandingan menggunakan jarak mahalanobis pengujian data uji Grafik perbandingan menggunakan jarak mahalanobis pengujian data latih Ilustrasi codebook heh dan owh Akurasi pengujian data latih dan data uji menggunakan jarak euclid dengan panjang frame = 275 dan overlap frame = Akurasi pengujian data latih dan data uji menggunakan jarak dengan panjang frame = 275 dan overlap frame = Ilustrasi codebook owh dan neh, serta data uji owh Ilustrasi codebook owh dan neh, serta data latih owh 24
14 21 Hierarchical clustering Antarmuka identifikasi jenis tangis bayi 26 DAFTAR LAMPIRAN 1 Hasil identifikasi jenis tangis bayi menggunakan jarak euclid pengujian data uji 29 2 Hasil identifikasi jenis tangis bayi menggunakan jarak euclid pengujian data uji 32 3 Hasil identifikasi jenis tangis bayi menggunakan jarak mahalanobis pengujian data uji 35 4 Hasil identifikasi jenis tangis bayi menggunakan jarak mahalanobis pengujian data latih 38
15 1 PENDAHULUAN Komunikasi verbal pertama yang dikuasai bayi adalah menangis. Tangisan ini sebagai komunikasi dengan manusia dewasa untuk memenuhi kebutuhan dan keinginannya serta untuk menanggapi situasi tertentu. Hampir sebagian besar ibu akan menyusui anaknya atau menggendong bayinya ketika bayi tersebut menangis, tetapi adakalanya tindakan ibu tersebut tidak membuat tangis bayi berhenti bahkan ada bayi yang justru menangis lebih kencang. Hal ini berarti ibu tersebut salah menerjemahkan maksud dari tangis bayi dan membuat orang tua, khususnya ibu menjadi panik. Saat ini terdapat sistem yang mempelajari arti tangis bayi untuk usia 0-3 bulan yang disebut Dunstan Baby Language (DBL). Dunstan (2006) menyatakan bahwa setiap bayi lahir mempunyai kemampuan untuk mengekspresikan kebutuhan dasar mereka melalui suara. Delapan tahun penelitian yang dilakukan oleh Priscilla Dunstan dari tahun 1998 sampai 2006 telah berhasil menemukan bahasa yang dimiliki oleh semua bayi di seluruh dunia. Bahasa tersebut dikenal dengan sebutan Dunstan Baby Language-DBL. DBL diperkenalkan oleh Priscilla Dunstan, musisi asal Australia yang mempunyai bakat mengingat semua jenis suara atau yang dikenal dengan sound photograph. Terdapat lima bahasa bayi versi DBL yaitu: neh berarti lapar, owh berarti lelah yang mengindikasikan bayi sudah mulai mengantuk, eh berarti ingin bersendawa, eairh berarti nyeri (ada angin) di perut, dan heh berarti tidak nyaman (bisa karena popoknya basah, udara terlalu panas atau dingin, atau hal lainnya). Perintis DBL di Indonesia adalah dokter Adhiatma Gunawan yang menyebutkan bahwa seorang bayi mempunyai refleks primitif yang dimiliki sejak dilahirkan. Refleks ini bersifat universal dan lambat laun akan menghilang seiring dengan berkembangnya kemampuan untuk beradaptasi. DBL berlaku pada bayi hingga usia tiga bulan karena setelah usia tersebut bayi akan mengembangkan kemampuan berkomunikasinya sendiri dengan bantuan orang tua dan lingkungan. Penelitian membuktikan bahwa 90% dari ibu-ibu di seluruh dunia yang mengikuti DBL merasa puas dan terbantu dengan sistem tersebut dan merekomendasikan pada yang lain. Sementara lebih dari 70% orang tua merasa lebih percaya diri dalam mengasuh bayinya dan by the end of the day, tingkat stres mereka berkurang signifikan (Gunawan 2011). Latar Belakang Kepakaran untuk menentukan arti tangis bayi versi DBL masih agak jarang sehingga informasi arti tangis bayi ini belum mudah didapatkan oleh para orang tua. Saat ini sistem untuk mentrasfer pengetahuan mengenai DBL dengan cara mengikuti pelatihan atau seminar yang diadakan oleh pengelola atau dengan cara mempelajari sendiri materi jenis tangis bayi versi DBL dalam bentuk optical discs atau dapat juga mengunduh materi DBL di internet. Pengguna sistem DBL khususnya di Indonesia akan lebih yakin dengan kesimpulan yang mereka buat jika ada suatu software yang secara otomatis dapat menghasilkan arti tangisan bayinya. Hal ini dapat menguatkan kesimpulan mereka, karena jika hanya
16 2 mengikuti pelatihan kilat atau seminar, masih ada beberapa peserta yang belum paham bagaimana mengenali maksud tangisan bayi tersebut atau belum tepat memaknai tangisan bayi. Selain itu nantinya software ini juga bisa bermanfaat bagi orang tua yang belum mengikuti pelatihan atau seminar DBL sehingga para orang tua dapat memahami bahasa/tangis bayi. Penelitian mengenai tangis bayi telah dilakukan oleh para peneliti, antara lain: klasifikasi tangis bayi bayi normal dan abnormal (menderita gangguan hipoksia-tubuh kekurangan oksigen) menggunakan neural network menghasilkan 85% (Poel & Ekkel 2006). Klasifikasi bayi sehat dan bayi yang mengalami sakit seperti kerusakan otak, bibir sumbing, hidrosefalus, dan sindrom kematian bayi mendadak menggunakan metode klasifikasi Hidden Markov Model-HMM menghasilkan 91% (Lederman et al. 2008). Penelitian lainnya adalah klasifikasi tiga jenis tangis yaitu bayi normal, bayi tuli, dan bayi yang menderita asfiksia (tidak dapat bernafas secara spontan dan teratur) pada usia satu hari sampai sembilan bulan menggunakan neural network menghasilkan 86% (Reyes-Galaviz dan Reyes-Garcia 2004). Dari beberapa hasil penelitian tersebut dapat disimpulkan bahwa tangisan bayi berarti sinyal suara tangis bayi dapat digunakan untuk mendeteksi status kesehatan bayi. Hal ini sejalan dengan penelitian yang dilakukan oleh Priscilla Dunstan yang menyatakan bahwa tangis bayi sebagai alat komunikasi untuk memenuhi kebutuhan atau keinginannya dan tangis bayi mempunyai tujuan untuk mengungkapkan sesuatu. Penelitian klasifikasi tangis bayi sebelumnya telah menggunakan neural network atau HMM sebagai pengenal polanya. Penelitian untuk identifikasi jenis bayi versi DBL ini menggunakan codebook untuk pengenal polanya dan Mel- Frequency Cepstrum Coefficients (MFCC) untuk ekstraksi ciri. Pemilihan metode ini didasari beberapa penelitian diantaranya: penelitian Lee et al. (2006) melakukan pengenalan suara burung menggunakan MFCC dan Vector Quantization (VQ) codebook dan berhasil mencapai 87%. Selain itu speaker recognition system juga berhasil dibuat menggunakan MFCC dan VQ (Kumar 2011). Penelitian serupa dilakukan oleh Singh dan Rajan (2011) yang berhasil mencapai 98,57% dengan melakukan penelitian speaker recognition menggunakan VQ dan MFCC. Penelitian mengenai speech recognition and verification menggunakan MFCC dan VQ yang dilakukan oleh Patel dan Prasad (2013) berhasil melakukan pengenalan dengan training error rate sebesar 13%. Codebook ini dibuat menggunakan k-means clustering. Tujuan Penelitian Penelitian ini bertujuan melakukan pemodelan codebook menggunakan k- means clustering untuk identifikasi jenis tangis bayi dengan MFCC sebagai ekstraksi ciri. Ruang Lingkup Penelitian Adapun ruang lingkup penelitian ini adalah: 1. Klasifikasi jenis tangis bayi yang digunakan adalah versi Dunstan Baby Language yang dibagi ke dalam kelompok bayi lapar, bayi lelah/mengantuk,
17 bayi ingin bersendawa, bayi mengalami nyeri (ada angin) di perut, dan bayi tidak nyaman. 2. Software ini digunakan untuk identifikasi jenis tangis bayi usia 0-3 bulan. 3 2 TINJAUAN PUSTAKA Dunstan Baby Language Gunawan (2011) mengungkapkan bahwa Dunstan Baby Language (DBL) diperkenalkan oleh Priscilla Dunstan, musisi asal Australia yang mempunyai bakat mengingat semua jenis suara atau yang dikenal dengan sound photograph. Ketika Priscilla menjadi seorang ibu, dia menyadari bahwa bayinya berusaha untuk berkomunikasi melalui suatu bahasa. Setelah delapan tahun meneliti dari tahun 1998 dan mengumpulkan bayi-bayi dari berbagai negara, suku bangsa, dan bahasa, akhirnya Priscilla menemukan suatu bahasa yang sama yang digunakan bayi-bayi tersebut untuk berkomunikasi, yaitu DBL. Terdapat lima bahasa bayi versi DBL yaitu: 1. Neh berarti lapar Ketika lapar, bayi akan mengeluarkan suara neh. Neh dinyatakan sebagai bunyi yang dihasilkan ketika bayi mengecap untuk menghisap puting ibu. Pengenalan suara neh dengan mendengar sisipan huruf N pada tangisannya. Selain mengeluarkan bunyi neh, menurut teori DBL, bayi yang lapar biasanya: - Menggerakan lidah ke langit-langit mulut (mengecap) - Menghisap jari atau kepala tangannya - Menjilati bibirnya - Menggelengkan kepalanya ke kiri dan kanan. 2. Owh berarti lelah yang mengindikasikan bayi sudah mulai mengantuk Owh pada dasarnya merupakan bunyi yang dihasilkan ketika menguap. Tetapi, owh ini tidak selalu dibarengi dengan kuapan, bisa juga dengan tanda-tanda seperti: - Bayi mulai bergerak gelisah - Mengusap-usap mata dan menggaruki/menarik telinganya - Mulai menggeliat dan melengkungkan tubuhnya. Namun, tanda-tanda ini biasanya didahului dengan bunyi owh. 3. Eh berarti ingin bersendawa Tangisan eh terjadi ketika dada bayi bekerja keras mengeluarkan angin yang masuk ke dalamnya. Biasanya, frekuensi tangisan 'eh' yang diucapkan lebih cepat dan pendek karena bayi berusaha untuk sendawa. Penting bagi ibu untuk menyendawakan bayi begitu bunyi 'eh' terdengar, karena dapat menghindari angin turun ke perut dan menyebabkan kolik serta menghindari bayi memuntahkan susunya kembali. Tanda-tanda lain saat bayi perlu sendawa adalah: - Dada yang mengencang - Gerakan menggeliat ketika diletakkan di tempat tidur - Berhenti minum susu dan mulai gelisah
18 4 4. eairh berarti nyeri (ada angin) di perut Jika bayi sering menangis dengan keras dan nampak kesakitan, ibu mungkin akan mendengar bunyi 'eairh'. Tangis 'eairh' terjadi karena adanya gas dan angin di perut bayi yang menyebabkan rasa sakit (kolik). Tanda-tanda lain yang dibarengi dengan bunyi 'eairh' adalah: - Kaki yang mengejang dan ditarik ke perut - Tubuh bayi menjadi kaku - Jerit tangisan yang merintih kesakitan Bila tangisan 'eairh' terdengar, segeralah telungkupkan bayi, kemudian usap punggungnya. Ibu juga bisa memijat lembut perutnya untuk mengeluarkan angin. Udara 'eairh' akan lebih sulit dikeluarkan, jadi akan lebih baik jika ibu segera menyendawakan bayi saat terdengar bunyi 'eh', untuk mencegah udara turun ke perut. 5. heh berarti tidak nyaman Salah satu alasan mengapa bayi rewel adalah karena ia merasa tidak nyaman, bisa karena popoknya basah, udara yang terlalu panas atau dingin, atau hal lainnya. Tangisan 'heh' biasanya terengah-engah (seperti membuang udara) dan ada penekanan pada huruf H diawal katanya. Jika ibu mendengar tangisan 'heh' ini segera periksa kondisi bayi, apa yang membuatnya tidak nyaman, seperti kepanasan, kedinginan, atau popok yang kotor dan harus diganti. Ruang Lingkup Pemrosesan Suara Reynolds (2002) membagi recognition menjadi tiga yaitu: speech recognition, language recognition, dan speaker recognition. Perbedaan kategori ini ditampilkan pada Gambar 1. Gambar 1 Perbedaan kategori recognition (Reynolds 2002) Speech Recognition Sistem pengenalan suara (speech recognition) memuat dua modul utama yaitu feature extraction dan feature matching. Feature extraction merupakan proses mengekstraki sejumlah data dari sinyal suara yang nantinya dapat
19 digunakan untuk merepresentasikan setiap speaker. Feature matching adalah proses untuk mengidentifikasi suara dengan membandingkan ekstraksi ciri suara yang akan diidentifikasi dengan ciri suara yang telah diketahui sebelumnya (Gupta et al. 2012). Sinyal Sinyal didefinisikan sebagai kuantitas fisik yang bervariasi dengan waktu, ruang atau sembarang satu atau lebih variabel belas lainnya. Secara matematika, sinyal digambarkan sebagai fungsi dari satu atau lebih variabel bebas. Berikut merupakan contoh fungsi yang menggambarkan dua sinyal, pertama fungsi yang liner dengan variabel bebas t (time) dan kedua fungsi kuadratik dengan t (Proakis & Manolakis 1996). s 1 (t) = 5t s 2 (t) = 20t 2 (1) Contoh lainnya sebagai berikut: s(x,y) = 3x + 2xy + 10y 2 (2) Fungsi tersebut menggambarkan sinyal dari dua variabel bebas x dan y yang dapat direpresentasikan ke dalam dua koordinat spasial pada suatu bidang. Pada beberapa kasus, fungsi yang menghubungkan antara waktu dengan kuantitas sinyal tidak diketahui atau sangat kompleks sehingga penerapannya tidak praktis, seperti pada sinyal suara yang ditampilkan pada Gambar 2. Sinyal tersebut tidak dapat digambarkan seperti pada ekspresi (1). Umumnya, segmen dari suara direpresentasikan dengan tinggi yang merupakan penjumlahan beberapa fungsi sinus yang berbeda amplitudo dan frekuensinya, dan ditulis sebagai berikut: NN ii=1 AA ii (tt) sin[2π F i (t) t + θ i (t) ] (3) Dengan {A i (t)}, {F i (t), dan {θ i (t)} adalah himpunan dari kemungkinan amplitudo, frekuensi, dan fase dari gelombang sinus untuk setiap waktu t. Salah satu cara untuk merepresentasikan konten informasi atau pesan dari segmen sinyal suara adalah mengukur amplitudo, frekuensi, dan fase segmen tersebut. (Proakis & Manolakis 1996). 5 Gambar 2 Contoh sinyal suara Transformasi Sinyal menjadi Informasi Pemrosesan sinyal suara merupakan teknik mentransformasi sinyal suara menjadi informasi yang berarti sesuai dengan yang diinginkan (Buono 2009).
20 6 Pada proses transformasi terdapat tahapan yang perlu dilakukan diantaranya dijitalisasi sinyal analog, ekstraksi ciri, dan pengenalan pola, seperti yang ditampilkan pada Gambar 3. Gambar 3 Tahapan transformasi sinyal suara menjadi informasi (Jurafsky & Martin 2007, dimodifikasi oleh Buono 2009) Dijitalisasi Gelombang Suara Tahap pertama dari pemrosesan suara adalah mengonversi sinyal analog menjadi sinyal digital, proses ini disebut dijitalisasi. Proses dijitalisasi terdiri atas dua tahap yaitu sampling dan kuantisasi. Sampling adalah pengambilan sinyal dengan mengukur amplitudonya pada waktu tertentu. Sampling rate adalah jumlah sampel yang diambil per detik. Sampling rate yang umumnya digunakan untuk pengenalan suara adalah 8000 Hz sampai dengan Hz. Tahapan setelah sampling adalah proses kuantisasi. Proses ini menyimpan nilai amplitudo ke dalam representasi nilai 8 bit atau 16 bit (Jurafsky & Martin 2007). Ekstraksi Ciri Mel Frequency Cepstrum Coefficients Ekstraksi ciri merupakan proses untuk menentukan satu nilai atau vektor yang dapat digunakan sebagai penciri objek atau individu. Ciri yang biasa digunakan
21 adalah koefisien cepstral dari sebuah frame. Mel Frequency Cepstrum Coefficients (MFCC) merupakan ekstraksi ciri yang menghitung koefisien cepstral dengan mempertimbangkan pendengaran manusia (Buono 2009). MFCC memiliki tahapan yang terdiri atas (Do 1994): 1. Frame Blocking. Pada tahap ini sinyal suara continous speech dibagi ke dalam beberapa frame serta dilakukan overlapping frame agar tidak kehilangan informasi. 2. Windowing. Windowing merupakan salah satu jenis filtering untuk meminimalisasikan distorsi antar frame. Proses ini dilakukan dengan mengalikan antar frame dengan jenis window yang digunakan. Jika didefinisikan window sebagai w(n), 0 n N 1, N adalah jumlah sampel setiap frame, maka hasil windowing dari sinyal tersebut adalah: yt ( n) = xt ( n) w( n), 0 n N 1 (4) Persamaan window Hamming adalah : 2πn w( n) = cos, 0 n N 1 N 1 3. Fast Fourier Transform (FFT). Tahap selanjutnya adalah mengubah tiap frame N sampel dari domain waktu ke dalam domain frekuensi. FFT adalah algoritme yang mengimplementasikan Discrete Fouries Transform (DFT) yang didefinisikan pada set N samples {x n }, sebagai berikut: NN 1 XX nn = 2ππππππππ /NN kk=0 XX kk ee, nn = 0, 1, 2,, NN 1 (6) Pada umumnya X k adalah bilangan kompleks dan hanya mempertimbangkan nilai absolut (frequency magnitudes). Hasil sequence {X k } direpresentasikan sebagai berikut: frekuensi positif 0 f < Fs / 2 untuk nilai 0 n N / 2 1, sementara frekuensi negatif F s / 2 < f < 0 untuk N / n N 1. F s menunjukkan frekuensi sampling. Hasil akhir tahap ini sering disebut sebagai spectrum atau periodogram. 4. Mel-Frequency Wrapping. Persepsi sistem pendengaran manusia terhadap frekuensi sinyal suara ternyata tidak mengikuti skala linear. Setiap nada dengan frekuensi aktual f, diukur dengan Hz, subjective pitch diukur pada skala yang disebut skala mel. Skala mel-frequency adalah jarak frekuensi di bawah 1000 Hz dan jarak logaritmik di atas 1000 Hz. Penerimaan sinyal suara untuk frekuensi rendah (<1000 Hz) bersifat linear, sedangkan untuk frekuensi tinggi (>1000 Hz) bersifat logaritmik. Skala inilah yang disebut dengan skala melfrequency yang berupa filter. Ukuran persepsi dalam skala mel dan hubungan skala mel dengan frekuensi dirumuskan pada Persamaan 7. Dari persamaan 7, maka nilai frekuensi F Hz sebagai fungsi dari skala mel ditampilkan pada persamaan 8 (Nilsson & Ejnarsson 2002). (5) 7 FF mmmmmm = 2595 llllll FF HHHH 700 jjjjjjjj FF HHHH > 1000 FF HHHH jjjjjjjj FF HHHH 1000 (7)
22 8 FF HHHH = FF mmmmmm (8) Proses wrapping terhadap sinyal dalam domain frekuensi dilakukan menggunakan persamaan 9 (Ganchev 2005). NN 1 XX ii = llllll 10 ( kk=0 XX(kk) HH ii (kk)), ii = 1, 2,., MM (9) Keterangan: X i = nilai frequency wrapping pada filter i=1,2 sampai n jumlah filter. X(k) = nilai magnitudo frekuensi pada k frekuensi. H i (k) = nilai tinggi pada filter i segitiga dan k frekuensi, dengan k=0, 1 sampai N-1 jumlah magnitudo frekuensi. 5. Cepstrum. Tahap ini merupakan tahap terakhir pada MFCC. Pada tahap ini mel-frequency akan diubah menjadi domain waktu menggunakan Discrete Cosine Transform (DCT) dengan persamaan 10. CC jj = MM ii=1 XX ii jj (ii 1) cos 2 ππ MM (10) Keterangan : C j = nilai koefisien C ke j. j = 1, 2, sampai jumlah koefisien yang diharapkan X i = nilai X hasil mel-frequency wrapping pada frekuensi i= 1, 2 sampai n jumlah wrapping M = jumlah filter Diagram alur dari MFCC dapat dilihat pada Gambar 4. Codebook Vector Quantization (VQ) merupakan proses memetakan vektor-vektor dari ruang vektor yang besar menjadi ruang vektor dengan jumlah terbatas. Setiap daerah disebut cluster dan dapat direpresentasikan oleh pusatnya yang disebut codeword. Kumpulan codeword disebut codebook (Do 1994). Pemodelan speaker menggunakan pendekatan berbasis VQ dibentuk oleh clustering dari fitur speaker pada K yang tidak overlapping. Setiap cluster direpresentasikan oleh code vector ci yang disebut centroid. Hasil himpunan code vector ini disebut codebook. Codebook ini berfungsi sebagai model pembicara (Linde et al. 1980). Codebook adalah kumpulan titik (vektor) yang mewakili distribusi suara dari seorang pembicara tertentu dalam ruang suara. Setiap titik dari codebook dikenal sebagai codeword. Oleh karena itu pada setiap pembicara dibuat sebuah codebook yang merepresentasikan ciri suara dari pembicara tersebut dan setiap pembicara dibuat sebuah codebook yang terdiri atas beberapa codeword. Prinsipnya proses pengenalan yang dilakukan adalah setiap suara yang masuk dihitung jarak suara tersebut ke codebook setiap pembicara. Jarak sinyal suara masuk dengan codebook seorang pembicara dihitung sebagai jumlah jarak setiap frame yang dibaca ke codeword terdekat pada codebook tersebut. Dari sini akhirnya sinyal masukan diberi label pembicara sesuai jarak codebook terkecil (Buono 2009). Gambar 5 menunjukkan diagram konseptual untuk mengilustrasikan proses pengenalan. Pada Gambar 5 terdapat dua codebook owh dan neh. Simbol +
23 berwarna merah merupakan contoh data uji owh dan symbol + berwarna biru merupakan contoh data latih owh. Sinyal suara 9 Frame ke-t O = O 1, O 2,., O t, O T Windowing yt ( n) = xt ( n) w( n), 0 n N 1 2πn w( n) = cos, 0 n N 1 N 1 FFT: XX nn = NN 1 2ππππππππ /NN kk=0 XX kk ee, nn = 0, 1, 2,, NN 1 Mel Frequency Wrapping: mel(f)= 2595 llllll ff 700 Dari sini diperoleh M filter dan dihitung spektrum Mel: NN 1 XX ii = llllll 10 XX(kk) HH ii (kk), kk=0 ii = 1, 2,., MM HH ii (kk) adalah nilai filter segitiga ke-i Cepstrum Coeficients: Discrete Cosine Transform CC jj = MM ii=1 XX ii jj (ii 1) cos 2 ππ MM j=1,2,3, J; J=Jumlah koefisien; MM=jumlah filter Gambar 4 Diagram Alur MFCC (Buono 2009) Gambar 5 Ilustrasi diagram konseptual dari formasi codebook VQ
24 10 K-means Clustering K-means clustering merupakan algoritma clustering eksklusif. Setiap objek ditetapkan secara tepat ke dalam salah satu dari sekumpulan cluster. Metode clustering ini dimulai dengan menentukan banyaknya cluster yang akan dibentuk (disebut dengan nilai k). Nilai k umumnya nilai integer terkecil seperti 2, 3, 4, atau 5. Pengukuran kualitas satu cluster dapat menggunakan nilai dari fungsi objektif yang diambil dari jumlah kuadrat jarak setiap titik dari centroid yang telah ditentukan (euclidean distance). Pilih poin k yang umumnya sesuai dengan lokasi k dari suatu objek. Poin k ini nantinya dijadikan sebagai centroid dari k cluster. Metode ini dapat bekerja maksimal jika pemilihan poin awal k yang berjauhan. Selanjutnya dipilih setiap poin, satu per satu dari suatu cluster yang mempunyai centroid terdekat. Semua objek mempunyai k cluster berdasarkan k initial centroid tetapi centroid ini tidak akan menjadi centroid sejati suatu cluster. Langkah selanjutnya dihitung ulang centroid dari cluster dan dilakukan langkah-langkah sebelumnya untuk menempatkan setiap objek ke cluster dengan centroid terdekat. Algoritma k-means clustering sebagai berikut (Bramer 2007): 1. Pilih nilai k 2. Pilih objek k secara acak. Objek ini akan menjadi k initial centroid 3. Tetapkan setiap objek dari suatu cluster yang terdekat dengan centroid 4. Hitung ulang centroid dari k cluster 5. Ulangi langkah 3 dan 4 sampai perubahan nilai centroid pada iterasi satu dengan lainnya tetap (centroid tidak bergerak)
25 3 METODE Metode penelitian ini terdiri atas beberapa tahapan proses yaitu pengambilan data, preprocessing, pemodelan codebook tangis bayi, pengujian dan analisis, serta pembuatan antarmuka. Metodologi penelitian proses identifikasi jenis tangis bayi ditampilkan pada Gambar 6. mulai Pengambilan data Data Latih Data Uji Preprocessing: Pemotongan silence Ekstraksi ciri: MFCC Preprocessing: Pemotongan silence Ekstraksi ciri: MFCC Pemodelan Codebook: k-means clustering Codebook Tangis bayi Pengujian dan Analisis Pembuatan Antarmuka selesai Gambar 6 Metodologi penelitian identifikasi jenis tangis bayi Perlakuan pada penelitian ini adalah: kombinasi panjang frame, overlap frame, banyaknya codeword/jumlah cluster, dan variasi jarak. Faktor dan level penelitian ini ditampilkan pada Tabel 1. Tabel 1 Faktor dan level penelitian Faktor Panjang frame Overlap frame Banyaknya codeword/jumlah cluster Variasi jarak Level 25 ms/panjang frame ms/ panjang frame ms/ panjang frame 660 0% = 0 25% = % = s/d 18 Jumlah cluster 1 s/d 29 untuk panjang frame= 275 dan overlap = 0 Jarak euclid Jarak mahalanobis
26 12 1. Pengambilan data Data yang digunakan untuk penelitian ini adalah diambil dari video Dunstan Baby Language yang sudah dilakukan pengolahan data. Data terbagi menjadi dua yaitu data latih dan data uji. Terdapat 140 data latih yang masing-masing mewakili 28 tangis bayi lapar, 28 tangis bayi mengantuk, 28 tangis bayi ingin bersendawa, 28 tangis bayi mengalami nyeri (ada angin) di perut, dan 28 tangis bayi tidak nyaman (bisa karena popoknya basah/udara yang terlalu panas/dingin atau hal lainnya). Data uji sebanyak 35, masing-masing 7 tangis bayi untuk setiap jenis tangis bayi. Sampling rate yang digunakan pada penelitian ini adalah 11000Hz. 2. Preprocessing Pada tahap preprocessing ini dilakukan pemotongan silence dan ekstraksi ciri menggunakan metode Mel Frequency Cepstrum Coefficients (MFCC). Contoh sinyal suara tangis bayi lapar ( owh ) ditampilkan pada Gambar 7 dan pemotongan silence pada suara tangis bayi tersebut ditampilkan pada Gambar 8. Pemotongan silence ini dilakukan di awal dan di akhir sinyal suara tangis bayi. Ekstraksi ciri merupakan proses untuk menentukan satu nilai atau vektor yang dapat digunakan sebagai penciri objek atau individu. Ciri yang biasa digunakan adalah koefisien cepstral dari sebuah frame. MFCC merupakan ekstraksi ciri yang menghitung koefisien cepstral dengan mempertimbangkan pendengaran manusia (Buono 2009). Diagram alur dari MFCC dapat dilihat pada Gambar 4. dipotong Gambar 7 Sinyal suara owh Gambar 8 Sinyal owh yang dipotong 3. Pemodelan codebook tangis bayi Pemodelan codebook ini berasal dari setiap data latih yang nantinya digunakan sebagai representasi sinyal tangis bayi yang akan dikenali. Codebook yang akan dibuat adalah codebook dari setiap data tangis bayi. Codebook dari cluster yang dibuat berasal dari hasil clustering semua data tangis bayi dengan menggunakan k-means clustering. Penjelasan codebook dan k-means clustering disajikan pada Bab 2. Tahap pembuatan codebook untuk seorang pembicara sebagai berikut (Buono 2009): 1. Untuk setiap pengucapan (ada n pengucapan sebagai data training), dilakukan ekstraksi ciri menggunakan MFCC pada setiap frame dengan panjang dan overlap tertentu.
27 2. Semua frame dari n pengucapan digabungkan menjadi satu set dan dilakukan unsupervised clustering menggunakan teknik k-means clustering dengan memilih banyaknya cluster sesuai dengan jumlah codeword yang diinginkan. 4. Pengujian dan Analisis Tahapan pengujian berarti melakukan pengujian untuk identifikasi jenis tangis bayi. Alur proses untuk tahap identifikasi/pengenalan adalah (Buono 2009): 1. Untuk setiap ucapan baru yang masuk ke sistem dibaca frame demi frame, (misalkan jumlah frame yang diperoleh adalah T), dan dilakukan ekstraksi ciri menggunakan MFCC. 2. Hitung jarak sinyal input ucapan ini ke codebook setiap pembicara yang ada dalam sistem. 3. Keputusan: menetapkan label pada input suara sesuai dengan pembicara dengan jarak codebook terkecil. Jarak input ucapan dengan codebook dirumuskan sebagai berikut (Buono 2009): 1. Untuk setiap frame dari input ucapan yang masuk, hitung jarak ke setiap codeword dan dipilih codeword dengan jarak minimum. 2. Jarak antara input ucapan dengan codebook adalah jumah dari jarak minimum tersebut (persamaan 11): mmmmmm tt=1 cccccccccccccccc kk jjjjjjjjjj(iiiiiiiiii, cccccccccccccccc) = TT [dd(ffffffffff tt, cccccccccccccccc kk )] Variasi jarak yang digunakan pada penelitian ini adalah jarak euclid dan jarak mahalanobis. Jarak euclid antara objek i didefinisikan pada persamaan 12 (Brindha et al. 2013). Jarak mahalanobis didefinisikan pada persamaan 13 (Gomathy et al. 2012). (11) DD(XX, YY) = DD ii=1 (xx ii yy ii ) 2 (12) 13 DD = (xx ss yy ss ) CC 1 (xx ss yy ss ) TT (13) C adalah covariance matrix, x = {x 1,x 2,.x s } T dan y = {y 1, y 2,.,y s } T Pengujian dilakukan menggunakan data uji sebanyak 35 dan data latih yang berjumlah 140. Tahap analisis dilakukan berdasarkan hasil yang didapatkan pada tahap pengujian. Analisis dilakukan berdasarkan hasil dari kombinasi faktor dan level berikut: panjang frame : 25 ms/panjang frame 275, 40 ms/ panjang frame 440, 60 ms/ panjang frame 660. overlap frame : 0%, 25%, 40%. banyaknya codeword/jumlah cluster: 1 sampai dengan 18. Untuk panjang frame = 275 dan overlap frame = 0, jumlah k adalah 1-29 cluster. Variasi jarak: euclid dan mahalanobis
28 14 Masing-masing kombinasi faktor dan level tersebut akan dihitung nilai menggunakan persamaan 14. aaaaaaaaaaaaaa = jjjjjjjjjj h dddddddd pppppppppppppppppp dddddddddddd iidddddddddddddddddddddd bbbbbbbbbb jjjjjjjjjj h dddddddd pppppppppppppppppp 100% (14) Ilustrasi identifikasi jenis tangis bayi ditampilkan pada Gambar 9. W1 W2 Wc W1 (1) W2 (1).. Wc (1) Codebook = Neh = W1 (2) W2 (2).. : W ( ) ( ).. ( ) 1 p W2 p Wc p min d(f1,wi) i=1,2, c Frame 1 Frame 2 Frame T min d(f2,wi) i=1,2, f1(1) f2(1).. ft (1) c O = f1(2) f2(2).. : f ( ) ( ).. ( ) 1 p f2 p ft p Gambar 9 Ilustrasi identifikasi jenis tangis bayi Jarak sinyal O dengan codebook neh : 5. Pembuatan Antarmuka d( O, codebook) = T min i {1,2,... c} t= 1 { d( ft, wi)} Pembuatan antarmuka identifikasi jenis tangis bayi dibuat berdasarkan data latih yang menghasilkan tertinggi.
29 4 HASIL DAN PEMBAHASAN Penelitian ini dibuat menggunakan software Matlab R2010b version Hasil perbandingan menggunakan jarak euclid pengujian data uji ditampilkan pada Gambar % 95% 90% 85% 80% 75% 70% 65% 60% 55% 50% 45% 40% 35% 30% jumlah cluster (k) panjang frame overlap frame panjang frame overlap frame Gambar 10 Grafik perbandingan menggunakan jarak euclid pengujian data uji Berdasarkan Gambar 10 dapat diketahui bahwa menggunakan jarak euclid pengujian data uji berkisar antara 37% sampai 94%. Akurasi tertinggi dicapai ketika panjang frame = 440, overlap frame = 0.4, dan k = 18 dengan 94%. Hasil 94% juga didapat ketika panjang frame = 660, overlap frame = 0.25, dan k = 14. Sedangkan terendah sebesar 37% diperoleh ketika panjang frame = 660, overlap frame = 0, dan k = 1. Hasil secara rinci ditampilkan pada Lampiran 1. Hasil tersebut menunjukkan bahwa semakin tinggi jumlah cluster, semakin tinggi yaitu >= 80%. Tetapi ketika k-nya kecil, misal k=1, maka nya rendah yaitu antara 37%-51%. Hasil pengujian data uji saat k = 18, panjang frame = 440, dan overlap frame = 0.4 menggunakan jarak euclid ditampilkan pada Tabel 2. Hasil pengujian data uji saat k = 18, panjang frame = 660, dan overlap frame = 0.25 ditampilkan pada Tabel 3. Hasil pengujian data uji saat k = 18, panjang frame = 275, dan overlap frame = 0.25 ditampilkan pada Tabel 4.
30 16 Tabel 2 Hasil pengujian data uji saat k = 18, panjang frame = 440, dan overlap frame = 0.4 menggunakan jarak euclid Uji Data Ke- Jenis Tangis 'a' 'a' 'a' 'a' 'a' 'a' 'a' a-eairh 'e' 'e' 'e' 'e' 'e' 'e' 'e' e-eh 'h' 'h' 'h' 'h' 'h' 'e' * 'h' h-heh 'n' 'n' 'n' 'n' 'n' 'n' 'n' n-neh 'o' 'o' 'o' 'o' 'a' * 'o' 'o' o-owh Tabel 3 Hasil pengujian data uji saat k = 18, panjang frame = 660, dan overlap frame = 0.25 menggunakan jarak euclid Uji Data Ke- Jenis Tangis 'o' * 'a' 'a' 'a' 'a' 'a' 'a' a-eairh 'e' 'e' 'e' 'e' 'e' 'e' 'e' e-eh 'h' 'h' 'h' 'h' 'h' 'e' * 'h' h-heh 'n' 'n' 'n' 'n' 'n' 'n' 'n' n-neh 'n' * 'o' 'n' * 'o' 'a' * 'o' 'o' o-owh Tabel 4 Hasil pengujian data uji saat k = 18, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak euclid Uji Data Ke- Jenis Tangis 'a' 'a' 'a' 'a' 'a' 'a' 'a' a-eairh 'e' 'e' 'e' 'e' 'e' 'e' 'e' e-eh 'h' 'h' 'h' 'h' 'h' 'h' 'h' h-heh 'n' 'o' * 'n' 'n' 'n' 'o' * 'n' n-neh 'n' * 'o' 'o' 'a' * 'o' 'o' 'o' o-owh keterangan: * = salah identifikasi Dari beberapa hasil pengujian tersebut dapat diketahui bahwa suara eh merupakan suara yang sering benar dikenali (Tabel 2, Tabel 3, Tabel 4). Sedangkan suara owh merupakan suara yang sering salah dikenali dan biasanya kesalahannya dikenali sebagai suara neh dan eairh (Tabel 3, Tabel 4). Kesalahan identifikasi ini disebabkan karena variasi data latih owh lebih besar dibandingkan dengan yang lain. Ilustrasi codebook eh dan owh pada saat k=18, panjang frame = 440, dan overlap frame= 0.4 ditampilkan pada Gambar 11. Gambar tersebut menunjukkan sebaran codebook owh lebih besar dibandingkan codebook eh. Ilustrasi codebook eairh, owh, dan eh ditampilkan pada Gambar 12. Berdasarkan ilustrasi Gambar 12 dapat diketahui bahwa codebook owh lebih dekat dengan eairh dibandingkan dengan eh.
31 17 Gambar 11 Ilustrasi codebook eh dan owh Gambar 12 Ilustrasi codebook eairh, eh, dan owh Perbandingan menggunakan jarak euclid pengujian data latih ditampilkan pada Gambar 13. Hasil secara rinci ditampilkan pada Lampiran 2. Akurasi menggunakan jarak euclid pengujian data latih berkisar antara 47% sampai 91%.
32 18 100% 95% 90% 85% 80% 75% 70% 65% 60% 55% 50% 45% 40% 35% 30% jumlah cluster (k) panjang frame overlap frame panjang frame overlap frame Gambar 13 Grafik perbandingan menggunakan jarak euclid pengujian data latih Gambar 13 menunjukkan bahwa tertinggi menggunakan pengujian data latih sebesar 91%, ketika panjang frame = 660, overlap frame = 0.25, dan k = 17. Sedangkan ketika panjang frame = 440, overlap frame =0.4, dan k = 18 sebesar 89% (ketika menggunakan data uji, mencapai 94%). Hasil menggunakan jarak mahalanobis pengujian data uji secara rinci ditampilkan pada Lampiran 3. Grafik perbandingan nya ditampilkan pada Gambar 14. Akurasi menggunakan jarak mahalanobis pengujian data uji berkisar antara 9% sampai 83%. Nilai 83% didapat ketika panjang frame = 275, overlap frame 0.25, dan k=16. Pengujian menggunakan data latih ditampilkan pada Lampiran 4. Grafik perbandingan nya ditampilkan pada Gambar 15. Akurasi menggunakan jarak mahalanobis pengujian data latih berkisar antara 12% sampai 83%. Kisaran nilai secara umum ditampilkan pada Tabel 5.
33 19 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% jumlah cluster (k) panjang frame overlap frame panjang frame overlap frame Gambar 14 Grafik perbandingan menggunakan jarak mahalanobis pengujian data uji 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% jumlah cluster (k) panjang frame overlap frame panjang frame overlap frame Gambar 15 Grafik perbandingan menggunakan jarak mahalanobis pengujian data latih
34 20 Tabel 5 Kisaran nilai menggunakan jarak euclid dan mahalanobis Jarak dan Jenis Pengujian Nilai Minimum Akurasi Nilai Maksimum Akurasi Jarak euclid pengujian data uji 37% 94% Jarak euclid pengujian data latih 47% 91% Jarak mahalanobis pengujian data uji 9% 83% Jarak mahalanobis pengujian data latih 12% 83% Berdasarkan Gambar 14 dan 15 dapat diketahui bahwa hasil terbesar ketika menggunakan jarak mahalanobis pengujian data latih adalah 83%. Akurasi tertinggi ini dicapai ketika panjang frame = 275, overlap frame = 0.25, dan k = 17. Hasil pengujian ketika k = 17, panjang frame = 275, dan overlap frame = 0.25 ditampilkan pada Tabel 6. Tabel 6 Hasil pengujian data latih saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis Uji Data Ke- Jenis Tangis 'a' 'a' 'a' 'a' 'a' 'a' 'a' a-eairh 'e' 'e' 'e' 'n' * 'e' 'e' 'e' e-eh 'h' 'h' 'h' 'h' 'h' 'h' 'h' h-heh 'n' 'n' 'n' 'n' 'n' 'n' 'n' n-neh 'a' * 'o' 'o' 'o' 'o' 'o' 'o' o-owh Tabel 6 Hasil pengujian data latih saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis (lanjutan) Uji Data Ke- Jenis Tangis 'a' 'a' 'a' 'a' 'a' 'a' 'a' a-eairh 'e' 'e' 'e' 'h' * 'e' 'o' * 'e' e-eh 'h' 'h' 'e' * 'h' 'h' 'h' 'h' h-heh 'n' 'n' 'n' 'n' 'n' 'n' 'h' * n-neh 'n' * 'o' 'n' * 'o' 'a' * 'n' * 'o' o-owh Tabel 6 Hasil pengujian data latih saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis (lanjutan) Uji Data Ke- Jenis Tangis 'n' * 'a' 'a' 'n' * 'e' * 'a' 'a' a-eairh 'e' 'n' * 'e' 'e' 'e' 'e' 'e' e-eh 'h' 'h' 'h' 'h' 'h' 'h' 'h' h-heh 'e' * 'n' 'n' 'n' 'n' 'h' * 'n' n-neh 'a' * 'o' 'e' * 'o' 'o' 'a' * 'o' o-owh
35 Tabel 6 Hasil pengujian data latih saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis (lanjutan) Uji Data Ke- Jenis Tangis 'a' 'a' 'a' 'a' 'a' 'a' 'a' a-eairh 'e' 'e' 'h' * 'e' 'e' 'e' 'e' e-eh 'h' 'h' 'e' * 'h' 'h' 'h' 'h' h-heh 'n' 'a' * 'n' 'n' 'n' 'n' 'n' n-neh 'o' 'o' 'o' 'a' * 'h' * 'o' 'o' o-owh keterangan: * = salah identifikasi Dari beberapa hasil pengujian tersebut dapat diketahui bahwa suara heh merupakan suara yang sering benar dikenali. Hasil ini berbeda ketika menggunakan jarak euclid pengujian data uji. Hasil sebelumnya menunjukkan suara eh yang mudah dikenali. Sedangkan suara owh merupakan suara yang sering salah dikenali dan biasanya kesalahannya dikenali sebagai suara neh dan eairh. Hasil ini sama dengan hasil sebelumnya yang menggunakan jarak euclid pengujian data uji. Kesalahan identifikasi ini disebabkan karena variasi data latih owh lebih besar dibandingkan dengan yang lain. Ilustrasi codebook heh dan owh pada saat k=17, panjang frame = 275, dan overlap frame= 0.25 ditampilkan pada Gambar Gambar 16 Ilustrasi codebook heh dan owh Perbedaan hasil menggunakan data latih dan data uji ditampilkan pada Gambar 17 dan Gambar 18. Perbedaannya, pada Gambar 17 menggunakan jarak euclid, sedangkan Gambar 18 menggunakan jarak mahalanobis. Kedua gambar tersebut menampilkan perbedaan hasil ketika panjang frame = 275, overlap frame = 0, jumlah cluster (k) = 1 s/d 29. Jumlah cluster di sini dibuat lebih banyak dengan tujuan supaya dapat menggambarkan perbedaannya.
36 22 100% 90% 80% 70% 60% data latih data uji 50% 40% jumlah cluster (k) Gambar 17 Akurasi pengujian data latih dan data uji menggunakan jarak euclid dengan panjang frame = 275 dan overlap frame = 0 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% data latih data uji jumlah cluster (k) Gambar 18 Akurasi pengujian data latih dan data uji menggunakan jarak mahalanobis dengan panjang frame = 275 dan overlap frame = 0 Berdasarkan Gambar 17 dapat diketahui bahwa ketika k < 12, pengujian menggunakan data uji lebih baik dibandingkan data latih. Sedangkan
37 ketika k > 25 data latih lebih bagus dibandingkan data uji. Hal ini berarti pada cluster rendah, data uji lebih tinggi, sedangkan pada cluster tinggi, data latih lebih bagus. Hal ini disebabkan karena data latih sangat bervariasi dibandingkan data uji, sehingga hasil untuk data uji lebih baik ketika cluster rendah. Cluster rendah tidak bisa mengakomodasi data latih. Namun ketika cluster tinggi, data latih dapat terakomodasi sehingga pengujian menggunakan data latih hasilnya lebih bagus. Hal ini sesuai dengan prinsip dasar bahwa data latih pasti lebih bagus dibandingkan data uji. Gambar 18 menunjukkan hasil yang berbeda yaitu ketika k > 9, menggunakan data latih lebih tinggi dibandingkan data uji. Hal ini dikarenakan pada jarak mahalanobis sudah ada pembagi variasi sehingga data latih lebih bagus. Ilustrasi yang menggambarkan penjelasan tersebut ditampilkan pada Gambar 19 dan Gambar 20. Ilustrasi codebook owh, neh, dan data uji owh ditampilkan pada Gambar 19. Ilustrasi codebook owh, neh, dan data latih owh ditampilkan pada Gambar 20. Terdapat 2 codebook pada Gambar 19 dan Gambar 20 yaitu codebook owh dan neh. Ketika dilakukan pengujian menggunakan data uji owh, suara owh dikenali sebagai owh (ilustrasi Gambar 19). Tetapi ketika data latih owh diuji, dikenali sebagai neh (ilustrasi Gambar 20). Hal ini karena data latih owh (simbol * berwarna merah pada Gambar 20) tersebut memang dekat ke codebook neh (simbol ο berwarna hijau) (Gambar 20). Hal ini membuktikan walaupun data latih owh tersebut sudah dimodelkan sebagai codebook owh tetapi hasil pengujiannya teridentifikasi neh. Perbedaan lainnya antara Gambar 17 dan Gambar 18 adalah pengujian menggunakan jarak mahalanobis lebih stabil. Hal ini dapat dilihat ketika k > 9, menggunakan data latih selalu lebih tinggi dibandingkan data uji. Sedangkan pada Gambar 18, perbandingan data uji dan data latih berubah-ubah (fluktuatif) sampai k = Gambar 19 Ilustrasi codebook owh dan neh, serta data uji owh
38 24 Gambar 20 Ilustrasi codebook owh dan neh, serta data latih owh Hierarchical clustering codebook eairh, eh, heh, neh, dan owh ditampilkan pada Gambar 21. Berdasarkan Gambar 21 dapat diketahui bahwa codebook eairh dekat dengan owh. Hal ini sebagai penyebab tangis owh sering dikenali sebagai tangis bayi eairh (Tabel 2, Tabel 3, Tabel 4, Tabel 6). Selain dekat dengan eairh, selanjutnya codebook owh juga mempunyai kedekatan dengan codebook neh, heh, dan eh. Hal ini dapat dibuktikan dengan hasil identifikasi pada Tabel 3, Tabel 4, dan Tabel 6 yang menampilkan hasil kesalahan identifikasi tangis owh. Jenis tangis owh dikenali sebagai jenis tangis neh, heh atau eh. Gambar 21 Hierarchical clustering
39 Confusion matrix saat k = 18, panjang frame = 440, dan overlap frame = 0.4 menggunakan jarak euclid ditampilkan pada Tabel 7. Sedangkan confusion matrix saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis ditampilkan pada Tabel 8. Tabel 7 Confusion matrix saat k = 18, panjang frame = 440, dan overlap frame = 0.4 menggunakan jarak euclid Jenis Tangis Bayi Eairh Eh Heh Neh Owh Akurasi Eairh % Eh % Heh % Neh % Owh % Rata-rata 94.40% 25 Tabel 8 Confusion matrix saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis Jenis Tangis Bayi Eairh Eh Heh Neh Owh Akurasi Eairh % Eh % Heh % Neh % Owh % Rata-rata 82.80% Berdasarkan Tabel 8, dapat diketahui bahwa jenis tangis owh merupakan jenis suara yang sering salah dikenali, dan seringnya dikenali sebagai eairh. Hal ini sesuai dengan hierarchical clustering pada Gambar 21 yang menunjukkan bahwa codebook owh dekat dengan eairh. Antarmuka identifikasi jenis tangis bayi ditampilkan pada Gambar 22. Model codebook yang diambil adalah panjang frame = 440, overlap frame = 0.4, k=18, dan jarak yang digunakan adalah jarak euclid. Model ini dipilih karena dapat menghasilkan paling besar yaitu 94%. Terdapat 2 command button yaitu browse dan rekam. Command button browse digunakan untuk memilih suara bayi yang masuk ke kategori data latih atau data uji. Sedangkan command button rekam digunakan untuk merekam tangis bayi secara langsung.
40 26 Gambar 22 Antarmuka identifikasi jenis tangis bayi 5 SIMPULAN DAN SARAN Simpulan Software ini digunakan untuk identifikasi jenis tangis bayi versi Dunstan Baby Language. Identifikasi ini menggunakan codebook untuk pengenal pola dan MFCC untuk ekstraksi ciri. Penelitian ini memvariasikan panjang frame, overlap frame, dan banyaknya codeword. Model codebook dan MFCC yang menghasilkan tertinggi adalah: panjang frame = 440, overlap frame = 0.4, k=18. Penggunaan jarak yang menghasilkan tertinggi adalah jarak euclid. Model tersebut mampu menghasilkan pengenalan jenis tangis bayi tertinggi sebesar 94%. Saran Penelitian yang dilakukan hanya memotong silence di awal dan di akhir sinyal suara. Penelitian selanjutnya diharapkan melakukan pemotongan silence di setiap segmen suara supaya data yang dihasilkan lebih mencirikan suara tersebut. Selain itu disarankan melakukan optimasi pembentukan codebook menggunakan genetic algorithm. Hal ini diharapkan mempunyai dampak terhadap yang lebih tinggi.
PENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar
Lebih terperinciIDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti
Lebih terperinciPENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar
PENDAHULUAN Latar Belakang Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit
Lebih terperinciPengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.
Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi
Lebih terperinciBAHASA BAYI (BABY LANGUAGE) Hasnerita, S.Si.T,M.Kes
BAHASA BAYI (BABY LANGUAGE) Hasnerita, S.Si.T,M.Kes Pendahuluan Masa bayi atau balita (di bawah lima tahun) adalah masa yang paling signifikan dalam kehidupan manusia. Dan jika diibaratkan seperti pondasi
Lebih terperinciPerbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan
Lebih terperinciBAB I PENDAHULUAN. 2012). Penelitian yang dilakukan oleh Bosma dkk. (1965), menemukan bahwa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Orang tua memiliki keinginan yang mendalam untuk menenangkan bayinya yang gelisah, tidak berdaya, dan frustrasi akibat menangis terus menerus (Dunstan, 2012).
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre
Lebih terperinciudara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.
BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun
Lebih terperinciPENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO
PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI SKRIPSI
Lebih terperinciSISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI
SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN
Lebih terperinciRancang Bangun Aplikasi Pendeteksi Suara Tangisan Bayi
A476 Rancang Bangun Aplikasi Pendeteksi Suara Tangisan Bayi Welly Setiawan Limantoro, Chastine Fatichah, dan Umi Laili Yuhana Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi
Lebih terperinciPEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA
PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciPENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI
PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR PERNYATAAN
Lebih terperinciSistem Verifikasi Penutur menggunakan Metode Mel Frequensi.
SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik
Lebih terperinciIdentifikasi Suara Tangisan Bayi menggunakan Metode LPC dan Euclidean Distance
ELKOMIKA ISSN (p): 2338-8323 ISSN (e): 2459-9638 Vol. 6 No. 1 Halaman 153-164 DOI : http://dx.doi.org/10.26760/elkomika.v6i1.153 Januari 2018 Identifikasi Suara Tangisan Bayi menggunakan Metode LPC dan
Lebih terperinciPENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS
PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN PROBABILISTIC NEURAL NETWORK (PNN) SEBAGAI CLASSIFIER CLARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA
Lebih terperinciIDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA
IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 IDENTIFIKASI CAMPURAN
Lebih terperinciPENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO
PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Perkembangan penelitian di dunia telekomunikasi sangat pesat beberapa tahun terakhir ini. Salah satunya adalah penelitian di bidang suara. Suara adalah salah satu cara manusia
Lebih terperinciPENERAPAN LEARNING VECTOR QUANTIZATION
PENERAPAN LEARNING VECTOR QUANTIZATION (LVQ) DAN EKSTRAKSI CIRI MENGGUNAKAN MEL- FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) UNTUK TRANSKRIPSI SUARA KE TEKS LAKSMI NIRMALA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS
Lebih terperinciTINJAUAN PUSTAKA. Pengenalan Suara
Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan
Lebih terperinciBAB II LANDASAN TEORI. menjadi respons terhadap kebutuhan atas perubahan temperatur, rasa lapar, dan rasa
BAB II LANDASAN TEORI 2.1 Tangis Bayi Menangis merupakan jalan utama bayi untuk berkomunikasi. Dalam beberapa hari pertama dari hidupnya, bayi yang baru lahir menangis dikarenakan reaksi dari kedua internal
Lebih terperinciUNIVERSITAS BINA NUSANTARA
UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006 PERANCANGAN SISTEM PROTEKSI FILE DENGAN PASSWORD SUARA Rendy Sesario 0600615431 Samanta Limbrada
Lebih terperinciPEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA
PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian
BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,
Lebih terperincii. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz
Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode
Lebih terperinciSTRATEGI PENGEMBANGAN DAYA SAING PRODUK UNGGULAN DAERAH INDUSTRI KECIL MENENGAH KABUPATEN BANYUMAS MUHAMMAD UNGGUL ABDUL FATTAH
i STRATEGI PENGEMBANGAN DAYA SAING PRODUK UNGGULAN DAERAH INDUSTRI KECIL MENENGAH KABUPATEN BANYUMAS MUHAMMAD UNGGUL ABDUL FATTAH SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2016 iii PERNYATAAN
Lebih terperinciANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student
Lebih terperinciPERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA
SKRIPSI PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA MADE GDE JAYA HARRY KHESA S JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA BUKIT JIMBARAN
Lebih terperinciPENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO
PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN INSTITUT PERTANIAN BOGOR
Lebih terperincivii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI
vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinci2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...
DAFTAR ISI PERNYATAAN... i KATA PENGANTAR... ii UCAPAN TERIMA KASIH... iii ABSTRAK... v ABSTRACT... vi DAFTAR ISI... vii DAFTAR TABEL... ix DAFTAR GAMBAR... x DAFTAR LAMPIRAN... xii BAB I PENDAHULUAN...
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Pengenalan fonem adalah implementasi dari speech to teks yang merupakan bagian dari speech recognition atau pengenalan ucapan. Pengenalan ucapan lebih dikonsentrasikan pada ekstraksi
Lebih terperinciIDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO
IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO 02.50.0020 PROGRAM STUDI TEKNIK ELEKTRO FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS KATOLIK
Lebih terperinciPENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI
PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi
Lebih terperinciTRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY
TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA
PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA M. G. J. Harry Khesa S 1, W. Setiawan 2, I.G.A.K. Diafari Djuni H 3 1,2,3 Jurusan Teknik Elektro dan Komputer,
Lebih terperinciMANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR
MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI TESIS DAN SUMBER
Lebih terperinciBAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari
BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker
Lebih terperinciSISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR
SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR Ali Mustofa Jurusan Teknik Elektro, Universitas Brawijaya Email: a_tofa@yahoo.com Abstrak - Pengenalan penutur adalah
Lebih terperinciIdentifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)
Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM) Inggih Permana 1, Benny Sukma Negara 2 1 Universitas Sultan Sarif Kasim Riau 2 Universitas Sultan Sarif
Lebih terperinciPERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI
PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI DAPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciINDEPT, Vol. 3, No.1, Februari 2013 ISSN
SISTEM SPEAKER RECOGNITION (PENGENAL PENGUCAP) UNTUK MENCARI KARAKTERISTIK UCAPAN SESEORANG DENGAN METODE MEL FREQUENCY CEPTRUM COEFFISIENT (MFCC) MENGGUNAKAN SOFTWARE MATLAB Andriana, ST., MT. Dosen Fakultas
Lebih terperinciPENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK
ABSTRAK PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN Dosen Jurusan Teknik Elektronika Fakultas Teknik Universitas Negeri Makassar Pada penelitian ini dibuat sebuah sistem pengenalan suara manusia dengan
Lebih terperinciBab 3. Perancangan Sistem
34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara
Lebih terperinciPENDETEKSIAN KATA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN CODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL
PENDETEKSIAN KATA DENGAN MF SEBAGAI EKSTRAKSI IRI DAN ODEBOOK SEBAGAI PENGENALAN POLA MOHAMMAD LUTHFI SYAFRUL DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciBIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES
Agustini, Biometrik Suara Dengan Transformasi Wavelet 49 BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES Ketut Agustini (1) Abstract: Biometric as one of identification or recognition
Lebih terperinciPERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER
PERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER LATHIFATURRAHMAH SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2010 PERNYATAAN MENGENAI TUGAS AKHIR DAN SUMBER
Lebih terperinciDigital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods
Pemrosesan Sinyal DigitalUntuk Mengidentifikasi Akord Dasar Penyanyi Dengan Metode Mel Frequency Cepstral Coeficients (MFCC) Dan Jaringan Syaraf Tiruan Backpropagation Digital Signal Processing To Identify
Lebih terperinciPENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA. Oleh : VICKY ZILVAN G
PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK BERTINGKAT MENGGUNAKAN FUZZY C-MEANS UNTUK IDENTIFIKASI PEMBICARA Oleh : VICKY ZILVAN G64103043 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciPENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA
PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan
BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat
Lebih terperinciPENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG
PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad
Lebih terperinciPENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION
PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION DETECTION OF THE LEVEL OF YOUTH, ADULTS AND ELDERLY BY USING MFCC METHOD AND FUZZY
Lebih terperinciPENGARUH SERTIFIKASI GURU TERHADAP KESEJAHTERAAN DAN KINERJA GURU DI KABUPATEN SUMEDANG RIZKY RAHADIKHA
1 PENGARUH SERTIFIKASI GURU TERHADAP KESEJAHTERAAN DAN KINERJA GURU DI KABUPATEN SUMEDANG RIZKY RAHADIKHA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI
Lebih terperinciAPLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT
APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT DAN LINEAR VECTOR QUANTIZATION UNTUK PENGENDALIAN GERAK ROBOT Anggoro Wicaksono, Sukmawati NE, Satriyo Adhy,
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan
Lebih terperinciJaringan Syaraf Tiruan pada Robot
Jaringan Syaraf Tiruan pada Robot Membuat aplikasi pengenalan suara untuk pengendalian robot dengan menggunakan jaringan syaraf tiruan sebagai algoritma pembelajaran dan pemodelan dalam pengenalan suara.
Lebih terperinci1. BAB I PENDAHULUAN 1.1. Latar Belakang
1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat
Lebih terperinciIDENTIFIKASI BUNYI DALAM PEMBELAJARAN NADA DASAR PERMAINAN SULING BATAK MENGGUNAKAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT SKRIPSI
IDENTIFIKASI BUNYI DALAM PEMBELAJARAN NADA DASAR PERMAINAN SULING BATAK MENGGUNAKAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT SKRIPSI MUHAMMAD WARDANA 121402024 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS
Lebih terperinciNTIFIKASI PEMBICARA DENGAN PEMODELAN IDENTIFIKASI PEMBICARA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN SVM SEBAGAI PENGENALAN POLA LUTHFAN ALMANFALUTHI
NTIFIKASI PEMBICARA DENGAN PEMODELAN IDENTIFIKASI PEMBICARA DENGAN MFCC SEBAGAI EKSTRAKSI CIRI DAN SVM SEBAGAI PENGENALAN POLA LUTHFAN ALMANFALUTHI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014
Lebih terperinciJurnal Ilmiah Komputer dan Informatika (KOMPUTA)
21 PERANGKAT LUNAK UNTUK MEMBUKA APLIKASI PADA KOMPUTER DENGAN PERINTAH SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENTS Anna Dara Andriana Program Studi Teknik Informatika Fakultas Teknik
Lebih terperinciPENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO
PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Tetris Tetris adalah sebuah tipe permainan yang dibuat oleh seorang programmer berkebangsaan Rusia yang bernama Alexey Pajitnov pada tahun 1984 dan semenjak saat itu game tetris
Lebih terperinciJurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau
Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, 121-132 121 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Aplikasi Pengenalan Ucapan Dengan Ekstraksi Ciri Mel- Frequency Cepstrum Coefficients
Lebih terperinciAPLIKASI PENGENALAN SUARA DIGITAL NADA DASAR PIANO SKRIPSI M. ARDIANSYAH
APLIKASI PENGENALAN SUARA DIGITAL NADA DASAR PIANO SKRIPSI M. ARDIANSYAH 091402062 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2014
Lebih terperinciSISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE
SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan
Lebih terperinciUNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV
UNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV SKRIPSI YUNANTO WIDYATMAJI 0404030881 FAKULTAS TEKNIK
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Genre Menurut Kamus Besar Bahasa Indonesia, genre adalah jenis, tipe, atau kelompok sastra atas dasar bentuknya. Jadi genre musik merupakan pengelompokan musik berdasarkan kemiripan
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Indonesia
BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai
Lebih terperinciUNIVERSITAS BINA NUSANTARA
UNIVERSITAS BINA NUSANTARA Program Studi Ganda 2006-200 Skripsi Sarjana Program Ganda Semester Ganjil 2006/200 HALAMAN ABSTRAK SKRIPSI PROGRAM GANDA UNIVERSITAS BINA NUSANTARA Devi Natalia 0600656841 ABSTRAK
Lebih terperinciPengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC
Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC Elghar Wisnudisastra, Agus Buono Departemen Ilmu Komputer, Institut Pertanian Bogor, Jl. Meranti Wing 20 Lv.V,
Lebih terperinciImplementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC)
ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.3 December 2016 Page 3998 IMPLEMENTASI KUNCI BERBASIS SUARA MENGGUNAKAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) Implementation of Voice
Lebih terperinciSeminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:
Perintah Suara Berbahasa Indonesia untuk Membuka dan Menutup Aplikasi dalam Sistem Operasi Windows Menggunakan Metode Mel Frequency Cepstrum Coefficient dan Metode Backpropagation Zakaria Ramadhan 1, Sukmawati
Lebih terperinciFrekuensi Dominan Dalam Vokal Bahasa Indonesia
Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan
Lebih terperinciAPLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW
APLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW,, [1] Jurusan Teknik Informatika, Fakultas Teknologi Industri, Itenas Bandung youllia@itenas.ac.id, sangkuriang69@gmail.com, adrianyuki16@gmail.com
Lebih terperinciKlasifikasi Burung Berdasarkan Suara Kicau Burung Menggunakan Jaringan Syaraf Tiruan Propagasi Balik
Klasifikasi Burung Berdasarkan Suara Kicau Burung Menggunakan Jaringan Syaraf Tiruan Propagasi Balik Lorencius Echo Sujianto Putera 1, C. Kuntoro Adi 2 1,2 Program Studi Teknik Informatika, FST, Universitas
Lebih terperinciKata Kunci: Suara; Mel Frequency Cepstral Coefficient; K-NEAREST NEIGHBOUR
120 Dielektrika, [P-ISSN 2086-9487] [E-ISSN 2579-650X] Vol. 4, No. 2 : 120-126, Agustus 2017 KLASIFIKASI SUARA BERDASARKAN USIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN K-NEAREST NEIGHBOUR
Lebih terperinciBAB II LANDASAN TEORI. Konsep ini pertama kali diperkenalkan oleh Fritz Bauer, yang menerapkan
6 BAB II LANDASAN TEORI 2.1 Konsep Dasar Rekayasa Piranti Lunak Konsep ini pertama kali diperkenalkan oleh Fritz Bauer, yang menerapkan beberapa syarat dalam merekayasa suatu piranti lunak yang kita buat
Lebih terperinciVerifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW
Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW Darma Putra 1, Adi Resmawan 2 1 Staff pengajar Teknologi Informasi, Fakultas Teknik, Universitas Udayana 2 Alumni Teknik Elektro, Fakultas Teknik,
Lebih terperinciBab 1. Pendahuluan. aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi
1 Bab 1 Pendahuluan 1.1 Latar Belakang Di era teknologi informasi khususnya internet, keberadaan sistem proteksi yang aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi tersedia
Lebih terperinciANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENYALURAN KREDIT DI BANK UMUM MILIK NEGARA PERIODE TAHUN RENALDO PRIMA SUTIKNO
ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENYALURAN KREDIT DI BANK UMUM MILIK NEGARA PERIODE TAHUN 2004-2012 RENALDO PRIMA SUTIKNO SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI
Lebih terperinciANALISIS BIPLOT UNTUK MEMETAKAN MUTU SEKOLAH YANG SESUAI DENGAN NILAI UJIAN NASIONAL SUJITA
ANALISIS BIPLOT UNTUK MEMETAKAN MUTU SEKOLAH YANG SESUAI DENGAN NILAI UJIAN NASIONAL SUJITA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan
Lebih terperinciPENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA
PENGENALAN SUARA BERDASARKAN USIA DAN JENIS KELAMIN MENGGUNAKAN ALGORITME SUPPORT VECTOR MACHINE (SVM) IKRA DEWANTARA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium,
Lebih terperinciTeam project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP
Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis
Lebih terperinciIDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY
IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY Erni Seniwati 1), Ninik Tri Hartanti 2) 1 Sistem Informasi, STMIK Amikom erni.s@amikom.ac.id 2 Sistem Informasi, STMIK Amikom
Lebih terperinciDESAIN MESIN PRESENSI BERBASIS IDENTIFIKASI SUARA PENUTUR
REKAYASA LAPORAN PENELITIAN HIBAH BERSAING DESAIN MESIN PRESENSI BERBASIS IDENTIFIKASI SUARA PENUTUR Oleh : Hernawan Sulistyanto, ST, MT Nurgiyatna, ST. MSc DIBIAYAI OLEH DIREKTORAT JENDERAL PENDIDIKAN
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi di bidang informasi spasial dan fotogrametri menuntut sumber data yang berbentuk digital, baik berformat vektor maupun raster. Hal ini dapat
Lebih terperinciGambar 2.1. Katak Sawah (Djatmiko, 2005)
BAB 2 LANDASAN TEORI 2.1. Katak Sawah Katak sawah merupakan salah satu jenis katak yang memiliki nama latin Fejerfarya cancrivora. Katak sawah sesuai dengan namanya banyak dijumpai di daerah persawahan,
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul
37 BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil 4.1.1 Pengambilan Database Awalnya gitar terlebih dahulu ditala menggunakan efek gitar ZOOM 505II, setelah ditala suara gitar dimasukan kedalam komputer melalui
Lebih terperinciMODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG
MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini
Lebih terperinciPERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER
PERBANDINGAN PEMODELAN WAVELET DAN MFCC SEBAGAI EKSTRAKSI CIRI PADA PENGENALAN FONEM DENGAN TEKNIK JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER MUTIA FIJRI TAUFANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA
Lebih terperinciEKSTRAKSI FITUR MENGGUNAKAN ELLIPTICAL FOURIER DESCRIPTOR UNTUK PENGENALAN VARIETAS TANAMAN KEDELAI HERMAWAN SYAHPUTRA
EKSTRAKSI FITUR MENGGUNAKAN ELLIPTICAL FOURIER DESCRIPTOR UNTUK PENGENALAN VARIETAS TANAMAN KEDELAI HERMAWAN SYAHPUTRA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 PERNYATAAN MENGENAI TESIS
Lebih terperinciMODUL 5 EKSTRAKSI CIRI SINYAL WICARA
MODUL 5 EKSTRAKSI CIRI SINYAL WICARA I. TUJUAN - Mahasiswa mampu melakukan estimasi frekuensi fundamental sinyal wicara dari pengamatan spektrumnya dan bentuk gelombangnya - Mahasiswa mampu menggambarkan
Lebih terperinciUNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007
UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 SPEAKER IDENTIFICATION DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF
Lebih terperinci