View metadata, citation and similar papers at core.ac.uk

dokumen-dokumen yang mirip
IDENTIFIKASI JENIS TANGIS BAYI MENGGUNAKAN CODEBOOK UNTUK PENGENAL POLA DAN MFCC UNTUK EKSTRAKSI CIRI MEDHANITA DEWI RENANTI

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

Identifikasi Suara Tangisan Bayi menggunakan Metode LPC dan Euclidean Distance

BAB I PENDAHULUAN. 2012). Penelitian yang dilakukan oleh Bosma dkk. (1965), menemukan bahwa

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

PENDAHULUAN. Latar Belakang

Rancang Bangun Aplikasi Pendeteksi Suara Tangisan Bayi

Karakteristik Spesifikasi

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

INDEPT, Vol. 3, No.1, Februari 2013 ISSN

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

Pengenalan Chord pada Alat Musik Gitar Menggunakan CodeBook dengan Teknik Ekstraksi Ciri MFCC

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI

PENERAPAN MODEL CODEBOOK UNTUK TRANSKRIPSI SUARA KE TEKS DENGAN EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) MEGGA DARA NINGGAR SUHARTO

BAB I PENDAHULUAN 1.1 Latar Belakang

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone

PENDAHULUAN. Latar Belakang

UNIVERSITAS BINA NUSANTARA

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

Bab 1. Pendahuluan. aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI

PENERAPAN LEARNING VECTOR QUANTIZATION

BAB 1 PENDAHULUAN. Universitas Indonesia

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...

TUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat untuk Menyelesaikan Program Strata I Pada Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas

Digital Signal Processing To Identify chords Singer Using Mel Frequency Cepstral Coefficients (MFCC) and Neural Network Backpropagation Methods

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK ADE FRUANDTA

PERBANDINGAN METODE HIDDEN MARKOV MODEL DAN VECTOR QUANTIZATION UNTUK APLIKASI IDENTIFIKASI SUARA

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

PENGENALAN LAFAL HUKUM NUN MATI MENGGUNAKAN HIDDEN MARKOV MODEL

Bab 3. Perancangan Sistem

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

BAB I PENDAHULUAN I.1 Latar Belakang

PENERAPAN LVQ DENGAN INISIALISASI K-MEANS UNTUK PENGENALAN NADA GITAR DENGAN EKSTRAKSI CIRI MFCC ARIF BUDIARTO

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

SISTEM PENGENALAN PENUTUR DENGAN METODE MEL-FREQUENCY WRAPPING DAN KUANTISASI VEKTOR

RANCANG BANGUN APLIKASI PENGENAL PENUTUR MENGGUNAKAN METODE HIDDEN MARKOV MODEL (HMM)

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

BAB III METODOLOGI PENELITIAN

BAB II LANDASAN TEORI. menjadi respons terhadap kebutuhan atas perubahan temperatur, rasa lapar, dan rasa

PENGEMBANGAN MODEL JARINGAN SYARAF TIRUAN RESILIENT BACKPROPAGATION UNTUK IDENTIFIKASI CHORD GITAR YOSI NURHAYATI

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

PERBANDINGAN BERBAGAI METODE UKURAN JARAK UNTUK PENGENALAN FONEM DENGAN MFCC SEBAGAI EKSTRAKSI CIRI YULIANA SURI

PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI

Pengembangan Model HMM Berbasis Maksimum Lokal Menggunakan Jarad Euclid Untuk Sistem Identifikasi Pembicara -,,

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO

Pembuatan Prototype Speaker Diarization

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification

BAB III ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. spesifikasi perangkat keras dan perangkat lunak yang menunjang.

BAB I PENDAHULUAN. 1.1 Latar Belakang

Sistem Pengenalan Kata Bahasa Indonesia Berbasis LabVIEW untuk Pengendalian Peralatan Ruang Perkuliahan

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA

BAHASA BAYI (BABY LANGUAGE) Hasnerita, S.Si.T,M.Kes

PENGENALAN FORMULA MATEMATIKA DARI POLA TULISAN TANGAN

APLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW

UNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN PERANGKAT LUNAK UNTUK MENENTUKAN JENIS IKAN SECARA REAL-TIME DENGAN MENGGUNAKAN METODA HIDDEN MARKOV

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri

1. BAB I PENDAHULUAN 1.1. Latar Belakang

PENGGUNAAN ALGORITMA LEARNING VECTOR QUANTIZATION DALAM MENGENALI SUARA MANUSIA UNTUK KENDALI QUADROTOR

PENERAPAN MEL FREQUENCY CEPSTRUM COEFFICIENTS

IDENTIFIKASI BUNYI DALAM PEMBELAJARAN NADA DASAR PERMAINAN SULING BATAK MENGGUNAKAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT SKRIPSI

BAB II LANDASAN TEORI

IMPLEMENTASI SPEAKER RECOGNITION UNTUK OTENTIKASI MENGGUNAKAN MODIFIED MFCC VECTOR QUANTIZATION ALGORITMA LBG

DESAIN MESIN PRESENSI BERBASIS IDENTIFIKASI SUARA PENUTUR

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT

Klasifikasi Burung Berdasarkan Suara Kicau Burung Menggunakan Jaringan Syaraf Tiruan Propagasi Balik

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

Verifikasi Suara menggunakan Jaringan Syaraf Tiruan dan Ekstraksi Ciri Mel Frequency Cepstral Coefficient

vii MODEL FONEM DENGAN PENDEKATAN DISTRIBUSI NORMAL UNTUK PENGENALAN KATA MENGGUNAKAN MFCC SEBAGAI EKSTRAKSI CIRI ADITYA DWI HAPSARI

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA

PENGENALAN WAJAH DENGAN CITRA MASUKAN BERUPA CITRA SKETSA WAJAH SEBAGAI HASIL SINTESIS DENGAN TEKNIK MULTISCALE MARKOV RANDOM FIELD (MRF)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Gambar 2.1. Katak Sawah (Djatmiko, 2005)

TRANSKRIPSI SUARA KE TEKS BAHASA INDONESIA BERBASIS SUKU KATA MENGGUNAKAN CODEBOOK DAN 2-LEVEL DYNAMIC PROGRAMMING SINTYA ROSDWIANTY

Identifikasi Suara Pengontrol Lampu Menggunakan Mel-Frequency Cepstral Coefficients dan Hidden Markov Model

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL

BAB 2 LANDASAN TEORI

PERBANDINGAN ANALISIS PENGENALAN HURUF ARAB MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION DAN K-NEAREST NEIGHBOR

PERBANDINGAN METODE KUANTISASI VEKTOR DAN MODEL MARKOV TERSEMBUNYI PADA PENGENALAN PEMBICARA BERBAHASA INDONESIA TESIS

APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM)

Implementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC)

PENDAHULUAN. Latar Belakang

Sistem Pengenalan Suara Bahasa Indonesia Untuk Mengenali Aksen Melayu Pontianak Dan Sunda Garut

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

UJI KINERJA FACE RECOGNITION MENGGUNAKAN EIGENFACES

ANALISA HASIL PERBANDINGAN IDENTIFIKASI CORE POINT PADA SIDIK JARI MENGGUNAKAN METODE DIRECTION OF CURVATURE DAN POINCARE INDEX

Transkripsi:

View metadata, citation and similar papers at core.ac.uk brought to you by CORE provided by Scientific Journals of Bogor Agricultural University IDENTIFIKASI ARTI TANGIS BAYI VERSI DUNSTAN BABY LANGUAGE MENGGUNAKAN JARAK TERPENDEK DARI JARAK MAHALANOBIS (Infant Cries Identification of Dunstan Baby Language Version using the Shortest Distance of Mahalanobis) 1 1 Program Diploma Institut Pertanian Bogor, medha_nuha@yahoo.com Diterima 7 Oktober 2013/ Disetujui 21 Oktober 2013 ABSTRACT New born babies have the ability to express their basic needs through sounds. A system to understand the meaning of crying infants of aged 0-3 months is called Dunstan Baby Language (DBL), which was introduced in 2006. This research aimed to perform the modeling of codebook method with k-means clustering technique as feature matching, and Mel Frequency Cepstrum Coefficients (MFCC) as feature extraction to identify the infant cries. The infant cries identification of Dunstan Baby Language version used the shortest distance of mahalanobis. The treatment in this research was the combination of frame length: 25 ms, 40 ms and 60 ms, frame overlap of 0%, 40%, and 60%, and the number of codewords (number of clusters) of 1 to 29. The best accuracy in recognizing five types of crying Infants using mahalanobis distance can be achieved up to 83% when the frame length = 275, the overlap frame = 0.25, and the k = 17. Sound heh was the most familiar, whereas sound owh was always missunderstood and generally known as neh and eairh. Keywords: Codebook, Dunstan baby language, Mahalanobis Distance, MFCC PENDAHULUAN Dunstan (2006) menyatakan bahwa setiap bayi lahir mempunyai kemampuan untuk mengekspresikan kebutuhan dasar mereka melalui suara. Penelitian yang dilakukan oleh Priscilla Dunstan dari tahun 1998 sampai 2006 telah berhasil menemukan bahasa yang dimiliki oleh semua bayi di seluruh dunia usia 0-3 bulan. Bahasa tersebut dikenal dengan sebutan Dunstan Baby Language-DBL. Terdapat lima bahasa bayi versi DBL yaitu: neh berarti lapar, owh berarti lelah yang mengindikasikan bayi sudah mulai mengantuk, eh berarti ingin bersendawa, eairh berarti nyeri (ada angin) di perut, dan heh berarti tidak nyaman (bisa karena popoknya basah, udara terlalu panas atau dingin, atau hal lainnya). Perintis DBL di Indonesia adalah dokter Adhiatma Gunawan yang menyebutkan bahwa seorang bayi mempunyai refleks primitif yang dimiliki sejak dilahirkan. Refleks ini bersifat universal dan lambat laun akan menghilang seiring dengan berkembangnya kemampuan untuk beradaptasi. DBL berlaku pada bayi hingga usia tiga bulan karena setelah usia tersebut bayi akan mengembangkan kemampuan berkomunikasinya sendiri dengan bantuan orang tua dan lingkungan. Penelitian membuktikan bahwa 90% dari ibu-ibu di seluruh dunia yang mengikuti DBL merasa puas dan terbantu dengan sistem tersebut dan merekomendasikan pada yang lain. Sementara lebih dari 70% orang tua merasa lebih percaya diri dalam mengasuh bayinya dan by the end of the day, tingkat stres mereka berkurang signifikan (Gunawan 2011). Kepakaran untuk menentukan arti tangis bayi versi DBL masih agak jarang sehingga informasi arti tangis bayi ini belum mudah didapatkan oleh para orang tua. Saat ini sistem untuk mentrasfer pengetahuan mengenai DBL dengan cara mengikuti pelatihan atau seminar yang diadakan oleh pengelola atau dengan cara mempelajari sendiri materi jenis tangis bayi versi DBL dalam bentuk optical discs atau dapat juga mengunduh materi DBL di internet. Pengguna sistem DBL khususnya di Indonesia akan lebih yakin dengan kesimpulan yang mereka buat jika ada suatu software yang secara otomatis dapat menghasilkan arti tangisan bayinya. Hal ini dapat menguatkan kesimpulan mereka, karena jika hanya mengikuti pelatihan kilat atau seminar, masih ada beberapa peserta yang belum paham bagaimana mengenali maksud tangisan bayi tersebut atau belum tepat memaknai tangisan bayi. Selain itu nantinya software ini juga bisa bermanfaat bagi orang tua yang belum mengikuti pelatihan atau seminar DBL sehingga para orang tua dapat memahami bahasa/tangis bayi. Penelitian mengenai tangis bayi telah dilakukan oleh para peneliti, antara lain: klasifikasi tangis bayi bayi normal dan abnormal (menderita gangguan hipoksia-tubuh kekurangan oksigen) menggunakan neural network menghasilkan akurasi 85% (Poel & Ekkel 2006). Klasifikasi bayi sehat dan bayi yang mengalami sakit seperti kerusakan otak, bibir sumbing, hidrosefalus, dan sindrom kematian bayi mendadak menggunakan metode klasifikasi Hidden Markov Model-HMM menghasilkan akurasi 91% (Lederman et al. 2008). Penelitian lainnya adalah klasifikasi tiga jenis tangis yaitu bayi normal, bayi tuli, dan bayi yang menderita asfiksia (tidak dapat bernafas secara spontan dan teratur) pada usia satu hari sampai sembilan bulan menggunakan neural network menghasilkan akurasi 86% (Reyes-Galaviz dan Reyes-Garcia 2004). Dari beberapa hasil penelitian tersebut dapat disimpulkan bahwa tangisan bayi berarti sinyal suara tangis bayi dapat digunakan untuk mendeteksi status kesehatan bayi. Hal ini sejalan dengan penelitian yang dilakukan oleh Priscilla Dunstan yang menyatakan bahwa tangis bayi sebagai alat komunikasi untuk memenuhi kebutuhan atau keinginannya dan tangis bayi mempunyai tujuan untuk mengungkapkan sesuatu. Penelitian klasifikasi tangis bayi sebelumnya telah menggunakan neural network atau HMM sebagai pengenal polanya. Penelitian untuk identifikasi jenis bayi versi DBL ini menggunakan codebook untuk pengenal 27

polanya dan Mel-Frequency Cepstrum Coefficients (MFCC) untuk ekstraksi ciri. Pemilihan metode ini didasari beberapa penelitian diantaranya: penelitian Lee et al. (2006) melakukan pengenalan suara burung menggunakan MFCC dan Vector Quantization (VQ) codebook dan berhasil mencapai akurasi 87%. Selain itu speaker recognition system juga berhasil dibuat menggunakan MFCC dan VQ (Kumar 2011). Penelitian serupa dilakukan oleh Singh dan Rajan (2011) yang berhasil mencapai akurasi 98,57% dengan melakukan penelitian speaker recognition menggunakan VQ dan MFCC. METODOLOGI Metode penelitian ini terdiri atas beberapa tahapan proses yaitu pengambilan data, preprocessing, pemodelan codebook tangis bayi, pengujian dan analisis, serta pembuatan antarmuka. Metodologi penelitian proses identifikasi jenis tangis bayi ditampilkan pada Gambar 1. mulai Pengambilan data Data latih Data uji Preprocessing: Pemotongan silence Ekstraksi ciri: MFCC Preprocessing: Pemotongan silence Ekstraksi ciri: MFCC Pemodelan Codebook: k-means clustering Pengujian dan analisis Codebook Tangis bayi Pembuatan antarmuka selesai Gambar 1 Metodologi penelitian identifikasi arti tangis bayi Pengumpulan Data Data yang digunakan untuk penelitian ini adalah diambil dari video Dunstan Baby Language yang sudah dilakukan pengolahan data. Data terbagi menjadi dua yaitu data latih dan data uji. Terdapat 140 data latih yang masing-masing mewakili 28 tangis bayi lapar, 28 tangis bayi mengantuk, 28 tangis bayi ingin bersendawa, 28 tangis bayi mengalami nyeri (ada angin) di perut, dan 28 tangis bayi tidak nyaman (bisa karena popoknya basah/udara yang terlalu panas/dingin atau hal lainnya). Data uji sebanyak 35, masing-masing 7 tangis bayi untuk setiap jenis tangis bayi. Sampling rate yang digunakan pada penelitian ini adalah 11000Hz. 28

Preprocessing Pada tahap preprocessing ini dilakukan pemotongan silence dan ekstraksi ciri menggunakan metode Mel Frequency Cepstrum Coefficients (MFCC). Pemotongan silence ini dilakukan di awal dan di akhir sinyal suara tangis bayi. Ekstraksi ciri merupakan proses untuk menentukan satu nilai atau vektor yang dapat digunakan sebagai penciri objek atau individu. Ciri yang biasa digunakan adalah koefisien cepstral dari sebuah frame. MFCC merupakan ekstraksi ciri yang menghitung koefisien cepstral dengan mempertimbangkan pendengaran manusia (Buono 2009). Diagram alur dari MFCC dapat dilihat pada Gambar 2. Sinyal suara O = O1, O2,., Ot, OT Frame ke-t Windowing yt ( n) xt ( n) w( n), 0 n N 1 2 n w( n) 0.54 0.46 cos, 0 n N 1 N 1 FFT: Mel Frequency Wrapping: mel(f)= Dari sini diperoleh M filter dan dihitung spektrum Mel: adalah nilai filter segitiga ke-i Cepstrum Coeficients: Discrete Cosine Transform Gambar 2 Diagram Alur MFCC j=1,2,3, J; J= number of coefficients; = number of filter Pemodelan Codebook Tangis Bayi Pemodelan codebook ini berasal dari setiap data latih yang nantinya digunakan sebagai representasi sinyal tangis bayi yang akan dikenali. Codebook yang akan dibuat yaitu codebook dari setiap data tangis bayi. Codebook dari cluster yang dibuat berasal dari hasil clustering semua data tangis bayi dengan menggunakan k- means clustering. Vector Quantization (VQ) merupakan proses memetakan vektor-vektor dari ruang vektor yang besar menjadi ruang vektor dengan jumlah terbatas. Setiap daerah disebut cluster dan dapat direpresentasikan oleh pusatnya yang disebut codeword. Kumpulan codeword disebut codebook (Do 1994). Pemodelan speaker menggunakan pendekatan berbasis VQ dibentuk oleh clustering dari fitur speaker pada K yang tidak 29

overlapping. Setiap cluster direpresentasikan oleh code vector ci yang disebut centroid. Hasil himpunan code vector ini disebut codebook. Codebook ini berfungsi sebagai model pembicara (Linde et al. 1980). K-means clustering merupakan algoritma clustering eksklusif. Setiap objek ditetapkan secara tepat ke dalam salah satu dari sekumpulan cluster. Metode clustering ini dimulai dengan menentukan banyaknya cluster yang akan dibentuk (disebut dengan nilai k). Nilai k umumnya nilai integer terkecil seperti 2, 3, 4, atau 5. Pengukuran kualitas satu cluster dapat menggunakan nilai dari fungsi objektif yang diambil dari jumlah kuadrat jarak setiap titik dari centroid yang telah ditentukan (euclidean distance). Pilih poin k yang umumnya sesuai dengan lokasi k dari suatu objek. Poin k ini nantinya dijadikan sebagai centroid dari k cluster. Metode ini dapat bekerja maksimal jika pemilihan poin awal k yang berjauhan. Selanjutnya dipilih setiap poin, satu per satu dari suatu cluster yang mempunyai centroid terdekat. Semua objek mempunyai k cluster berdasarkan k initial centroid tetapi centroid ini tidak akan menjadi centroid sejati suatu cluster. Langkah selanjutnya dihitung ulang centroid dari cluster dan dilakukan langkah-langkah sebelumnya untuk menempatkan setiap objek ke cluster dengan centroid terdekat. Algoritma k-means clustering sebagai berikut (Bramer 2007): 1. Pilih nilai k 2. Pilih objek k secara acak. Objek ini akan menjadi k initial centroid 3. Tetapkan setiap objek dari suatu cluster yang terdekat dengan centroid 4. Hitung ulang centroid dari k cluster 5. Ulangi langkah 3 dan 4 sampai perubahan nilai centroid pada iterasi satu dengan lainnya tetap (centroid tidak bergerak Tahap pembuatan codebook untuk seorang pembicara sebagai berikut (Buono 2009): 1. Untuk setiap pengucapan (ada n pengucapan sebagai data training), dilakukan ekstraksi ciri menggunakan MFCC pada setiap frame dengan panjang dan overlap tertentu. 2. Semua frame dari n pengucapan digabungkan menjadi satu set dan dilakukan unsupervised clustering menggunakan teknik k-means clustering dengan memilih banyaknya cluster sesuai dengan jumlah codeword yang diinginkan. Pengujian dan Analisis Tahapan pengujian berarti melakukan pengujian untuk identifikasi jenis tangis bayi. Alur proses untuk tahap identifikasi/pengenalan adalah (Buono 2009): 1. Untuk setiap ucapan baru yang masuk ke sistem dibaca frame demi frame, (misalkan jumlah frame yang diperoleh adalah T), dan dilakukan ekstraksi ciri menggunakan MFCC. 2. Hitung jarak sinyal input ucapan ini ke codebook setiap pembicara yang ada dalam sistem. 3. Keputusan: menetapkan label pada input suara sesuai dengan pembicara dengan jarak codebook terkecil. Jarak input ucapan dengan codebook dirumuskan sebagai berikut (Buono 2009): 1. Untuk setiap frame dari input ucapan yang masuk, hitung jarak ke setiap codeword dan dipilih codeword dengan jarak minimum. 2. Jarak antara input ucapan dengan codebook adalah jumlah dari jarak minimum tersebut (persamaan 1): Penelitian ini menggunakan jarak mahalanobis untuk identifikasi arti tangis bayi. didefinisikan pada persamaan 2 (Gomathy et al. 2012). (1) Jarak mahalanobis (2) C adalah covariance matrix, x = {x1,x2,.xs} T dan y = {y1, y2,.,ys} T Pengujian dilakukan menggunakan data uji sebanyak 35 dan data latih yang berjumlah 140. Tahap analisis dilakukan berdasarkan hasil yang didapatkan pada tahap pengujian. Analisis dilakukan berdasarkan hasil dari kombinasi faktor dan level berikut: panjang frame : 25 ms/panjang frame 275, 40 ms/ panjang frame 440, 60 ms/panjang frame 660. overlap frame : 0%, 25%, 40%. banyaknya codeword/jumlah cluster: 1 sampai dengan 18. Untuk panjang frame = 275 dan overlap frame = 0, jumlah k adalah 1-29 cluster. Masing-masing kombinasi faktor dan level tersebut akan dihitung nilai akurasi menggunakan persamaan 3. 30

Pembuatan Antarmuka Pembuatan antarmuka identifikasi jenis tangis bayi dibuat berdasarkan data latih yang menghasilkan akurasi tertinggi.. HASIL DAN PEMBAHASAN Penelitian ini dibuat menggunakan software Matlab R2010b version 7.11.0.584. Hasil perbandingan akurasi pengujian data uji ditampilkan pada Gambar 3. panjang frame overlap frame Gambar 3 Grafik perbandingan pengujian data uji Grafik perbandingan akurasi menggunakan pengujian data latih ditampilkan pada Gambar 4. panjang frame overlap frame Gambar 4 Grafik perbandingan pengujian data latih 31

Akurasi menggunakan pengujian data uji berkisar antara 9% sampai 83%. Nilai akurasi 83% didapat ketika panjang frame = 275, overlap frame 0.25, dan k=16. Sedangkan akurasi pengujian menggunakan data latih berkisar antara 12% sampai 83%. Nilai akurasi 83% diperoleh ketika panjang frame = 275, overlap frame 0.25, dan k=17 serta panjang frame = 440, overlap frame 0.4, dan k=18. Dari beberapa model yang menghasilkan akurasi tertinggi tersebut, model yang akan digunakan untuk identifikasi adalah model dengan panjang frame = 275, overlap frame = 0.25, k=17 karena pengujian yang digunakan menggunakan data latih yang jumlah data latihnya jauh lebih besar dibandingkan data uji. Hasil pengujian ketika k = 17, panjang frame = 275, dan overlap frame = 0.25 ditampilkan pada Tabel 1. 32

Tabel 1 Hasil pengujian data latih saat k = 17, panjang frame = 275, dan overlap frame = 0.25 Uji Data Ke- Jenis Tangis 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'n' 'a' 'a' 'n' 'e' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' 'a' a-eairh 'e' 'e' 'e' 'n' 'e' 'e' 'e' 'e' 'e' 'e' 'h' 'e' 'o' 'e' 'e' 'n' 'e' 'e' 'e' 'e' 'e' 'e' 'e' 'h' 'e' 'e' 'e' 'e' e-eh 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'e' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'h' 'e' 'h' 'h' 'h' 'h' h-heh 'n' 'n' 'n' 'n' 'n' 'n' 'n' 'n' 'n' 'n' 'n' 'n' 'n' 'h' 'e' 'n' 'n' 'n' 'n' 'h' 'n' 'n' 'a' 'n' 'n' 'n' 'n' 'n' n-neh 'a' 'o' 'o' 'o' 'o' 'o' 'o' 'n' 'o' 'n' 'o' 'a' 'n' 'o' 'a' 'o' 'e' 'o' 'o' 'a' 'o' 'o' 'o' 'o' 'a' 'h' 'o' 'o' o-owh keterangan: salah identifikasi 32

Dari beberapa hasil pengujian tersebut dapat diketahui bahwa suara heh merupakan suara yang sering benar dikenali. Sedangkan suara owh merupakan suara yang sering salah dikenali dan biasanya kesalahannya dikenali sebagai suara neh dan eairh. Kesalahan identifikasi ini disebabkan karena variasi data latih owh lebih besar dibandingkan dengan yang lain. Ilustrasi codebook heh dan owh pada saat k=17, panjang frame = 275, dan overlap frame= 0.25 ditampilkan pada Gambar 5. Gambar 5 Ilustrasi codebook heh dan owh Perbedaan hasil akurasi menggunakan pengujian data latih dan datauji ditampilkan pada Gambar 6. Akurasi tersebut untuk panjang frame = 275, overlap frame = 0.25, jumlah cluster (k) = 1 s/d 29. Jumlah cluster di sini dibuat lebih banyak dengan tujuan supaya dapat menggambarkan perbedaannya. Gambar 6 Akurasi pengujian data latih dan data uji dengan panjang frame = 275 dan overlap frame = 0 Gambar 6 menunjukkan akurasi menggunakan data latih lebih tinggi dibandingkan data uji. Hal ini dikarenakan pada jarak mahalanobis sudah ada pembagi variasi sehingga akurasi data latih lebih bagus. Confusion matrix saat k = 17, panjang frame = 275, dan overlap frame = 0.25 menggunakan jarak mahalanobis ditampilkan pada Tabel 2. Tabel 2 Confusion matrix saat k = 17, panjang frame = 275, dan overlap frame = 0.25 Jenis Tangis Bayi Eairh Eh Heh Neh Owh Akurasi Eairh 25 1 0 2 0 89% Eh 0 23 2 2 1 82% Heh 0 2 26 0 0 93% Neh 1 1 2 24 0 86% Owh 5 1 1 3 18 64% Rata-rata 82.80% 33

Antarmuka identifikasi arti tangis bayi ditampilkan pada Gambar 7. Model codebook adalah model dengan panjang frame = 275, overlap frame = 0.25, k=17. Gambar 7 Antarmuka identifikasi arti tangis bayi SIMPULAN Software ini digunakan untuk identifikasi jenis tangis bayi versi Dunstan Baby Language. Identifikasi ini menggunakan codebook untuk pengenal pola dan MFCC untuk ekstraksi ciri. Penelitian ini memvariasikan panjang frame, overlap frame, dan banyaknya codeword. Model codebook dan MFCC yang menghasilkan akurasi tertinggi yaitu: panjang frame = 275, overlap frame = 0.25, k=17 dengan akurasi 83%. DAFTAR PUSTAKA Bramer M. 2007. Principles of Data Mining. London: Springer. Buono A. 2009. Representasi Nilai HOS dan Model MFCC sebagai Ekstraksi Ciri pada Sistem Indentifikasi Pembicara di Lingkungan Ber-noise Menggunakan HMM. [disertasi]. Depok: Program Studi Ilmu Komputer, Universitas Indonesia. Do MN. 1994. Digital Signal Processing Mini-Project: An Automatic Speaker Recognition System. Audio Visual Communication Laboratory, Swiss Federal Institute of Technology, Lausanne, Switzerland. Dunstan P. 2006. Open Up and Discover Your Baby s Language. [Internet]. [diunduh 2012 Maret 19]. Tersedia pada: http://www.babytaal.nl/media/pdf/ Comprehensive Booklet(2).pdf. Gomathy M, Meena K, Subramaniam KR. 2012. Gender Clustering and Classification Algorithms in Speech Processing: A Comprehensive Performance Analysis. International Journal of Computer Applications 51(20): 9-17. Gunawan A. 2011. Dunstan Baby Language Indonesia. [Internet]. [diunduh 2012 September 8]. Tersedia pada: http://www.mommeworld.com/ post/view/49/ dunstan-baby-language-indonesia/. Kumar C. Rao PM. 2011. Design of an Automatic Speaker Recognition System using MFCC, Vector Quantization, and LBG Algorithm. International Journal on Computer Science and Engineering (IJCSE) 3(8): 2942-2954. Lederman D, Zmora E, Hauschildt S, Stellzig-Eisenhauer A, Wermke K. 2008. Classification of cries of infants with cleft-palate using parallel hidden Markov models. International Federation for Medical and Biological Engineeering 46: 965-975. Lee C, Lien C, Huang R. 2006. Automatic Recognition of Birdsongs Using Mel-frequency Cepstral Coefficients and Vector Quantization. International MultiConference of Engineers and Computer Scientists; 2006 June 20-22; Hong Kong. Linde Y, Buzo A, Gray RM. 1980. An Algorithm for Vector Quantizer Design. IEEE Transactions On Communications 28(1): 84-95. Poel M, Ekkel T. 2006. Analyzing Infant Cries Using a Committee of Neural Networks in order to Detect Hypoxia Related Disorder. International Journal on Artificial Intelligence Tools (IJAIT) 15(3): 397-410. Reyes-Galaviz OF, Reyes-Garcia CA. 2004. A System for the Processing of Infant Cry to Recognize Pathologies in Recently Born Babies with Neural Networks. International Speech Communication Association; 2004 September 20-22; Rusia. Singh S, Rajan EG. 2011. Vector Quantization Approach for Speaker Recognition using MFCC and Inverted MFCC. International Journal of Computer Applications 17(1): 1-7. 34