BAB I PENDAHULUAN. seseorang, ataupun takut terhadap sesuatu (Frieda, 1993). Kondisi

dokumen-dokumen yang mirip
BAB II LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN SIMULASI DAN ANALISIS PEMANTAUAN KAMAR PASIEN RAWAT INAP DENGAN DETEKSI DAN KLASIFIKASI SINYAL AUDIO 1

BAB 1 PENDAHULUAN. Universitas Indonesia

BAB 1 PENDAHULUAN. misalnya untuk mendeteksi ketidakpuasan pelanggan pada sistem call center otomatis,

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BAB I PENDAHULUAN. menggunakan voice recognition dapat membantu user memilih produk buah

BAB I PENDAHULUAN 1.1 Latar Belakang

APLIKASI PENDETEKSI EMOSI MANUSIA MENGGUNAKAN METODE MFCC DAN DTW

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

EKSPRESI EMOSI MARAH BAHASA ACEH MENGGUNAKAN ALGORITMA PERCEPTRON

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

BAB I PENDAHULUAN ! <!!!!!

BAB I PENDAHULUAN. dapat menghasilkan suara yang enak untuk didengar.

BAB I PENDAHULUAN I.1 Latar Belakang

IMPLEMENTASI MEL FREQUENCY CEPSTRAL COEFFICIENT DAN DYNAMIC TIME WARPING UNTUK PENGENALAN NADA PADA ALAT MUSIK BELLYRA

BAB 2 LANDASAN TEORI

Rekognisi Pengucap Forensik Forensic Speaker Recognition

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

PENDAHULUAN. Latar Belakang

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

PENDAHULUAN. Latar Belakang

APLIKASI SPEECH RECOGNITION BAHASA INDONESIA DENGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENT

APLIKASI SPEECH TO TEXT BERBAHASA INDONESIA MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENTS DAN HIDDEN MARKOV MODEL (HMM)

Implementation of Voice Recognition Based Key Using Mel Frequency Cepstral Coefficient (MFCC)

BAB II TINJAUAN PUSTAKA. penelitian yang didapat oleh peneliti terdahulu yang relevan dengan

Rancang Bangun Aplikasi Pendeteksi Suara Tangisan Bayi

EKSTRASI CIRI DAN PENGENALAN SUARA VOKAL BAHASA INDONESIA BERDASARKAN JENIS KELAMIN SECARA REAL TIME

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

IDENTIFIKASI KEBERADAAN TIKUS BERDASARKAN SUARANYA MENGGUNAKAN SMS GATEWAY

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA BAB I PENDAHULUAN

Warble Of Lovebird Classification Using Mel Frequency Cepstral Coefficient (MFCC)

IMPLEMENTASI DYNAMIC TIME WARPING UNTUK VOICE RECOGNITION

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

BAB I PENDAHULUAN. 1.1 Latar Belakang

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

TRANSFORMASI SUARA BERBASIS PEMETAAN SELUBUNG SPEKTRAL DAN PREDIKSI RESIDU

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

PENDETEKSIAN TINGKAT USIA MUDA, DEWASA DAN TUA MENGGUNAKAN METODE MFCC DAN FUZZY LOGIC BERBASISKAN SPEECH RECOGNITION

Jaringan Syaraf Tiruan pada Robot

1. BAB I PENDAHULUAN 1.1. Latar Belakang

Verifikasi Biometrika Suara Menggunakan Metode MFCC Dan DTW

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...

BAB 1 PENDAHULUAN. Manusia memiliki insting untuk berinteraksi satu sama lain demi mencapai

PENDAHULUAN 1.1. Latar Belakang

Identifikasi Pembicara dengan Menggunakan Mel Frequency Cepstral Coefficient (MFCC) dan Self Organizing Map (SOM)

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

SISTEM PENGOLAHAN SUARA MENGGUNAKAN ALGORITMA FFT (FAST FOURIER TRANSFORM)

BAB I PENDAHULUAN. 1.1 Latar Belakang

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

BAB V PENUTUP. A. Kesimpulan. ekspresi emosi pada keempat suku tersebut baik di rumah sendiri maupun di

I. PENDAHULUAN. lain. Menurut Supratiknya (1995:9) berkomunikasi merupakan suatu

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

Perbandingan Estimasi Selubung Spektral dari Bunyi Voiced Menggunakan Metoda Auto-Regressive (AR) dengan Weighted-Least-Square (WLS) ABSTRAK

PENDAHULUAN. Latar Belakang

BAB IV HASIL DAN PEMBAHASAN

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength

BAB 1 PENDAHULUAN 1.1 Latar Belakang

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO

Analisis Koefisien Cepstral Emosi Berdasarkan Suara

ISSN : e-proceeding of Engineering : Vol.3, No.2 Agustus 2016 Page 1787

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength

Perintah Menggunakan Sinyal Suara dengan Mel- Frequency Cepstrum Coefficients dan Learning Vector Quantization

Jony Sitepu/ ABSTRAK

PENGENALAN EMOSI BERDASARKAN SUARA MENGGUNAKAN ALGORITMA HMM

Pengenalan Karakter Suara Laki-Laki Aceh Menggunakan Metode FFT (Fast Fourier Transform)

Sistem Pengenal Tutur Bahasa Indonesia Berbasis Suku Kata Menggunakan MFCC, Wavelet Dan HMM

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

EKSTRAKSI CIRI DAN PENGENALAN TUTUR VOKAL BAHASA INDONESIA MENGGUNAKAN METODE DISCRETE WAVELET TRANSFORM

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

DETEKSI SLEEP APNEA MELALUI ANALISIS SUARA DENGKURAN DENGAN METODE MEL FREKUENSI CEPSTRUM COEFFICIENT

1. Pendahuluan Latar Belakang

Budaya Keselamatan dalam dunia Transportasi Udara

IDENTIFIKASI UCAPAN WARNA MENGGUNAKAN LPC (LINIER PREDICTIVE CODE ) DAN KELOMPOK PEMILIHAN BOBOT

BAB I PENDAHULUAN. penelitian di dunia pendidikan. Dilaporkan sekitar 25-60% mahasiswa drop-out

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Pengenalan Suara Menggunakan Metode MFCC (Mel Frequency Cepstrum Coefficients) dan DTW (Dynamic Time Warping) untuk Sistem Penguncian Pintu

BAB 3 PERANCANGAN SISTEM. yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model

PERKEMBANGAN KOGNITIF DAN PEMAHAMAN EMOSI PENGALAMAN SOSIAL DAN PEMAHAMAN EMOSI

Penerapan Metode Mel Frequency Ceptral Coefficient dan Learning Vector Quantization untuk Text-Dependent Speaker Identification

BAB I PENDAHULUAN. waktu adalah suatu deret observasi yang berurut dalam waktu. Analisis data

BAB I PENDAHULUAN A. Latar Belakang Masalah

IMPLEMENTASI SISTEM PESAN VIA SUARA : KONVERSI SUARA KE TEKS PADA APLIKASI PENGIRIMAN PESAN BERBAHASA INDONESIA

BAB 3 METODOLOGI. seseorang. Hal inilah yang mendorong adanya perkembangan teknologi

Kata Kunci: Suara; Mel Frequency Cepstral Coefficient; K-NEAREST NEIGHBOUR

BAB I PENDAHULUAN. manusia baik individu maupun kelompok. Setiap saat manusia berpikir, bertindak

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BAB II TINJAUAN PUSTAKA. salah satu persoalan penting dalam bidang affective computing. Deteksi emosi dapat

ABSTRAK. Universitas Kristen Maranatha

BAB I PENDAHULUAN. 2012). Penelitian yang dilakukan oleh Bosma dkk. (1965), menemukan bahwa

BAB III METODOLOGI. dari suara tersebut dapat dilihat, sehingga dapat dibandingkan, ataupun dicocokan dengan

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Emosi adalah perasaan intens yang ditujukan kepada seseorang atau sesuatu dan juga merupakan reaksi terhadap seseorang atau kejadian. Emosi dapat ditunjukkan ketika merasa senang mengenai sesuatu, marah kepada seseorang, ataupun takut terhadap sesuatu (Frieda, 1993). Kondisi emosional terefleksi dalam perkataan, gerak tubuh, dan terutama ekspresi wajah (Chibelushi & Bourel, 2003). Manusia memiliki insting untuk berinteraksi satu sama lain demi mencapai suatu tujuan, dan dalam interaksi itu, mengintepretasi kondisi emosional menjadi penting untuk komunikasi yang baik. Komunikasi yang baik menjamin adanya pertukaran pikiran dan pandangan yang benar sehingga tidak terjadi kebingungan. Jika sebuah hal tidak dikomunikasikan dengan baik, maka orang akan sulit mengerti. Jika dibiarkan, masalah pun akan timbul sebagai dampaknya. Dampak yang ditimbulkan merupakan kesalahpahaman yang dapat berakibat fatal dalam berbagai situasi seperti contoh berikut ini. Pada kecelakaan pesawat Korean Air Flight 801 (KE801, KAL801) pada 6 Agustus 1997, terekam terjadi miskomunikasi antara petugas bandara dan pilot sekalipun mereka semua berbahasa Inggris dengan baik. Perbedaan latar belakang budaya dalam berbahasa membuat mereka salah tanggap atas 1

2 apa yang mereka maksudkan. Pilot dan Co-Pilot berusaha untuk menyampaikan urgensi di lokasi kejadian, tetapi urgensi itu tidak tersampaikan ke petugas dengan baik, sehingga petugaspun tidak menyadari akan urgensi tersebut. Kesalah-pahaman ini menyebabkan petugas bandara memberi instruksi yang salah, dan menyebabkan pilot dan co-pilot mengambil tindakan yang salah. Pilot dan co-pilot baru menyadari tindakan mereka salah disaat keadaan sudah kritis dan akhirnya pesawatpun mengalami kecelakaan (Gladwell, 2008). Perbedaan semacam ini tentu sulit dihilangkan atau dihindari tetapi mungkin seandainya kita bisa mendeteksi keadaan emosi mereka, tidak sekedar dari kata-kata belaka, kesalah-pahaman bisa diminimalisasi dengan baik, misalnya: apakah mereka sedang dalam keadaan khawatir atau dalam keadaan baik. Manusia memiliki keterbatasan dalam mengartikan sebuah komunikasi. Perbedaan kebudayaan dan adat istiadat menjadi salah satu kendala dalam menerjemahkan emosi manusia. Dalam kisah ini, kesalahpahaman dalam membaca emosi manusia mengakibatkan bahaya yang sangat fatal. Oleh karena itu, butuh adanya deteksi emosi manusia untuk merepresentasikan keadaan sesungguhnya. Dengan kendala-kendala yang ditemukan, beberapa ilmuwan telah melakukan penelitian deteksi tingkat emosi manusia berdasarkan informasi verbal. Salah satu penelitian tersebut dilakukan oleh Kandali A.B., Routray A., dan Basu T.K. (2008) mengenai pendeteksian tingkat emosi dari hasil percakapan suku Assam menggunakan metodegaussian Mixture Model Classifier (GMM) dengan Mel-Frequency Cepstral Coefficient (MFCC)

3 yang menyimpulkan bahwa keadaan terkejut merupakan emosi yang paling sulit untuk diidentifikasi. Kemudian penelitian yang dilakukan oleh Chaniago I. (2014) dengan menggunakan metodediscrete Wavelet Transform (DWT) dengan Linear Predictive Coefficient (LPC) mencapai tingkat akurasi hingga 95%. Hal ini menjadi bukti bahwa kedua metode tersebut dapat digunakan dalam pendeteksian emosi seseorang. Kemudian penelitian yang dilakukan oleh Muda L., Begam M., dan Elamvazuthi I mengenai pembuktian bahwa metodedynamic Time Warping (DTW) dengan Mel-Frequency Cepstral Coefficient (MFCC) dapat digunakan secara efektif dalam pendeteksian suara. Dari beberapa penelitian di atas dapat dilihat bahwa terdapat perbedaan pada hasil akurasi dari masing-masing metode. Hal ini disebabkan karena perbedaan parameter yang digunakan dalam pengujian yang dilakukan seperti sumber data yang berbeda, banyak data yang berbeda, dan banyak iterasi yang berbeda untuk pelatihan pada masingmasing metode, sehingga sulit untuk menentukan metode mana yang lebih baik dalam melakukan penelitian ini. Tabel 1.1 menjelaskan kelebihan dan kekurangan dari tiga macam metode yang telah digunakan peneliti-peneliti yang disebutkan sebelumnya (Magre, Janse, & Deshmukh, 2014). Identifikasi tingkat emosi orang berdasarkan informasi verbal dilakukan dengan menggunakan Mel-Frequency Cepstral Coefficient (MFCC) untuk membantu manusia dalam berkomunikasi tanpa harus mengkhawatirkan adanya perbedaan kultur, aksen dan cara berbahasa.

4 Tabel 1.1 Perbandingan Hasil dari Model Prediksi yang Berbeda. Kelebihan MFCC Mendekati respon sistem manusia lebih dekat daripada sistem lainnya LPC Memberikan pendekatan yang baik untuk saluran vocal spectral envelope DWT Memiliki resolusi waktu yang lebih baik daripada Fourier Transform. Memberikan lokalisasi simultan dalam waktu dan domain frekuensi. Memberikan akurasi pengenalan suara yang lebih tinggi daripada LPC dan MFCC. Kekurangan Kepekaan terhadap kebisingan karena ketergantungannya pada bentuk spektral. Metode ini akan merangkul spektrum seketat mungkin, dan dalam kondisi tertentu akan turun sampai ke tingkat riuh yang tersisa pada saat berada di celah antara dua parsial harmonic Membutuhkan waktu kompresi lebih lama dan biaya yang dibutuhkan lebih tinggi. Metode yang dipilih adalah Mel-Frequency Cepstral Coefficient (MFCC) karena merupakan salah satu metode yang banyak digunakan dalam bidang teknologi percakapan, baik identifikasi pembicara maupun identifikasi percakapan. Metode ini digunakan untuk melakukan ekstraksi fitur, sebuah proses yang mengkonversikan sinyal suara menjadi beberapa parameter. Beberapa keunggulan dari metode ini adalah (Manunggal, 2005): 1) Mampu untuk menangkap karakteristik suara yang sangat penting bagi pengenalan suara, atau dengan kata lain dapat

5 menangkap informasi-informasi penting yang terkandung dalam sinyal suara. 2) Menghasilkan data seminimal mungkin, tanpa menghilangkan informasi-informasi penting yang dikandungnya. 3) Mereplikasi organ pendengaran manusia dalam melakukan persepsi terhadap sinyal suara. 4) Mendekati respon sistem manusia lebih dekat daripada sistem lainnya 5) Biaya yang dibutuhkan rendah Sudah banyak penelitian yang dilakukan untuk mengidentifikasi tingkat emosi orang berdasarkan informasi verbal dalam Bahasa Inggris (Sapra, Panwar, & Panwar, 2013), Jerman (Sathe-Pathak & Panat, 2012), Mandarin (Pao, Chen, Yeh, & Liao, 2005), Assam (Kandali, Routray, & Basu, 2008), Persia (Hamidi & Mansoorizade, 2012), Denmark (Lin & Wei, 2005) dan bahasa-bahasa lainnya. Namun belum ada yang melakukan penelitian untuk mengidentifikasi tingkat emosi orang berdasarkan informasi verbal dalam Bahasa Indonesia; sehingga, penelitian yang akan dilakukan akan menggunakan basis data suara berbahasa Indonesia. 1.2 Perumusan Masalah Apakah fitur yang diperoleh dari informasi verbal dalam Bahasa Indonesia dapat digunakan untuk klasifikasi jenis emosi dengan

6 menggunakan metode MFCC dan SVM? Berapakah tingkat akurasi yang bisa dicapai? 1.3 Tujuan Penelitian Tujuan penelitian ini adalah: Mengklasifikasi tingkat emosi manusia berdasarkan informasi verbal berbahasa Indonesia. Mendapatkan rata-rata tingkat emosi manusia berdasarkan informasi verbal berbahasa Indonesia. 1.4 Manfaat Penelitian Manfaat penelitian ini adalah: Memberikan pengalaman kepada penulis untuk menerapkan dan memperluas wawasan penerapan teori dan pengetahuan yang telah didapat dari riset yang telah dilakukan. Hasil riset ini dapat digunakan untuk mengembangkan sebuah aplikasi yang akan berguna di berbagai bidang dalam melancarkan sebuah pekerjaan karena terjalinnya komunikasi yang baik.

7 1.5 Ruang Lingkup Ruang lingkup penelitian ini adalah sebagai berikut: Riset ini hanya melakukan identifikasi empat jenis emosi seseorang (senang, sedih, marah dan takut) Sampel diambil dari 4 orang aktor (2 orang wanita dan 2 orang pria) untuk masing-masing jenis emosi. Sampel yang digunakan merupakan sampel berbahasa Indonesia.