1.1 Latar Belakang BAB 1 PENDAHULUAN

dokumen-dokumen yang mirip
Pembuatan Text-To-Speech Synthesis System Untuk Penutur Berbahasa Indonesia

BAB I PENDAHULUAN. yang telah digunakan secara luas oleh orang orang di dunia saat ini adalah

BAB I PENDAHULUAN. Cerita Rakyat Jawa Barat merupakan cerita yang bisa dijadikan suri

TEXT TO SPEECH ENGINE GENERIK BAHASA BUGIS WAJO

BAB I PENDAHULUAN. pernah tepat, dan sedikitnya semacam noise terdapat pada data pengukuran.

Konversi dari Teks ke Ucapan

TEXT PRE-PROCESSING PADA TEXT TO SPEECH SYNTHESIS SYSTEM UNTUK PENUTUR BERBAHASA INDONESIA

BAB 1 PENDAHULUAN. untuk bersosialisasi didalam kehidupan sehari-hari dalam kehidupan mereka. Sarana

BAB I PENDAHULUAN. sangat cepat, yang tanpa disadari telah menjadi suatu kebutuhan primer di

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

BAB I PENDAHULUAN. 1.1 Latar Belakang. Banyak kegiatan yang dilakukan dalam kehidupan sehari-hari, secara

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

BAB I PENDAHULUAN. Suara merupakan salah satu media komunikasi yang paling sering dan

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III ANALISIS DAN PERANCANGAN SISTEM

OTOMATISASI SISTEM KEAMANAN KENDARAAN BERMOTOR BERBASIS PENGOLAHAN CITRA PENGENALAN KARAKTER LAPORAN TUGAS AKHIR

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Portabel Text to Speech yang Terintegrasi dengan Telepon Seluler untuk Tunawicara

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB IV HASIL DAN PEMBAHASAN. database dan database query, secara keseluruhan menggunakan cara yang sama.

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

UNIVERSITAS INDONESIA ANALISA PENGGUNAAN VOICEBANK BERFORMAT KVK DALAM APLIKASI SPEECH SYNTHESIZER DAN SINGING SYNTHESIZER BAHASA INDONESIA SKRIPSI

PERANGKAT LUNAK PENGUCAPAN KATA BAHASA INDONESIA BERDASARKAN PEMENGGALAN KATA DENGAN FINITE STATE AUTOMATA

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. kehandalannya. Komputer terus dikembangkan. Komputer dituntut memiliki kecepatan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN I-1

SISTEM AKSES BUKU PERPUSTAKAAN JURUSAN TEKNIK ELEKTRO UNIVERSITAS ANDALAS MENGGUNAKAN APLIKASI PENGENALAN WICARA DENGAN METODA MFCC-VQ dan SSE

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN SIMULASI DAN ANALISIS PEMANTAUAN KAMAR PASIEN RAWAT INAP DENGAN DETEKSI DAN KLASIFIKASI SINYAL AUDIO 1

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Text To Speech Bahasa Indonesia Menggunakan Metode Dhipone Concatenation

BAB 1 PENDAHULUAN. mengkonversikan tulisan / teks ke dalam bentuk ucapan dengan menggunakan

BAB I Pendahuluan 1 BAB I PENDAHULUAN

BAB 2 LANDASAN TEORI

BAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

PENDAHULUAN. Terdapat tiga topik utama di teori otomata yaitu:

APLIKASI KONVERSI TEKS MENJADI SUARA DENGAN MENGGUNAKAN METODE PENGGAL KATA FINITE STATE AUTOMATA (FSA)

BAB I PENDAHULUAN. mendigitalisasi kata yang diucapkan dan mencocokkannya dengan pola yang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

APLIKASI PENERJEMAH BAHASA INDONESIA-REJANG DAN SEBALIKNYA DENGAN KONVERSI TEKS TERJEMAHAN MENJADI SUARA (Studi Kasus SMP 1 Curup Tengah)

BAB 3 METODOLOGI PEMECAHAN MASALAH DAN PERANCANGAN

BAB I PENDAHULUAN. (images), suara (audio), maupun video. Situs web (website) yang kita jumpai

Bab 4. Implementasi Dan Evaluasi

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Seorang muslim harus bisa membaca ayat-ayat Al-Quran dengan baik

BAB I PENDAHULUAN. dalam storage lebih sedikit. Dalam hal ini dirasakan sangat penting. untuk mengurangi penggunaan memori.

PEMBUATAN PERANGKAT BASIS DATA UNTUK SINTESIS UCAPAN (NATURAL SPEECH SYNTHESIS) BERBAHASA INDONESIA BERBASIS HIDDEN MARKOV MODEL (HMM)

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

Suara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur

1. Pendahuluan Latar Belakang

BAB I PENDAHULUAN. yang dikenal sebagai antarmuka pengguna grafis atau Graphical User Interface. yakni ucapan, untuk meningkatkan kemudahannya.

1. BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III ANALISA DAN PERANCANGAN. Aplikasi penterjemahan kata Indonesia-Inggris yang dibuat dalam tulisan

BAB 1 PENDAHULUAN. sesamanya dalam kehidupan sehari hari untuk menunjang kebutuhan hidup mereka.

BAB 1 PENDAHULUAN. dengan proses pengolahan citra digital (digital image processing), dimana data berupa

Aplikasi Pengenalan Suara Dalam Pengaksesan Sistem Informasi Akademik

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Von Neumann

BAB I PENDAHULUAN. jiwa manusia, yang dinyatakan dalam bentuk deretan nada yang diciptakan atau

MODUL II : SPEECH AND AUDIO PROCESSING

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. digunakan untuk mengamankan data ada bermacam-macam. Setiap metode

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Aplikasi Teknik Speech Recognition pada Voice Dial Telephone

Simulasi Sistem Pengacak Sinyal Dengan Metode FFT (Fast Fourier Transform)

BAB I PENDAHULUAN. Tugas Akhir yang berjudul Sistem Penyama Adaptif dengan Algoritma Galat

PEMANFAATAN TEKNOLOGI TEXT-TO-SPEECH SEBAGAI MEDIA PEMBELAJARAN PADA LABORATORIUM BAHASA INGGRIS

Aplikasi Pensintesa Ucapan Bahasa Indonesia Sebagai Pembaca . Makalah Seminar Tugas Akhir

ANALISIS MODEL PROSODI UNTUK KALIMAT TANYA PADA BAHASA INDONESIA Desi Novianti ABSTRAK

PERANCANGAN SISTEM PENGENALAN NADA TUNGGAL KEYBOARD (ORGEN) PADA PC BERBASIS MATLAB

IV. HASIL DAN PEMBAHASAN. a. Ruang Lingkup (Scope) Perangkat Lunak P-ATIS. P-ATIS memproduksi suara dari data-data cuaca terkini yang

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

PERANCANGAN APLIKASI VOICE USER INTERFACE DENGAN MENGGUNAKAN MICROSOFT SPEECH API

BAB I PENDAHULUAN. digunakan untuk mengirim dan menerima informasi. penting dalam suatu organisasi maupun pribadi. Hal ini terkait dengan

BAB III METODE PENELITIAN. jantung pasien penyakit jantung secara elektro-akustik atau PCG

Universitas Bina Nusantara. Jurusan Teknik Informatika Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

KAMUS DIGITAL DENGAR TULIS UCAP BAHASA INDONESIA

BAB 1 PENDAHULUAN. berkaitan dengan pemprosesan sinyal suara. Berbeda dengan speech recognition

BAB 3 METODOLOGI. Metodologi penelitian yang digunakan dalam penulisan ini adalah studi

III. METODE PENELITIAN. Penelitian ini dilaksanakan dari bulan Desember 2008 sampai dengan bulan Mei

BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM. penelitian laboratorium. Studi kepustakaan dilakukan untuk mencari teori atau

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Rancang Bangun Alat Pengendali Elektronik Universal Menggunakan Suara Manusia

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. seperti isyarat dan tulisan. Suara yang dihasilkan oleh setiap orang pada dasarnya

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB 1 PENDAHULUAN. 1.1.Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Transkripsi:

BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang semakin meningkat menimbulkan berbagai macam metode ataupun sistem yang memungkinkan komputer mengubah tulisan menjadi suara atau sebaliknya. Sinyal suara manusia mengandung berbagai macam informasi terutama kata atau pesan dalam bentuk ucapan yang akan disampaikan. Dengan semakin berkembangnya teknologi komputer, dimana salah satunya adalah pemanfaatan komputer untuk dapat memproses suara manusia baik pengucapan maupun intonasi yang dikenal dengan istilah proposodi [10]. Pada dasarnya proposodi ini dikelompokan dalam dua kelompok yaitu pengenalan ucapan atau SR (Speech Recognation) dan pensitesa ucapan atau SS (Speech Synthesis). Teknologi SR adalah bagian komputer yang dapat memproses dan mengenali ucapan bahasa manusia menjadi suatu teks atau tulisan, sedangkan teknologi SS kebalikannya yaitu bagaimana komputer dapat membangkitkan ucapan teks menjadi suara [15]. TTS (Text To speech) merupakan perancangan dari aplikasi VUI (Voice User Interface) yang dikembangkan dari teknologi ASR (Automatic Speech Recognition). ASR adalah suatu perkembangan teknologi dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan komputer untuk mengenali suara manusia. VUI merupakan pengembangan dari GUI (Grafhical User Interface) yang menggunakan visualisasi gambar atau tulisan untuk berkomunikasi antar manusia [2]. Cool edit pro 2 adalah aplikasi perekaman dan pengolahan data atau audio yang berfungsi sebagai kegiatan editing terhadap sebuah gelombang tunggal (single waveforem) [16] yang menggunakan suara rekaman manusia yang bertujuan untuk penyimpanan data dalam database dalam bentuk file wav. Microsoft speech API (SAPI) adalah suatu lapisan perangkat lunak yang digunakan oleh aplikasi pengucapan untuk berkomunikasi dengan speech

recognition (SR) enginer dan TTS enginer [12]. SAPI adalah sistem teks ke ucapan TTS dan pengenalan ucapan Speech Recognition sisitem TTS mensintesis string teks dan file ke dalam audio ucapan menggunakan suara sintetis pengenalan ucapan untuk mengkonveris audio yang diucapkan manusia ke dalam string teks yang dapat dibaca file. Pada prinsipnya sistem pensitesa ucapan terdiri dari dua sub sistem, yaitu bagian konverter teks ke fonem (text to phoneme) dan bagian konverter fonem ke ucapan (phoneme to speech), dimana kedua bagian ini digambarkan oleh gambar 1.1 Gambar 1.1 Prinsip dari Pensintesa Ucapan [1] 1.2 Rumusan Masalah Berdasarkan latar belakang yang telah dikemukakan di atas maka yang menjadi rumusan masalahnya adalah: a. Bagaimana memodelkan teks menjadi suara menggunakan Microsoft Speech API. b. Bagaimana nilai frekuensi pitch dan frekuensi sampling mengunakan rekaman cool edit pro 2 dan menggunakan Microsoft Speech API. c. Bagaimana analisis perbandingan nilai frekuensi pitch dan frekuensi sampling menggunakan rekaman cool edit pro 2 dan Microsoft Speech API. 1.3 Batasan Masalah Pada Tugas Akhir ini masalah akan dibatasi pada: a. Data masukan berupa suara yang direkam dan disimpan dalam database.

b. Tugas Akhir ini mengukur parmeter frekuensi pitch dan frekuensi sampling. c. Teknik perekaman suara dalam bentuk file wav agar dapat diolah oleh komputer. d. Tugas Akhir ini tidak membahas proses pengenalan suara atau pengenalan pola dan proses sintetis suara. e. Tugas Akhir ini tidak membahas algoritma yang digunakan Microsoft speech API. f. Tugas Akhir ini tidak membahas struktur dan jenis database yang digunakan pada matlab R2010a. g. Tugas Akhir ini menggunakan Microsoft speech API yang free. 1.4 Tujuan Tujuan dari Tugas Akhir ini adalah: a. Untuk memodelkan teks menjadi suara menggunakan Microsoft Speech API b. Mengetahui frekuensi pitch dan frekuensi sampling mengunakan rekaman cool edit pro 2 c. Mengetahui frekuensi pitch dan frekuensi sampling menggunakan rekaman cool edit pro 2 dan Microsoft Speech API d. Melakukan analisis perbandingan frekuensi pitch dan frekuensi sampling dari rekaman cool edit pro 2 dan Microsoft speech API (SAPI). 1.5 Posisi Penelitian (State of the Art) Posisi penelitian pada tugas akhir ini ditunjukan pada gambar 1.2 PERANCANGAN APLIKASI VOICE USER INTERFACE DENGAN MENGGUNAKAN MICROSOFT SPEECH API Oleh : Budi Supriyono Jurusan Teknik Elektro Fakutlas Teknik Universitas Diponegoro Semarang 2011 Pengujian yang dilakukan adalah penggunaan memori oleh aplikasi, pengaruh kondisi lingkungan terhadap jalannya aplikasi, pengaruh kualitas microphone pada aplikasi dan tanggapan responden terhadap aplikasi ini.

Analisis Penggunaan Voicebank Berformat KPK dalam Aplikasi Speech Synthesizer Bahasa Indonesia Oleh : Dimas Tribudi Wiriaatmadja Teknik Elektro Universitas Indonesia 2010 Menganalisa penggunaan unsur KVK dalan voicebank. Yang digunakan aplikasi speech synthesizer UTAU untuk membuat ucapan dan nyanyian sintasis dalam bahasa Indonesia. Untuk PENGENALAN POLA INTONASI PROSODI KALIMAT TANYA UNTUK SISTEM PENSINTESA SUARA BAHASA INDONESIA MENGGUNAKAN ARTIFICAL NEURAL NETWORKS Oleh : 1. Suhari, 2. Sri Chusri Hariyanti, 3. Elan Suherlan Fakultas Teknologi Informasi universitas YARSI 2009 Pensintesa ucapan (speech synthesis) merupakan suatu proses dimana suatu komputer mampu membangkitkan suatu bunyi dari suatu kata atau kalimat. Judul Skripsi SIMULASI PERBANDINGAN PERFORMASI PENGOLAHAN TEXT TO SPEECH MENGGUNAKAN COOL EDIT PRO 2 DAN MICROSOFT SPEECH API (SAPI) Pengujian yang dilakukan adalah membandingkan dua rekaman yaitu rekaman cool edit pro 2 dan Microsoft speech API (SAPI) untuk mengetahui frekuansi pitch dan frekuensi sampling. Algoritma Sistem Pembaca Teks Bahasa Indonesia Menggunakan Metode FSA (Finite State Automata) Oleh : Sigit Wasista, Novita Astin Jurusan Teknik elektronika Politeknik Elektronika Negeri Surabaya Institute Teknologi Sepuluh November 2010 Suatu sistem pembaca teks bahasa Indonesia otomatis menggunakan kamera web dimana lebih dikhususkan pada sistem algoritma suatu kata menjadi bagian terkecil yaitu fonem maupun suku kata. Gambar 1.2 Posisi Penelitian (State of the Art)

1.6 Sistematika Penulisan Sistematika penulisan Tugas Akhir ini adalah: BAB I PENDAHULUAN Bab ini terdiri dari latar belakang, rumusan masalah, batasan masalah, tujuan, metodologi p nelitian, serta sistematika penulisan tugas akhir. BAB II DASAR TEORI Bab ini membahas mengenai teori-teori yang berkaitan dengan penyelesaian Tugas Akhir, yaitu pengolahan aplikasi VUI, proses pengenalan ucapan, teknologi-teknologi yang mendasari aplikasi Microsoft speech API dan cool edit. BAB III METODOLOGI PENELITIAN Bab ini berisi tentang metodologi penelitian yang digunakan dalam menyusun tugas akhir. BAB IV PERANCANGAN DAN SIMULASI SISTEM Bab ini membahas mengenai perancangan sistem, meliputi perancangan sistem, perekaman suara, perancangan cool edit dan Microsoft speech API. BAB V HASIL SIMULASI DAN ANALISIS Bab ini menyajikan hasil simulasi dengan menggunakan Matlab dan analisis hasil perbandingan frekuensi pitch dan frekuensi sampling dengan menggunakan rekaman cool edit dan Microsoft speech API.. BAB VI PENUTUP Bab ini yang berisi kesimpulan dan saran untuk pengembangan Tugas Akhir lebih lanjut.