BAB II LANDASAN TEORI

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II LANDASAN TEORI"

Transkripsi

1 BAB II LANDASAN TEORI Bab ini memberikan penjelasan dasar mengenai konsep representasi sinyal ucapan, fonem, karakteristik dan cara kerja sistem pengenalan ucapan berbasis HMM. Juga dijelaskan mengenai HTK sebagai perkakas pembuatan model akustik, Julius sebagai mesin pengenal ucapan, konsep bahasa pemrograman C++, dan pustaka Qt, serta Sistem Operasi GNU/Linux. 2.1 Representasi Sinyal Ucapan Sinyal Ucapan Sinyal ucapan merupakan sinyal yang berubah terhadap waktu dengan kecepatan perubahan yang relatif lambat. Sinyal ucapan memiliki karakteristik yang tetap jika diamati pada rentang waktu yang pendek (antara 5 sampai 100 ms). Namun dalam rentang waktu yang lama (0,2 sekon atau lebih) karakteristiknya terlihat berubah-ubah sesuai bunyi ucapannya [8]. Ada berbagai cara untuk mengklasifikasikan komponen-komponen sinyal ucapan. Salah satu cara yang sederhana adalah dengan mengklasifikasikannya menjadi tiga keadaan yang berbeda, yaitu (1) silence (S), keadaan pada saat tidak ada ucapan yang diucapkan; (2) unvoiced (U), keadaan pada saat pita suara tidak melakukan vibrasi, sehingga suara yang dihasilkan bersifat tidak periodik; (3) voiced (V), keadaan pada saat terjadinya vibrasi pada pita suara, sehingga menghasilkan suara yang bersifat kuasi periodik. 6

2 7 Gambar 2.1 Contoh Sinyal Ucapan It's time. Gambar 2.1 Menunjukkan contoh sinyal ucapan dari ujaran bahasa inggris It's time yang diucapkan seorang pria. Kelima baris bersama pada gambar tersebut memperlihatkan sinyal ucapan sepanjang 500 ms dimana setiap baris memperlihatkan potongan sinyal selama 100 ms. Pada Gambar 2.1 tercantum label-label S, U, dan V yang dapat mempermudah pengamatan perbedaan keadaan. Baris pertama dan awal baris kedua ditandai dengan silence (S) yang merepresentasikan keadaan diam dimana pembicara belum mengucapkan apapun. Amplitudo kecil yang tampak pada periode tersebut merupakan noise latar belakang yang ikut terekam.

3 8 Suatu periode singkat unvoiced (U) tampak mendahului vocal pertama dalam kata It's. Selanjutnya diikuti oleh daerah voiced (V) yang cukup panjang, merepresentasikan vokal i. Berikutnya diikuti oleh daerah unvoiced (U) yang merepresentasikan daerah pelemahan pengucapan i. Setelah itu diikuti oleh silence (S) sebelum pengucapan fonem t pada kata "It's", dan seterusnya. Dari contoh tersebut jelas bahwa segmentasi ucapan menjadi S, U dan V tidak bersifat eksak, artinya ada daerah-daerah yang tidak dapat dikategorikan dengan tegas ke dalam salah satu dari tiga kategori tersebut. Salah satu penyebabnya adalah perubahan dari keadaan-keadaan alat ucap manusia yang tidak bersifat diskrit dari satu keadaan ke keadaan lainnya, sehingga bunyi transisi dari satu segmen ke segmen lainnya menghasilkan bentuk yang tidak mudah ditentukan. Selain itu, ada segmen-segmen ucapan yang mirip atau bahkan mengandung silence didalamnya Fonem Fonem merupakan konsep penting dalam hal representasi ucapan. Fonem adalah unit bunyi terkecil yang dapat dibedakan oleh manusia. Fonem berbeda dengan abjad dimana fonem diklasifikasikan menurut pendengaran manusia. Satu abjad bisa saja memiliki beberapa fonem, atau sebaliknya. Setiap fonem memiliki ciri-ciri yang berbeda. Gambar 2.2 memperlihatkan daftar fonem bahasa Inggris-Amerika dan representasi ARPABET 1 1. ARPABET merupakan kode transkripsi yang dibangun oleh Advanced Research Projects Agency (ARPA) sebagai bagian dari proyek Speech Understanding ( ). ARPABET merepresentasikan tiap fonem Inggris-Amerika dengan urutan karakter ASCII tertentu.

4 9 Tabel 2.1 Daftar Simbol Fonetik untuk Bahasa Inggris-Amerika. Gambar 2.2 Daftar dan Klasifikasi Fonem Bahasa Inggris-Amerika.

5 10 Fonem vokal pada umumnya memiliki durasi yang lebih panjang dibandingkan dengan konsonan, dan spektrum frekuensinya lebih mudah dikenali. Fonem diftong adalah fonem yang bunyinya dimulai dengan vokal, dan berakhir dengan vokal lainnya [8]. Beberapa jenis diftong dalam bahasa Inggris-Amerika adalah /ay/, /oy/, /aw/, dan /ey/. Semivokal adalah fonem-fonem yang bunyinya mirip dengan vokal, namun sebenarnya bukan. Contoh fonem dalam kategori ini adalah /w/, /l/, /r/, dan /y/. Klasifikasi fonem untuk setiap bahasa tidaklah jauh berbeda. Pada bahasa Indonesia terdapat 32 fonem [2] yang terdiri dari /a/, /e/, /E/, /i/, /o/, /u/, /b/, /p/, /d/, /t/, /g/, / k/, /kh/, /j/, /c/, /v/, /f/, /z/, /s/, /sy/, /h/, /r/, /l/, /m/, /n/, /ny/, /ng/, /w/ dan /y/ serta tiga buah diftong, yaitu : /ai/, /au/ dan /ou/. 2.2 Pengenalan Ucapan Pengenalan ucapan merupakan proses penerjemahan sinyal akustik menjadi pesan linguistik. Proses pengenalan ucapan dilakukan oleh komponen perangkat lunak yang disebut sebagai mesin pengenal ucapan. Fungsi utama dari mesin pengenal adalah memproses masukan ucapan dan menerjemahkannya menjadi teks yang dikenali aplikasi. Aplikasi kemudian dapat melakukan salah satu dari dua tindakan berikut: 1. Aplikasi mengartikan hasil dari pengenalan sebagai perintah. Pada kasus ini, aplikasi merupakan aplikasi perintah dan kontrol. Salah satu contohnya adalah saat pengujar mengatakan "matikan komputer", aplikasi akan memberikan perintah kepada sistem untuk mematikan komputer. 2. Jika aplikasi menangani teks ucapan yang dikenali hanya sebagai teks,

6 11 maka ia dianggap sebagai aplikasi diktasi. Pada aplikasi diktasi, jika pengujar mengatakan "matikan komputer", aplikasi tidak akan mengartikan hasil sebagai perintah, tetapi hanya memberikan hasil teks "matikan komputer". Proses pengenalan melibatkan beberapa komponen yang ditunjukkan pada Gambar 2.3 yakni: Gambar 2.3 Pengenal Ucapan. 1. Masukan audio Masukan audio merupakan masukan berupa ucapan dari pengujar dan noise yang dihasilkan pada lingkungan pengenalan. 2. Grammar Grammar menggunakan sintaks tertentu, atau beberapa aturan, untuk mendefinisikan kata dan frasa yang dapat dikenali mesin pengenalan ucapan. Grammar dapat hanya berupa daftar kata-kata, atau dapat juga berupa aturan yang cukup fleksibel sehingga memampukan keragaman kata dan frasa yang dapat diucapkan seperti pada bahasa natural. Grammar

7 12 digunakan untuk memprediksikan kemungkinan urutan-urutan kata yang muncul dalam bahasa. 3. Model akustik Model akustik dibuat dengan mengambil data rekaman ucapan dan transkripsi teksnya yang kemudian digunakan untuk membuat representasi statistikal dari tiap bunyi yang membentuk kata yang terdapat pada data. Model akustik menunjukkan bagaimana sebuah kata atau sebuah fon dilafalkan. 4. Kamus Pelafalan Kamus elektronik dari transkripsi kata yang mengandung pelafalan fonetik dari keseluruhan kosakata yang digunakan pada proses pengenalan ucapan. 5. Teks yang dikenali Keluaran berupa string teks yang didapat dari ucapan yang dikenali oleh mesin pengenalan ucapan. Pada saat masukan audio datang ke mesin pengenal, biasanya ia tidak hanya mengandung ucapan tetapi juga noise latar belakang. Noise ini dapat menginterferensi proses pengenalan, sehingga mesin pengenal harus mengatasi (dan mungkin juga beradaptasi) lingkungan di mana ucapan diujarkan. Dalam melakukan tugasnya, mesin pengenal ucapan menggunakan bermacam data, statistik, dan algoritma perangkat lunak. Tugas pertamanya adalah memproses sinyal audio yang datang dan mengubahnya ke dalam format yang cocok untuk analisis selanjutnya. Setelah data ucapan telah berada dalam format yang tepat, mesin akan mencari kecocokan yang paling baik. Ia melakukan ini

8 13 dengan cara memanfaatkan kata dan frasa yang dikenalnya (grammar), bersamaan dengan pengetahuannya tentang lingkungan di mana ia beroperasi. Pengetahuan tentang lingkungannya disediakan dalam bentuk model akustik. Setelah ia mengidentifikasi kemungkinan kecocokan terbaik dari ucapan, ia akan memberikan hasil pengenalan berupa string teks. Hasil pengenalan dapat berupa salah satu dari keadaan: Penerimaan atau penolakan. Penerimaan dan penolakan ditandai oleh mesin pengenalan ucapan pada tiap pemrosesan ucapan. Ujaran yang diterima akan mengakibatkan mesin memberikan hasil teks yang dikenali. Tidak semua ujaran yang diproses oleh mesin pengenalan diterima. Apapun yang dikatakan pengujar, mesin pengenal ucapan akan berusaha keras untuk mencari kecocokan ujaran dengan kata atau frasa yang ada pada grammar. Terkadang kecocokan yang dihasilkan buruk karena pengujar mengatakan sesuatu di mana aplikasi tidak mengharapkannya, atau pengujar berbicara sayup-sayup. Pada kasus ini, mesin pengenal akan menghasilkan kecocokan yang paling mendekati, yang mungkin tidak tepat. Dari perspektif pengguna, sistem pengenalan ucapan dapat diklasifikasikan oleh kriteria berikut: Apakah sistem dapat digunakan oleh satu orang pengguna (speaker dependent) atau dapat digunakan oleh banyak pengguna (speaker independent) Apakah sistem memerlukan jeda waktu antara pengucapan tiap kata (isolated word recognition) atau dapat mengenali ucapan natural manusia,

9 14 dimana beberapa kata berhubungan dan diartikulasikan secara berkelanjutan (continuous speech recognition) Apakah ukuran dari kosakata yang dapat dikenali kecil (puluhan atau paling banyak ratusan kata) atau besar (ribuan kata). Pada kasus kosakata besar, ketika sistem dapat menerima ucapan yang kontinu, sistem tersebut dinamakan large vocabulary continuous speech recognition (LVSCR). Sistem pengenalan ucapan biasanya dapat dioperasikan dalam dua mode [3]: 1. Mode pelatihan Pada mode ini, sistem dilatih menggunakan sejumlah kata atau kalimat yang memenuhi kriteria tertentu. Setiap contoh kata atau kalimat latih tersebut akan menghasilkan pola tertentu yang akan dipelajari oleh sistem dan disimpan sebagai template atau referensi. 2. Mode produksi atau pengenalan ucapan Pada mode ini, setiap kalimat yang ingin dikenali akan dianalisis polanya lalu dibandingkan dengan template atau referensi. Kata atau kalimat yang diucapkan akan diidentifikasi oleh sistem. Semua sistem pengenalan ucapan memiliki inti yang terdiri dari kumpulan model-model statistik yang merepresentasikan beragam ucapan pada bahasa yang ingin dikenali. Karena ucapan memiliki struktur temporal dan dapat dienkodekan sebagai urutan vektor spektral pada daerah frekuensi audio, maka Hidden Markov Model (HMM) 2 tepat dipakai untuk membangun model-model tersebut [7]. Dalam sistem pengenalan ucapan, satu model HMM mewakili model pengetahuan dari satu fonem tertentu. HMM digunakan untuk memfasilitasi permasa- 2. Penjelasan mengenai HMM dapat dilihat pada Lampiran A.

10 15 lahan proses stokastik yang dideskripsikan dengan fungsi probabilitas yang terbentuk dalam Markov Chain 3. Dalam penggunaan HMM, Markov Chain yang terdapat di dalamnya tidak pernah secara langsung bisa dianalisis atau diamati, oleh karena itu disebut Hidden Markov Model. Komponen utama pada sistem pengenalan ucapan berbasis HMM ditunjukkan pada Gambar 2.4. Gambar 2.4 Arsitektur Sistem Pengenalan. Masukan gelombang audio dari mikrofon dikonversikan menjadi urutan vektor fitur akustik berukuran tetap Y 1:T = y 1,..., y T dengan proses yang disebut ekstraksi fitur. Vektor fitur pada dasarnya adalah representasi parametrik dari sinyal ucapan yang mengandung informasi terpenting dan disimpan dalam bentuk yang kompak. Proses ekstraksi fitur umumnya menggunakan skema encoding yang berdasarkan Mel-Frequency Cepstral Coefficient (MFCC). Pada skema ini digunakan skala non-linier yang disebut sebagai Mel-scale yang memimikkan jangkauan akustik dari pendengaran manusia. Mel-scale dapat diaproksimasi dengan: 3. Penjelasan mengenai Markov Chain dapat dilihat pada Lampiran A.

11 16 Mel f =2595log 10 1 f 700 (2.1) Pada proses ekstraksi yang menggunakan MFCC yang ditunjukkan pada Gambar 2.5, pertama sekali sinyal ditransformasikan ke domain spektral dengan transformasi fourier. Spektrum sinyal ucapan yang didapatkan kemudian dihaluskan dengan mengintegrasikan koefisien spektral dengan bin frekuensi yang disusun dalam Mel-scale. Kemudian kompresi log diterapkan pada keluaran bank filter untuk membuat statistik dari spektrum power ucapan yang diestimasi dalam aproksimasi Gaussian. Discrete cosine transform (DCT) diterapkan pada akhir proses. Gambar 2.5 Proses Ekstraksi Menggunakan MFCC.

12 Setelah ekstraksi fitur, decoder kemudian mencoba untuk mencari urutan kata w 1:L = w 1,...,w L dimana decoder kemungkinan besar telah menghasilkan Y: 17 w=arg max { p w Y } w (2.2) Namun, karena P(w Y) sangat susah untuk dimodelkan secara langsung, maka aturan Bayes digunakan untuk mentransformasikan persamaan 2.2 menjadi masalah pencarian yang ekivalen: w=arg max {P Y w P w } (2.3) w Kemungkinan P(Y w) ditentukan oleh model akustik dan P(w) sebelumnya ditentukan oleh model bahasa. 2.3 Hidden Markov Model Toolkit HTK (Hidden Markov Model Toolkit) merupakan kumpulan dari perkakas pemrograman untuk membuat dan memanipulasi Hidden Markov Model (HMM). HTK dikembangkan oleh Speech Vision and Robotics Group di Cambridge University Engineering Department (CUED) untuk membangun sistem pengenalan ucapan berkosakata besar. Hak untuk menjual HTK diperoleh Entropic Research Laboratory Inc. pada tahun 1993 dan pengembangan penuh HTK ditransfer ke Entropic Cambridge Research Laboratory Ltd. saat didirikan pada tahun Microsoft membeli Entropic pada tahun 1999 dan melisensikan HTK kembali ke CUED pada tahun Microsoft menguasai hak cipta kode HTK, meskipun demikian HTK disediakan bebas untuk tujuan penelitian.

13 Arsitektur perangkat lunak HTK Kebanyakan fungsionalitas HTK dibangun dalam bentuk modul-modul pustaka. Modul-modul ini memastikan setiap perkakas memiliki pengantaraan yang sama ke dunia luar. Modul-modul ini juga menyediakan akses ke fungsi yang umum digunakan. Gambar 2.6 menunjukkan struktur perangkat lunak dari perkakas HTK dan pengantaraan masukan/keluarannya. Gambar 2.6 Arsitektur Perangkat Lunak HTK. Masukan/keluaran dan interaksi dengan sistem operasi diatur oleh modul HShell dan semua manajemen memori diatur oleh HMem. Dukungan matematika disediakan oleh HMath dan operasi pemrosesan sinyal yang dibutuhkan pada analisis ucapan disediakan oleh HSigP. Tiap jenis berkas yang dibutuhkan oleh

14 19 HTK memiliki modul pengantaraan tersendiri. HLabel memberikan pengantaraan untuk berkas label, HLM untuk berkas model bahasa, HNet untuk word network dan lattice, HDict untuk kamus, HVQ untuk VQ (Vector Quantisizer) codebook dan HModel untuk definisi HMM. Masukan dan keluaran ucapan dikontrol oleh HWave pada tingkat waveform dan oleh HParm pada tingkat parameter. Masukan audio langsung didukung oleh HAudio dan interaksi grafis interaktif sederhana disediakan oleh HGraf. HUtil menyediakan fungsionalitas untuk memanipulasi HMM sedangkan HTrain dan HFB menyediakan dukungan untuk perkakas pelatihan HTK. HAdapt memberikan dukungan untuk perkakas adaptasi HTK. HRec mengandung fungsi utama proses pengenalan Toolkit (Perkakas) Perkakas HTK dibagi ke dalam 4 kategori yang berhubungan dengan tiga tahap yang terkait dalam pembangunan pengenalan ucapan yakni: 1. Persiapan data 2. Pelatihan 3. Evaluasi (Pengujian dan analisis) Beragam perkakas HTK dan tahap pemrosesannya ditunjukkan pada Gambar 2.7.

15 20 Gambar 2.7 Tahap-tahap Penggunaan Perkakas HTK [11] Perkakas Persiapan Data Untuk membangun sebuah pengenal ucapan dibutuhkan sejumlah berkas data ucapan dan transkripsinya. Korpus yaitu basis data dari berkas audio dapat digunakan sebagai berkas data. Namun sebelum dapat digunakan, korpus harus dikonversi ke dalam bentuk parametrik yang sesuai dan transkripsinya harus dikonversi ke format yang tepat dan menggunakan label yang diperlukan. HTK menyediakan perkakas HSlab untuk merekam data audio dan menganotasinya secara manual dengan transkripsi yang sesuai. Untuk memparameterisasi audio digunakan HCopy. Secara mendasar, HCopy melakukan operasi penyalinan berkas audio dan mengkonversinya menjadi bentuk

16 21 parametrik yang dibutuhkan disaat proses penyalinan. Selain menyalin keseluruhan berkas, HCopy memperbolehkan ekstraksi dari segmen yang relevan dan penyambungan berkas dengan menentukan parameter konfigurasi yang tepat. Perkakas HList dapat digunakan untuk mengecek isi dari berkas ucapan dan konversi parametrik. Transkripsi biasanya memerlukan persiapan lebih lanjut karena sumber asli transkripsi tidak akan tepat seperti yang dibutuhkan, contohnya, karena perbedaan set fonem yang telah digunakan. HLed dapat digunakan untuk mengkonversi transkripsi menjadi format label HTK. HLed merupakan editor label yang digerakkan oleh script dan dapat menghasilkan keluaran berkas transkripsi ke sebuah berkas label master atau Master Label File (MLF). Perkakas persiapan data lainnya mencakup HLStats, yang dapat mengumpulkan dan menampilkan statistik pada berkas label, dan HQuant yang dapat digunakan untuk membangun sebuah VQ codebook untuk membangun sistem HMM probabilitas diskrit Perkakas Pelatihan Langkah selanjutnya dalam membangun pengenal ucapan adalah mendefinisikan topologi dari tiap HMM pada definisi prototip. HTK memperbolehkan HMM dibangun dengan topologi sembarang. Definisi prototip disimpan sebagai berkas teks dan dapat diedit dengan editor teks sederhana. Definisi prototip hanya ditujukan untuk menentukan karakteristik keseluruhan dan topologi HMM, sedangkan parameter aktual akan dikomputasi oleh perkakas pelatihan.

17 22 Pelatihan HMM berlangsung dalam beberapa tahap, seperti ditunjukkan pada Gambar 2.8. Tahap pertama adalah membangun set inisial model. Jika ada beberapa data pelatihan tersedia di mana batasan fon telah ditranskripsikan, data ini dapat digunakan sebagai bootstrap data. Dalam hal ini, perkakas HInit dan HRest menyediakan pelatihan kata-terisolasi menggunakan bootstrap data. HMM dihasilkan secara individual. HInit membaca semua bootstrap data dan memotong contoh fon yang dibutuhkan, setelah set inisial dari parameter dikomputasi secara iteratif menggunakan prosedur segmental k-means. Gambar 2.8 Proses Pelatihan HMM [11].

18 23 Pada iterasi pertama, data pelatihan disegmentasi secara seragam, setiap keadaan dicocokkan dengan segmen data yang berkaitan dan means dan variance-nya diestimasi. Pada iterasi selanjutnya segmentasi seragam digantikan dengan viterbi alignment. Setelah HInit selesai mengkomputasi nilai-nilai inisial parameter, nilainilai ini dire-estimasi lebih lanjut dengan HRest. HRest juga menggunakan bootstrap data, tetapi prosedur segemental k-means digantikan dengan re-estimasi Baum-Welch. Jika tidak ada bootstrap data tersedia, maka sebuah flat start dapat dibuat. Pada kasus ini, HMM diinisialisasi secara identikal dan memiliki mean dan variance keadaan sama dengan mean dan variance ucapan global. Perkakas HCompV dapat digunakan untuk hal ini. Setelah set inisial model telah dibuat, perkakas HERest digunakan untuk melakukan embedded training menggunakan keseluruhan set pelatihan. HERest melakukan satu re-estimasi Baum-Welch dari keseluruhan set model fon HMM secara simultan. Untuk setiap ujaran, model fon yang berkorespondensi digabungkan dan kemudian algoritma forward-backward digunakan untuk mengumpulkan statistik relevan dari okupasi keadaan, means, variance dan sebagainya untuk tiap HMM pada urutan. Setelah semua data pelatihan telah diproses, statistik yang terakumulasi digunakan untuk re-estimasi parameter HMM. HTK memperbolehkan HMM untuk direfinasi secara inkremental. Pada umumnya, Gaussian tunggal, model context-independent dibuat pertama sekali. HMM ini dapat direfinasi secara iteratif dengan memperluasnya untuk memasukkan context-dependency (contohnya, biphone dan triphone) dan memakai komponen campuran multipel distribusi gaussian. Perkakas HHed dapat digun-

19 24 akan untuk menggandakan model ke dalam set context-dependent dan menaikkan jumlah komponen campuran. Kinerja dari pengujar spesifik dapat diperbaiki dengan mengadaptasi HMM menggunakan sejumlah kecil data adaptasi. Salah satu masalah besar dalam pembuatan HMM context-dependent adalah kekurangan data pelatihan. Semakin kompleks set model, semakin banyak data pelatihan yang diperlukan, sehingga keseimbangan terjebak di antara kompleksitas dan ketersediaan data. Keseimbangan ini dapat dicapai dengan mengikat parameter bersama-sama, yang memperbolehkan data dikumpulkan untuk mengestimasi secara kokoh parameter yang dibagi. HTK juga mendukung campuran terikat dan sistem probabilitas diskrit. Perkakas HSmooth dapat digunakan pada kasus ini untuk mengatasi kekurangan data Perkakas Pengujian Perkakas pengenalan yang disediakan HTK adalah HVite. HVite menggunakan algoritma yang disebut token passing algorithm untuk melakukan pengenalan ucapan berbasis Viterbi. Sebagai masukan, HVite memerlukan word network yang mendeskripsikan urutan kata yang diperbolehkan, kamus yang mendefinisikan bagaimana tiap kata dilafalkan dan set HMM. HVite akan mengubah word network menjadi phone network dan mencantumkan definisi HMM yang tepat pada tiap instance fon, setelah itu pengenalan dapat dilakukan terhadap masukan audio atau pada sebuah daftar berkas ucapan yang disimpan. Word network yang dibutuhkan HVite dapat berupa loop kata sederhana atau sebuah grammar kerja finite-state yang direpresentasikan oleh directed graphs. Pada loop word network sederhana, tiap kata dapat mengikuti kata apapun dan

20 25 probabilitas bigram secara normal dicantumkan ke transisi kata. Berkas network disimpan dalam format standar lattice HTK yang berbasis teks. HTK menyediakan dua perkakas untuk membantu pembangunan network yakni HBuild dan HParse. HBuild memperbolehkan pembuatan sub-network yang dapat digunakan pada network di level yang lebih tinggi dan dapat memfasilitasi generasi loop kata. HParse merupakan perkakas yang dapat mengubah network yang ditulis dengan notasi grammar pada level yang lebih tinggi menjadi format standar lattice HTK. Notasi grammar pada level yang lebih tinggi didasarkan pada Extended Backus Naur Form (EBNF). Perkakas HSGen dapat digunakan untuk melihat contoh jalur yang mungkin dikandung dalam sebuah network. HSGen mengambil network sebagai masukan dan secara acak menjelajahinya lalu menghasilkan keluaran berupa string-string kata. String ini dapat diperiksa untuk memastikan network sesuai dengan spesifikasi rancangannya. Konstruksi kamus yang besar dapat mencakup penggabungan sumber-sumber berbeda dan melakukan transformasi pada sumber-sumber ini. Perkakas HDMan dapat membantu dalam proses ini Perkakas Analisis Analisis kinerja pengenal berbasis HMM biasanya dilakukan dengan mencocokkan keluaran set transkripsi pengenal dengan transkripsi referensi yang tepat. Perkakas HResults dapat digunakan untuk melakukan perbandingan ini. Perkakas ini menggunakan Dynamic Programming untuk menyusun dengan benar distribusi transkripsi dan distiribusi hitung, penghapusan dan penyisipan.

21 Julius [1] Julius merupakan decoder open-source pengenalan ucapan berkinerja tinggi yang digunakan baik pada penelitian akademik maupun aplikasi-aplikasi industri. Julius menggabungkan teknik canggih utama pengenalan ucapan dan dapat melakukan pekerjaan LVCSR secara efektif pada pengolahan real-time dengan jejak memori yang relatif kecil. Julius ditulis dengan bahasa C. Berjalan pada sistem operasi Linux, Windows, Mac OS X, Solaris, dan varian Unix lainnya. Dengan memiliki model bahasa dan model akustik, Julius akan berfungsi sebagai Speech Recognition Engine (SRE) atau mesin pengenalan ucapan sesuai dengan tugas yang diberikan. Gambaran umum dari Julius diilustrasikan pada Gambar 2.9. Julius mendukung pemrosesan berkas audio dan live audio stream. Untuk masukan berkas, Julius mengasumsikan satu ujaran kalimat per berkas masukan. Julius juga mendukung pemenggalan otomatis masukan dengan long pause, dimana deteksi pause akan dikerjakan berdasarkan tingkatan dan zero cross thresholds. Masukan audio melalui stream jaringan juga didukung. Diperlukan model bahasa dan model akustik untuk menjalankan Julius. Model bahasa mencakup kamus pengucapan kata dan batasan sintaksis. Julius mendukung beragam jenis model bahasa: model kata N-gram, rule-base grammar, dan daftar kata sederhana untuk pengenalan kata-terisolasi. Model akustik untuk unit-unit sub-kata harus didefinisikan menurut HMM. Julius mendukung penuh berkas definisi HMM HTK.

22 27 Gambar 2.9 Gambaran Umum Julius Arsitektur Sistem Struktur modul internal Julius ditunjukkan pada Gambar Struktur teratas merupakan Engine Instance yang mengandung semua modul yang dibutuhkan untuk sistem pengenalan, yakni model masukan audio, deteksi suara, ekstraksi fitur, model bahasa, model akustik dan proses pencarian.

23 28 Gambar 2.10 Struktur Internal Julius. AM (Acoustic Model) process instance menangani HMM akustik dan area kerja komputasi akustik. MFCC (Mel-Frequency Cepstral Coefficients) instance dihasilkan dari AM process instance untuk mengekstrak urutan vektor fitur dari masukan gelombang ucapan. LM (Language Model) process instance menangani model bahasa dan area kerja komputasi linguistik. Recognition process instance merupakan proses pengenalan utama yang menggunakan AM process instance dan LM process instance. Modul-modul ini akan diciptakan di Engine instance sesuai dengan parameter konfigurasi yang diberikan. Untuk efisiensi saat melakukan pengenalan multi-model, model dapat dibagikan di antara beberapa instance yang lebih tinggi Algoritma Decoding Julius melakukan pencarian dengan algoritma two-pass forward-backward pada saat decoding. Gambaran umum dari algoritma decoding ini ditunjukkan pada Gambar 2.11.

24 29 Gambar 2.11 Algoritma Decoding. Pada pass pertama, sebuah leksikon berstruktur pohon yang ditetapkan dengan batasan model bahasa diterapkan dengan algoritma pencarian standar frame synchronous beam. Untuk efesiensi decoding, pada pass ini digunakan batasan model bahasa yang tereduksi yang hanya berkenaan dengan koneksi kata ke kata dengan mengabaikan konteks selanjutnya. Batasan aktual bergantung pada jenis model bahasa: saat menggunakan model N-gram, probabilitas bigram akan diaplikasikan pada pass ini. Saat memakai rule-based grammar, batasan pasangan kata yang diekstrak dari grammar yang diberikan akan digunakan. Banyak aproksimasi lain yang diterapkan pada pass pertama ini untuk decoding yang cepat dan handal. Dependensi konteks kata-silang diatasi dengan aproksimasi yang menerapkan model terbaik untuk history terbaik.

25 30 Setelah selesai pass pertama akan dihasilkan sebuah word trellis index yang merupakan set node kata akhir per frame yang bertahan, dengan score-nya dan starting frame-nya. Word trellis index ini digunakan untuk mencari kandidat kata dan score-nya pada pass selanjutnya secara efisien. Tidak seperti word-graph rescoring konvensional, pass kedua dapat melakukan Viterbi scoring yang lebih lebar dan ekspansi kata yang lebih lebar, yang akan memampukan pass ini mengatasi kehilangan akurasi akibat aproksimasi. Pada pass kedua, model bahasa lengkap dan dependensi konteks silang-kata diaplikasikan untuk re-scoring. Pencarian dilakukan dengan arah yang berkebalikan sehingga sentence-dependent Viterbi score yang tepat bisa didapatkan dengan decoding pencarian word-level stack. Masukan ucapan dievaluasi lagi dengan menghubungkannya dengan forward trellis sebagai hasil dari pass pertama. Julius pada dasarnya mengasumsikan satu ujaran kalimat per masukan. Tetapi pada ucapan spontan alami seperti pada perkuliahan atau pertemuan, segmen masukan terkadang tidak tentu dan sering sekali panjang. Untuk mengatasinya, Julius memiliki fungsi untuk melakukan decoding suksesif dengan segmentasi short-pause yakni dengan memotong masukan yang panjang pada saat pengenalan dengan short pause secara otomatis. Ketika short pause dideteksi, Julius mengakhiri pencarian saat ini pada titik tersebut dan memulai kembali pengenalan dari titik tersebut.

26 Pengantaraan Modul Agar dapat bertindak sebagai modul dari sistem pengenalan ucapan, mesin pengenalan perlu memiliki pengantaraan yang sederhana dan mudah dengan modul lainnya. Untuk itu Julius mengadopsi format standar dan umum pada pengantaraan untuk mempertahankan generalitas dan modularitas terhadap model yang beragam. Pengantaraan, masukan ucapan, dan keluaran dari Julius dijelaskan sebagai berikut. A. Model Akustik Julius mendukung HMM monophone dan triphone dengan campuran, keadaankeadaan dan unit fon sembarang. Julius juga dapat menangani model-model campuran terikat dan model-model fonetik campuran terikat. Format berkas model akustik harus dalam bentuk HTK ASCII. Format ini dapat diubah menjadi berkas biner Julius dengan perkakas mkbinhmm untuk pemuatan lebih cepat pada saat start-up. B. Kamus Format kamus pelafalan yang digunakan adalah format umum pada setiap jenis model bahasa yang berdasarkan pada format kamus HTK. Setiap pelafalan harus merupakan urutan sub-kata unit nama seperti yang didefinisikan pada model akustik. Pelafalan lebih dari satu untuk sebuah kata dapat dibuat sebagai sebuah entri terpisah. C. Model Bahasa Julius mendukung pengenalan ucapan berbasis model N-gram, rule-based grammar, dan hanya kamus.

27 32 1. N-gram: Sembarang panjang N-gram didukung. Class N-gram juga didukung, dimana probabilitas kata in-class harus diberikan di kamus bukannya di model bahasa. 2. Rule-based Grammar: Julius dapat melakukan pengenalan berdasarkan grammar tertulis. Format berkasnya dalam bentuk Backus Naur Form (BNF) dimana sintaks category-level penulisan dan entri leksikal perkategori dibuat dalam berkas berbeda. Berkas-berkas ini harus dikompilasi menggunakan script mkdfa.pl menjadi finite state automaton (FSA) dan sebuah kamus pengenalan. Multipel grammar dapat digunakan pada satu waktu. Dalam hal ini, Julius akan mengeluarkan hipotesis terbaik dari antara semua grammar. 3. Pengenalan kata-terisolasi: Julius akan melakukan pengenalan kataterisolasi saat hanya digunakan sebuah kamus tanpa model bahasa. Karena pengenalan tidak memerlukan aproksimasi antar kata maka pengenalan akan berakhir pada pass pertama. Model bahasa atau grammar pengenalan ucapan pada Julius dipisahkan ke dalam dua berkas: 1. Berkas ".grammar" yang mendefinisikan kumpulan aturan kata yang dapat diantisipasi oleh mesin pengenalan ucapan; daripada mendaftarkan semua kata di berkas.grammar, berkas grammar Julius menggunakan "Kategori Kata" yang merupakan nama dari daftar kata-kata yang ingin dikenali (yang didefinisikan pada berkas ".voca" yang terpisah).

28 33 2. Berkas ".voca" yang mendefinisikan "Kandidat Kata" yang sebenarnya di tiap kategori kata dan informasi pelafalannya (fonem yang membentuk informasi pelafalan ini harus sama dengan yang digunakan pada pelatihan model akustik). D. Masukan/Keluaran Julius mendukung masukan suara berupa berkas waveform (16 bit PCM) atau berkas vektor pola (format HTK) dan masukan live mikrofon. Decoding pada pass pertama dilakukan secara paralel dengan masukan ucapan. Julius memulai pemrosesan segera setelah segmen masukan dimulai, saat pause panjang dideteksi, Julius akan mengakhiri pass pertama dan melanjutkan pass kedua. Karena pass kedua diselesaikan dalam waktu singkat maka keterlambatan keluaran hasil pengenalan sangat kecil. Keluaran merupakan hasil pengenalan dalam bentuk urutan kata. Hasil N-best dapat menjadi keluaran. Urutan fonem, log kemungkinan score dan beberapa statistik pencarian juga dapat dihasilkan. Hasil parsial dapat juga muncul secara suksesif sebagai keluaran disaat proses pass pertama meskipun hasil akhir belum dapat dipastikan hingga pass kedua berakhir. 2.5 Bahasa Pemrograman C++ C++ adalah salah satu bahasa pemrograman komputer yang bersifat statically typed, bebas-bentuk, multi paradigma, kompilasi, dan general purpose. Dianggap sebagai bahasa pemrograman tingkat menengah karena mencakup gabungan dari bahasa tingkat tinggi dan bahasa tingkat rendah. Awalnya dikembangkan oleh Bjarne Stroustrup pada tahun 1979 pada Bell Labs sebagai perbaikan pada bahasa

29 34 pemrograman C, yang dinamakan C dengan Kelas-kelas. Kemudian pada tahun 1983 dinamakan sebagai C++. C++ banyak digunakan pada industri perangkat lunak. Beberapa bidang aplikasinya mencakup perangkat lunak sistem, perangkat lunak aplikasi, driver peranti, perangkat lunak sistem tertanam, aplikasi client dan server berkinerja tinggi, dan perangkat lunak hiburan seperti video game. C++ memperbaiki sebagian besar fitur dari C dan memberikan kemampuan pemrograman berbasis objek atau object-oriented-programming (OOP) sehingga memberikan peningkatan produktivitas perangkat lunak, kualitas, dan reusability. Pada pemrograman berbasis objek, data (atribut) dan fungsi (behaviour) dienkapsulasi ke dalam paket yang disebut kelas-kelas dimana data dan fungsi sebuah kelas sangat berhubungan erat. Sebuah kelas seperti sebuah cetak biru. Dari sebuah cetak biru, perancang dapat membangun sebuah rumah. Dari sebuah kelas, programmer dapat membuat sebuah objek. Sebuah cetak biru dapat digunakan berulang kali untuk membuat banyak rumah. Sebuah kelas dapat digunakan berulang kali untuk membuat banyak objek dari kelas yang sama. Kelas-kelas memiliki properti penyembunyian data. Ini berarti, meskipun objek kelas dapat berkomunikasi dengan kelas lain melalui pengantaraan yang telah ditentukan, kelas-kelas normalnya tidak diperbolehkan untuk mengetahui bagaimana kelas lain dimplementasikan karena detail implementasinya disembunyikan dari kelas itu sendiri. Programmer C++ berkonsentrasi pada pembuatan tipe user-defined yang disebut kelas. Kelas juga disebut sebagai tipe programmer-defined. Setiap kelas

30 35 mengandung data dan kumpulan dari fungsi untuk memanipulasi data. Komponen data dari sebuah kelas disebut data member. Komponen fungsi dari sebuah kelas disebut member function atau method. Instance dari sebuah tipe built-in seperti int disebut sebagai variabel, dan instance dari sebuah tipe user-defined (yakni kelas) disebut sebagai sebuah objek. C++ lebih berfokus kepada kelas-kelas dibanding fungsi. 2.6 Pustaka Qt [5] Pustaka Qt merupakan framework pengembangan aplikasi cross-platform yang banyak digunakan dalam pengembangan program Graphical User Interface (GUI), dikenal sebagai perkakas widget toolkit, dan juga digunakan dalam mengembangkan program non-gui seperti perangkat konsol dan server. Diproduksi oleh divisi Pengembangan framework Qt milik Nokia. Qt menggunakan standar C++, tetapi memanfaatkan penggunaan C preprocessor secara ekstensif untuk memperkaya bahasa pemrograman tersebut. Qt dapat juga digunakan dalam beberapa bahasa pemrograman lainnya melalui binding bahasa pemrograman. Dapat berjalan pada semua platform utama, dan memiliki dukungan internasionalisasi yang luas. Fitur non-gui mencakup akses basis data SQL, parsing XML, manajemen thread, dukungan jaringan dan satu kesatuan API cross-platform untuk penanganan berkas. 2.7 Sistem Operasi GNU/Linux Sistem operasi GNU/Linux merupakan kumpulan program dasar dan utilitas yang membuat komputer dapat bekerja yang menggunakan kernel (inti dari sistem

31 36 operasi) Linux dan perkakas dari GNU Project. Kernel Linux mulanya ditulis oleh Linus Torvalds pada tahun GNU Project dimulai pada tahun 1983 oleh Richard Stallman, memiliki tujuan untuk membuat "Sistem perangkat lunak Unixcompatible lengkap" yang keseluruhannya dibentuk dari Free Software. Proyek ini mulai dikerjakan tahun Kemudian, pada tahun 1985, Stallman memulai Free Software Foundation dan menulis GNU General Public License (GNU GPL) pada tahun Pada tahun 1990, sejumlah besar program yang dibutuhkan dalam sebuah sistem operasi (seperti pustaka, kompiler, editor teks, shell Unix, dan sistem windowing) telah selesai dikembangan namun elemen-elemen tingkatrendah seperti device driver, daemon, dan kernel berhenti perkembangannya dan belum lengkap. Disinilah kernel Linux mengisi kekosongan kernel yang dimiliki oleh GNU Project sehingga Linux menjadi kernel dari GNU Project ini. Gabungan GNU Project dan kernel Linux disebut sebagai GNU/Linux oleh Free Software Foundation. GNU/Linux dapat dipasang pada banyak jenis perangkat keras komputer, mulai dari telepon genggam, komputer tablet, konsol video game, hingga mainframe dan superkomputer. Pengembangan GNU/Linux dilakukan dengan kolaborasi Free and Open Source Software (FOSS) dimana biasanya semua kode sumbernya dapat digunakan, bebas dimodifikasi, dan distribusikan, baik secara komersial maupun nonkomersial, oleh siapa saja dengan lisensi seperti GNU General Public License (GNU GPL). GNU/Linux biasanya dipaketkan ke dalam bentuk yang dikenal sebagai distribusi GNU/Linux atau umumnya dikenal dengan istilah distro

32 37 GNU/Linux. Distribusi ini mencakup kernel Linux dan semua perangkat lunak pendukung yang dibutuhkan untuk menjalankan sistem operasi yang lengkap seperti utilitas, pustaka, Sistem X Window, dan perkakas sistem user space serta pustaka utama yang mendukung yang berasal dari GNU Project. Perbedaan utama antara GNU/Linux dengan sistem operasi kontemporer populer lainnya adalah bahwa kernel Linux dan komponen lainnya merupakan perangkat lunak gratis dan berkode sumber terbuka (FOSS) dan sebagian besar berlisensi GNU GPL. Sedangkan kelebihan GNU/Linux terhadap sistem operasi lainnya adalah keamanan yang tinggi, reliabilitas, harga yang rendah, dan kebebasan dari vendor lock-in.

BAB I PENDAHULUAN. yang dikenal sebagai antarmuka pengguna grafis atau Graphical User Interface. yakni ucapan, untuk meningkatkan kemudahannya.

BAB I PENDAHULUAN. yang dikenal sebagai antarmuka pengguna grafis atau Graphical User Interface. yakni ucapan, untuk meningkatkan kemudahannya. BAB I PENDAHULUAN 1.1 Latar Belakang Pada kebanyakan sistem operasi komputer kontemporer telah disediakan pengantaraan grafis untuk mempermudah interaksi antar pengguna dan komputer yang dikenal sebagai

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Pengenalan lafal manusia agar dapat dilakukan oleh sebuah mesin telah menjadi fokus dari berbagai riset selama lebih dari empat dekade. Ide dasar yang sederhana

Lebih terperinci

IMPLEMENTASI PENDIKTEAN BAHASA INDONESIA. Hari Bagus Firdaus dan Ayu Purwarianti

IMPLEMENTASI PENDIKTEAN BAHASA INDONESIA. Hari Bagus Firdaus dan Ayu Purwarianti IMPLEMENTASI PENDIKTEAN BAHASA INDONESIA Hari Bagus Firdaus dan Ayu Purwarianti Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung, Jalan Ganesha 10, Bandung, 40132, Indonesia E-mail: hari.firdaus@gmail.com

Lebih terperinci

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI 3.1. Analisa Sistem 3.1.1. Sejarah Umum Perusahaan Binus Learning Community adalah komunitas belajar binus yang berada dibawah sub unit mentoring Student

Lebih terperinci

1. BAB I PENDAHULUAN 1.1. Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang 1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat

Lebih terperinci

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

Frekuensi Dominan Dalam Vokal Bahasa Indonesia Frekuensi Dominan Dalam Vokal Bahasa Indonesia Tjong Wan Sen #1 # Fakultas Komputer, Universitas Presiden Jln. Ki Hajar Dewantara, Jababeka, Cikarang 1 wansen@president.ac.id Abstract Pengenalan ucapan

Lebih terperinci

Proses Pembentukan dan Karakteristik Sinyal Ucapan

Proses Pembentukan dan Karakteristik Sinyal Ucapan Proses Pembentukan dan Karakteristik Sinyal Ucapan (Pertemuan ke-3) Disampaikan oleh: Dr. R. Rizal Isnanto, S.T., M.M., M.T. Program Studi Sistem Komputer Universitas Diponegoro 1. Sistem Pembentukan Ucapan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI 2.1 Kata baku dan tidak baku Bahasa Indonesia Kata merupakan bentuk yang sangat kompleks yang tersusun atas beberapa unsur. Kata dalam bahasa Indonesia terdiri atas satu suku kata

Lebih terperinci

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari BAB I PENDAHULUAN I.1. Latar Belakang Masalah Proses pengenalan kata merupakan salah satu fungsi dari voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker

Lebih terperinci

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang BAB 1 PENDAHULUAN 1.1 Latar Belakang Kecerdasan buatan (artificial intelligence) merupakan bidang yang berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang mengarah kepada bidang

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Suara Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Indonesia

BAB 1 PENDAHULUAN. Universitas Indonesia BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai

Lebih terperinci

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis

Lebih terperinci

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian BAB IV IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian Penelitian ini dilakukan dengan menggunakan satu set komputer dengan prosesor berkecepatan 1,18 GHz,

Lebih terperinci

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk 6 BAB 2 LANDASAN TEORI 2.1 Teori-teori Dasar / Umum Landasan teori dasar / umum yang digunakan dalam penelitian ini mencakup teori speaker recognition dan program Matlab. 2.1.1 Speaker Recognition Pada

Lebih terperinci

Proses Pembentukan dan Karakteristik Sinyal Ucapan

Proses Pembentukan dan Karakteristik Sinyal Ucapan Proses Pembentukan dan Karakteristik Sinyal Ucapan Oleh : Arry Akhmad Arman Dosen dan Peneliti di Departemen Teknik Elektro ITB email : aa@lss.ee.itb.ac.id, aa_arman@rocketmail.com 2.5.1 Sistem Pembentukan

Lebih terperinci

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Bima Laksmana Pramudita (13511042) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,

Lebih terperinci

BAB 1 PENDAHULUAN. tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai

BAB 1 PENDAHULUAN. tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Komputer adalah sebuah alat/mesin yang membantu kita untuk menyelesaikan tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai penghibur

Lebih terperinci

Cover Daftar isi Latar belakang Rumusan masalah Batasan masalah Tujuan Uml (Unified modelling language) Use case diagram Class diagram Activity

Cover Daftar isi Latar belakang Rumusan masalah Batasan masalah Tujuan Uml (Unified modelling language) Use case diagram Class diagram Activity SEMINAR PENDADARAN SKRIPSI APLIKASI ADMINISTRASI PENDIDIKAN ANAK USIA DINI (PAUD) AISYIYAH SUMBEREJO KLATEN SELATAN BERBASIS JAVA OLEH KRIS MAWARDI / 12080572 DAFTAR ISI Cover Daftar isi Latar belakang

Lebih terperinci

BAB 3 PERANCANGAN SISTEM. yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk

BAB 3 PERANCANGAN SISTEM. yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk BAB 3 PERANCANGAN SISTEM 3.1 Gambaran Umum Sistem Voice Command pada demonstrasinya merupakan aplikasi pengenalan suara yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk menampung

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 1.1 Tinjauan studi Penelitian yang sudah ada sebelumnya, yaitu : 1. Nur Afifah (2010), Pembuatan Kamus Elektronik Kalimat Bahasa Indonesia dan Bahasa Jawa untuk Aplikasi Mobile

Lebih terperinci

BAB 3 PERANCANGAN SISTEM

BAB 3 PERANCANGAN SISTEM 20 BAB 3 PERANCANGAN SISTEM 3.1 Rancangan Perangkat Keras Sistem ini hanya menggunakan beberapa perangkat keras yang umum digunakan, seperti mikrofon, speaker (alat pengeras suara), dan seperangkat komputer

Lebih terperinci

PEMBUATAN PERANGKAT BASIS DATA UNTUK SINTESIS UCAPAN (NATURAL SPEECH SYNTHESIS) BERBAHASA INDONESIA BERBASIS HIDDEN MARKOV MODEL (HMM)

PEMBUATAN PERANGKAT BASIS DATA UNTUK SINTESIS UCAPAN (NATURAL SPEECH SYNTHESIS) BERBAHASA INDONESIA BERBASIS HIDDEN MARKOV MODEL (HMM) PEMBUATAN PERANGKAT BASIS DATA UNTUK SINTESIS UCAPAN (NATURAL SPEECH SYNTHESIS) BERBAHASA INDONESIA BERBASIS HIDDEN MARKOV MODEL (HMM) Oleh: ELOK ANGGRAYNI NRP. 2409 100 092 Dosen Pembimbing: Prof. Dr.

Lebih terperinci

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK Ade Fruandta dan Agus Buono Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor Jl. Meranti

Lebih terperinci

MODUL II : SPEECH AND AUDIO PROCESSING

MODUL II : SPEECH AND AUDIO PROCESSING MODUL II : SPEECH AND AUDIO PROCESSING TUJUAN 1. Memahami karakteristik sinyal suara dan audio 2. Mampu melakukan pengolahan terhadap sinyal suara dan audio 3. Mampu menggunakan tool untuk pengolahan sinyal

Lebih terperinci

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.3 Desember 2015 Page 7422 IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX IMPLEMENTATION

Lebih terperinci

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO

IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO IDENTIFIKASI TUTUR DENGAN METODE KUANTISASI VEKTOR LINDE - BUZO - GRAY TUGAS AKHIR OLEH: YOHANES AGUNG SANTOSO PRANOTO 02.50.0020 PROGRAM STUDI TEKNIK ELEKTRO FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS KATOLIK

Lebih terperinci

1. PENDAHULUAN 1.1. Latar Belakang Masalah

1. PENDAHULUAN 1.1. Latar Belakang Masalah 1. PENDAHULUAN 1.1. Latar Belakang Masalah Kompresi data merupakan suatu proses pengubahan ukuran suatu file atau dokumen menjadi lebih kecil secara ukuran. Berkembangnya teknologi hardware dan software

Lebih terperinci

Penyusunan Kamus Fonetik dalam Pengembangan Sistem Pengenalan Suara Otomatis untuk Bahasa Indonesia

Penyusunan Kamus Fonetik dalam Pengembangan Sistem Pengenalan Suara Otomatis untuk Bahasa Indonesia Penyusunan Kamus Fonetik dalam Pengembangan Sistem Pengenalan Suara Otomatis untuk Bahasa Indonesia Skripsi Amalia Zahra 120400702X Fakultas Ilmu Komputer Depok Juli 2008 HALAMAN PERNYATAAN ORISINALITAS

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan

BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan BAB I PENDAHULUAN 1.1 Latar Belakang Suara adalah merupakan gabungan berbagai sinyal, tetapi suara murni secara teoritis dapat dijelaskan dengan kecepatan osilasi atau frekuensi yang diukur dalam Hertz

Lebih terperinci

Kategori Free dan Non-Free Software. Andi Susilo,

Kategori Free dan Non-Free Software. Andi Susilo, 1 Kategori Free dan Non-Free Software Jakarta, 18 Januari 2003 Andi Susilo, E-mail: andi.susilo@mail.com + = GNU/Linux System Linux GNU System Gambar 1 Linux adalah kernel, saat ditambahkan dengan sistem

Lebih terperinci

BAB II. KAJIAN PUSTAKA

BAB II. KAJIAN PUSTAKA BAB II. KAJIAN PUSTAKA A. MYSQL MySQL merupakan sistem basis dataopen source paling populer. MySQL adalah sebuah implementasi dari sistem manajemen basis data relasional (Relational Database Management

Lebih terperinci

DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti

DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA Aswin Juari dan Ayu Purwarianti Teknik Informatika, Institut Teknologi Bandung, Bandung, Indonesia aswin_tsy@yahoo.com, ayu@stei.itb.ac.id

Lebih terperinci

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar. BAB II DASAR TEORI 2.1 Suara (Speaker) Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan amplitudo tertentu melalui media perantara yang dihantarkannya seperti media air, udara maupun

Lebih terperinci

APLIKASI BERBASIS WEB

APLIKASI BERBASIS WEB Pendahuluan Komputer sejak diluncurkan pertama kali dengan bobot yang cukup berat hingga hingga saat ini dengan produk notebook yang sangat ringan dan dapat di bawa kemana-mana, berbagai macam aplikasi

Lebih terperinci

DIALOG DESAIN. 2. Sintaksis - Yaitu urutan dan struktur dari input dan output. - Pada bahasa manusia, ekuivalen dengan grammar suatu kalimat.

DIALOG DESAIN. 2. Sintaksis - Yaitu urutan dan struktur dari input dan output. - Pada bahasa manusia, ekuivalen dengan grammar suatu kalimat. DIALOG DESAIN Dialog dalam arti umum adalah percakapan antara dua kelompok atau lebih. Sedangkan dialog dalam konteks perencanaan user interface adalah struktur dari percakapan antara user dan sistem komputer.

Lebih terperinci

Rancang Bangun Modul Pengenalan Suara Menggunakan Teknologi Kinect

Rancang Bangun Modul Pengenalan Suara Menggunakan Teknologi Kinect JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) 1 Rancang Bangun Modul Pengenalan Suara Menggunakan Teknologi Kinect Ratri Cahyarini, Umi Laili Yuhana, dan Abdul Munif Teknik

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA 1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat

Lebih terperinci

Studi Dan Implementasi Steganografi Pada Video Digital Di Mobile Phone Dengan DCT Modification

Studi Dan Implementasi Steganografi Pada Video Digital Di Mobile Phone Dengan DCT Modification Studi Dan Implementasi Steganografi Pada Video Digital Di Mobile Phone Dengan DCT Modification Paul Gunawan Hariyanto (13504023) Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi

Lebih terperinci

AP2B-Dini Triasanti KONSEP DASAR PYTHON

AP2B-Dini Triasanti KONSEP DASAR PYTHON KONSEP DASAR PYTHON Pada awalnya, motivasi pembuatan bahasa pemrograman ini adalah untuk bahasa skrip tingkat tinggi pada sistem operasi terdistribusi Amoeba. Bahasa pemrograman ini menjadi umum digunakan

Lebih terperinci

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI. Tujuan Tujuan dari penelitian ini adalah untuk mengidentifikasi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1. Sistem Informasi Sistem informasi adalah sekumpulan elemen yang saling bekerja sama baik secara manual atau berbasis komputer yang didalamnya ada pengumpulan, pengolahan, pemprosesan

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre

Lebih terperinci

SISTEM OPERASI LINUX

SISTEM OPERASI LINUX SISTEM OPERASI LINUX Linux adalah sistem operasi seperti Unix, yang merupakan implementasi independen dari POSIX, meliputi true multitasking, virtual memory, shared libraries, demand-loading, proper memory

Lebih terperinci

IMPLEMENTASI DAN PENGUJIAN

IMPLEMENTASI DAN PENGUJIAN BAB V IMPLEMENTASI DAN PENGUJIAN Bab ini merupakan pembahasan mengenai implementasi perangkat lunak untuk menerapkan dynamic folksonomy dan pengujian terhadap perangkat lunak yang telah diimplementasikan.

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Manusia dianugrahi oleh Tuhan dua telinga yang memiliki fungsi untuk menangkap sinyal-sinyal suara. Namun untuk mengoptimalkan dari fungsi telinga tersebut manusia harus belajar

Lebih terperinci

VISUALISASI KINERJA PENGKODEAN MENGGUNAKAN ALGORITMA VITERBI

VISUALISASI KINERJA PENGKODEAN MENGGUNAKAN ALGORITMA VITERBI VISUALISASI KINERJA PENGKODEAN MENGGUNAKAN ALGORITMA VITERBI Aslam mahyadi 1, Arifin,MT 1 Politeknik Elektronika Negeri Surabaya, Jurusan Teknik Telekomunikasi Kampus ITS, Surabaya 60111 e-mail : meaninglife@yahoo.com

Lebih terperinci

BAB 2 LANDASAN TEORI. Istilah komputer ( computer ) berasal dari bahasa latin computere yang berarti

BAB 2 LANDASAN TEORI. Istilah komputer ( computer ) berasal dari bahasa latin computere yang berarti BAB 2 LANDASAN TEORI 2.1 Pengertian Komputer Istilah komputer ( computer ) berasal dari bahasa latin computere yang berarti menghitung. Dalam bahasa Inggris berasal dari kata computer yang artinya menghitung.

Lebih terperinci

BAB 1 PENDAHULUAN. perubahan kultur kita sehari-hari. Dalam era yang disebut information age ini, media

BAB 1 PENDAHULUAN. perubahan kultur kita sehari-hari. Dalam era yang disebut information age ini, media BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi telekomunikasi dan komputer menyebabkan terjadinya perubahan kultur kita sehari-hari. Dalam era yang disebut information age ini, media elektronik

Lebih terperinci

BAB I PENGANTAR LINUX

BAB I PENGANTAR LINUX BAB I PENGANTAR LINUX 1.1. Apakah LINUX itu LINUX adalah nama sistem operasi yang dapat diterapkan pada berbagai jenis mesin, dari PC hingga mainframe. Linux diciptakan oleh Linus Torvard. Sistem operasi

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Sistem Operasi adalah sebuah perangkat lunak (software) yang berfungsi

BAB II TINJAUAN PUSTAKA. Sistem Operasi adalah sebuah perangkat lunak (software) yang berfungsi BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1 Sistem Operasi Sistem Operasi adalah sebuah perangkat lunak (software) yang berfungsi untuk mengalokasikan sumber daya untuk proses. Menurut Stalling (2005)

Lebih terperinci

Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition

Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition Abstrak Angela Irfani 1, Ratih Amelia 2, Dyah Saptanti P 3 Laboratorium Ilmu dan Rekayasa Komputasi Departemen Teknik

Lebih terperinci

BAB 1 PENDAHULUAN. perusahaan yang serupa menggunakan sistem pelayanan bisinis secara online.

BAB 1 PENDAHULUAN. perusahaan yang serupa menggunakan sistem pelayanan bisinis secara online. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Perkembangan teknologi dibidang informasi mendorong setiap instansi atau perusahaan untuk tetap mengikuti perkembangannya, terutama berkenaan dengan perkembangan

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

JENIS PERANGKAT LUNAK

JENIS PERANGKAT LUNAK Dari perkembangan perangkat lunak, kita bisa membayangkan bagaimana perkembangan interaksi manusia dengan perangkat lunak. Bentuk paling primitif dari perangkat lunak, menggunakan aljabar Boolean, yang

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1 Disleksia Disleksia adalah ketidakmampuan bahasa, yang berpengaruh dalam hal membaca, menulis, berbicara dan mendengarkan. Ini adalah disfungsi atau gangguan dalam penggunaan

Lebih terperinci

Suara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur

Suara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur PEMBENTUKAN BASIS DATA UCAPAN DALAM BAHASA INDONESIA DAN PENGKODEANNYA BERDASARKAN LINEAR PREDICTIVE CODING (LPC) Elly Oktarina zonalee_cho@yahoo.com Universitas Gunadarma Jl. Margonda Raya No. 100 Pondok

Lebih terperinci

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows 1 Muhammad Anggia Muchtar, 2 Raisha Ariani Sirait, 3 Romi Fadillah Rahmat 1,2,3 Program Studi S1 Teknologi Informasi

Lebih terperinci

BAB II LANDASAN TEORI Konsep Dasar Membangun Aplikasi Berbasis Web

BAB II LANDASAN TEORI Konsep Dasar Membangun Aplikasi Berbasis Web BAB II LANDASAN TEORI 2.1. Konsep Dasar Membangun Aplikasi Berbasis Web Aplikasi berbasis web adalah aplikasi yang dijalankan melalui browser dan diakses melalui jaringan komputer. Aplikasi berbasis web

Lebih terperinci

BAB 2 LANDASAN TEORI. Istilah komputer (computer) berasal dari bahasa latin computere yang berarti

BAB 2 LANDASAN TEORI. Istilah komputer (computer) berasal dari bahasa latin computere yang berarti BAB 2 LANDASAN TEORI 2.1 Pengertian Komputer Istilah komputer (computer) berasal dari bahasa latin computere yang berarti menghitung. Dalam bahasa Inggris komputer berasal dari kata to compute yang artinya

Lebih terperinci

APLIKASI PENGENALAN SUARA MENGGUNAKAN MICROSOFT SAPI SEBAGAI PENGENDALI PERALATAN ELEKTRONIK

APLIKASI PENGENALAN SUARA MENGGUNAKAN MICROSOFT SAPI SEBAGAI PENGENDALI PERALATAN ELEKTRONIK APLIKASI PENGENALAN SUARA MENGGUNAKAN MICROSOFT SAPI SEBAGAI PENGENDALI PERALATAN ELEKTRONIK Sukarso 1, Abdusy Syarif 2 Teknik Informatika, Universitas Mercu Buana, Jakarta e-mail: 1 sukarso@gmail.com,

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK BAB I PERSYARATAN PRODUK Dengan berkembangannya bahasa pemrograman sekarang ini, maka dibutuhkan editor bahasa pemrograman yang dapat memberikan solusi lengkap untuk penggunanya. Beberapa tahun yang lalu,

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antarmanusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, Jepang, dan sebagainya. Bahasa

Lebih terperinci

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 UNIVERSITAS BINA NUSANTARA Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007 SPEAKER IDENTIFICATION DENGAN MENGGUNAKAN TRANSFORMASI WAVELET DISKRIT DAN JARINGAN SARAF

Lebih terperinci

BAB 2 LANDASAN TEORI. Data adalah fakta atau bagian dari fakta yang digambarkan dengan simbol-simbol,

BAB 2 LANDASAN TEORI. Data adalah fakta atau bagian dari fakta yang digambarkan dengan simbol-simbol, BAB 2 LANDASAN TEORI 2.1 Data dan Informasi Data adalah fakta atau bagian dari fakta yang digambarkan dengan simbol-simbol, gambar-gambar, nilai-nilai, bilangan-bilangan, uraian karakter yang mempunyai

Lebih terperinci

BAB 1 PENDAHULUAN. diinginkan. Dengan banyaknya penjual ikan secara konvensional untung yang

BAB 1 PENDAHULUAN. diinginkan. Dengan banyaknya penjual ikan secara konvensional untung yang BAB 1 PENDAHULUAN 1.1 Latar Belakang Melihat banyaknya bidang usaha ikan secara konvensional saat ini maka tidak mudah bagi penjual yang menjual ikannya untuk mendapatkan hasil yang diinginkan. Dengan

Lebih terperinci

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah BAB III METODOLOGI Dalam penelitian ini metodologi memegang peranan penting guna mendapatkan data yang obyektik, valid dan selanjutnya digunakan untuk memecahkan permasalahan yang telah dirumuskan. Maka

Lebih terperinci

Konsep I/O Programming

Konsep I/O Programming Pertemuan 4 Algoritma dan Pemrograman 2A Jurusan Sistem Komputer Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Gunadarma 2015 Review Konsep Pemrograman dengan Delphi dengan Delphi Pembuatan

Lebih terperinci

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 29-37 ISSN: 2089-6026 Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI Bab ini berisi analisis pengembangan program aplikasi pengenalan karakter mandarin, meliputi analisis kebutuhan sistem, gambaran umum program aplikasi yang

Lebih terperinci

PENGGUNAAN KEMBALI (REUSE) PERANGKAT LUNAK

PENGGUNAAN KEMBALI (REUSE) PERANGKAT LUNAK PENGGUNAAN KEMBALI (REUSE) PERANGKAT LUNAK I.MASALAH-MASALAH MANAJEMEN A. KENDALA UNTUK REUSE 1. Beberapa perusahaan dan organisasi memiliki sesuatu yang sangat mirip dengan rencana reusabilitas per.lunak

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN 4.1. Pengujian Perangkat Lunak Dalam mengetahui perangkat lunak yang dibuat bisa sesuai dengan metode yang dipakai maka dilakukan pengujian terhadap masin-masing komponen perangkat.

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB III ANALISIS DAN PERANCANGAN SISTEM BAB III ANALISIS DAN PERANCANGAN SISTEM Pokok bahasan pada bab ini akan dibagi menjadi 3 tahap perancangan. Tahap perancangan pertama membahas tentang analisis. Tahap perancangan kedua membahas tentang

Lebih terperinci

BAB I PENDAHULUAN. digunakan untuk mengirim dan menerima informasi. penting dalam suatu organisasi maupun pribadi. Hal ini terkait dengan

BAB I PENDAHULUAN. digunakan untuk mengirim dan menerima informasi. penting dalam suatu organisasi maupun pribadi. Hal ini terkait dengan BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi kian pesat dalam setiap lini kehidupan yang secara disadari atau tidak telah mengubah gaya hidup masyarakat. Sejalan dengan meningkatnya peranan

Lebih terperinci

BAB 3 PERANCANGAN SISTEM

BAB 3 PERANCANGAN SISTEM 21 BAB 3 PERANCANGAN SISTEM Sebelum citra tanda tangan dikenali dengan menggunakan Hidden Markov Model (HMM) citra tanda tangan tersebut ditransmisikan dengan dikompresi menggunakan Run Length Encoding

Lebih terperinci

: Peringkasan Terpandu Otomatis (Automatic Guided Summarization)

: Peringkasan Terpandu Otomatis (Automatic Guided Summarization) I. Identitas Calon Promotor Nama Lengkap Fakultas/Sekolah Kelompok Keahlian Telp/Fax/E mail : Ir. Dwi Hendratmo Widyantoro, M.Sc., Ph.D. : STEI : Informatika : (022)2502260/dwi@stei.itb.ac.id II. Deskripsi

Lebih terperinci

BAB III LANDASAN TEORI. permasalahan yang dibahas dan juga menjelaskan aplikasi-aplikasi yang akan

BAB III LANDASAN TEORI. permasalahan yang dibahas dan juga menjelaskan aplikasi-aplikasi yang akan BAB III LANDASAN TEORI Pada bab ini akan dijelaskan dasar-dasar teori yang berhubungan dengan permasalahan yang dibahas dan juga menjelaskan aplikasi-aplikasi yang akan digunakan. Hal ini sangat penting

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium,

Lebih terperinci

TINJAUAN PUSTAKA. Pengenalan Suara

TINJAUAN PUSTAKA. Pengenalan Suara Pengenalan Suara TINJAUAN PUSTAKA Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM BAB 3 ANALISIS DAN PERANCANGAN PROGRAM Program aplikasi ini dirancang dengan menggunakan perangkat lunak Microsoft Visual C# 2008 Express Edition. Proses perancangan menggunakan pendekatan Object Oriented

Lebih terperinci

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG TUGAS AKHIR MUHAMMAD AGUNG NURSYEHA 2211100164 Pembimbing: Dr. Muhammad

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Isyarat tutur merupakan isyarat yang diproduksi oleh alat ucap manusia hingga menghasilkan informasi, baik berupa makna dari isyarat tutur yang diucapkan maupun yang

Lebih terperinci

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model

Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Pengenalan Fonem Vokal Bahasa Jawa Mataraman Menggunakan Metode Liner Predictive Model Dan Hidden Markov Model Ziaul Haq, Teknik Informatika S1,Universitas Dian Nuswantoro Semarang Abstract Pengenalan

Lebih terperinci

BAB I PENDAHULUAN. pernah tepat, dan sedikitnya semacam noise terdapat pada data pengukuran.

BAB I PENDAHULUAN. pernah tepat, dan sedikitnya semacam noise terdapat pada data pengukuran. BAB I PENDAHULUAN 1.1 Latar Belakang Saat sesuatu diukur maka beberapa data didapatkan. Umumnya pengukuran tidak pernah tepat, dan sedikitnya semacam noise terdapat pada data pengukuran. Mendapatkan data

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI BAB III LANDASAN TEORI 3.1 Pendaftaran Siswa Baru Penerimaan siswa baru merupakan gerbang awal yang harus dilalui peserta didik dan sekolah didalam penyaringan objek-objek pendidikan. Peristiwa penting

Lebih terperinci

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi.

Sistem Verifikasi Penutur menggunakan Metode Mel Frequensi. SISTEM VERIFIKASI PENUTUR MENGGUNAKAN METODA MEL FREQUENCY CEPSTRAL COEFFICIENTS-VECTOR QUANTISATION (MFCC-VQ) SERTA SUM SQUARE ERROR (SSE) DAN PENGENALAN KATA MENGGUNAKAN METODA LOGIKA FUZZY Oleh : Atik

Lebih terperinci

LAPORAN AWAL Perangkat Lunak Jaringan 1 NAMA : DIAN BAYU NIM : KELAS : C

LAPORAN AWAL Perangkat Lunak Jaringan 1 NAMA : DIAN BAYU NIM : KELAS : C LAPORAN AWAL Perangkat Lunak Jaringan 1 NAMA : DIAN BAYU NIM : 2008 31 080 KELAS : C TEKNIK INFORMATIKA SEKOLAH TINGGI TEKNIK PLN JAKARTA 2011 MENGENAL LINUX Apakah Linux itu? Linux adalah nama yang diberikan

Lebih terperinci

Bab 3. Perancangan Sistem

Bab 3. Perancangan Sistem 34 Bab 3 Perancangan Sistem 3.1 Gambaran Umum Sistem Aplikasi yang kami namakan Voice Protect ini, mempunyai alur program sebagai berikut: Start Enkripsi Dekripsi Pilih File Buka file enkripsi Rekam Suara

Lebih terperinci

RANCANG BANGUN MODUL PENGENALAN SUARA MENGGUNAKAN TEKNOLOGI KINECT

RANCANG BANGUN MODUL PENGENALAN SUARA MENGGUNAKAN TEKNOLOGI KINECT RANCANG BANGUN MODUL PENGENALAN SUARA MENGGUNAKAN TEKNOLOGI KINECT Ratri Cahyarini NRP 5109100165 Dosen Pembimbing Umi Laili Yuhana, S.Kom., M.Sc. Abdul Munif, S.Kom., M.Sc. LATAR BELAKANG Teknologi pengenalan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Makanan Sehat Makanan yang sehat yaitu makanan yang higienis dan bergizi. Makanan yang higienis adalah makanan yang tidak mengandung kuman penyakit dan tidak mengandung racun

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Suara (Wicara) Suara khususnya wicara merupakan cara yang natural bahkan paling penting dalam melakukan proses komunikasi. Dalam kehidupan sehari-hari, manusia melakukan berbagai

Lebih terperinci

BAB III LANDASAN TEORI. layanan (service) tertentu dalam sebuah jaringan komputer. Server. sebagai sistem operasi jaringan (network operating system).

BAB III LANDASAN TEORI. layanan (service) tertentu dalam sebuah jaringan komputer. Server. sebagai sistem operasi jaringan (network operating system). BAB III LANDASAN TEORI 3.1 Server Server adalah sebuah sistem komputer yang menyediakan jenis layanan (service) tertentu dalam sebuah jaringan komputer. Server didukung dengan prosesor yang bersifat scalable

Lebih terperinci

HTML 5. Geolocation Web SQL Database, media penyimpanan database lokal

HTML 5. Geolocation Web SQL Database, media penyimpanan database lokal HTML 5 HTML5 adalah sebuah bahasa markah untuk menstrukturkan dan menampilkan isi dari Waring Wera Wanua, sebuah teknologi inti dari Internet. Tujuan utama pengembangan HTML5 adalah untuk memperbaiki teknologi

Lebih terperinci

SISTEM OPERSI. bertugas untuk melakukan control dan manajemen perangkat keras serta operasi-operasi dasar system, dan menjalankan software aplikasi.

SISTEM OPERSI. bertugas untuk melakukan control dan manajemen perangkat keras serta operasi-operasi dasar system, dan menjalankan software aplikasi. SISTEM OPERSI Sistem operasi atau Operating System (OS) adalah perangkat lunak yang bertindak sebagai perantara atau penghubung antara pengguna computer (User) dengan Hardware, yang bertugas untuk melakukan

Lebih terperinci

BAB III LANDASAN TEORI. dengan istilah web adalah sebuah sistem terhubung dari hypertext document yang

BAB III LANDASAN TEORI. dengan istilah web adalah sebuah sistem terhubung dari hypertext document yang 10 BAB III LANDASAN TEORI 3.1 World Wide Web World Wide Web yang biasanya disingkat dengan WWW dan lebih dikenal dengan istilah web adalah sebuah sistem terhubung dari hypertext document yang ada di Internet.

Lebih terperinci

BAB I PENDAHULUAN I.1 Latar Belakang

BAB I PENDAHULUAN I.1 Latar Belakang BAB I PENDAHULUAN I.1 Latar Belakang Prinsip teknologi dikembangkan adalah untuk membuat alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidup. Seiring

Lebih terperinci

INSTALASI SISTEM OPERASI KOMPUTER. Nur Rahmad Suhendra. Pertemuan pertama

INSTALASI SISTEM OPERASI KOMPUTER. Nur Rahmad Suhendra. Pertemuan pertama INSTALASI SISTEM OPERASI KOMPUTER Nur Rahmad Suhendra Pertemuan pertama KOMPETENSI DASAR Setelah mempelajari materi ini siswa diharapkan mampu : 1. Mengenal media paket installasi sistem operasi 2. Menjelaskan

Lebih terperinci