BAB 2 LANDASAN TEORI

dokumen-dokumen yang mirip
BAB 2 LANDASAN TEORI

APLIKASI PENGENALAN SUARA MENGGUNAKAN MICROSOFT SAPI SEBAGAI PENGENDALI PERALATAN ELEKTRONIK

BAB 2 LANDASAN TEORI

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB 3 ANALISIS DAN PERANCANGAN SISTEM. ini adalah penginputan menggunakan media suara dengan mikrofon ke dalam komputer

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti

BAB 1 PENDAHULUAN 1.1 Latar Belakang

Pemgantar Teknologi Informasi

BAB I PENDAHULUAN. Suara merupakan salah satu media komunikasi yang paling sering dan

BAB I PENDAHULUAN. alat komunikasi universal pada ruang lingkup internasional. Pembelajaran bahasa

BAB II LANDASAN TEORI

BAB 3 PERANCANGAN PROGRAM

BAB II LANDASAN TEORI

MODUL 2 KOMPONEN, LAYANAN SISTEM OPERASI M. R A J A B F A C H R I Z A L - S I S T E M O P E R A S I - C H A P T E R 2

PEMOGRAMMAN VISUAL III APLIKASI TRANSAKSI PENJUALAN

KAMUS BAHASA INDONESIA-BAHASA INGGRIS DENGAN KEMAMPUAN TEXT TO SPEECH RECOGNITION

SPEECH RECOGNITION (Pengenalan Ucapan)

: Peringkasan Terpandu Otomatis (Automatic Guided Summarization)

BAB 1. Pendahuluan. ada waktu dan tempat. Dari penjelasan di atas, dapat disimpulkan bahwa

1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB I PENDAHULUAN. gabah, dan yang sudah dibuang kulit luarnya disebut beras. Dalam praktek di

1. PENDAHULUAN 1.1 Latar belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Bab 1. Pendahuluan. aman semakin diperlukan untuk menjamin keamanan data. Berbagai solusi proteksi

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. menggunakan voice recognition dapat membantu user memilih produk buah

IMPLEMENTASI PENDIKTEAN BAHASA INDONESIA. Hari Bagus Firdaus dan Ayu Purwarianti

Aplikasi Interactive Voice Response (IVR) untuk Layanan Informasi Akademik (Studi Kasus: Universitas Kristen Satya Wacana)

Model User Interface. Dibuat Oleh: Anindito Yoga Pratama, S.T., MMSI

Mufadhol Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang. Abstract. Keyword : E-Speaking, Respondingheads, Computer,Voice Command.

BAB 2 LANDASAN TEORI. Data adalah fakta atau bagian dari fakta yang digambarkan dengan simbol-simbol,

Organisasi SistemKomputer, Pelayanan Sistem Operasi. Ptputraastawa.wordpress.com

Seminar Nasional Teknologi Informasi & Komunikasi Terapan 2012 (Semantik 2012) ISBN Semarang, 23 Juni 2012

Pengantar Teknologi Informasi. Evangs Mailoa (evangsmailoa.wordpress.com) Fakultas Teknologi Informasi UKSW

Pemrograman Visual. Pengenalan Visual Basic. Sisilia Thya Safitri, MT Agus Priyanto, M.KOM

Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition

Aplikasi Pengenalan Suara Dalam Pengaksesan Sistem Informasi Akademik

BAB I PENDAHULUAN 1.1 Latar Belakang

Pembuatan Speech Recognition Dan Database Wicara Untuk Kontrol Peralatan Rumah Tangga Jarak Jauh

intruksi kepada CPU untuk mengakses sistem operasi. BIOS tersimpan pada Read Only

BAB 1 PENDAHULUAN Latar Belakang Masalah

Rancang Bangun Modul Pengenalan Suara Menggunakan Teknologi Kinect

BAB 2 LANDASAN TEORI. Komputer berasal dari bahasa Latin computare yang artinya menghitung. Jadi

MENGENAL VISUAL BASIC

BAB 3 PERANCANGAN SISTEM. yang akan menjalankan perintah-perintah yang dikenali. Sistem ini dibuat untuk

BAB 3 METODOLOGI. Metodologi penelitian yang digunakan dalam penulisan ini adalah studi

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

DIALOG DESAIN. 2. Sintaksis - Yaitu urutan dan struktur dari input dan output. - Pada bahasa manusia, ekuivalen dengan grammar suatu kalimat.

BAB I PENDAHULUAN 1.1. Latar Belakang

Bahasa Pemograman Modul XI

Sistem operasi. Contoh sistem operasi modern adalah Linux, Android, ios, Mac OS X, dan Microsoft Windows

Microsoft Data Access Components (MDAC) Oleh : Edi Sugiarto, S.Kom, M.Kom

Arsitektur Sistem Operasi WINDOWS

BAB 2 LANDASAN TEORI

OPERASI DASAR KOMPUTER dan PERANGKAT LUNAK DALAM SISTEM INFORMASI

Visual Basic (VB) Tatik yuniati. Abstrak.

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

PEMROGRAMAN KOMPUTER KODE MODUL: TIN 202 MODUL IV PENGENALAN MICROSOFT VISUAL BASIC 6.0

BAB 1 PENDAHULUAN. mengalami perubahan baik dari segi software maupun hardware. Komputer yang

BAB 1 PENDAHULUAN. mengkonversikan tulisan / teks ke dalam bentuk ucapan dengan menggunakan

APLIKASI KOMPUTER SISTEM OPERASI. Modul ke: I b r a h i m, S.T, M.T. Fakultas Psikologi. Program Studi Psikologi.

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

Introduction To Programming & Software Engineering. Inggriani Liem Revisi oleh: Tim Penyusun Materi KU1071/Pengantar Teknologi Informasi A

Operating System. I/O System. Fak. Teknik Jurusan Teknik Informatika Universitas Pasundan. Dosen : Caca E. Supriana, S.Si

BAB II LANDASAN TEORI. Dalam landasan teori ini akan dibahas mengenai: (1) Microsoft ActiveX

SISTEM KENDALI JARAK JAUH DENGAN HANDPHONE MENGGUNAKAN PENGENAL SUARA MICROSOFT SAPI 5.3

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

Kernel. Sistem Operasi. STMIK Indonesia Padang Yayasan Amal Bakti Mukmin LINATI IFFAH ( )

PENERAPAN SPEECH RECOGNITION LIBRARY UNTUK QUERY BASIS DATA

BAB I PENDAHULUAN. pengenalan terhadap gelombang suara. Pengenalan gelombang suara yang sudah

RANCANG BANGUN OPEN/CLOSE PINTU RUANGAN OTOMATIS MENGGUNAKAN VOICE RECOGNITION BERBASIS RASPBERRY PI

BERBASIS JAVA DENGAN MENGGUNAKAN TOOLS NETBEANS

BAB 4 IMPLEMENTASI DAN EVALUASI SISTEM. pengujian pada handset Galaxy Tab Hasilnya adalah sebagai berikut :

Pertemuan 6 GAYA INTERAKSI DAN PERANGKAT INTERAKSI #1

Implementasi OOP Pada Perangkat Lunak Pemrograman

4. Bahasa pemrograman dibawah ini yang masih berbentuk teks hasil outputnya adalah : a. Delphi b. Visual Basic b. Pascal d.

BAB 2 LANDASAN TEORI. Istilah komputer (computer) berasal dari bahasa Latin Computare yang berarti

BAB I PENDAHULUAN I-1

PENGENALAN DASAR PEMROGRAMAN

BAB II LANDASAN TEORI

Pengenalan VB.net. Ibnu Muakhori, S.Kom (wa)

Pertemuan XI Database Connectivity Fak. Teknik Jurusan Teknik Informatika. Caca E. Supriana, S.Si.,MT.

Struktur Sistem Komputer

JENIS PERANGKAT LUNAK

BAB II LANDASAN TEORI

KOMPONEN DAN AKTIVITAS SISTEM INFORMASI

BAB III LANDASAN TEORI. dengan istilah web adalah sebuah sistem terhubung dari hypertext document yang

Transkripsi:

7 BAB 2 LANDASAN TEORI 2.1 Kata baku dan tidak baku Bahasa Indonesia Kata merupakan bentuk yang sangat kompleks yang tersusun atas beberapa unsur. Kata dalam bahasa Indonesia terdiri atas satu suku kata atau lebih. Kata merupakan bagian yang sangat penting dalam kehidupan berbahasa. Bidang atau kajian mengenai kata telah banyak diselidiki oleh para ahli bahasa. Penyelidikan tersebut menghasilkan berbagai teori-teori antara yang satu dengan yang lain berbeda-beda. Perbedaan ini terjadi karena adanya perbedaan sudut pandang antara ahli bahasa yang satu dengan yang lainnya. Adanya perbedaan konsep antara ahli yang satu dengan yang lainnya tentu akan membingungkan dalam kegiatan pembelajaran. Untuk mengurangi kebingungan tersebut, dikelompokanlah jenis kata yaitu kata baku dan kata tidak baku. Kata baku dan tidak baku sering dijadikan sebagai pembahasan dalam mata pelajaran bahasa Indonesia. Kata baku dan tidak baku dalam bahasa Indonesia berhubungan dengan penyerapan kosakata bahasa asing dan berhubungan juga dengan kaidah penulisan yang benar. Kata baku adalah kata yang digunakan sesuai dengan kaidah bahasa Indonesia yang telah ditentukan. Kamus Besar Bahasa Indonesia merupakan sumber utama dan menjadi acuan untuk menentukan kata baku bahasa Indonesia. Kata tidak baku adalah kata yang digunakan tidak sesuai dengan kaidah bahasa Indonesia yang ditentukan. Kata tidak baku cenderung lebih sering digunakan dalam kehidupan sehari-hari. Penggunaan kata baku dan tidak baku dihadapkan kepada dua ragam yaitu ragam resmi dan tidak resmi. Ragam resmi merupakan keadaan atau situasi yang bersifat formal seperti penulisan karya ilmiah, pidato kenegaraan, dan lain-lain. Ragam tidak resmi merupakan keadaan atau situasi yang bersifat tidak formal seperti dalam percakapan sehari-hari.

8 Banyak anak-anak yang belum mengetahui mana yang menjadi kata baku dan mana yang menjadi kata tidak baku dari sebuah kata. Hal ini dikarenakan penggunaan kata baku tidak begitu sering diterapkan kepada anak dalam bentuk penulisan. Selain pada anak-anak, penggunaan kata baku juga sering salah penggunaannya oleh orang yang sudah dewasa, akan tetapi kesalahan tersebut sudah lebih minim daripada kesalahan yang ditemukan pada anak yang berusia 9 sampai 15 tahun. 2.2 Speech Recognition Speech Recognition pertama kali muncul di tahun 1952 dan terdiri dari device untuk pengenalan satu digit yang diucapkan. Kemudian pada tahun 1964, muncul IBM Shoebox. Salah satu teknologi yang cukup terkenal di Amerika dalam bidang kesehatan adalah Medical Transcriptionist (MT) merupakan aplikasi komersial yang menggunakan speech recognition. Sekarang banyak aplikasi yang dikembangkan menggunakan speech recognition, antara lain di bidang kesehatan terdapat MT, di bidang militer terdapat High-performance fighter aircraft, Training air traffic controllers, sampai pada alat yang membantu orang-orang yang memiliki kesulitan dalam menggunakan tangan, maka diciptakannya komputer yang dapat dioperasikan menggunakan deteksi pengucapan user (Sunny, A.S. 2009). Speech recognition merupakan teknik dimana perangkat akan mengenali masukan berupa suara, setelah itu perangkat melakukan respon yang sesuai dengan masukan suara tersebut (Syarif, A., Daryanto, T. & Arifin, M.J. 2011). Output yang dihasilkan perangkat dapat berupa output penulisan teks maupun output runnning program. Keuntungan dari sistem ini adalah pada kecepatan dan kemudahan dalam penggunaannya. Kata-kata yang ditangkap dan dikenali bisa sebagai hasil akhir, untuk sebuah aplikasi seperti command & control, penginputan data, dan persiapan dokumen. Banyak metode yang dapat digunakan untuk membangun suatu speech recognition diantaranya metode Dynamic Time Warping (DTW) (Sunny, A.S. 2009), Metode Independent Component Analysis (Tumpak, P. 2005), dan Hidden Markov Model (HMM) (Prasetyo, M.E.B. 2010 ). Penggunaan metode dapat dipilih sesuai keefektifannya.

9 Untuk membangun sistem pengenalan suara ini, dibutuhkan model akustik, model bahasa, dan kamus. Setelah itu maka akan dilakukan dua proses lanjutan yaitu tahap pembelajaran dan tahap pengujian. 2.2.1 Model akustik, model bahasa dan kamus a. Model Akustik Pada tahap pertama pemrosesan sinyal suara input adalah dengan melakukan ekstraksi kepada sinyal suara tersebut. Setelah itu dilanjutkan dengan pembangunan model yang terdiri atas Hidden state (tidak dapat diamati /Hidden) dan feature vector (dapat diamati/observable). Pembangunan model berarti pembangunan data probabilitas transisi antar Hidden state serta data probabilitas emisi (emission) yaitu pembangkitan feature vector oleh Hidden state. Model akustik dapat dinyatakan dalam bentuk tiedstate N-phone atau monophone. Jika nilai N adalah dua, model tersebut berbentuk tied-state biphone. b. Model Bahasa Model bahasa digunakan dalam speech recognition untuk membantu menentukan probabilitas dari urutan hipotesis kata. Selain itu, probabilitas model bahasa dan model akustik akan membuat system membatasi ruang pencarian selama pengenalan ke arah hanya urutan kata yang memiliki kemungkinan yang besar untuk benar. Jadi, hal ini akan mengurangi ruang pencarian kata sehingga proses pencarian lebih cepat dan tepat. Model bahasa dapat dibangun dengan dua pendekatan, yaitu model bahasa berbasiskan rules dan model bahasa statistik. Model bahasa berbasis rules artinya terdapat rules statis yang didefinisikan. Sedangkan, model bahasa statistic akan memberikan probabilitas dari suatu urutan kata. 1. Model Bahasa berbasis Rules Grammar statis dari suatu bahasa ditulis. Dalam kasus ini, pengguna hanya boleh mengucapkan kata-kata yang secara eksplisit berada dalam grammar.

10 2. Model Bahasa berbasis Statistik Model bahasa berdasarkan statistik memberikan nilai probabilitas dari suatu urutan kata. Model N-gram adalah yang paling sering digunakan karena menghasilkan solusi yang lebih baik dan fleksibel. Model bahasa N-Gram digunakan untuk menyediakan sistem pengenal dengan nilai probabilitas urutan kata tersebut muncul bersama-sama. Model bahasa N-Gram digunakan untuk menyediakan sistem pengenal dengan nilai probabilitas urutan kata tersebut muncul bersama-sama. Nilai ini diperoleh dari teks latih yang besar yang menggunakan bahasa yang sama. Jika kita menganggap bahwa W adalah urutan kata, w merupakan kata-kata dalam W, dan q adalah jumlah kata, nilai P(W) dapat dilihat pada persamaan berikut. P(W) = P(w 1,w 2,,w q ) =πi=1p(w i w i-n+1,,w i-1 ) Q Untuk memperoleh nilai probabilitas P (wi wi-2 wi-1) dalam kasus trigram, dilakukan dengan hanya menghitung jumlah masing-masing kemunculan tiga kata secara berturut-turut dalam data latih. Jika N(a,b) menyatakan jumlah kemunculan a,b berturut-turut pada data latih, rumus matematisnya dapat dilihat pada persamaan : P(w 1 w i-2, w 1-1 ) = N( wi-2, w i-1, w i ) N(w 1-2, w i-1 ) 3. Kamus Kamus akan memberikan daftar kata yang dapat dikenali oleh sistem beserta cara pengucapannya. Kata-kata yang dikenali oleh sistem pengenal suara bergantung pada kamus.

11 2.3 Microsoft Speech Application Programming Interface (SAPI) Speech Application Programming Interface (SAPI) merupakan Application Programming Interface (API) yang dikembangkan oleh Microsoft yang dapat digunakan untuk pengembangan speech recognition dengan sistem operasi yang berbasis windows. Speech Aplication Programming Interface (SAPI) diperkenalkan oleh Microsoft pada tahun 1995. SAPI memungkinkan sistem akan mengenali input suara dari sipengguna dan kemudian akan menghasilkan ouput berupa text. Dengan kata lain Speech Application Programming Interface (SAPI) ini dapat mengubah sinyal suara menjadi text melalui proses ekstraksi yang terjadi di dalamnya. Dalam speech recognition, speech to text terdapat beberapa modul yang disebut engines (Permadi. T, 2008). SAPI telah digunakan dalam windows XP, windows vista, dan windows seven. Banyak versi dari Speech Application Programming Interface (SAPI), diantaranya adalah Speech Application Programming Interface (SAPI) 1, Speech Application Programming Interface (SAPI) 3, Speech Application Programming Interface (SAPI) 4, dan versi terbaru Speech Application Programming Interface (SAPI) 5. Komponen yang terdapat pada Speech Application Programming Interface (SAPI) adalah sebagai berikut. 1. Voice Command Sebuah obyek level tinggi untuk perintah dan kontrol menggunakan pengenalan suara. 2. Voice Dictation Sebuah obyek level tinggi untuk continous dictation speech recognition. 3. Voice Talk Sebuah obyek level tinggi untuk speech synthesis. 4. Voice Telephony Sebuah obyek untuk menulis aplikasi telepon berbasiskan pengenalan suara. 5. Direct Speech Recognition Sebuah obyek sebagai mesin untuk mengontrol pengenalan suara (direct control of recognition engine)

12 6. Direct Text to Speech Sebuah obyek sebagai mesin yang mengontrol synthesis. 7. Audio Object Untuk membaca dari audio device atau sebuah file audio. Speech Application Programming Interface (SAPI) terdiri dari 2 antarmuka yaitu Application Programming Interface dan Device Driver Interface (DDI) (Permadi. T, 2008) Arsitektur SAPI ini dapat dilihat pada gambar 2.1. API Aplikasi SAPI Runtime Aplikasi DDI Recognition Engine TTS Engine Gambar 2.1. Arsitektur SAPI 2.3.1 Application Programming Interface (API) Dalam API terdapat fungsi-fungsi/ perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah dimengerti oleh programmer. Fungsi yang dibuat dengan menggunakan API tersebut kemudian akan memanggil system calls sesuai dengan sistem operasinya. Keuntungan memprogram dengan menggunakan API adalah : a. Portabilitas dimana programmer yang menggunakan API dapat menjalankan programnya dalam sistem operasi mana saja apabila API sudah ter- install dalam sistem operasi tersebut. Sedangkan system call berbeda antar sistem operasi, dengan catatan dalam pengaplikasiannya ada kemungkinan untuk berbeda.

13 b. Lebih mudah dimengerti. API menggunakan bahasa yang lebih terstruktur dan mudah dimengerti daripada bahasa system call. Hal ini sangat penting dalam hal editing dan pengembangan. System call interface ini berfungsi sebagai penghubung antara API dan system call yang dimengerti oleh sistem operasi. System call interface ini akan menerjemahkan perintah dalam API dan kemudian akan memanggil system calls yang diperlukan. 2.3.2 Device Driver Interface (DDI) Device Driver Interface (DDI) berfungsi untuk menerima data masukan yang berupa suara dari Speech Application Programming Interface (SAPI) dan mengembalikan phrase pada level SAPI paling dasar. 2.4 Penelitian Terdahulu Dalam membangun aplikasi dalam penelitian ini, penulis menggunakan referensi dari beberapa penelitian terdahulu yang telah pernah dilakukan. Adapun penelitian terdahulu yang dimaksud, dapat dilihat pada tabel 2.1. Tabel 2.1. Penelitian Terdahulu Peneliti Terdahulu Permadi, T. 2008. Judul Pemanfaatan Microsoft Speech Application Programming Interface Pada Pembuatan Aplikasi Perintah Suara. Junaedih. 2007. Implementasi Speech Recognition Menggunakan SAPI 5 dan Visual Basic 6.0 Pada Pembuatan Aplikasi Kalkulator Audio Visual.

14 Noertjahyana, A. & Adipranata, R. 2003 Implementasi Sistem Pengenalan Suara Menggunakan SAPI 5.1 dan DELPHI 5 Dari tabel 2.1, dapat dilihat bahwa penelitian terdahulu cenderung melakukan penelitian mengenai speech recognition untuk suatu aplikasi perintah suara. Oleh sebab itu penulis melakukan penelitian untuk membangun suatu aplikasi pembelajaran menggunakan Speech Application Programming Interface (SAPI) 5.