Algoritma Greedy untuk Membangun Korpus Pengenalan Suara Al-Quran

dokumen-dokumen yang mirip
Algorima Greedy Pada Self Serve Gas Station

Penerapan Algoritma Greedy dalam Optimasi Keuntungan Perusahaan Pengiriman Barang

Penerapan Algoritma Greedy untuk Permainan Halma

Aplikasi Algoritma Greedy dalam Penjurusan Mahasiswa Tingkat Pertama Institut Teknologi Bandung

Penerapan Algoritma Greedy pada Intelegensia Buatan untuk Transfer Pemain dalam Permainan Simulasi Sepakbola

Implementasi Algoritma Greedy dalam Pembagian kerja pada Mesin yang Identik

Implementasi Algoritma Greedy pada Permainan Ludo

IMPLEMENTASI ALGORITMA GREEDY PADA PERMAINAN OTHELLO

Penggunaan Algoritma Greedy Dalam Perancangan Papan Teka Teki Silang

Penerapan algoritma Greedy dalam penentuan Porter Generic Strategies untuk suatu perusahaan

Penerapan Algoritma Greedy pada Permainan Tower Defense

Penggunaan Algoritma Greedy dalam Optimasi Masalah Perkebunan

Penerapan Algoritma Greedy Pada Game Tower Defense: Tower of Greece

Analisis Penerapan Algoritma Kruskal dalam Pembuatan Jaringan Distribusi Listrik

Penentuan Keputusan dalam Permainan Gomoku dengan Program Dinamis dan Algoritma Greedy

PENERAPAN ALGORITMA GREEDY DALAM PENGISIAN RENCANA STUDI SEMESTER DI ITB SEBAGAI PERSOALAN BINARY KNAPSACK

Penerapan Algoritma Greedy dalam Permainan Connect 4

Penerapan Algoritma Greedy dan Algoritma BFS untuk AI pada Permainan Greedy Spiders

Pemilihan Monster yang Akan Digunakan dalam Permainan Yu-Gi-Oh! Capsule Monster Coliseum

Penerapan Algoritma Greedy pada Permainan Bubble Breaker

Perbandinganan Penggunaan Algoritma Greedy dan Modifikasi Algoritma Brute Force pada Permainan Collapse XXL

Penerapan Algoritma Greedy dalam Pengisian Rencana Studi Semester di ITB sebagai Persoalan Binary Knapsack

Aplikasi Algoritma Greedy untuk Menyelesaikan Permainan Magic Wingdom

PENGGUNAAN ALGORITMA GREEDY PADA MESIN PENCARI

Algoritma greedy merupakan metode yang paling populer untuk memecahkan persoalan optimasi.

Penerapan Algoritma Greedy dalam Pembuatan Klasemen Kompetisi

Pendahuluan. Algoritma greedy merupakan metode yang paling populer untuk memecahkan persoalan optimasi.

TUGAS RESUME MATERI KULIAH ALGORITMA DAN STRUKTUR DATA STRATEGI ALGORITMA : H

Penggunaan Algoritma Greedy untuk Mencari Solusi Optimal dalam Permainan Brick Breaker

Penerapan Algoritma Greedy dalam Permainan MarketGlory

Penerapan Algoritma Greedy pada Artificial Inteligence dalam Permainan Defence of the Ancient

Aplikasi Algoritma Greedy untuk Optimasi Sistem Booking Hotel Online

Penerapan Algoritma Greedy untuk Permainan Flood It

Penerapan Algoritma Greedy dalam Algoritma Disk Scheduling Shortest Seek Time First

Optimisasi Penjadwalan Proses Pada Central Processing Unit Dengan Menggunakan Algoritma Greedy

APLIKASI ALGORITMA GREEDY DALAM PENENTUAN SPESIFIKASI KOMPUTER RAKITAN

Penerapan Algoritma Greedy dalam Pemilihan Benih Terbaik pada Permainan Harvest Moon: Friends of Mineral Town

Algoritma Greedy pada Penjadwalan Real-Time untuk Earliest Deadline First Scheduling dan Rate Monotonic Scheduling serta Perbandingannya

BAB II LANDASAN TEORI

Penerapan Algoritma Greedy pada Permainan Kartu 100

Perbandingan BFS, DFS dan Greedy pada Permainan Logika Crossing Bridge

Kompleksitas Algoritma untuk Penyelesaian Persoalan Penukaran Koin dengan Algoritma Greedy

IF3051 Strategi Algoritma Penerapan Algoritma Greedy untuk Peletakan Tanaman dalam Game Harvest Moon: Back to Nature

ALGORITMA GREEDY DALAM PERMAINAN DOTS AND BOXES

Penerapan Algoritma Greedy dalam Algoritma Penjadwalan Prosesor Tunggal Shortest Job First

Aplikasi Algoritma Greedy dalam Permainan Kartu Truf

Penerapan Algoritma Greedy dalam Penyetokan Barang

Penerapan Algoritma Greedy dalam Pencarian Rantai Penjumlahan Terpendek

Penggunaan Algoritma Greedy untuk Meminimalkan Belanja

Strategi Permainan Bridge menggunakan Algoritma Greedy

PERBANDINGAN APLIKASI ALGORITMA BRUTE-FORCE DAN KOMBINASI ALGORITMA BREADTH FIRST SEARCH DAN GREEDY DALAM PENCARIAN SOLUSI PERMAINAN TREASURE HUNT

PENERAPAN ALGORITMA GREEDY UNTUK PENENTUAN JALUR DISTRIBUSI BANTUAN PASCA BENCANA ALAM

Penerapan Algoritma Greedy dalam Permainan Othello

Penggunaan Algoritma Greedy Dalam Penentuan Rute Wisata

Pencarian Jalur Terpendek dengan Menggunakan Graf dan Greedy dalam Kehidupan Sehari-hari

Penggunaan Algoritma Greedy untuk menyelesaikan Permainan Othello

Penyelesaian Permainan Sliding Puzzle 3x3 Menggunakan Algoritma Greedy Dengan Dua Fungsi Heuristik

Penentuan Lokasi Pemasaran Produk dengan Media Periklanan Menggunakan Algoritma Greedy

PENGGUNAAN ALGORITMA GREEDY DALAM PERMAINAN KARTU BLACK JACK

Strategi Konstruksi Pizza Hut Salad Tower Dengan Pendekatan Algoritma Greedy

Aplikasi Algoritma Greedy pada Pemilihan Jenis Olahraga Ringan

Penerapan Algoritma Greedy dalam Permainan Tradisional Congklak

IMPLEMENTASI ALGORITMA GREEDY PADA PERMAINAN CONGKLAK

Penerapan Algoritma Greedy dalam Permainan Bantumi

APLIKASI GREEDY PADA ALGORITMA HUFFMAN UNTUK KOMPRESI TEKS

APLIKASI ALGORITMA GREEDY DALAM PERMAINAN JAWBREAKER

Penerapan Greedy pada Jalan Jalan Di Bandung Yuk! V1.71

Implementasi Brute Force dan Greedy dalam Permainan Big Two (Capsa)

Analisis Pengimplementasian Algoritma Greedy untuk Memilih Rute Angkutan Umum

Penerapan Algoritma Greedy dalam Pembuatan Artificial Intelligence Permainan Reversi

Penerapan Algoritma Brute force dan Greedy pada Penjadwalan Disk

Penerapan Algoritma Greedy dan Breadth First Search pada Permainan Kartu Sevens

Penggunaaan Algoritma Greedy Dalam Aplikasi Vending Machine

Penerapan Algoritma Greedy Pada Permainan Killbots

Analisis Beberapa Algoritma dalam Menyelesaikan Pencarian Jalan Terpendek

Penerapan Algoritma Greedy Pada Permainan Kartu Truf

Aplikasi Algoritma Greedy pada Optimasi Pelaksanaan Misi dalam Permainan Assassins Creed : Revelations

Aplikasi Algoritma Greedy untuk Menyelesaikan Permainan Hedgewars

Design and Analysis of Algorithms CNH2G3- Week 8 Greedy Algorithm

Penggunaan Algoritma Greedy Untuk Menyelesaikan Permainan Cluedo

Penerapan Algoritma Greedy dalam Pemilihan Pemain di Game Football Manager

Implementasi Algoritma Greedy Dua Sisi pada Permainan 2048

Algoritma Greedy pada Board Game Saboteur

Perbandingan Algoritma Greedy & Bactracking Dalam Penyelesaian Permainan 2048

Implementasi Algoritma Runut Balik dalam Pengenalan Citra Wajah pada Basis Data

Design and Analysis Algorithm

Penerapan Travelling Salesman Problem dalam Penentuan Rute Pesawat

PENERAPAN ALGORITMA GREEDY DALAM PENCARIAN SOLUSI TERBAIK PADA PERMAINAN TETRIS

Penerapan Algoritma Greedy Dalam Permainan Clash Royale

Pencarian Lintasan Terpendek Pada Aplikasi Navigasi Menggunakan Algoritma A*

Aplikasi Algoritma Greedy Pada Permainan Big Two

PENERAPAN ALGORITMA GREEDY DALAM PENENTUAN USAHA BISNIS INVESTASI

Implementasi Algoritma Greedy pada Permainan Hangman Versi Bahasa Indonesia dengan Memanfaatkan Frekuensi Huruf

Pembahasan Pencarian Lintasan Terpendek Menggunakan Algoritma Dijkstra dan A*

IMPLEMENTASI GRAF DENGAN MENGGUNAKAN STRATEGI GREEDY

Optimalisasi Susunan Tempat Duduk Kereta Api Menggunakan Algoritma Greedy dan Program Dinamis

Implementasi Algoritma Greedy untuk Pembelian Saham

IF3051 Strategi Algoritma Penerapan Algoritma Greedy untuk Reservasi Tiket Konser

Penerapan Algoritma Greedy untuk Menempatkan Pelanggan dalam Permainan Video Diner Dash

IMPLEMENTASI GRAF DENGAN MENGGUNAKAN STRATEGI GREEDY

Transkripsi:

Algoritma Greedy untuk Membangun Korpus Pengenalan Suara Al-Quran Aisyah Dzulqaidah 13510005 1 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia 1 13510005@std.stei.itb.ac.id Abstrak Pada bidang pengenalan suara dibutuhkan korpus yang berisi berbagai suara dengan teks transkripsinya, termasuk pada pengenalan suara Al-Quran. Pembangunan korpus pada pengenalan suara biasanya menggunakan metode generally balance corpora di mana pada metode ini korpus berisi database suara yang seimbang mencakup seluruh kategori kata yang penting dan cukup sering yang diambil secara proporsional dari target bahasa. Korpus ini sangat besar dan menjadi tidak optimal dalam pembelajaran data. Pembangunan korpus pada makalah ini akan menggunakan metode minimally balanced corpus yaitu dengan korpus yang kaya dan seimbang secara fonetik. Pembangunan korpus pada pengenalan Al-Quran dengan phonetically balance and rich akan menggunakan algoritma greedy dalam membangunnya. Kata Kunci Algoritma Greedy, pengenalan suara Al- Quran, phonetically balanced and rich corpus. I. PENDAHULUAN Algoritma greedy banyak digunakan untuk menyelesaikan masalah-masalah di dunia. Algoritma ini dapat menyelesaikan berbagai masalah walau hasil yang didapatkan bukan merupakan solusi yang paling optimal. Oleh karena itu penyelesaian masalah ini dapat digunakan untuk membentuk korpus pada pengenalan suara, termasuk pengenalan suara Al-Quran. Strategi pembangunan korpus yang memenuhi phonetically balanced and rich corpus sudah pernah dikdigunakan untuk data pembelajaran pada sistem Automatic Speech Recognition (ASR)[2]. Jumlah data latih yang besar dibutuhkan untuk mengembangkan model akustik yang dapat mencakup semua fonem dengan jumlah yang cukup. Data latih korpus yang kaya dan seimbang secara fonetik ini lebih optimal dibandingkan korpus yang dibangun tidak seimbang fonetiknya dengan target. Pada makalah ini akan membahas pembangunan korpus pengenalan suara Al-Quran dengan algoritma Greedy. Algoritma Greedy ini digunakan untuk memilih ayat-ayat Al-Quran yang akan dimasukkan ke dalam korpus tersebut. Ayat-ayat yang akan dipilih untuk dimasukkan ke korpus adalah ayat yang secara fonetik dapat merepresentasikan fonem-fonem dan jumlahnya pada Al- Quran. Hasil yang diharapkan dari pembangunan korpus ini yaitu sdata latih untuk pengenalan suara Al-Quran yang fonetiknya seimbang dengan seluruh data pada Al- Quran namun minimal sehingga dapat menjadi data latih yang optimal baik dari segi waktu pemrosesan maupun keterwakilan datanya.. II. STUDI LITERATUR A. Algoritma Greedy Algoritma Greedy merupakan algoritma yang popular digunakan dalam pemecahan suatu masalah karena algoritma ini pasti akan menemukan solusi walau solusi yang didapatkan bukan merupakan solusi yang paling optimal untuk permasalahan tersebut. Ada dua macam permasalahan optimasi yaitu yang pertama adalah permasalahan maksimasi yaitu bagaimana mendapat nilai sebesar-besarnya, contohnya pada permasalahan integer knapsack 1/0 yang merupakan persoalan maksimasi dengan tujuan memperoleh untung sebesar-besarnya dari barang yang diambil. Yang kedua, yaitu permasalahan minimasi, misalnya pada travelling salesperson problem (TSP), bagaimana mencapai setiap titik dengan cost yang minimum. Secara umum, prinsip dari algoritma in yaitu take what you can get now. Algorima ini membentuk solusi secara langkah per langkah dengan mengambil pilihan yang saat itu dirasa paling optimal (local optima) dengan harapan dari setiap langkah yang diambil tersebut akan membentuk solusi yang paling optimal (global optima). Elemen-elemen pada algoritma greedy yaitu: 1. Himpunan kandidat, C. Himpunan yang berisi elemen-elemen pembentuk solusi. Contohnya pada permasalahan Integer Knapsack, himpunan kandidatnya adalah himpunan barang yang akan diambil. Pada setiap langkah, akan diambil satu buah kandidat dari himpunan tersebut. 2. Himpunan solusi, S. Himpunan yang berisi kandidat-kandidat yang terpilih dari solusi persoalan. Kandidat ini berasal dari himpunan kandidat yang dipilih dari setiap langkah. 3. Fungsi seleksi

Fungsi seleksi yaitu dinyatakan dengan predikat seleksi yaitu fungsi untuk memilih kandidatkandidat pada himpunan kandidat yang paling memungkinkan untuk mencapai solusi paling optimal. Kandidat yang dipilih pada suatu langkah tidak pernah dipertimbangkan lagi pada pilihan selanjutnya. Fungsi seleksi ini memilih kandidat yang memiliki nilai terkecil atau terbesar tergantung persoalan. 4. Fungsi kelayakan Fungsi ini bisanya dinyatakan dengan predikat Layak yang memeriksa apakah kandidat yang dipilih dapat memberikan solusi yang layak, yaitu kandidat yang dipilih tidak melanggar batasan yang ada. Contoh pada permasalahan integer knapsack, fungi kelayakan memeriksa apakah dari kandidatkandidat yang dipilih tersebut melebihi batas berat yang diperbolehkan untuk diambil. 5. Fungsi obyektif Fungsi ini memaksimumkan dan meminimumkan nilai solusi. Misalnya pada integer knapsack fungsi obyektif yaitu fungsi yang memaksimumkan keuntungan. Dari elemen-elemen tersebut, skema umum dari algoritma greedy adalah sebagai berikut: 1. Inisialisasi himpunan kandidat (S) dengan himpunan kosong 2. Pilih sebuah kandidat dari himpunan kandidat (C) dengan fungsi seleksi 3. Setelah dipilih kurangi C dengan kandidat yang sudah dipilih 4. Periksa apakah kandidat yang dipilih tersebut dan himpunan solusinya membentuk solusi yang layak dengan fungsi kelayakan. Jika iya, maka kandidat tersebut dimasukkan ke dalam himpunan solusi. Jika tidak, maka kandidat tersebut dibuang dan tidak dipertimbangkan lagi. 5. Periksa apakah himpunan solusi telah memberikan solusi yang lengkap (dengan menggunakan fungsi obyektif). Jika ya, maka selesai,jika sebaliknya maka ulangi dari langkah ke-2. [1] Berikut dari pseudocode dari algoritma Greedy[1]: function greedy(input C: himpunan_kandidat) himpunan_kandidat { Mengembalikan solusi dari persoalan optimasi dengan algoritma greedy Masukan: himpunan kandidat C Keluaran: himpunan solusi yang bertipe himpunan_kandidat } Deklarasi x : kandidat S : himpunan_kandidat Algoritma: S {} { inisialisasi S dengan kosong } while (not SOLUSI(S)) and (C {} ) do x SELEKSI(C) { pilih sebuah kandidat dari C} C C - {x} { elemen himpunan kandidat berkurang satu } if LAYAK(S {x}) then S S {x} endif endwhile {SOLUSI(S) or C = {} } if SOLUSI(S) then return S else write( tidak ada solusi ) endif B. Minimally Balanced Corpus Minimally balanced corpus yaitu korpus yang seimbang dan lengkap namun dibangun dengan paling minimal. Minimal ini maksudnya adalah korpus yang dibangun telah mewakili semua kata yang penting yang perlu dimasukkan pada latih namun tidak berlebihan dan seimbang jumlah kemunculannya dengan target sebenarnya. Salah satu caranya adalah dengan memilih kata berdasarkan fonem sehingga terbentuk korpus yang kaya dan seimbang secara fonetik (phonetically rich and balanced corpora). Phonetically balanced untuk materi pengenalan suara dipilih berdasarkan frekuensi kemunculan dalam bahasa umum. Contoh penggunaan dari kalimat yang phonetically balanced dapat digunakan untuk speech audiometri dan untuk menguji karakteristik dari kanal komunikasi atau sistem alamat publik[3]. Distribusi frekuensi fonem yang seragam dapat didapatkan dengan menggunakan kalimat yang kaya secara fonetik. Oleh karena itu, dalam pembentukan korpus ini dapat digunakan algoritma greedy. Jika kita membentuk set kalimat-kalimat dengan setiap fonem muncul minimal sekali oleh diri sendiri tentu saja akan sulit dan membutuhkan waktu yang lama dan menghabiskan banyak waktu. Khususnya untuk Al-Quran, tentu saja tidak bisa sembarangan untuk membentuk kalimat karena bias menimbulkan arti yang berbeda. Oleh karena itu, sebagai alternatif yaitu dengan mencari set yang sesuai dari korpus teks yang cukup besar.pada Al- Quran, kita dapat mengambil satu Al-Quran sebagai sumber untuk dibentuk korpus yang seimbang dan kaya secara fonetik tanpa semua ayat harus diambil. Algoritma greedy dapat digunakan untuk memperoleh jumlah minimum dari kumpulan ayat yang mengandung semua fonem. Berikut langkah-langkah untuk mengambil data set yang dapat digunakan[3] : 1. Menggunakan grapheme to phoneme converter untuk mencari fonem disbanding untuk mencari karakter 2. Memilih kalimat dalam korpus dengan jumlah fonem terbesar, tidak menghitung fonem yang terulang di kalimat yang sama. 3. Memilih setiap kalimat selanjutnya sebagai satu dengan jumlah fonem terbesar yang belum pernah

ditemui. Prosedur ini berhenti saat seluruh fonem ditemukan. Untuk mendapatkan banyak kemunculan dari fonem, makaprosedur di atas dapat diulangi beberapa kali dengan sisa kalimat pada korpus. C. Fonem pada Al-Quran Berikut transkripsi fonetik berdasarkan skema yang ditemukan pada Arabic Through the Quran oleh Aalan Jones (Islamic Texts Society, 2008) [5]. Gambar 1 Transkripsi fonetik untukhuruf Gambar 2 Transkripsi fonetik untuk tanda baca Berikut ini contoh penerjemahan fonetik dari surat Al- Baqarah ayat 147: Gambar 3 Transkripsi surat Al-Baqarah ayat 147 III. PEMBENTUKAN KORPUS A. Rancangan Algoritma Greedy Untuk membentuk korpus dari Al-Quran secara phonetically balance and rich maka menggunakan algoritma greedy sebagai berikut: 1. Transliterasi ayat menjadi fonetik dengan Java API: Buckwalter transliteration

2. Inisialisasi himpunan solusi dengan himpunan kosong. 3. Pilih ayat dengan fonem terkaya. 4. Lanju ke ayat berikutnya dengan mempertimbangkan jumlah fonem B. Transkripsi Fonetik dengan Java API: Buckwalter Transliteration Untuk mempermudah transkripi fonetik, maka digunakan Buckwalter Transliteration. Berikut tabel trankripsi dengan menggunakan Buckwalter Transliteration [4]:

[4] http://corpus.quran.com/java/buckwalter.jsp, terakhir diakses pada 19 Mei 16.30 [5] http://corpus.quran.com/documentation/phonetic.jsp, terakhir diakses pada 19 Mei, 16.30. PERNYATAAN Dengan ini saya menyatakan bahwa makalah yang saya tulis ini adalah tulisan saya sendiri, bukan saduran, atau terjemahan dari makalah orang lain, dan bukan plagiasi. Bandung, 19 Mei 2014 Gambar 4 Transliterasi dengan BuckWalter Aisyah Dzulqaidah 13510005 V. CONCLUSION Proses pembentukan korpus dengan phonetically balanced and rich dapat membuat proses pembelajaran menjadi optimal dengan hanya mempertimbangkan kemunculan fonem dan jumlahnya. Algoritma Greedy cocok untuk membantu permasalahan ini karena yang dicari adalah persoalan optimasi pembentukan korpus secara fonetik. VI. UCAPAN TERIMAKASIH Penulis ingin mengucapkan terima kasih kepada pihakpihak yang telah membantu saya dalam mengerjakan makalah berikut ini: 1. Pengajar matakuliah IF 2211 Strategi Algoritma, Ibu Masayu dan Pak Rinaldi yang telah mengajar selama satu semester di matakuliah ini. 2. Teman saya yang telah memberikan ide inspirasi untuk membuat makalah mengenai pembentukan korpus pengenalan suara ini. 3. Dan seluruh pihak-pihak yang telah membantu yang tidak bisa disebutkan satu persatu.. REFERENCES [1] Munir, Rinaldi, Diktat Kuliah IF2211 Strategi Algoritmat. Bandung: Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, 2009. [2] Irtza, Saad. Dr Sarmad Hussain. Minimally Balanccd Corpus for Speech Recognition. Electrical Engineering Department. University of Engineering & Technology Labore, Pakistan. [3] Gibbon, Dafydd, Roger Moore and Richard Winski. Spoken Language System and Corpus Design. 199. Walter de Gruyter.