DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA JAWA KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP (SOM) Faizar Mazdi Hasibuan¹, Bambang Hidayat², Rita Magdalena³ ¹Teknik Telekomunikasi,, Universitas Telkom Abstrak Negara Indonesia merupakan negara yang memiliki keanekaragaman budaya. Salah satunya adalah keanekaragaman bahasa daerah. Bahasa Jawa merupakan salah satu bahasa daerah yang digunakan di Indonesia. Untuk membaca tulisan Aksara Jawa tidaklah mudah. Karena kita harus menghafal bentuk bentuk dari aksara jawa tersebut serta pengucapannya. Hal ini dikarenakan bentuk dari aksara jawa yang sangat kompleks. Pada tugas akhir ini dibuat alat bantu pembacaan aksara Jawa berupa program aplikasi yang berfungsi untuk mengidentifikasi aksara Jawa kemudian menerjemahkannya menjadi huruf Latin dengan menggunakan Optical Character Recognition (OCR), yaitu suatu sistem komputer yang mampu mengenali karakter hasil tulisan tangan atau naskah ketikan hasil penindaian, menjadi suatu teks yang dapat diedit menggunakan suatu aplikasi komputer. Serangkaian aksara Jawa yang akan diidentifikasi dalam tugas akhir ini berasal dari teks aksara Jawa hasil dari print-out atau huruf cetak yang akan langsung diterjemahkan oleh sistem dengan peng-capture-an oleh webcam sebelumnya. Hasil dari proses ini berupa teks. Pada prosesnya dilakukan beberapa tahapan. Pada tahap preprocessing, hasil citra oleh webcam diubah warnanya dari RGB ke dalam bentuk grayscale dan black and white. Citra black and white di segmentasi tiap karakter untuk dideteksi. Pada tahap ekstrasi ciri, citra hasil segmentasi diambil ciri nya tiap karakter. Dan pada tahap pengenalan karakter yang menggunakan JST Self Organizing Map dilakukan penentuan vektor penyusun garis karakter dengan cara menghubungkan titik-titik neuron yang ada pada suatu region karakter. Pengujian yang dilakukan terhadap sistem meliputi pengambilan gambar dari font yang sudah dilatih. Hasil akurasi terbaik adalah 98% untuk aksara Murda dan Suara, 96% untuk aksara dasar, 55% untuk aksara dengan sandhangan, dan 53% untuk aksara jawa dengan tanda baca. Kata Kunci : Aksara Jawa, OCR, webcam, ekstraksi ciri, Jaringan Syaraf Tiruan SOM.
Abstract Indonesia is a country that has a cultural diversity. One of them is the diversity of regional languages. Java language is one of the regional languages which is used in Indonesia. To read the Java Characters are not easy. Because we have to memorize the shapes of java characters and its pronunciation. This because the shape of Java characters are very complex. In this final project, the writer has made a tool that can help people to read Java characters easier. This tool identifies the Java characters and then translated them into Latin characters using Optical Character Recognition (OCR). OCR is a computer system that can recognize handwritten characters or typed manuscript which is produced by scanner, into an editable text using a computer application. A series of Java characters which will be identified in this final project comes from the Javanese character texts from the print-out or block letters. Those characters will be directly translated by the system after capturing it by webcam. The result of this process is in the editable text form. The process does a few stages. In the preprocessing stage, the image which is produced by the webcam, is changed its color from RGB to grayscale, and then changed it to black and white form. Black and white image is segmented into one syllable, in order to be detected. At this feature extraction stage, the traits of image which is produced in preprocessing stage is taken of each character. And at this character recognition stage using Self Organizing Map neural network, the determination of vector compiler character line is done by connecting the neurons dots in a region character. The test which is done to the system involves taking a picture of the fonts that have been trained. And from tests above, the best accuracy is 98% for aksara Murda and Swara, 96% for Basic Aksara, 55% for Aksara with Sandhangan, 53% for Aksara with punctuations. Keywords : Java character, OCR, webcam, feature extraction, SOM artificial neural network. Powered by TCPDF (www.tcpdf.org)
BAB 1 PENDAHULUAN Latar Belakang Banyaknya budaya budaya barat yang masuk Indonesia terkadang membuat budaya budaya kita terlupakan. Ironisnya banyak jiwa jiwa muda Indonesia yang mengikuti budaya barat namun tidak mengenal sama sekali mengenai budaya negaranya sendiri. Hal ini perlu segera dibenahi. Budaya budaya nasional maupun budaya daerah perlu dilestarikan agar tidak punah. Salah satu budaya daerah yang harus dilestarikan adalah aksara Jawa. Aksara Jawa adalah salah satu bentuk penulisan bahasa jawa selain menggunakan tulisan latin. Berbeda dengan bahasa Indonesia yang penulisannya menggunakan tulisan latin. Bentuk bentuk dari aksara jawa sangat kompleks, sehingga sedikit sulit untuk menghapal dan memahami tulisan tersebut dikarenakan bentuknya yang tidak familiar. Oleh karena itu, dalam tugas akhir ini dibuat sebuah program aplikasi yang mampu menerjemahkan aksara Jawa dari sebuah citra ke huruf Latin yang mampu di edit, dengan menggunakan Optical Character Recognition (OCR), sebagai media yang bisa membantu user dalam mempelajari aksara Jawa dan membantu membaca berbagai tulisan Aksara Jawa dengan mudah. Dari beberapa program penerjemah bahasa yang sudah ada, program tersebut hanya bisa digunakan untuk menerjemahkan huruf dari sebuah file teks dan bukan dari citra. Pada penelitian sebelumnya, program aplikasi yang sudah dibuat dan bisa menerjemahkan huruf dari gambar adalah penerjemah huruf Arab ke huruf Latin, huruf korea ke latin serta huruf Jepang ke latin. Dengan latar belakang ini juga akhirnya topik penerjemah Aksara Jawa ke huruf Latin dari gambar bisa menarik untuk dipilih sebagai tugas akhir. Adapun proses yang dilakukan dalam perancangan program aplikasi ini adalah mengambil gambar aksara jawa hasil print-out lalu dilakukan pengambilan gambar oleh webcam kemudian dilakukan preprocessing, ekstraksi ciri, dan pengenalan karakter menggunakan Jaringan Syaraf Tiruan Self Organizing Map (SOM). Diharapkan melalui metode yang dipilih dapat meningkatkan tingkat akurasi dan menjadi referensi sebagai salah satu metode untuk mengidentifikasi karakter yang handal dan mempunyai tingkat akurasi lebih dari 75 persen. 1
Bab I Pendahuluan Tujuan dan Manfaat Tugas akhir ini memiliki beberapa tujuan diantaranya adalah: Merancang dan membuat program aplikasi yang berfungsi untuk mengenali Aksara Jawa yang diambil melalui webcam kemudian menerjemahkannya ke huruf Latin melalui pengolahan citra digital dengan menggunakan Jaringan Syaraf Tiruan Self Organizing Map (SOM). Menganalisa performansi program aplikasi yang telah dibuat berdasarkan parameter akurasi. 3. Menganalisa waktu yang dibutuhkan program untuk mendapatkan teks latin. Tugas akhir ini diharapkan dapat memberikan manfaat antara lain: Sebagai media yang dapat membantu user mempelajari Aksara Jawa. Sebagai media yang dapat membantu user membaca Aksara Jawa dalam huruf Latin. 3. Rumusan Masalah Permasalahan yang dijadikan obyek penelitian dan pengembangan tugas akhir ini adalah sebagai berikut: Bagaimana membentuk sebuah sistem pengambilan gambar aksara Jawa dari webcam kemudian diproses secara langsung untuk diterjemahkan ke huruf Latin dengan waktu yang cepat. Bagaimana mengenali Aksara Jawa menggunakan Jaringan Syaraf Tiruan SelfOrganizing Map. 4. Batasan Masalah Berdasarkan rumusan masalah yang telah diuraikan diatas maka batasan-batasan masalah pada pembahasan tugas akhir ini adalah: Text Aksara Jawa pada gambar yang akan diproses dalam posisi mendatar sesuai pada tempat yang telah dibuat. Implementasi menggunakan bahasa pemrograman MATLAB 2009a 3. Text Aksara Jawa yang dapat di deteksi adalah Huruf dasar (aksara nglegena) tanpa pasangannya, aksara Murda tanpa Pasangannya, aksara Swara serta tanda baca. DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA JAWA KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP (SOM) 2
Bab I Pendahuluan 4. Format file masukan dalam format.jpg dari gambar dokumen bertuliskan aksara Jawa hasil print-out. 5. Training jaringan syaraf tiruan dilakukan secara terpisah, baik itu training untuk aksara dasar, Aksara Murda dan Aksara Swara, Aksara dengan sandhangan, dan aksara dengan tanda baca. 5. Metodologi Penelitian Metode penelitian pada tugas akhir ini meliputi beberapa tahapan, antara lain sebagai berikut: Mengumpulkan data melalui studi literatur dari buku-buku referensi dan jurnal yang terkait. Studi literatur merupakan tahap pendalaman materi, identifikasi permasalahan dan teori yang berkaitan dengan permasalahan dalam penelitian. Menyusun algoritma untuk merancang program aplikasi yang akan dibuat dan mengimplementasikannya dengan menggunakan bahasa pemrograman MATLAB. 3. Pengujian dan analisa performansi yang bertujuan untuk mengukur akurasi program aplikasi yang telah dibuat. 4. Pengambilan kesimpulan dari penelitian dalam membuat program aplikasi penerjemah Aksara Jawa ke huruf Latin yang telah dilakukan. 6. Sistematika Penulisan Sistematika Penulisan Laporan Tugas Akhir ini terdiri atas lima bab yang disusun sebagai berikut: BAB I : PENDAHULUAN Bab ini membahas latar belakang pemilihan topik tugas akhir, tujuan dan manfaat penelitian, perumusan masalah, batasan masalah, metode penyelesaian masalah dan sistematika penulisan pada tugas akhir ini. BAB II: DASAR TEORI Bab ini menjelaskan teori Aksara Jawa, citra digital, webcam, Optical Character Recognition (OCR), Ekstraksi Ciri, Jaringan Syaraf Tiruan Self Organizing Map (SOM). BAB III: PERANCANGAN DAN SIMULASI SISTEM DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA JAWA KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP (SOM) 3
Bab I Pendahuluan Bab ini akan menguraikan tentang proses perancangan program aplikasi pengenalan karakter Aksara Jawa. BAB IV: ANALISA HASIL Bab ini akan menguraikan hasil dan analisa dari program aplikasi yang telah dibuat. BAB V: KESIMPULAN DAN SARAN Bab ini akan memberikan kesimpulan mengenai hal-hal yang telah dibahas dalam tugas akhir ini dan diberikan pula saran-saran untuk pengembangan topik yang dibahas dalam tugas akhir ini. DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA JAWA KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP (SOM) Powered by TCPDF (www.tcpdf.org) 4
BAB V KESIMPULAN DAN SARAN 5. Kesimpulan Dari hasil analisis terhadap pengujian yang dilakukan pada sistem penerjemah Aksara Jawa dengan menggunakan jaringan syaraf tiruan SOM, maka dapat ditarik kesimpulan sebagai berikut : Pada penggunaan lima metode ektraksi ciri pada lima kelompok aksara, didapat akurasi terbaik saat menggunakan ektraksi ciri sum vertical + sum horizontal. Kecuali pada kelompok akurasi yang bertanda baca, akurasi terbaik ketika menggunakan ektraksi ciri Sum vertical + sum Horizontal + blok. Pembacaan aksara Murda dan Swara pada citra mendapat akurasi tertinggi dibanding pembacaan aksara lainnya, yaitu mencapai 98% dengan parameter JST: Epoch 1500, Topologi hextop, ektraksi ciri Sum vertical + Sum horizontal. 3. Dengan penentuan kombinasi parameter-parameter jaringan yang sesuai, jaringan syaraf tiruan SOM dapat memberikan hasil klasifikasi yang optimal. 4. Waktu yang diperlukan untuk melakukan pengenalan huruf pada 1 file gambar sebesar 7,9 detik. Dimana terdapat 20 karakter tiap 1 file, sehingga didapat waktu pengenalan tiap karakter sebesar 0.395 detik. 5. 5. Penggunaan Topologi baik menggunakan Gridtop maupun Hextop sama baiknya. 6. Makin tinggi tingkat akurasi biasanya makin lambat waktu pemrosesan. Saran Pengembangan yang dapat dilakukan pada tugas akhir ini antara lain : Penggunaan algoritma segmentasi yang bisa memperbaiki kelemahan pada tugas akhir ini. Penggunaan metode ekstraksi ciri lain yang bisa menghasilkan ciri yang lebih spesifik antar tiap karakter. 3. Pada proses klasifikasi bisa digunakan model jaringan syaraf tiruan yang lain baik yang supervised learning maupun unsupervised learning sehingga bisa dibandingkan hasil akhirnya. 30
Bab III Perancangan dan Simulasi Sistem 4. Pemberian data latih yang lebih banyak sehingga bisa digunakan untuk mengenali berbagai macam ukuran dan jenis font. 5. Sistem bisa dikembangkan untuk mengenali aksara jawa dengan pasangannya, serta sandhangan - sandhangan yang lebih lengkap. DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA JAWA KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP (SOM) Powered by TCPDF (www.tcpdf.org) 31
DAFTAR PUSTAKA [1] Gonzales, Rafael C. and Woods, Richard. 1993.Digital Image Processing. USA: Addison-Wesley Publishing Company. [2] Tinku, Acharya and Ajoy K, Ray. 2005. Image Processing Principles and Applications. Wiley. [3] Siang, Jong Jek, Drs., MSc.2005.Jaringan Syaraf Tiruan & Pemrogramannya Menggunakan MATLAB.Yogyakarta:Andi. [4] Fitria, Whielda.Tugas Akhir.2008. Desain Dan Implementasi Sistem Penerjemah Huruf Jepang Kana(Hiragana-Katakana) Ke Huruf Latin Berbasis Pengolahan Citra Digital Dan Jaringan Syaraf Tiruan Self-Organizing Map (SOM) Menggunakan Webcam. Jurusan Teknik Telekomunikasi IT Telkom Bandung. [5] Sukmawan, Arief.Tugas Akhir.2008.Implementasi Pembacaan Huruf Hijaiyyah dengan Pendekatan Struktur Melalui Ekstraksi Ciri Vektor dan Pengenalan Menggunakan Jaringan Syaraf Tiruan SOMs (Self-Organizing Maps). Jurusan Teknik Telekomunikasi IT Telkom Bandung. [6] http://hanacaraka.fateback.com/ [7] http://id.wikipedia.org/wiki/hanacaraka [8] http://id.wikibooks.org/wiki/pengantar_aksara_jawa xii Powered by TCPDF (www.tcpdf.org)