PENGENALAN POLA TULISAN TANGAN AKSARA JAWA MENGGUNAKAN MULTI LAYER PERCEPTRON

STMIK AMIKOM Yogyakarta, 6-8 Februar 2015 PENGENALAN POLA TULISAN TANGAN AKSARA JAWA MENGGUNAKAN MULTI LAYER PERCEPTRON Madha Chrstan Wbowo 1), I Dewa Gede Ra Mardana 2), Sandy Wrakusuma 3) 1), 2), 3) Sstem Komputer STMIK Surabaya Jl. Raya Kedung Baruk 98, Surabaya 60298 Emal : dhama1314@yahoo.com 1), dewa.gederm@gmal.com 2), cluster_sand@yahoo.co.d 3) Atrak Peneltan n berfokus pada optcal character recognton (OCR) untuk tulsan tangan Aksara Jawa Nglegena. Metode pengenalan pola yang dgunakan adalah mult layer perceptron dengan algortma pembelaaran back propagaton. Sampel yang dgunakan adalah 100 set sampel untuk pelathan dan 50 set sampel untuk penguan. Bobot akhr yang dhaslkan telah mampu mengenal sampel pelathan sebesar 100%, dan sampel penguan sebesar 38,1%. Kata kunc: Aksara Jawa Nglegena, pengenalan pola, mult layer perceptron, back propagaton, optcal character recognton. 1. Pendahuluan Indonesa adalah negara yang memlk bermacammacam suku dan budaya. Masng-masng suku dan budaya d Indonesa memlk cr khas, tak terkecual dengan bentuk tulsan. Salah satu suku d Indonesa yang memlk cr khas dalam tulsan adalah suku Jawa yang hurufnya dsebut dengan Aksara Jawa. Aksara Jawa terdr dar konsonan dasar, vokal, angka, pasangan, pangkon, dan tanda baca. Bentuk Aksara Jawa yang palng dasar adalah aksara konsonan dasar, yang dsebut dengan Aksara Jawa Nglegena. Aksara Jawa Nglegena terdr dar 20 huruf yang masng-masng huurfnya mewakl suku kata dengan buny tertentu, sepert yang dtunukkan pada Gambar 1. Wbowo dan Wrakusuma [1] mencoba membuat aplkas optcal character recognton (OCR) untuk mengubah tulsan Aksara Jawa yang ada pada dokumen-dokumen kuno tersebut menad teks dgtal menggunakan model mult layer perceptron (MLP). Aksara Jawa yang dgunakan hanya 5 huruf, Ha, Na, Ca, Ra, dan Ka. Seluruh sampel yang dadkan bahan pelathan dapat dkenal. Akan tetap, dar 25 sampel baru yang du hanya 14 sampel yang berhasl dkenal dengan benar. Sedangkan Hasbuan [2] menggunakan self organzng map (SOM) untuk melakukan pengenalan pola pada huruf cetak Aksara Jawa dengan rata-rata tngkat keberhaslannya mencapa 75,5%. Basu dan Das sudah berhasl mengenal pola tulsan tangan untuk [3] angka dan [4] huruf Bangla, serta [5] angka Arab menggunakan MLP dengan rata-rata tngkat keberhaslan d atas 75%. Namun yang mereka gunakan adalah ctra tulsan yang sudah dekstrak crnya. Peneltan n menggunakan MLP dengan algortma pembelaaran error back propagaton untuk melakukan pengenalan pola terhadap pola Aksara Jawa berdasarkan ctra hasl tulsan tangan. Huruf yang dkenal adalah 20 ens huruf dasar Aksara Jawa modern. Mult layer perceptron (MLP) adalah pengembangan dar model perceptron yang dkembangkan oleh Rosenblatt [6] pada tahun 1958. Perceptron memlk keterbatasan hanya dapat menyelesakan masalah-masalah yang lner, sedangkan MLP dapat dgunakan untuk menyelesakan masalah yang lebh kompleks. Pada dasarnya, MLP adalah perceptron yang memlk layer atau lapsan tambahan d antara layer nput (neuron X ) dan layer output (neuron Y ) yang dsebut dengan hdden layer. Bentuk arngan umum MLP dapat dlhat pada Gambar 2. Proses perhtungan dar setap neuronnya sama dengan perceptron, sepert pada Persamaan 1. Snyal output neuron (v) kemudan dmasukkan ke dalam sebuah fungs aktvas. [7] Dalam hal n fungs aktvas yang dgunakan adalah fungs bnary sgmod dengan fungs sepert pada Persamaan 2 dengan bentuk pada Gambar 3 [8]. Gambar 1. Aksara Jawa Nglegena 3.8-1

STMIK AMIKOM Yogyakarta, 6-8 Februar 2015 Gambar 2. Model Mult Layer Perceptron y f v 1 1 e v... (2) v x w b k n v n x k 0 Gambar 3. Fungs Sgmod 1 k w 1 (, k ) b... (1) : Snyal output yang dhaslkan neuron : Snyal nput untuk neuron : Bobot/snaps yang menghubungkan neuron dengan neuron-neuron d layer sebelumnya : Bas : Indeks layer dar neuron : Indeks neuron pada layer ke- : Indeks neuron pada layer sebelumnya (-1) : Jumlah neuron pada layer ke- Meskpun dgunakan dalam arngan saraf truan, back propagaton sendr bukanlah sebuah arngan saraf truan. Back propagaton adalah sebuah algortma pembelaaran untuk arngan saraf truan sehngga ddapatkan kombnas nla bobot-bobot antar neuron yang sesua. Metode pembelaaran back propagaton adalah pembelaaran berdasarkan contoh. Selama proses pembelaaran, algortma n perlu untuk dberkan pasangan-pasangan nput dan output. Masng-masng pasang berupa satu set pola nput beserta output yang dharapkan terhadap pola tersebut. Back propagaton akan menggunakan output yang dharapkan tersebut serta output yang dhaslkan oleh arngan saraf truan untuk mengubah nla bobot-bobot yang ada dalam arngan saraf truan [9]. Untuk mengubah bobot-bobot tu dengan algortma back propagaton, dgunakan Persamaan 3. w 1 (, k ) w 1 (, k ) y... (3) 1 k Gambar 4. Dagram Blok Sstem 3.8-2

STMIK AMIKOM Yogyakarta, 6-8 Februar 2015 out out out t y g( y )... (4) (, p) 1 h w k, h g( y )... (5) g ( y) f ( y) 1 f ( y)... (6) Pada algortma back propagaton, pon yang pentng adalah bagamana mendapatkan δ. D mana nla δ untuk neuron-neuron d layer output adalah hasl perhtungan error dar tap-tap neuron. Sehngga δ dapat dhtung dengan Persamaan 4. Sedangkan untuk neuron-neuron d layer yang lan, δ dapat dhtung dengan Persamaan 5. Dengan g() adalah turunan pertama dar f (), turunan pertama untuk fungs sgmod dar Persamaan 2 dapat dlhat pada Persamaan 6. Sedangkan parameter µ adalah lau pembelaaran yang menentukan kecepatan proses pembelaaran hngga dapat mendekat nla bobot yang optmal. Semakn besar nla µ, semakn cepat prosesnya. Tetap, resolusnya uga kurang bak. Dagram blok pada Gambar 4 menunukkan model yang akan dgunakan. Obek yang dgunakan adalah ctra dar tulsan tangan. Ctra tulsan tangan dakuss langsung dar responden menggunakan dgtal pen. Ctra tersebut dtulskan secara vrtual ke dalam sebuah obek kanvas yang memlk resolus 30000 pksel (200 x 150 pksel) yang kemudan dsmpan d fle. Dar proses akuss data ddapatkan umlah ctra sampel yang dgunakan adalah 100 set tulsan tangan Aksara Jawa sehngga total ada 2000 sampel yang akan dgunakan dalam proses pembelaaran. Tetap karena ukurannya yang mash terlalu besar, sampel-sampel tersebut harus melalu tahap pemrosesan awal supaya ukurannya menad lebh kecl. Untuk tu dlakukan proses pengeclan ctra dengan menggunakan skala 10 : 1, sehngga data-data yang akan dgunakan sebaga proses pembelaaran berukuran 20 x 15 pksel (300 data) Sampel-sampel yang telah dkeclkan n dgunakan sebaga data nput pada arngan MLP, yang kemudan hasl dar MLP akan devaluas dengan target dar masngmasng nput. Bla mash ada kesalahan antara hasl MLP dengan target, bobot-bobot yang ada pada MLP akan dsesuakan dengan menggunakan algortma back propagaton hngga haslnya konvergen. Dalam peneltan n, ke-2000 sampel tulsan akan dlathkan menggunakan MLP dan back propagaton dengan kombnas pola nput dan target output sepert pada Tabel 1. Sampel-sampel tersebut akan dadkan sebaga data pembelaaran untuk algortma MLP dan back propagaton dengan proses sepert pada dagram alr proses pelathan d Gambar 5. Pelathan terus dlakukan hngga mencapa batasan nla error tertentu. Hasl yang ddapatkan dar proses pembelaaran tersebut adalah bobot dan konfguras bentuk arngan MLP. Pola Aksara Input Tabel 1. Kombnas Input dan Output Target Neuron Output ke- 4 3 2 1 0 Ha 0 0 0 0 0 Na 0 0 0 0 1 Ca 0 0 0 1 0 Ra 0 0 0 1 1 Ka 0 0 1 0 0 Da 0 0 1 0 1 Ta 0 0 1 1 0 Sa 0 0 1 1 1 Wa 0 1 0 0 0 La 0 1 0 0 1 Pa 0 1 0 1 0 Dha 0 1 0 1 1 Ja 0 1 1 0 0 Ya 0 1 1 0 1 Nya 0 1 1 1 0 Ma 0 1 1 1 1 Ga 1 0 0 0 0 Ba 1 0 0 0 1 Tha 1 0 0 1 0 Nga 1 0 0 1 1 Bobot dan arngan n kemudan akan du dengan mencoba mengenal sampel-sampel yang dgunakan sebaga data pembelaaran serta 50 set sampel lan (1000 data) sepert contoh pada Gambar 6 yang dgunakan sebaga data penguan untuk proses evaluas bobot dan arngan yang dhaslkan dar proses pembelaaran. 2. Pembahasan Proses pembelaaran dlakukan dengan konfguras: - Jumlah hdden layer : 2 - Jumlah neuron nput : 300 - Jumlah neuron layer 1 : 120 - Jumlah neuron layer 2 : 80 - Jumlah neuron output : 5 - Lau pembelaaran (µ) : 0.1 - Error mnmum : 10E -3 - Iteras maksmum : 10E +5 Proses pembelaaran dlakukan sebanyak 849044 teras dengan menggunakan 100 set sampel nput dengan nla error akhr sebesar 0.00958442307671328. In berart bahwa proses pembelaaran selesa hngga target error mnmum terhadap data sampel terpenuh. Bobot dan arngan yang dhaslkan kemudan dgunakan untuk melakukan proses pengenalan terhadap sampel pembelaaran dan sampel u. Dar penguan n ddapatkan hasl bahwa seluruh sampel pembelaaran yang dcoba untuk dkenal ulang berhasl dkenal dengan benar. Sedangkan untuk sampel u, 381 sampel dar 1000 sampel u yang terseda dapat dkenal dengan benar sepert tersa pada Tabel 2. 3.8-3

STMIK AMIKOM Yogyakarta, 6-8 Februar 2015 Gambar 6. Contoh 100 dar 1000 Sampel U Tabel 2. Hasl Penguan Sampel U Aksara Berhasl Aksara Berhasl Ha 23 Pa 20 Na 13 Dha 23 Ca 9 Ja 11 Ra 32 Ya 19 Ka 18 Nya 24 Da 22 Ma 21 Ta 20 Ga 19 Sa 19 Ba 7 Wa 8 Tha 22 La 31 Nga 20 TOTAL 381 (a) (b) (c) Gambar 6. Karakter-karakter yang salah dkenal Sampel u yang palng serng salah dkenal adalah aksara Ca, Wa, dan Ba sepert pada Gambar 6. Aksaraaksara tersebut memang memlk kemrpan dengan aksara-aksara lannya. Sebaga contoh, aksara Ca dengan Sa, Wa, dan Dha memlk kemrpan cr d beberapa bagan. Karakter-karakter dalam Aksara Jawa memang memlk pola-pola yang rumt dan banyak d antaranya yang hanya memlk sedkt perbedaan. Akan lebh bak bla ada nformas yang dtambahkan pada pola nput [10], sepert ekstraks ftur-ftur khusus yang menad cr pembeda dalam Aksara Jawa. Sehngga dengan demkan proses pengenalan pola dapat dlakukan dengan lebh bak. Gambar 5. Dagram Alr Proses Pelathan 3.8-4

STMIK AMIKOM Yogyakarta, 6-8 Februar 2015 3. Kesmpulan Dar proses pembelaaran dengan menggunakan 100 set sampel, bobot dan konfguras arngan yang dhaslkan telah dapat mengenal dengan benar seluruh sampel pembelaaran. D lan phak, tngkat keberhaslan untuk 50 set sampel u adalah 38,1%. Sandy Wrakusuma, memperoleh gelar Sarana Komputer (S.Kom.), Jurusan Sstem Komputer STMIK Surabaya, lulus tahun 2010. Memperoleh gelar Magster Teknk (M.T.) Program Pasca Sarana Magster Teknk Elektro Insttut Teknolog Sepuluh Nopember Surabaya, lulus tahun 2013. Persentase tngkat keberhaslan n mash terlalu rendah. Hal n dsebabkan karena banyaknya pola huruf-huruf Aksara Jawa yang mrp satu sama lan. Untuk mengatas hal n, selanutnya akan dlakukan peneltan untuk melakukan ekstraks cr yang sesua bag pola-pola huruf Aksara Jawa. Daftar Pustaka [1] Wbowo, M.C. dan Wrakusuma, S., Pengenalan Pola Tulsan Tangan Aksara Jawa Ha Na Ca Ra Ka Menggunakan Mult Layer Perceptron, n Proc. Semnar Nasonal Sstem & Teknolog Informas (SNASTI) 2013, pp. ICCS 27 ICCS 32. Surabaya. Oktober 24, 2013. [2] Hasbuan, F.M., dkk., Desan dan Implementas Sstem Peneremah Aksara Jawa ke Huruf Latn Berbass Pengolahan Ctra Dgtal dan Jarngan Saraf Truan Self-Organzng Map (SOM), (onlne) http://cdndata.ttelkom.ac.d/tapa/urnal/ 111060121.pdf. 2011. [3] Basu, S., dkk., Handwrtten Bangla Alphabet Recognton usng an MLP Based Classfer, n Proc. 2nd Natonal Conference on Computer Processng of Bangla, pp. 285 291. Dhaka. February, 2005. [4] Basu, S., dkk., An MLP Based Approach for Recognton of Handwrtten Bangla Numerals, n Proc. 2nd Indan Internatonal Conference on Artfcal Intellgence, pp. 407 417. Pune. December, 2005. [5] Das, N., dkk., Handwrtten Arabc Numeral Recognton usng a Mult Layer Perceptron, Proceedng Natonal Conference on Recent Trends n Informaton Systems, pp. 200 203. 2006. [6] Rosenblatt, F., The Perceptron: A Probablstc Model for Informaton Storage and Organzaton n the Bran, n Psychologcal Revew, vol. 5: pp. 368-408. 1958. [7] Fausett, L. Fundamentals of Neural Networks. Prentce-Hall, New York. 2006. [8] Ham, F.M. dan Kostanc, I., Prncples of Neurocomputng for Scence & Engneerng. McGraw-Hll, New York. 2001. [9] Rumelhart, D.E. dkk., 1986, Learnng Representatons by Back- Propagatng Errors. Nature, vol. 323: hal. 533-536. [10] Chaudhur, B.B. dan Bhattacharya, U., Effcent Tranng and Improved Performance of Multlayer Perceptron n Pattern Classfcaton, n Neurocomputng, vol. 34, pp. 11-27. 2000 Bodata Penuls Madha Chrstan Wbowo, memperoleh gelar Sarana Komputer (S.Kom.), Jurusan Sstem Komputer STMIK Surabaya, lulus tahun 2008. Sedang menempuh Program Pasca Sarana Magster Teknk Elektro Insttut Teknolog Sepuluh Nopember Surabaya. Saat n menad Dosen d STMIK Surabaya. I Dewa Gede Ra Mardana, memperoleh gelar Sarana Komputer (S.Kom.), Jurusan Sstem Komputer STMIK Surabaya, lulus tahun 2005. Memperoleh gelar Master of Engneerng (M.Eng.) Program Pasca Sarana Magster Teknk Elektro Unverstas Gaah Mada Yogyakarta, lulus tahun 2014. 3.8-5

STMIK AMIKOM Yogyakarta, 6-8 Februar 2015 3.8-6