PENGENALAN HURUF TULISAN TANGAN PADA FORM HASIL SCANNING MENGGUNAKAN FEATURE EXTRACTION DAN INFERENCE RULE

dokumen-dokumen yang mirip
Oleh: Riza Prasetya Wicaksana

Ekstraksi Fitur Perpotongan dan Lengkungan untuk Mengenali Huruf Cetak

pbab 4 IMPLEMENTASI DAN EVALUASI PROGRAM APLIKASI uji coba terhadap program aplikasi pengenalan plat nomor kendaraan roda empat ini,

PENGENALAN BILANGAN ARAB MENGGUNAKAN TEMPLATE MATCHING

Sistem Pembaca Teks Bahasa Indonesia Otomatis Menggunakan Kamera Web Dengan Metode Integral Proyeksi

BAB 3 METODOLOGI PENELITIAN. a. Spesifikasi komputer yang digunakan dalam penelitian ini adalah

APLIKASI PENCARIAN RUTE OPTIMAL MENGGUNAKAN METODE TRANSITIVE CLOSURE

BAB 1 PENDAHULUAN. memindahkan data secara manual ke dalam komputer untuk dapat diolah lebih

PERBANDINGAN ANALISIS PENGENALAN HURUF ARAB MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION DAN K-NEAREST NEIGHBOR

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. Saat ini, teknologi komputer telah berkembang dengan pesat dan telah

BAB 3 PERANCANGAN SISTEM

BAB I PENDAHULUAN 1.2. Latar Belakang Permasalahan

PERANCANGAN PENGENALAN PLAT NOMOR MELALUI CITRA DIGITAL DENGAN OPENCV

BAB 4 IMPLEMENTASI DAN EVALUASI

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK MENDESAIN KARTU UCAPAN

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI

BAB III ANALISIS DAN PERANCANGAN SISTEM. Dalam pengerjaan tugas akhir ini memiliki tujuan untuk mengektraksi

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

PENGENALAN HURUF TULISAN TANGAN BERBASIS CIRI SKELETON DAN STATISTIK MENGGUNAKAN JARINGAN SARAF TIRUAN. Disusun oleh : Mario Herryn Tambunan ( )

Nama : Raden Septiana Faza NPM : Jurusan : Teknik Informatika Pembimbing 1 : Dr. Rodiah Pembimbing 2 : Fitrianingsih, Skom.

BAB III METODE PENELITIAN. Tujuan tugas akhir ini akan membangun suatu model sistem yang

PENGENALAN AKSARA BALI MENGGUNAKAN METODE MODIFIED DIRECTION FEATURE DAN ALGORITMA GENERALIZED LEARNING VECTOR QUANTIZATION (GLVQ)

APLIKASI IMAGE STABILIZER DENGAN METODE UNSHARP MASK

Oleh: Ulir Rohwana ( ) Dosen Pembimbing: Prof. Dr. H. M. Isa Irawan, M.T.

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

Bab 1 PENDAHULUAN Latar Belakang Masalah

BAB III METODE PENELITIAN

BAB 3 ANALISA DAN PERANCANGAN

Identifikasi Tanda Tangan Menggunakan Transformasi Gabor Wavelet dan Jarak Minskowski

IMPLEMENTASI DAN EVALUASI

BAB 2 LANDASAN TEORI. metode yang digunakan sebagai pengawasan kendaraan yang menggunakan pengenalan

Rekognisi karakter optik merupakan salah satu aplikasi pengenalan pola yang

PENGOLAHAN CITRA DIGITAL MENGGUNAKAN TEKNIK FILTERING ADAPTIVE NOISE REMOVAL PADA GAMBAR BERNOISE

Oleh : Umar Maksum Dosen Pembimbing : Ahmad Zaini, ST, M.T. Dr. I Ketut Eddy Purnama.ST.,MT

BAB 1 PENDAHULUAN. dengan proses pengolahan citra digital (digital image processing), dimana data berupa

BAB I PENDAHULUAN. tangan dijadikan alat untuk menganalisis kepribadian pemiliknya. Sebuah

PENGENALAN POLA MARGINS TULISAN TANGAN UNTUK MENGIDENTIFIKASI KARAKTER SESEORANG MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM)

APLIKASI JARINGAN SYARAF TIRUAN UNTUK MENGENALI TULISAN TANGAN HURUF A, B, C, DAN D PADA JAWABAN SOAL PILIHAN GANDA

DETEKSI DAN SEGMENTASI OTOMATIS DERET PADA CITRA METERAN AIR

PEMBUATAN APLIKASI STEREOGRAM GENERATOR

PEMANFAATAN NEURAL NETWORK PERCEPTRON PADA PENGENALAN POLA KARAKTER

SISTEM PENGENALAN PENGUCAPAN HURUF VOKAL DENGAN METODA PENGUKURAN SUDUT BIBIR PADA CITRA 2 DIMENSI ABSTRAK

KOMBINASI METODE MORPHOLOGICAL GRADIENT DAN TRANSFORMASI WATERSHED PADA PROSES SEGMENTASI CITRA DIGITAL

OPTICAL CHARACTER RECOGNITION DAN INFORMATION EXTRACTION PADA DOKUMEN KAMUS BILINGUAL ABSTRAK

PERANCANGAN APLIKASI PENGOLAHAN CITRA TEKS ARAB DAN PENERJEMAHANNYA KE DALAM BAHASA INDONESIA MENGGUNAKAN SMARTPHONE ANDROID

BAB III PERANCANGAN SISTEM

Segmentasi Plat Nomor Kendaraan Dengan Menggunakan Metode Run-Length Smearing Algorithm (RLSA)

BAB 3 PERANCANGAN SISTEM

PEMBUATAN APLIKASI STEREOGRAM GENERATOR

Pengantar PENGOLAHAN CITRA. Achmad Basuki PENS-ITS Surabaya 2007

DETEKSI DAN REPRESENTASI FITUR MATA PADA SEBUAH CITRA WAJAH MENGGUNAKAN HAAR CASCADE DAN CHAIN CODE

BAB 4 IMPLEMENTASI DAN EVALUASI

UKDW BAB I PENDAHULUAN Latar Belakang

APLIKASI PENGENALAN DAUN UNTUK KLASIFIKASI TANAMAN DENGAN METODE PROBABILISTIC NEURAL NETWORK

BAB 2 LANDASAN TEORI. Teknologi pengenalan teks merupakan teknologi yang mampu mengenali teks

BAB 4. Sistem Yang Diusulkan

JURNAL PENGENALAN POLA KAKI O DAN KAKI X MENGGUNAKAN METODE BRAY-CURTIS DISTANCE

Pemotongan Poligon Menggunakan Algoritma Weiler Atherton

PENGUJIAN PENGENALAN KARAKTER PADA KTP MENGGUNAKAN METODE TEMPLATE MATCHING

Fitur bentuk merupakan fitur dasar dalam visual content

Implementasi Metode Watershed Transformation Dalam Segmentasi Tulisan Aksara Bali Berbasis Histogram

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

PERANCANGAN PROGRAM APLIKASI PENGENALAN TEKS MENGGUNAKAN FUZZY LOGIC

PEMBUATAN PERANGKAT LUNAK EDITOR DENAH RUANG 2D UNTUK DIVISUALISASIKAN SECARA 3D 1

BAB 3 ANALISA DAN PERANCANGAN SISTEM

BAB V : KESIMPULAN DAN SARAN 38 V.1. Kesimpulan 38 V.2. Saran 38 DAFTAR PUSTAKA LAMPIRAN

SISTEM PENGENALAN WAJAH MENGGUNAKAN WEBCAM UNTUK ABSENSI DENGAN METODE TEMPLATE MATCHING

PENGKONVERSIAN IMAGE MENJADI TEKS UNTUK IDENTIFIKASI PLAT NOMOR KENDARAAN. Sudimanto

Deteksi dan Klasifikasi Citra Berdasarkan Warna Kulit Menggunakan HSV

Deteksi Tepi pada Citra Digital menggunakan Metode Kirsch dan Robinson

IDENTIFIKASI NOMOR POLISI KENDARAAN BERMOTOR MENGGUNAKAN JARINGAN SYARAF TIRUAN SELF ORGANIZING MAPS (SOMS)

BAB 1 PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI OPTICAL CHARACTER RECOGNITION (OCR) DENGAN PENDEKATAN METODE STRUKTUR MENGGUNAKAN EKSTRAKSI CIRI VEKTOR DAN REGION

SEGMENTASI CITRA MEDIK MRI (MAGNETIC RESONANCE IMAGING) MENGGUNAKAN METODE REGION THRESHOLD

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

PERBANDINGAN ALGORITMA TEMPLATE MATCHING DAN FEATURE EXTRACTION PADA OPTICAL CHARACTER RECOGNITION

BAB IV HASIL DAN PENGUJIAN. telah dibuat. Pengujian yang dilakukan adalah menguji proses region of interest

PENGENALAN POLA HURUF JEPANG (KANA) MENGGUNAKAN DIRECTION FEATURE EXTRACTION DAN LEARNING VECTOR QUANTIZATION

BAB II LANDASAN TEORI

BAB IV HASIL DAN PENGUJIAN. Perancangan perangkat lunak terdiri dari beberapa bagian, yaitu perangkat

PENGEMBANGAN APLIKASI PERHITUNGAN JUMLAH OBJEK PADA CITRA DIGITAL DENGAN MENGGUNAKAN METODE MATHEMATICAL MORPHOLOGY

BAB I PENDAHULUAN 1.1 Latar Belakang

DETEKSI KEBAKARAN BERBASIS WEBCAM SECARA REALTIME DENGAN PENGOLAHAN CITRA DIGITAL

BAB I PENDAHULUAN I.1.

Pengenalan Tulisan Tangan Dengan Menggunakan Metode Diagonal Feature Extraction dan K-Nearest Neighbour. Yustar Pramudana

BAB IV HASIL DAN PEMBAHASAN

BAB 3 METODOLOGI PENELITIAN

STMIK MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2011/2012

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM

PERANCANGAN PROGRAM APLIKASI PENGENALAN TEKS MENGGUNAKAN FUZZY LOGIC

ROBOT MOBIL DENGAN SENSOR KAMERA UNTUK MENELUSURI JALUR PADA MAZE

BAB 3 PERANCANGAN SISTEM. mendapatkan input, melakukan proses, dan menghasilkan output yang diinginkan oleh

PERANCANGAN APLIKASI PENGENAL KARAKTER UNTUK PERHITUNGAN MATEMATIKA BERBASIS TESSERACT

Implementasi Image Enhancement Menggunakan Homomorphic Filtering

PENGENALAN WAJAH DENGAN METODE TEMPLATE MATCHING SEBAGAI SISTEM STARTER SEPEDA MOTOR BERBASIS MIKROKONTROLER ATMEGA 16 Oleh : Margito Hermawan

BAB I PENDAHULUAN. begitu pula dengan perusahaan perusahaan yang menyediakan jasa data entry.

PENGENALAN POLA GARIS DASAR KALIMAT PADA TULISAN TANGAN UNTUK MENGETAHUI KARAKTER SESEORANG DENGAN MENGGUNAKAN ALGORITMA PROBABILISTIC NEURAL NETWORK

ABSTRAK Robovision merupakan robot yang memiliki sensor berupa indera penglihatan seperti manusia. Untuk dapat menghasilkan suatu robovision, maka

Transkripsi:

PENGENALAN HURUF TULISAN TANGAN PADA FORM HASIL SCANNING MENGGUNAKAN FEATURE EXTRACTION DAN INFERENCE RULE Rudy Adipranata 1, Rolly Intan 2, Delmar Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Kristen Petra, Surabaya rudya@petra.ac.id 1, rintan@petra.ac.id 2 ABSTRACT Nowadays computer tehcnology has been frequently used to facilitate human activities. OCR (Obect Character Recognition) is one example of those technologies used to recognize any kind of character and letter. In this research, we implement a software that is able to recognize handwritten characters in form. This software uses feature extraction and inference rule in its development. Feature extraction is a progress to extract features owned by a character. Recognizing progress is accomplished by comparing tracked character s features and database character s features using inference rule. Tracked character will be recognized appropriate with the result from inference rule progress. This software is created by using Microsoft Visual C++ 6.0, with library assist once from Intel Image Processing Library (IPL) and Intel Open Source Computer Vision (OpenCV). The software is tested using a variety of handwritten characters and the testing result shows that the accuracy of handwritten character recognition using this software is about 79.4% Keywords: Feature Extraction, Handwritten Character Recognition, Inference Rule, Scanning. 1. Pendahuluan Pengisian data pada sebuah form seringkali digunakan sebagai metode pengumpulan data untuk berbagai macam keperluan. Contoh dari form tersebut adalah form aplikasi tabungan, form aplikasi kartu kredit, dan form kuisioner. Cara ini memang baik digunakan mengingat banyak waktu dan biaya yang dapat dihemat untuk memperoleh data. Meskipun cara ini sudah banyak digunakan akan tetapi proses pembacaan hasil form isian secara otomatis dengan menggunakan komputer masih menadi masalah. Masalahnya adalah hasil isian pada form berupa tulisan tangan sedangkan OCR yang ada kebanyakan hanya dapat membaca huruf cetak. Hal ini menyebabkan proses memasukkan data form ke komputer masih harus menggunakan proses manual. Untuk itu pada penelitian ini dikembangkan sebuah perangkat lunak untuk mengenali hasil isian pada form yang menggunakan tulisan tangan. Perangkat lunak ini akan menghasilkan data mengenai huruf yang dikenali sesuai dengan apa yang telah dipelaari, dan hasil pengenalan dapat langsung disimpan pada file text. Hasil yang diberikan oleh perangkat lunak bergantung pada banyaknya variasi sampel yang diberikan. Semakin banyak variasi sampel yang dipelaari dan tingkat kekonsistenan yang tinggi dalam penulisan huruf, maka hasil pengenalan akan semakin akurat. Gambar 1. Contoh Form 2. Teori Penunang 2.1 Holistic Feature Extraction Holistic feature extraction adalah salah satu bentuk pengambilan feature yang dapat digunakan untuk mengenali suatu huruf (Karacs, 2001, 2002). Holistic feature extraction bahkan dapat digunakan untuk mengenali huruf pada kata-kata yang dituliskan secara bersambung, tetapi dalam perangkat lunak ini hanya dibatasi pada pengenalan sebuah huruf secara terpisah. Feature yang termasuk holistic feature extraction adalah ascenders and descenders, height and width, hill and valley. Tetapi tidak semua holistic features digunakan pada penelitian ini, karena tidak semua feature relevan dengan keperluan perangkat lunak yang dikembangkan. Holistic features yang digunakan pada penelitian ini adalah hill and valley. 2.1.1 Hill and Valley Hill and valley merupakan salah feature yang penting dalam pengenalan huruf. Sesuai dengan namanya, hill digunakan untuk mencari obyek dari huruf yang menyerupai bukit, sedangkan valley digunakan untuk mencari obyek dari huruf 258

yang menyerupai lembah. Pengertian hill / bukit di sini adalah apabila huruf mengalami pengurangan nilai koordinat y yang kemudian pada titik tertentu mengalami penambahan nilai koordinat y. Cara menghitung umlah hill ini adalah : - Cari koordinat huruf dari yang paling bawah. - Dari koordinat paling bawah tambah terus nilai koordinat x sekaligus cek nilai koordinat y. - Apabila koordinat y mengalami penurunan, artinya telah teradi garis naik - Setelah teradi garis naik cek terus nilai koordinat y, apabila pada titik tertentu teradi penambahan koordinat y maka telah teradi garis turun. - Kondisi saat telah teradi satu garis naik kemudian dilanutkan oleh satu garis turun terhadap garis horisontal disebut sebagai sebuah bukit. Gambar 2. Hill Pengertian valley / lembah adalah apabila huruf mengalami penambahan nilai koordinat y yang kemudian pada titik tertentu mengalami penurunan nilai koordinat y. Cara menghitung umlah valley ini adalah : - Cari koordinat huruf dari yang paling atas.. - Dari koordinat paling atas tambah terus nilai koordinat x sekaligus cek nilai koordinat y. - Apabila koordinat y mengalami penambahan, artinya telah teradi garis turun - Setelah teradi garis turun cek terus nilai koordinat y, apabila pada titik tertentu teradi pengurangan koordinat y maka telah teradi garis naik. - Kondisi saat telah teradi satu garis turun kemudian dilanutkan oleh satu garis naik terhadap garis horisontal disebut sebagai sebuah lembah. Gambar 3. Valley 2.2 Other Feature Extraction Disamping menggunakan holistic feature extraction, pada penelitian ini dikembangkan pula feature extraction yang lain yang digunakan untuk mendapatkan feature dari huruf, yaitu umlah garis horisontal, umlah garis vertikal, umlah perpotongan dengan garis horisontal, umlah perpotongan dengan garis vertikal, umlah left slope serta umlah right slope. 2.2.1 Garis Horisontal Untuk menghitung umlah garis horisontal digunakan cara: - Cek nilai piksel pada lokasi huruf mulai dari kiri atas ke kanan bawah. - Apabila menemui piksel berwarna hitam atau bernilai nol, teruskan periksa ke sebelah kanan. - Apabila di sebelah kanan terdapat piksel hitam dengan panang minimal 5 piksel setelah itu berisi piksel dengan warna putih, maka deretan piksel hitam itu disebut sebagai sebuah garis horisontal. Jumlah 5 piksel diperoleh dari hasil penguian yang telah dilakukan terhadap responden. Rata-rata garis horisontal yang dibuat oleh responden tidak kurang dari 5 piksel dengan ukuran kotak yang disediakan. - Garis horisontal ini memiliki toleransi 1 piksel ke atas dan ke bawah, hal ini dilakukan untuk mengantisipasi apabila teradi garis yang agak miring. 2.2.2. Garis Vertikal Mirip dengan garis horisontal, hanya untuk garis vertikal ini pencarian dilakukan dari atas ke bawah. Detail cara perhitungan adalah sbb: - Cek nilai piksel pada lokasi huruf mulai dari kiri atas ke kanan bawah. - Apabila menemui piksel berwarna hitam atau bernilai nol, teruskan periksa ke arah bawah. - Apabila di sebelah bawah terdapat piksel hitam dengan panang minimal 5 piksel setelah itu berisi piksel dengan warna putih, maka deretan piksel hitam itu disebut sebagai sebuah garis vertikal. - Garis vertikal ini memiliki toleransi 1 piksel ke kiri dan ke kanan, hal ini dilakukan untuk mengantisipasi apabila teradi garis yang agak miring. 2.2.3. Perpotongan dengan Garis Horisontal Guna menghitung umlah perpotongan dengan garis horisontal digunakan cara: - Buat garis horisontal / mendatar mulai dari kiri ke kanan. - Apabila menemui piksel berwarna hitam atau bernilai nol, teruskan periksa ke arah kanan. - Apabila di sebelah kanan terdapat piksel hitam kemudian dilanutkan dengan piksel berwarna putih, berarti sudah memiliki satu titik potong terhadap garis horisontal. - Teruskan pengecekan hingga posisi akhir huruf di sebelah kanan, dan akumulasikan umlah titik potong. 259

Gambar 4. Perpotongan dengan Garis Horisontal 2.2.4. Perpotongan dengan Garis Vertikal Pada feature ini, cara menghitung umlah perpotongan adalah : - Buat garis vertikal / tegak mulai dari atas ke bawah. - Apabila menemui piksel berwarna hitam atau bernilai nol, teruskan periksa ke arah bawah. - Apabila di sebelah bawah terdapat piksel hitam kemudian dilanutkan dengan piksel berwarna putih, berarti sudah memiliki satu titik potong terhadap garis vertikal. - Teruskan pengecekan hingga posisi akhir huruf di sebelah bawah, dan akumulasikan umlah titik potong. Gambar 5. Perpotongan dengan Garis Vertikal 2.2.5. Left Slope Pengertian left slope di sini adalah apabila huruf mengalami penambahan nilai koordinat x yang kemudian pada titik tertentu mengalami penurunan nilai koordinat x. Cara menghitung umlah left slope ini adalah : - Cari koordinat huruf dari yang paling atas. - Dari koordinat paling atas tambah terus nilai koordinat y sekaligus cek nilai koordinat x. - Apabila koordinat x mengalami penambahan, artinya telah teradi garis naik. - Setelah teradi garis naik cek terus nilai koordinat x, apabila pada titik tertentu teradi penurunan koordinat x maka telah teradi garis turun. - Kondisi saat telah teradi satu garis naik kemudian dilanutkan oleh satu garis turun terhadap garis vertikal disebut sebagai sebuah left slope. Gambar 6. Left Slope 2.2.6. Right Slope Feature ini digunakan untuk menghitung umlah right slope yang terdapat pada huruf. Pengertian right slope di sini adalah apabila huruf mengalami penurunan nilai koordinat x yang kemudian pada titik tertentu mengalami penambahan nilai koordinat x. Cara menghitung umlah right slope ini adalah: - Cari koordinat huruf dari yang paling bawah. - Dari koordinat paling bawah kurangi terus nilai koordinat y sekaligus cek nilai koordinat x. - Apabila koordinat x mengalami penurunan, artinya telah teradi garis turun. - Setelah teradi garis turun cek terus nilai koordinat x, apabila pada titik tertentu teradi penambahan koordinat x maka telah teradi garis naik. - Kondisi saat telah teradi satu garis turun kemudian dilanutkan oleh satu garis naik terhadap garis vertikal disebut sebagai sebuah right slope. Gambar 7. Right Slope 2.3 Region Percentation Region percentation merupakan perhitungan persentase nilai piksel hitam yang ada pada tiap region dibandingkan dengan total piksel yang ada pada region yang sama. Pengertian region di sini adalah daerah-daerah yang terbentuk dari pembagian proporsi huruf. Jumlah region yang digunakan adalah 9 buah dan dibentuk dari posisi awal huruf hingga akhir huruf, tidak menggunakan pembagian wilayah berdasarkan kotak huruf. Penentuan umlah region sebanyak 9 buah diambil menurut sumber referensi (Parker, 1994). Cara menghitung persentase region ini adalah : - Cari koordinat huruf paling awal dan koordinat huruf paling akhir.. - Bentuk wilayah-wilayah dengan cara membagi wilayah koordinat huruf dengan pembagian yang proporsional sebanyak 9 wilayah. - Pada masing-masing wilayah hitung persentase nilai piksel hitam terhadap umlah piksel seluruhnya yang ada dalam wilayah tersebut. 260

Gambar 8. Region Percentation 2.4 Inference Rule Rule merupakan aturan berisi sederetan fakta yang dapat digunakan untuk mengambil suatu keputusan. Perangkat lunak ini menggunakan rule yang dikumpulkan dalam database. Rule tersebut feature-feature yang dimiliki oleh masingmasing huruf yang telah dianalisa. Setiap huruf akan memiliki feature atau ciri yang membedakan huruf tersebut dengan huruf lainnya. Sebuah huruf dapat mempunyai lebih dari satu rule, yang merupakan representasi dari adanya variasi tulisan tangan untuk sebuah huruf. Dalam melakukan proses recognition atau pengenalan, rule huruf yang akan dikenali dibandingkan dengan rule yang sudah tersimpan dalam database dari proses training. Untuk mengetahui tingkat kemiripan atau similarity antara rule yang baru terbentuk dengan rule yang sudah tersimpan di dalam database digunakan confidence factor atau nilai CF. Nilai CF minimal adalah 0 apabila rule yang baru di-input-kan sama sekali tidak memiliki feature yang sama dengan rule pada database. Nilai maksimal adalah 1 apabila rule yang baru di-input-kan memiliki feature yang benar-benar sama dengan rule pada database. Pada masing-masing rule untuk setiap feature akan diperoleh nilai satu ika sama dan nol ika berbeda, kecuali untuk perhitungan region percentation. Dalam sistem ini digunakan 17 feature, dimana 8 feature pertama adalah umlah garis horisontal, umlah garis vertikal, umlah perpotongan dengan garis horisontal, umlah perpotongan dengan garis vertikal, umlah hill, umlah valley, umlah left slope dan umlah right slope dan feature berikutnya adalah region percentation yang berisi perbandingan piksel hitam pada daerah-daerah huruf, dimana terdapat 9 region yang menyatakan 9 feature. Untuk menghitung nilai confidence factor, digunakan formula: ( R, N ) 8 = 1 δ 17 ( Ri N ) + β ( Ri N ) = 9 λ i = (1) 17 dimana N merupakan sekumpulan (set) dari nilai-nilai features yang di-input-kan untuk dikenali/dibandingkan dengan nilai-nilai feature yang ada di database. N = { N( a ) {1,2,3,4,...,17}} (2) Dalam hal ini N ) adalah nilai feature a untuk input N. Ri adalah rule ke i. Untuk feature a 1 hingga a 8, perhitungan similarity antara N dan R i dilakukan oleh fungsi : + + + δ : I x I [ 0,1 ], I = { 0,1,2,3,...} (3) dan dinyatakan sebagai berikut: Ri( a) N( a) δ ( Ri N ) = 1 (4) max( Ri( a Na) Untuk = {1, 2, 3, 4, 5, 6, 7, 8}, R i) 0 atau N ) 0 Sedangkan untuk feature a 9 hingga a 17, perhitungan similarity antara N dengan R i menggunakan persamaan: β :[ 0,1 ] x [ 0,1 ] [ 0,1 ] (5) dan dinyatakan sebagai berikut: β ( Ri N ) = max ( 0, ( 1 ( Ri ) N ) ) (6) Untuk = { 9, 10, 11, 12, 13, 14, 15, 16, 17} 3. Desain Sistem Secara garis besar, proses perangkat lunak terbagi menadi dua bagian yaitu training serta recognition (pengenalan). 3.1 Training Proses training atau proses pembelaaran tulisan adalah suatu proses dimana terdapat suatu input berupa gambar berisi tulisan untuk dipelaari karakterisitiknya dan nantinya karakteristik tersebut akan tersimpan dalam bentuk rule. Secara garis besar, proses training tulisan dapat dibagi menadi dua bagian, yaitu: image preprocessing dan feature extraction. 261

Begin Input Dokumen image (.BMP atau.jpg) Image Preprocessing Proses Feature Extraction End Gambar 9. Flowchart Training Image preprocessing merupakan proses yang dilakukan terhadap dokumen image sebelum diproses lebih lanut. Tuuan dari image preprocessing ini adalah untuk menghilangkan faktor-faktor yang dapat menyebabkan pembacaan program menadi kurang akurat. image preprocessing terdiri dari beberapa proses yaitu : thresholding (Gonzales, 2002 skew angle detection (Parker, 1994 rotasi (Harrington, 1987) dan thinning (Parker, 1994). Feature extraction adalah suatu proses untuk mengambil feature / ciri khusus dari huruf-huruf yang dituliskan pada form pembelaaran. Sebelum dapat melakukan proses feature extraction, terlebih dahulu harus dilakukan pelacakan posisi kotak-kotak berisi huruf yang terdapat pada form pembelaaran. Setelah diperoleh posisi kotak-kotak yang berisi huruf, kemudian dilakukan analisa terhadap feature untuk tiap huruf. Analisa untuk mendapatkan feature tersebut adalah seperti terdapat di bagian 2 Teori Penunang. 3.2 Recognition Recognition atau proses pengenalan adalah suatu proses dimana terdapat suatu input berupa gambar berisi tulisan untuk dikenali hurufnya. Secara garis besar, proses recognition dibagi menadi beberapa bagian, yaitu: image preprocessing, feature extraction, dan character recognition. Jadi dibandingkan dengan proses training, terdapat penambahan bagian pengenalan itu sendiri. Begin Input: Dokumen image (.BMP atau.jpg) Image Preprocessing Feature Extraction Character Recognition Output: Data dalam bentuk teks End Gambar 10. Flowchart Recognition Pada proses recognition ini, bagian image preprocessing serta character recognition sama seperti pada proses training. Penambahan adalah pada bagian character recognition dimana pada bagian ini dilakukan inference rule untuk 262

membandingkan antara rule yang baru didapat dengan semua rule yang telah tersimpan pada database guna mendapatkan nilai confidence factor (CF). Hasil pengenalan ditentukan dari nilai CF tertinggi yang diperoleh. 4. Implementasi dan Hasil Penguian Implementasi sistem dilakukan dengan menggunakan bahasa pemrograman Visual C++ 6.0 (Chien, 2002) serta bantuan Intel IPL (Intel, 2000) dan Intel OpenCV (Intel, 2001). Dari hasil perangkat lunak yang dikembangkan kemudian dilakukan penguian pengenalan dengan beberapa kondisi yang berbeda. Pada penguian 1 dilakukan training hanya terhadap satu orang dan kemudian orang yang sama akan melakukan pengenalan tulisan tangan. Hasil dari penguian 1 adalah: Tabel 1. Hasil Penguian 1 Jenis Pengenalan Jumlah Karakter Jumlah Benar Jumlah Salah Persentase Karakter Benar Responden 1 60 52 8 86.67 Responden 2 41 34 7 82.93 Rata-rata 84.80 Pada penguian 2, dilakukan dengan cara training terhadap beberapa orang dan pengenalan dilakukan oleh salah satu orang yang sebelumnya telah melakukan training. Hasil dari penguian ini dapat dilihat pada tabel 2. Tabel 2. Hasil Penguian 2 Jenis Pengenalan Jumlah Karakter Jumlah Benar Jumlah Salah Persentase Karakter Benar Responden 1 60 49 11 81.67 Responden 2 45 39 6 86.67 Rata-rata 84.17 Pada penguian 3 atau terakhir, penguian dilakukan terhadap responden yang belum pernah melakukan training sebelumnya. Hasil dari penguian ini terdapat pada tabel 3. Tabel 3. Hasil Penguian 3 Jenis Pengenalan Jumlah Karakter Jumlah Benar Jumlah Salah Persentase Karakter Benar Responden 1 53 41 12 77.36 Responden 2 54 33 21 61.11 263 Rata-rata 69.23 5. Kesimpulan Berdasarkan penguian yang telah dilakukan maka dapat disimpulkan bahwa : - Rata-rata tingkat keberhasilan pengenalan tulisan tangan dari ketiga macam penguian yang dilakukan adalah sebesar 79.4 persen. - Kemiringan form pada saat di-scan akan mempengaruhi tingkat akurasi pengenalan. Semakin besar sudut kemiringan form, maka hasil pengenalan semakin rendah. - Semakin banyak variasi tulisan tangan belum tentu dapat memperbaiki hasil pengenalan, selain itu membuat ukuran database menadi besar dan proses menadi lebih lambat. Daftar Pustaka [1] Chien, Chao C. (2002). Professional Software Development with Visual C++ 6.0 & MFC. Hingham, Massachusetts, Charles River Media Inc, USA. [2] Gonzales, Rafael C, et al. (2002). Digital Image Processing. 2 nd Edition. Olahion, New Jersey, USA. [3] Harrington, Steven. (1987). Computer Graphics A Programming Approach (2 nd Edition). McGraw-Hill, Singapore. [4] Intel. (2000). Intel Image Processing Library Reference Manual. Intel Corporation, USA. [5] Intel. (2001). Open Source Computer Vision Library Reference Manual. Intel Corporation, USA. [6] Karacs, Kristof. (2001) Holistic Feature Extraction from Handwritten Words on Wave Computers. http:// www.cedar.buffalo.edu /papers/articles/role_holistic_2001.pdf, diakses terakhir 12 Januari 2006. [7] Karacs, Kristof. (2002) Analogic Preprocessing and Segmentation Algorithms for Off-line Handwriting Recognition. http://lab.analogic.sztaki.hu/publications/rcs/csc_2002_hwcharrec.pdf, diakses terakhir 22 Desember 2005. [8] Parker, J.R. (1994). Practical Computer Vision Using C. John Wiley & Sons Inc, New York, USA.