BAB 4 IMPLEMENTASI DAN EVALUASI 4.1 Implementasi 4.1.1 Spesifikasi Perangkat Keras Spesifikasi perangkat keras yang digunakan dalam pembuatan program ini adalah sebagai berikut: Prosesor Intel Atom 1,6 GHz Memori RAM 1 GHz VGA Card OnBoard Hardisk 120 GB Monitor Keyboard Mouse 4.1.2 Spesifikasi Piranti Lunak Spesifikasi piranti lunak yang digunakan dalam pembuatan program ini adalah sebagai berikut: Microsoft Windows P Borland Delphi 7.0 MsPaint
62 4.2 Tampilan Program 4.2.1 Menu Utama Menu Utama merupakan bagian utama program ini. Ada beberapa pilihan menu yang dapat dipilih oleh pengguna, yaitu: File : New, Open Image, Save Text As, Exit Setting : Font, Labeling, Fast Recognize Run : Training, Recognize Help : Program Help, About Gambar 4.1 Tampilan Menu Utama 4.2.2 Menu Open Image Menu Open Image bertugas menampilkan citra yang akan dikenali. Citra tersebut diambil dari File pada komputer pengguna. Untuk masuk ke dalam menu ini pengguna dapat memilih menu File Open Image atau langsung menekan Ctrl+O.
63 Gambar 4.2 Tampilan Menu Open Image Gambar 4.2 Tampilan Setelah Open Image
64 4.2.3 Menu Setting Pada menu Setting, pengguna dapat menentukan pilihan sesuai dengan yang diinginkan pengguna. Pilihan-pilihan tersebut adalah sebagai berikut. 1. Font Menentukan jenis font pada teks output dengan menampilkan Font Dialog. Gambar 4.3 Tampilan Menu Font 2. Labeling Pemberian tanda centang pada menu ini berarti menambahkan proses labeling pada sistem pengenalan teks. Proses labeling digunakan untuk mengenali huruf-huruf yang menempel tetapi tidak saling terhubung.
65 3. Fast Recognize Pemberian tanda centang pada menu ini berarti saat menjalankan perintah Recognize, program akan langsung menampilkan hasil teks output. Sebaliknya, jika pada menu ini tidak diberi tanda centang, maka saat menjalankan perintah Recognize, program akan melakukan tahap demi tahap. Gambar 4.4 Tampilan Menu Setting 4.2.4 Menu Recognize Menu Recognize terdiri dari 5 (lima) tahapan proses, yaitu: Grayscaling, Thresholding, Filtering, Segmentation, dan Recognition.
66 Gambar 4.5 Tampilan Proses Grayscaling Gambar 4.6 Tampilan Proses Thresholding
67 Gambar 4.7 Tampilan Proses Filtering Gambar 4.8 Tampilan Proses Segmentation
68 Gambar 4.9 Tampilan Proses Recognition 4.2.5 Menu Training Pada menu Training ini, pengguna dapat membuat library sendiri. Ada tiga pilihan yang dapat dilakukan, yaitu: Font Size Type : Menentukan fokus ukuran huruf yang akan dikenali pada sistem fuzzy. Pilihan ini sendiri terdiri dari empat pilihan yaitu: All, Small, Large, dan Other. Pilihan All berarti sistem fuzzy dapat dengan baik digunakan untuk mengenali semua ukuran huruf. Pilihan Small berarti sistem fuzzy difokuskan untuk mengenali huruf dengan ukuran yang kecil (Font 8-12). Pilihan Large berarti sistem fuzzy difokuskan untuk mengenali huruf dengan ukuran yang besar (Font >12). Pilihan Other berarti pengguna dapat memasukkan library sendiri dengan nama ImgOther pada picture library.
69 Matrix Box : Menentukan ciri berupa jumlah box (n x n) yang diambil pada sistem fuzzy. Pilihan ini direkomendasikan untuk pengguna lanjutan (advanced user). Pixel Per Box : Menentukan ciri berupa jumlah pixel per box (n x n) yang diambil pada sistem fuzzy. Pilihan ini direkomendasikan untuk pengguna lanjutan (advanced user). Gambar 4.10 Tampilan Menu Training 4.2.6 Menu Save Text As Menu ini bertugas untuk melakukan penyimpanan hasil output sistem yang berupa teks ke dalam File pada komputer pengguna dengan format text (.txt). Untuk melakukan save pengguna dapat memilih menu File Save Text As atau langsung menekan Ctrl+S.
70 Gambar 4.11 Tampilan Menu Save Text As 4.2.7 Menu Help Menu Help terdiri dua bagian menu, yaitu: menu Program Help yang merupakan menu bantuan bagi pengguna dan menu About. Gambar 4.12 Tampilan Menu Help
71 Gambar 4.13 Tampilan Menu About 4.3 Evaluasi Dalam melakukan evaluasi program, pada pengujian pertama dilakukan beberapa konfigurasi yang berasal dari pengaturan menu Training. Pengaturan tersebut berupa Type (Font Size Type), Nilai Box (Matrix Box), dan Nilai Pixel Per Box (Pixel Per Box). Setelah konfigurasi selesai, program ini diuji untuk mengenali huruf satu per satu. Pengujian lain yang dilakukan adalah untuk mengenali teks pada citra berupa dokumen standar. Pengujian terakhir yang dilakukan adalah pengujian pengaruh penggunaan labeling dalam sistem ini. Berikut hasil pengujian terhadap sistem pengenalan teks serta pembahasan hasil evaluasi tersebut. 4.3.1 Pengujian Nilai Box dan Pixel Per Box Pengujian ini dilakukan untuk mencari nilai Box dan nilai Pixel Per Box yang paling optimal. Pengujian ini dilakukan menggunakan sampel citra berisi huruf besar (A-Z) dan huruf kecil (a-z) dengan Font = 12 dan Type = All. Berikut ini data hasil pengujian nilai Box dan Pixel Per Box.
72 Tabel 4.1 Hasil Pengujian Nilai Box dan Pixel Per Box Box Pixel Per Box Pixel Known Rate (%) 3 10 30 44 84,62 4 8 32 48 92,31 5 8 42 50 96,15 6 6 36 48 92,31 7 6 40 49 94,23 8 4 32 42 80,77 9 4 36 47 90,38 10 3 30 47 90,38 Keterangan: Nilai Pixel = Box * Pixel Per Box Nilai Pixel Per Box dilakukan dengan sampling sebanyak 1 (satu) kali. Sampling dilakukan dengan perkiraan nilai Pixel yang tidak terlalu kecil dan juga tidak terlalu besar (berkisar 30-45). Dari tabel hasil pengujian di atas menunjukkan tingkat akurasi terbesar diperoleh pada Box = 5 dan Pixel Per Box = 8, yakni sebesar 96,15%. 4.3.2 Pengujian Pengenalan Huruf Pengujian ini dilakukan untuk mengenali huruf satu per satu. Tujuan dari pengujian ini adalah untuk memperoleh tingkat akurasi yang paling optimal dari sistem fuzzy yang ada. Sampel pengujian menggunakan citra pada kondisi terbaik yaitu citra berisi huruf besar (A-Z) dan huruf kecil (a-z). Setiap huruf dipisahkan dengan spasi. Font yang digunakan adalah 8 sampai 72. Sedangkan pengaturan sistem training digunakan Type = All, Box = 5, dan Pixel Per Box = 8. Berikut ini data hasil pengujian pengenalan huruf.
73 Tabel 4.2 Hasil Pengujian Pengenalan Huruf 8 9 10 11 12 14 16 18 20 22 24 26 36 48 72 Avg Rate A B C D E F G H I J K L M N O P Q R S T U V W Y Z a b c d e f g h i j k l m n o p q
74 r s t u v w x y z Error 12 2 4 1 1 0 1 0 2 0 1 1 1 0 0 1,73 3,33 Known 40 50 48 51 51 52 51 52 50 52 51 51 51 52 52 50,3 96,67 Hasil pengujian menunjukkan tingkat akurasi rata-rata sebesar 96,67%. 4.3.3 Pengujian Dokumen Standar Pengujian ini menggunakan sampel berupa citra berisi teks yang terdiri dari 3 (tiga) macam dokumen. Masing-masing dokumen memiliki 3 (tiga) ukuran font yang berbeda. Sedangkan ukuran font yang digunakan untuk pengujian ini adalah 10, 16, dan 24. Pada pengaturan sistem training digunakan Type = All, Box = 5, dan Pixel Per Box = 8. Berikut adalah tabel hasil pengujian dokumen standar. Tabel 4.3 Hasil Pengujian Dokumen Standar Jumlah Font Size 10 Font Size 16 Font Size 26 Total Citra Huruf Known (%) Known (%) Known (%) Average Sampel 1 451 424 94,01 446 98,89 448 99,33 Sampel 2 473 435 91,97 464 98,10 464 98,10 Sampel 3 360 327 90,83 348 96,67 350 97,22 Average 92,27 97,89 98,22 96,13 Keterangan: Known = Jumlah huruf yang berhasil dikenali (%) = Persentase jumlah huruf yang dikenali Dari tabel di atas dapat disimpulkan bahwa pengujian pada dokumen standar menunjukkan tingkat akurasi sebesar 96,13%.
75 4.3.4 Pengujian Labeling Pengujian ini bertujuan untuk melihat seberapa besar pengaruh labeling pada proses segmentation dalam sistem pengenalan teks. Pengaruh yang diujikan tersebut berupa waktu proses dan jumlah pemisahan huruf. Sampel yang digunakan pada pengujian ini sama dengan sampel yang digunakan pada dokumen standar yakni sebanyak 3 (tiga) buah sampel. Berikut tabel hasil pengujian labeling. Tabel 4.4 Hasil Pengujian Segmentation Font Size 10 Font Size 16 Font Size 24 Non L With L Non L With L Non L With L Citra T E T E T E T E T E T E Sampel 1 10,1 3 10,8 1 13,3 1 15,5 0 18,3 0 25,3 0 Sampel 2 10,2 4 11,0 3 12,9 3 15,8 0 16,4 1 22,8 0 Sampel 3 8,0 13 8,9 5 10,3 6 12,6 1 13,3 0 18,1 0 Total 28,3 20 30,7 9 36,5 10 42,9 1 48,0 1 66,2 0 Tabel 4.5 Hasil Pengujian Pengaruh Labeling Time (%) Error (%) 10 16 24 10 16 24 Total 7,82 14,92 27,49 0,86 0,70 0,08 Average 16,74 0,55 Keterangan: Tanda kutip ( ) = Ukuran font T = Time = Waktu Proses E = Error = Jumlah pemisahan huruf yang tidak berhasil dilakukan Non L = Non Labeling = Proses segmentation tanpa labeling With L = With Labeling = Proses segmentation dengan labeling Average = Nilai rata-rata Hasil pengujian di atas menunjukkan bahwa pada pengujian waktu proses, segmentation dengan labeling memerlukan waktu proses lebih lama daripada segmentation tanpa labeling, yakni sebesar 16,74%. Sedangkan pada pengujian jumlah pemisahan huruf, segmentation dengan labeling melakukan pemisahan huruf lebih banyak daripada segmentation tanpa labeling, yakni sebesar 0,55%.
76 4.3.5 Pembahasan Hasil pengujian memperlihatkan bahwa program ini mampu mengenali huruf satu per satu dengan tingkat akurasi yang cukup tinggi, yakni sebesar 96,67%. Hal ini berarti bahwa sistem fuzzy yang digunakan berjalan dengan baik. Salah satu keunggulan dari sistem fuzzy dalam pengenalan teks adalah pada tahapan feature extraction. Tahapan ini mampu membedakan huruf dari ciri-ciri yang dimilikinya. Pada pengujian dokumen standar juga memberikan hasil yang baik, yaitu dengan tingkat akurasi sebesar 96,13%. Hasil pengujian pada dokumen tersebut sangat tergantung pada berbagai faktor, antara lain: sistem fuzzy yang digunakan, pembedaan huruf besar dan kecil, serta huruf-huruf yang terhubung. Beberapa huruf yang telah tidak terbaca oleh sistem fuzzy sangat berpengaruh terhadap pembacaan keseluruhan dokumen. Hal ini disebabkan karena beberapa dokumen memiliki huruf-huruf tertentu yang sering digunakan, sedangkan huruf-huruf lain jarang digunakan. Salah satu kelemahan dari program ini adalah pada pembacaan huruf-huruf yang terhubung satu sama lain. Hal ini disebabkan karena sistem pengenalan teks akan membaca huruf yang terhubung tersebut sebagai satu kesatuan (satu buah huruf). Hal ini akan mempengaruhi input dari sistem fuzzy. Proses segmentation yang digunakan pada program ini belum mampu memisahkan huruf yang saling terhubung. Pada pengujian labeling, sistem memperlihatkan bahwa penggunaan labeling memerlukan waktu yang lebih lama dalam pengenalan teks, yakni dengan perbedaan waktu proses sebesar 16,74%. Sedangkan untuk pemisahan jumlah huruf, penggunaan labeling mampu memisahkan karakter lebih banyak daripada tanpa
77 labeling, yakni dengan perbedaan 0,55%. Semakin besar ukuran font maka perbedaan waktu proses semakin besar, akan tetapi perbedaan jumlah pemisahan huruf menjadi semakin kecil. Sebaliknya, semakin kecil ukuran font maka perbedaan waktu proses menjadi semakin kecil, akan tetapi perbedaan jumlah pemisahan huruf semakin besar. Nilai perbedaan yang kecil pada pemisahan huruf disebabkan karena hampir semua karakter mampu dipisahkan dengan cara biasa. Sedangkan labeling hanya ditujukan untuk huruf-huruf yang menempel. Hal ini berarti bahwa dari berbagai kemungkinan yang ada pada sebuah dokumen, presentase huruf yang menempel sangatlah kecil.