BAB 2 LANDASAN TEORI

5 BAB 2 LANDASAN TEORI 2.1 Digital Image 2.1.1 Definisi Digital Image Menurut Gonzalez dan Woods (1992, p6), digital image adalah image f(x,y) yang telah dibedakan berdasarkan koordinat tata letak dan warna. Digital image dapat dianggap sebagai matrix yang index baris dan kolomnya mengidentifikasikan titik pada image tersebut dan nilai matrixnya mengidentifikasikan warna titik tersebut. Elemen dari digital array seperti itu disebut image element, picture element, pixel, atau pel, dimana kedua istilah terakhir yang sering digunakan merupakan singkatan dari picture element. Gambar 2.1 Digital Image

6 2.1.2 Tetangga dari Sebuah Pixel Menurut Gonzalez dan Woods (1992, p40), sebuah pixel p pada koordinat (x,y) mempunyai empat tetangga horizontal dan vertikal yang koordinatnya : (x 1, y), (x 1, y), (x, y 1), (x, y 1). Kumpulan pixel ini disebut 4-neighbors dari p, dinotasikan dengan N 4 (p). Setiap pixel mempunyai jarak terhadap (x, y), dan beberapa tetangga dari p terdapat di luar digital image jika (x,y) berada pada batas (border) dari image tersebut. Empat tetangga diagonal dari p mempunyai koordinat (x 1, y 1), (x 1, y 1), (x 1, y 1), (x 1, y 1) dan dinotasikan dengan N D ( p). Titik-titik ini, bersama-sama dengan 4-neighbors, disebut 8-neighbors dari p, dinotasikan dengan N 8 ( p). Seperti sebelumnya, beberapa titik dalam N D ( p) dan ( p) dari image tersebut. N 8 jatuh di luar image jika (x, y) berada pada batas (border) 2.2 Transformasi Hough 2.2.1 Teori Menurut Anonymous (http://en.wikipedia.org/wiki/hough_transform), prinsip dasar dari transformasi Hough adalah terdapat jumlah tak terbatas dari garis yang melalui suatu titik, masing-masing pada orientasi yang berbeda. Tujuan dari transformasi Hough adalah untuk menentukan garis teoritis yang mana yang melewati titik-titik penting pada suatu image. Dengan kata lain, garis mana yang paling sesuai dengan data pada suatu image.

7 Untuk menentukan bahwa dua titik terdapat pada garis yang sama, representasi dari garis perlu dibuat terlebih dahulu sehingga dapat dilakukan perbandingan yang sesuai. Pada transformasi Hough standar, setiap garis direpresentasikan dengan dua parameter, biasanya disebut r dan θ (theta), yang merepresentasikan panjang dan sudut dari asal suatu normal ke garis yang dicari. Dengan kata lain, garis digambarkan 90 dari θ, dan berjarak r dari asal pada titik terdekatnya. Dengan mentransformasi semua garis yang melalui suatu titik ke sistem koordinat, menghitung nilai r untuk setiap nilai θ. Kurva sinus yang unik terhadap titik itu akan terbentuk. Representasi dari dua parameter ini sering kali disebut ruang Hough (Hough space). Jika kurva yang bersesuaian dengan dua titik saling tumpang tindih, lokasi (pada ruang Hough) dimana terjadi bersilangan akan bersesuaian dengan garis (pada ruang asli image) yang melewati dua titik tersebut. Lebih umumnya, kumpulan titik yang membentuk garis lurus akan menghasilkan transformasi Hough yang bersilangan pada parameter untuk garis tersebut. 2.2.2 Implementasi Menurut Anonymous (http://en.wikipedia.org/wiki/hough_transform), input pada transformasi Hough biasanya adalah image mentah. Dengan demikian, titik yang akan ditransformasikan tidak mungkin berada pada pinggir image. Transformasinya sendiri dibagi ke dalam bin (tempat penyimpanan) yang jumlahnya tidak tetap, dimana setiap bin merepresentasikan definisi garis. Setiap titik penting pada image diklasifikasikan ke dalam bin yang sesuai dengan garis yang melalui titik tersebut. Dengan hanya menambah nilai pada setiap bin untuk setiap titik-titik penting pada garis tersebut, array yang menunjukkan garis yang paling sesuai dengan data pada image akan terbentuk.

8 Dengan menemukan bin dengan nilai tertinggi, garis yang paling sesuai akan diperoleh. Cara yang paling sederhana untuk menemukan nilai yang memenuhi syarat adalah dengan menentukan nilai batas, tetapi teknik yang berbeda mungkin membuahkan hasil yang lebih baik dalam situasi yang berbeda menentukan garis mana yang ditemukan dan berapa banyak. Karena garis yang ditemukan tidak mengandung informasi panjang garis, sering kali langkah berikutnya adalah mencari bagian image yang cocok dengan masing-masing garis. 2.3 Thinning / Skeletonizing Menurut Gonzalez dan Woods (1992, p491), pendekatan yang penting untuk merepresentasikan bentuk berstruktur dari daerah bidang adalah dengan mereduksinya menjadi graph. Reduksi dapat dilakukan dengan mencari rangka suatu daerah melalui algoritma thinning (juga disebut skeletonizing). Prosedur thinning memegang peranan penting dalam pemecahan berbagai masalah pada pemrosesan image, mulai dari pemeriksaan otomatis pada papan sirkuit yg dicetak sampai perhitungan serat asbes pada saringan udara. Secara umum, algoritma thinning menghapus titik-titik pinggir dari suatu daerah secara berulang-ulang dengan syarat penghapusan titik-titik tersebut (1) tidak menghilangkan titik-titik ujung, (2) tidak memutuskan hubungan, dan (3) tidak menyebabkan erosi yang berlebihan pada daerah tersebut. Pada bagian ini akan dibahas algoritma thinning untuk daerah biner. Titik pada suatu daerah diasumsikan mempunyai nilai 1 dan titik pada latar suatu daerah mempunyai nilai 0. Algoritma ini terdiri dari dua langkah dasar berturut-turut yang diterapkan pada titik-titik contour dari daerah input, dimana titik-titik contour adalah

9 pixel yang bernilai 1 dan mempunyai paling sedikit 1 8-neighbor bernilai 0. Dengan referensi pada definisi 8-neighborhood yang ditunjukan dalam Gambar 2.2, langkah pertama memberi tanda pada titik contour p untuk dihapus jika kondisi berikut ini terpenuhi : ( a) 2 N( p1 ) 6; ( b) S( p1 ) = 1; () c p2 p4 p6 = 0; ( d ) p p p = 0; 4 6 8 dimana N ( p 1 ) adalah jumlah dari neighbor tak nol dari p 1; yaitu, ( p1 ) = p2 p3... p8 p9 N Gambar 2.2 Penyusunan Tetangga Titik yang Digunakan oleh Algoritma Thinning S adalah jumlah transisi dari 0 ke 1 pada urutan p 2, p3,..., p8, p9. Sebagai dan ( ) p 1 contoh, N ( p 1 ) = 4 dan ( p 1 ) = 3 S dalam Gambar 2.3. Gambar 2.3 Contoh Tetangga Titik

10 Pada langkah kedua, kondisi (a) dan (b) tetap sama, tetapi kondisi (c) dan (d) berubah menjadi : ' ( c ) p2 p4 p8 = 0; ' ( d ) p p p = 0; 2 6 8 Langkah 1 diterapkan pada setiap pixel di garis batas dalam daerah biner yang sedang diproses. Jika satu atau lebih kondisi (a) - (d) dilanggar, nilai titik tersebut tidak berubah. Jika semua kondisi terpenuhi, titik tersebut diberi tanda untuk dihapus nantinya. Bagaimanapun, titik tersebut tidak dihapus sampai semua titik di garis batas diproses. Penundaan ini mencegah perubahan struktur data selama eksekusi algoritma. Setelah langkah 1 diterapkan pada semua titik di garis batas, titik-titik yang diberi tanda dihapus (nilainya berubah menjadi 0). Kemudian, langkah 2 diterapkan pada data yang dihasilkan oleh langkah 1 sama seperti ketika menerapkan langkah 1. Dengan demikian, satu iterasi dari algoritma thinning terdiri dari (1) menerapkan langkah 1 untuk memberi tanda titik-titik yang akan dihapus; (2) menghapus titik-titik yang diberi tanda; (3) menerapkan langkah 2 untuk memberi tanda titik-titik di garis batas yang tersisa yang akan dihapus; dan (4) menghapus titik-titik yang diberi tanda. Prosedur dasar ini diterapkan secara berulang-ulang sampai tidak terdapat titik yang akan dihapus, dimana eksekusi algoritma dihentikan, menghasilkan rangka dari daerah input. Kondisi (a) dilanggar ketika titik contour p 1 hanya mempunyai satu atau tujuh 8-neighbor bernilai 1. Dengan hanya memiliki satu tetangga seperti itu menunjukkan bahwa p 1 adalah titik ujung dari rangka dan tentu saja tidak boleh dihapus. Menghapus p 1 jika titik tersebut mempunyai tujuh tetangga seperti itu akan menyebabkan terjadinya

11 erosi pada daerah input. Kondisi (b) dilanggar ketika diterapkan pada titik-titik pada garis yang tebalnya 1 pixel. Karenanya kondisi ini mencegah terputusnya hubungan antar segmen dari rangka selama operasi thinning. Kondisi (c) dan (d) terpenuhi secara bersama-sama dengan : ( p = or p = 0) or ( p = 0 and p 0) 4 0 6 2 8 =. Dengan referensi susunan tetangga dalam Gambar 2.2, titik yang memenuhi kondisi ini dan kondisi (a) dan (b), adalah titik Timur atau Selatan atau titik sudut di sebelah Barat Laut dari batas daerah input. Jika semua kondisi tadi tidak terpenuhi, p 1 bukan bagian dari rangka dan harus dihapus. Demikian juga, kondisi ( c ' ) dan ( ' ) dengan : ( p = or p = 0) or ( p = 0 and p 0) 2 0 8 4 6 = d dipenuhi secara bersama-sama. Titik ini merupakan titik Utara atau Barat atau Tenggara dari batas daerah input. Perhatikan bahwa titik Timur Laut mempunyai syarat = and p 0 p sehingga memenuhi kondisi (c) dan (d), juga ( c ' ) 2 0 4 = dan ( d ' ). Hal ini juga berlaku untuk titik Barat Daya, yang mempuyai syarat p = and p 0. 6 0 8 = Gambar 2.4 (a) Hasil Langkah 1 dari Algoritma Thinning (b) Hasil Langkah 2 (c) Hasil Akhir

12 2.4 Pengenalan Karakter dengan Feature Point Extraction 2.4.1 Pengenalan OCR Menurut Eric W. Brown (http://www.ccs.neu.edu/home/feneric), Optical Character Recognition (OCR) telah menjadi topik yang menarik sejak akhir tahun 1940- an ketika Jacob Rabinow memulai pekerjaannya dalam bidang ini. Mesin OCR yang pertama kali adalah alat mekanik yang sederhana dengan tingkat kesalahan yang cukup tinggi. Seiring dengan bertambahnya jumlah materi yang tertulis, maka kebutuhan untuk memproses ini semua dengan cepat dan dapat dihandalkan semakin tinggi. Mesin-mesin pada waktu itu belum bisa memenuhi kebutuhan ini. Untuk mengatasi masalah ini, maka ditemukanlah alat OCR yang berbasiskan komputer yang dapat melebihi kemampuan mesin-mesin itu dalam hal kecepatan dan kehandalan. Pada zaman sekarang terdapat banyak alat OCR digunakan berdasarkan sekumpulan algoritma yang berbeda-beda. Semua algoritma yang popular mendukung ketepatan dan kecepatan yang tinggi, tetapi masih banyak mengalami kekurangan yang agak sederhana : ketika algoritma tersebut melakukan kesalahan, kesalahan tersebut sering kali sangat tidak alami bagi sudut pandang manusia. Contohnya, menganggap 5 sebagai S tidak terlalu mengagetkan karena kebanyakan orang setuju bahwa kedua karakter ini mirip, tetapi menganggap 5 sebagai M sangat bertentangan dan tidak terduga. Algoritma-algoritma melakukan kesalahan seperti itu karena mereka umumnya beroperasi pada kumpulan fitur yang berbeda daripada manusia sebagai alasan komputasi. Manusia mengamati coretan dan hubungan antara coretan tersebut, sementara algoritma-algoritma mengukur segala sesuatu dari transformasi Ring Projection suatu karakter ke transformasi Fourier dari Horizontal-Vertical Projections

13 suatu karakter. Metode-metode ini memang membuahkan hasil dan sering kali efisien secara komputasi, tetapi metode-metode ini membuat komputer melihat huruf-huruf dengan cara yang berbeda dari mata manusia. Penting untuk disadari bahwa tujuan utama dari OCR adalah menyediakan komunikasi antara sesama manusia. Kesalahan-kesalahan yang manusiawi lebih dapat diperbaiki dengan mudah oleh manusia. Contohnya, 5impan lebih mudah dihubungkan dengan Simpan daripada Mimpan. Salah satu algoritma yang berusaha untuk beroperasi dengan bagian dari fiturfitur pada karakter yang dapat dikenali manusia sebagai karakter hasil cetakan mesin adalah Feature Point Extraction. Tingkat pengenalan dengan algoritma ini mungkin tidak setinggi tingkat pengenalan dengan algoritma sebelumnya, tetapi diharapkan jika algoritma ini dikembangkan untuk bekerja dengan kumpulan besar dari fitur-fitur, masalah ini akan hilang. Jika algoritma ini dikembangkan untuk menggunakan lebih banyak fitur, prosesnya kerjanya akan lebih lambat tetapi dengan bermunculannya mikroprosessor yang semakin cepat, masalah ini akan terpecahkan. 2.4.2 Feature Point Extraction Menurut Eric W. Brown (http://www.ccs.neu.edu/home/feneric), karakterkarakter alphabet dapat dengan nyaman digambarkan menggunakan hanya bidang 8 x 8. Bukan tidak mungkin menggunakan algoritma ini untuk karakter dengan resolusi tinggi, hanya saja diperlukan beberapa metode reduksi data pada data mentahnya. Metode reduksi blok akan menghasilkan hasil yang dapat diterima sebagai karakter alphabet

14 tetapi bukan berarti algoritma thinning yang bagus tidak bisa sebaik metode reduksi blok asalkan kebutuhan input dari algoritma thinning dimengerti dengan benar. Algoritma Feature Point Extraction menghindari thinning (dan praproses lainnya) dengan asumsi data input 8 x 8 tidak menyimpang dan tidak lebih tebal dari 2 piksel. Dengan asumsi ini, algoritma ini akan fokus dalam mencari feature point. Feature point adalah titik yang menjadi perhatian manusia dalam sebuah gambar, tempat terjadinya sesuatu. Feature point dapat berupa perpotongan antara 2 garis, atau sebuah sudut, atau hanya titik yang dikelilingi oleh ruang kosong. Titik-titik ini membantu kita dalam mendefinisikan hubungan antara coretan yang berbeda. Dua coretan dapat saling menyilang, membentuk Y atau T, membentuk suatu sudut, atau menghindari satu sama lain. Orang-orang cenderung sensitif terhadap hubungan ini. Fakta bahwa garis-garis pada Z terhubung dengan cara tertentu lebih penting daripada panjang masing-masing garis tersebut. Hubungan ini lah yang harus digunakan untuk pengenalan karakter dan feature point dapat diselidiki untuk melakukannya. Prosedur untuk mengekstrak feature point yang digunakan oleh algoritma ini langsung menuju pada intinya. Karena karakter 8 x 8 terdiri dari hanya 64 piksel, proses pencarian keseluruhan bagian karakter mungkin dilakukan dan memeriksa setiap piksel selama proses berlangsung. Jika sebuat piksel mengandung titik, delapan tetangganya diperiksa. Karena setiap tetangga dapat juga mengandung titik, terdapat 256 kemungkinan kombinasi dari tetangga-tetangga piksel tersebut. Dari 256, terdapat 58 yang mewakili feature point yang penting dengan cara yang tidak ambigu. Dengan demikian, proses mengekstrak feature point hanya menghitung sebuah nomor antara 0 dan 256 untuk menggambarkan tetangga sebuah piksel dan kemudian membandingkan

15 nomor itu dengan tabel feature point yang telah diketahui. Metode ini memang tidak selalu menangkap semua feature point (beberapa hanya dapat dilihat dalam konteks yang lebih besar), tetapi metode ini menangkap mayoritas feature point. Feature point yang hilang tentu saja bukan faktor penghambat dalam ketepatan algoritma ini. Algoritma ini juga tidak mengalami kekurangan dengan menangkap terlalu banyak titiktitik yang tidak penting sebagai feature point. Dengan demikian, ekstraktor feature point cepat dan dapat diandalkan.

16 0 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 1 17 33 49 65 81 97 113 129 145 161 177 193 209 225 241 2 18 34 50 66 82 98 114 130 146 162 178 194 210 226 242 3 19 35 51 67 83 99 115 131 147 163 179 195 211 227 243 4 20 36 52 68 84 100 116 132 148 164 180 196 212 228 244 5 21 37 53 69 85 101 117 133 149 165 181 197 213 229 245 6 22 38 54 70 86 102 118 134 150 166 182 198 214 230 246 7 23 39 55 71 87 103 119 135 151 167 183 199 215 231 247 8 24 40 56 72 88 104 120 136 152 168 184 200 216 232 248 9 25 41 57 73 89 105 121 137 153 169 185 201 217 233 249

17 10 26 42 58 74 90 106 122 138 154 170 186 202 218 234 250 11 27 43 59 75 91 107 123 139 155 171 187 203 219 235 251 12 28 44 60 76 92 108 124 140 156 172 188 204 220 236 252 13 29 45 61 77 93 109 125 141 157 173 189 205 221 237 253 14 30 46 62 78 94 110 126 142 158 174 190 206 222 238 254 15 31 47 63 79 95 111 127 143 159 175 191 207 223 239 255 Gambar 2.5 Kumpulan dari Tetangga-Tetangga Pixel yang Mungkin Nama Karakter: K XX X X XX X Gambar 2.6 Tampilan Karakter

18 Pada Gambar 2.6 dapat kita liat contoh karakter yang telah terasosiasi dengan feature point. X pada Gambar 2.6 adalah feature point yang membantu dalam pengenalan karakter. Karakter-karakter tidak dapat diidentifikasi oleh Feature Point Extraction sendiri. Tanpa database dari karakter-karakter dan feature point yang terasosiasi, ekstraktor feature point terhebat sekalipun akan menjadi tidak berguna. Hanya dengan database seperti ini, Feature Point Extraction dari karakter yang tidak diketahui dapat dibandingkan dengan karakter alphabet sesungguhnya. Dengan demikian standar emas dari database karakter-karakter dan feature point yang terasosiasi harus didefinisikan. Idealnya database ini harus mengandung detail bagi semua bentuk rata-rata dari setiap karakter. Jika bentuk-bentuk perwakilan yang kurang bagus dari karakter-karakter dipilih, maka karakter-karakter yang sebenarnya sah sulit diidentifikasi. Jika beberapa bentuk dari karakter tidak terdapat dalam database, maka aplikasi pasti tidak akan bisa mengidentifikasi karakter yang masuk ke dalam kelompok karakter tersebut. Dengan gabungan dari metode untuk mengekstrak feature point dan database karakter-karakter dan feature point yang terasosiasi sebagai referensi, pengenalan karakter menjadi masalah mengenai pengukuran tingkat kemiripan antara dua kumpulan feature. Metode yang digunakan oleh algoritma Feature Point Extraction hanya lah modifikasi ringan dari jarak Euclidean. Semua jarak antara setiap feature point pada karakter yang tidak diketahui dan feature point bersesuaian yang terdekat pada karakter referensi dijumlah dan feature point yang hilang atau kelebihan diabaikan. Pengenalan kemudian menjadi masalah pencarian karakter pada database yang berada pada jarak batas tertentu dari karakter yang tidak diketahui. Dalam prakteknya, algoritma tersebut memeriksa setiap karakter pada kumpulan referensi untuk menentukan jarak minimum

19 dan kemudian menverifikasi bahwa jarak minimum kurang dari batas tersebut. Sebagai tambahan, algoritma ini mencoba untuk membuat beberapa kompensasi yang sederhana terhadap noise dengan memperhatikan bahwa piksel yang dikelilingi oleh ruang kosong dan piksel yang dikelilingi oleh ruang penuh tidak biasanya terdapat pada karakter normal dan mungkin akibat dari beberapa jenis noise pada input. 2.5 Jarak Euclidean 2.5.1 Definisi Menurut Anonymous (http://en.wikipedia.org/wiki/euclidean_distance), jarak Euclidean untuk 2 titik x = (x 1,...,x n ) and y = (y 1,...,y n ) dalam n-ruang Euclidean di definisikan sebagai : 2.5.2 Jarak 2 Dimensi Menurut Anonymous (http://en.wikipedia.org/wiki/euclidean_distance), bagi titik 2 Dimensi P=[px,py] dan Q=[qx,qy], jarak dihitung dengan :

20 2.6 Rotasi Menurut Purcell dan Varberg (1998, p99), matriks rotasi terhadap ( p,θ ) dengan pusat ( a b) p, : ' x ' y cosθ = sinθ sinθ x a a cosθ y b b θ > 0 Rotasi berlawanan dengan arah jarum jam θ < 0 Rotasi searah dengan arah jarum jam