BAB II TINJAUAN PUSTAKA
|
|
- Irwan Budiman
- 6 tahun lalu
- Tontonan:
Transkripsi
1 7 BAB II TINJAUAN PUSTAKA 2.1. Image Preprocessing Masalah umum pada tahap awal proses preprocessing OCR adalah menyesuaikan orientasi area teks. Baris teks seharusnya sejajar dengan batas gambar. Pada bagian ini kami menyajikan sebuah algoritma memecahkan masalah ini. Pentingnya tahap preprocessing dari sistem pengenalan karakter terletak pada kemampuannya. Untuk memperbaiki beberapa masalah yang mungkin terjadi karena beberapa faktor. Tingkat pengenalan, penting untuk memiliki tahap preprocessing yang efektif, menggunakan algoritma preprocessing yang efektif membuat sistem OCR lebih kuat terutama melalui peningkatan kualitas gambar yang akurat, noise removal, thresholding gambar, condong deteksi/koreksi, segmentasi halaman, segmentasi karakter, normalisasi karakter (Bieniecky, et al., 2012). Teknik preprocessing dibutuhkan pada gambar dokumen warna, abuabu atau gambar biner berisi teks atau grafik. Dalam sistem pengenalan karakter sebagian besar aplikasi gunakan gambar abu-abu atau biner karena memproses gambar berwarna secara komputasi yang lebih sulit. Seperti itu gambar mungkin juga mengandung latar belakang atau tanda air yang tidak seragam sehingga menyulitkan ekstrak dokumen teks dari gambar tanpa melakukan beberapa preprocessing, karena itu hasil yang diinginkan dari preprocessing adalah gambar biner yang hanya berisi teks (Alginahi, 2013). Pada bagian image preprocessing dilakukan proses grayscalinge dan thresholding. Pada bagian ini diharapkan menghasilkan citra biner yang nantinya menjadi masukan pada tahap berikutnya tahap feature extraction Grayscaling Proses grayscaling mengubah citra berwarna menjadi hitam putih dengan mengubah warna setiap komponen RGB gambar menjadi bernilai sama. Proses threshold digunakan untuk mengekstrak foreground (tinta) dari background
2 8 (kertas) dan mengubah menjadi citra biner. Proses Thresholding mengubah warna gambar menjadi citra biner (binary image) dimana ditentukan sebuah nilai level threshold kemudian piksel yang memiliki nilai di bawah level threshold diset menjadi warna putih (0 pada nilai biner) dan nilai di atas nilai threshold diset menjadi warna hitam (1 pada nilai biner). Konversi citra berwarna menjadi grayscale merupakan tahapan awal dalam image preprocessing. Pada proses grayscaling, citra yang pada awalnya terdiri dari 3 layer matriks, yaitu R-layer, G-layer, dan B-layer akan diubah menjadi 1 layer matriks dan hasilnya adalah citra grayscale yang hanya memiliki derajat keabuan. Untuk mengubah citra berwarna, fungsi yang digunakan adalah ARGB_8888 yaitu mendefinisikan nilai alpha channel, merah, hijau, dan biru yang kemudian dapat dirumuskan dengan persamaan di bawah agar menjadi citra dengan derajat keabuan...(1) Dengan format warna ini dihasilkan citra grayscale dengan intensitas keabuan yang dipengaruhi oleh variabel warna merah hijau, dan biru Global Thresholding Metode Otsu Threshold adalah proses membagi gambar ke background dan latar depan. Hasil lambang adalah hitam atau putih. Pada teknik pengolahan citra, ambang batas dapat dikelompokkan menjadi lambang global dan lokal. Kinerja hasil ambang batas, ambang adaptif atau lokal menghasilkan hasil yang lebih baik dibandingkan dengan global ambang batas. Nilai ambang T memainkan peran penting, baik pixel yang diputaruntuk background atau foreground itu tergantung nilainya. Pengingat dari bagian ini dibahas tiga metode untuk menemukan nilai threshold T (maksudnya, median dan OTSU) (Razali, et al., 2014) Metode OTSU diperkenalkan oleh Nobuyuki Otsu. OTSU ambang batas adalah keputusan tingkat binariasi otomatis berdasarkan Histogram. Tujuan dari algoritma ini adalah untuk menemukan nilai threshold T yang meminimalkan varians dalam kelas tertimbang. Ini kemudian menghitungnilai ambang optimal
3 9 yang meminimalkan bobot di kelas varians dari dua kelas ini. Ini terbukti secara matematis meminimalkan varians dalam kelas sama dengan memaksimalkan antara varian kelas Metode OTSU telah diterapkan di percobaan sebelumnya, namun hasil segmentasi ternyata tidak mampu untuk mengelompokkan seluruh gigi. Pada proses selanjutnya citra akan berubah menjadi citra biner yang hanya mempunyai dua kemungkinan nilai yaitu 0 untuk hitam dan 1 untuk putih. Pada proses ini tiap piksel pada citra akan diklasifikasikan berdasarkan ambang batas tertentu, jika nilai piksel kurang dari ambang batas, maka piksel tersebut akan bernilai 0. Namun, jika nilai piksel lebih dari atau sama dengan ambang batas, maka piksel tersebut akan bernilai 1. Dalam proses binerisasi citra ini menggunakan global thresholding metode Otsu dengan tujuan untuk membagi histogram citra gray ke dalam dua daerah yang berbeda secara otomatis tanpa membutuhkan masukan nilai ambang batas. Probabilitas setiap piksel pada level ke-i dapat dinyatakan sebagai berikut. (2) = jumlah piksel pada level ke-i N = total piksel pada citra Dalam menentukan nilai ambang batas pada metode Otsu, ada beberapa hal yang perlu diketahui, nilai zeroth cumulative moment, first cumulative moment, dan nilai mean berturut-turut dapat dinyatakan dengan rumus berikut (Putra, 2004). ( ) ( )...(3) Nilai ambang k dapat ditentukan dengan memaksimumkan persamaan ( ) ( ) dengan ( ) ( ) ( ) ( ) ( ) (4) Gambar proses penerapan Threshold Metode Otsu dapat dilihat pada gambar 2.1 di bawah ini.
4 10 2.2Optical Character Recognition ( OCR ) Optical Character Recognition atau yang biasa disebut dengan OCR adalah suatu proses pengkonversian dari scanned image menjadi editable text. Editable text didapatkan dari sebuah scanned image yang bisa saja diambil dari hasil pemotretan atau juga hasil scan gambar yang kemudian dimasukkan kedalam komputer. Scanned image ini terdiri dari satu kesatuan konten-konten yang nantinya akan dipilah menjadi konten-konten tersendiri. Teknologi ini membuat sebuah mesin dapat mengenali sebuah teks secara otomatis (Mithe, et al., 2012). OCR memungkinkan untuk mengedit teks, mencari kata atau frase, dan menerapkan teknik seperti mesin penerjemahan, text-to-speech dan text mining. OCR biasa digunakan untuk bidang penelitian dalam pengenalan pola, kecerdasan buatan (artificial intelligent) dan computer vision. Sistem OCR memerlukan kalibrasi untuk membaca font yang spesifik versi awal harus diprogram dengan gambar karakter masing-masing, dan bekerja pada satu font pada suatu waktu (Rakshit, et al., 2009). Gambar 2.1 Proses sebelum dan sedudah metode OTSU Menurut Patel et.al (2012) hal ini dapat diumpamakan seperti kombinasi antara mata dan pikiran dari tubuh manusia. Sebuah mata yang dapat melihat teks yang terdapat pada suatu gambar dan secara langsung otak kita akan memproses mengekstrak teks tersebut dari gambar dan dibaca oleh mata. Konten-konten yang telah terkarakteristik kemudian dilakukan proses pengenalan dengan mengubahnya menjadi kode-kode karakter seperti ASCII atau Unicode lainnya. Setelah proses ini, konten-konten yang terdapat pada image tersebut yang sebelumnya tidak dapat di-edit akan menjadi karakter-karakter yang dapat di-edit ataupun juga di proses untuk keperluan selanjutnya seperti melakukan
5 11 perhitungan pada karakter-karakter numerik. Secara garis besar proses OCR dapat dijelaskan pada gambar 2.2 GAMBAR Image Preprocessing Segmentasi Ekstraksi Fitur Pengenalan Text Gambar 2.2 Proses OCR (Aprilia 2012) Didalam OCR, gambar yang berisi karakter yang ingin dikenali dilakukan preprocessing. Preprocessing adalah proses menghilangkan konten-konten yang tidak diinginkan seperti noise dan juga untuk memperbaiki kualitas gambar agar lebih mudah dikenali. Dalam tahap pertama preprocessing dilakukan grayscalling. Grayscalling adalah mengubah gambar yang berwarna menjadi gambar yang hanya memiliki derajat keabuan saja. Selanjutnya dalam tahap kedua dilakukan noise filtering, yaitu proses mengurangi atau mereduksi noise yang ada pada gambar. Noise yang terlalu banyak dapat mengurangi keakuratan dalam pengenalan karakter. Dan tahap terakhir dari preprocessing yaitu thresholding. Thresholding memisahkan konten yang akan dikenali dengan background dengan mengubah gambar menjadi hitam putih. Dengan berakhirnya tahap thresholding maka tahap preprocessing selesai dilakukan. Tahap selanjutnya adalah segmentasi. Segmentasi melakukan pemisahan karakter yang berarea besar menjadi area yang lebih kecil seperti suatu kalimat menjadi kata-kata, dan kata menjadi karakter. Setelah dilakukan segmentasi maka dilakukan normalisasi. Normalisasi mengubah karakter karakter hasil segmentasi menjadi suatu karakter yang memiliki karakterisitik yang telah ditentukan, seperti dimensi region dan ketebalan karakter. Setelah proses normalisasi dilakukan maka
6 12 selanjutnya dilanjutkan pada tahap ekstraksi fitur. Ekstraksi fitur dilakukan untuk mendapatkan karakteristik khas yang dimiliki oleh tiap-tiap karakter. Dan tahap akhir dalam proses OCR ini adalah recognition, dimana dilakukannya pengenalan dengan cara membandingkan ciri-ciri fitur yang ingin dikenali dengan data yang telah tersimpan sebelumnya sesuai dengan algoritma pengenalan yang dipakai. Hasil perbandingan yang miriplah yang kemudian keluar menjadi suatu hasil pengenalan berupa teks Tesseract OCR Engine Mesin OCR Tesseract adalah salah satu dari 3 mesin teratas dalam Tes Akurasi UNLV Antara tahun 1995 dan 2006, hanya ada sedikit aktivitas di Tesseract, sampai open-source oleh HP dan UNLV di tahun 2005.Mesin Tester Oter Tesseract awalnya dikembangkan untuk bahasa Inggris, sejak itu diperluas untuk mengenal Prancis, Italia, Jerman, Spanyol dan Belanda. Ini memiliki kemampuan untuk melatih bahasa dan skrip lain juga. Algoritma yang digunakan dalam berbagai tahap mesin sesuai dengan alfabet bahasa Inggris, yang membuatnya lebih mudah untuk mendukung skrip lain yang secara struktural serupa dengan hanya melatih kumpulan karakter dari skrip baru (Hasanat, 2013) Arsitektur Tesseract OCR Pada arsitekturnya, Tesseract OCR menyatakan input yang diterima merupakan sebuah binary image. Secara umum arsitektur Tesseract OCR dapat dilihat pada Gambar 2.3.
7 13 Gambar 2.3Arsitektur Tesseract OCR Setelah mengasumsikan bahwa input merupakan binary image proses dilanjutkan pada Page Layout Analysis dimana analisis dilakukan pada komponen terhubung (Connected Component) untuk menemukan dimana outline komponen disimpan (Aprilia, 2012). Outlines komponen yang telah disimpan dikumpulkan bersama untuk membentuk blob. Blob adalah kawasan gambar yang saling berlengketan. Blob ini lalu disusun menjadi suatu barisan teks, sedangkan garis dan region di analisa untuk pitch tetap dan teks proporsional (Aprilia, 2012). Teks dengan pitch tetap dipecah menjadi sel-sel karakter. Teks proporsional dibagi menjadi kata-kata dengan menggunakan ruang pasti dan ruang fuzzy. Selanjutnya pengenalan kata image dilakukan pada dua tahap yang disebut dengan pass-two (Smith, 2007). Pass pertama dilakukan untuk mengenali masing-masing kata.
8 14 Kata-kata yang melewati pass pertama adalah kata-kata yang cocok dengan kamus dan diteruskan pada adaptif classifier untuk selanjutakan dipakai sebagai data pelatihan. Setelah sampel mencukupi, classifier adaptif ini juga dapat memberikan hasil klasifikasi bahkan pada pass pertama (Aprilia, 2012). Kata-kata yang mungkin kurang dikenali atau terlewat pada pass pertama akan dilanjutkan pada proses pass two. Pada kondisi ini classifier adaptif yang telah mendapatkan informasi lebih pada pass pertma akan lebih dapat mengenali kata yang terlewatkan atau kurang dikenali sebelumnya Pengenalan Karakter oleh Tesseract Menurut Smith (2007) beberapa langkah yang dilakukan oleh Tesseract untuk pengenalan karakter adalah sebagai berikut : Pencarian Teks line dan kata a. Line finding Algoritma Line finding dirancang untuk dapat mengenali halaman miring tanpa harus melalui proses de-skew, hingga tidak menurunkan kualitas gambar (Smith, 2007). Kunci dari proses ini adalah filterisasi blob dan Line constructing mengasumsikan analisa tata letak halaman telah mendapatkan daerah teks yang memiliki ukuran teks yang seragam, filter presentasi ketinggian sederhana menghilangkan drop-caps dan garis vertikal yang menyentuh karakter. Rata tengah dari tinggi mendekati dari besar teks di dalam daerah tersebut, sehingga aman untuk menyaring blobs yang lebih kecil dari beberapa pecahan dari rata-rata tengah, seperti tanda baca dan juga noise. Filterisasi blob lebih cocok kepada pemodelan non-overlapping, paralel, tetapi sloping lines (Smith, 2007). Penyortingan dan pemrosessan pada blob oleh kordinat-x memungkinkan untuk menentukan blob menjadi text line yang unik, sementara pelacakan kemiringan di sepanjang halaman, dengan sangat mengurangi kesalahan menempatkan text line yang salah didalam kemiringan. Setelah blob yang di filter disejajarkan pada garis, rata tengah terakhir dari squares fit digunakan untuk memperkirakan baselines, dan blob yang telah difilter akan dipasang kembali ke line yang tepat.
9 15 Filterisasi blob lebih cocok kepada pemodelan non-overlapping, paralel, tetapi sloping lines (Smith, 2007). Penyortingan dan pemrosesan pada blob oleh kordinat-x memungkinkan untuk menentukan blob menjadi text line yang unik, sementara pelacakan kemiringan di sepanjang halaman, dengan sangat mengurangi kesalahan menempatkan text line yang salah didalam kemiringan. Setelah blob yang di filter disejajarkan pada garis, rata tengah terakhir dari squares fit digunakan untuk memperkirakan baselines, dan blob yang telah difilter akan dipasang kembali ke line yang tepat. b. Baseline Fitting Setelah text lines ditemukan, garis pangkal (baselines) dicocokkan dengan lebih tepat menggunakan quadratic splines. Hal inilah merupakan hal baru dalam sistem OCR, dimana tesseract memungkinkan dapat menangani halaman dengan baseline yang miring. Baseline dicocokkan dengan partisi blob kedalam sebuah kelompok perpindahan yang cukup berkelanjutan baseline lurus yang asli. Sebuah quadratic spline dicocokkan pada partisi yang paling padat (diasumsikan sebagai baseline). Kelebihan dari Quadratic Spline terletak dari kemampuan berhitungnya yang stabil, namun memiliki kelemahan yaitu diskonitinuitas dapat muncul pada beberapa saat segmen spline diperlukan. Gambar 2.4Contoh fitted baseline c. Chopping Pada bagian ini, baris karakter yang berhasil diidentifikasi akan dilakukan proses chopping atau dipisahkan untuk tiap karakternya agar proses pengenalan karakter menjadi lebih akurat. Akan tetapi, syarat dari proses pemisahan karakter adalah jarak antarkarakter terdeteksi dengan jarak yang tetap atau fixed pitch detection, jika jarak antarkarakter tidak tetap atau non-fixed pitch detection, maka
10 16 akan dicari dulu ambang batas jarak antarkarakter untuk menentukan karakter yang terhubung dan karakter yang terpisah. Adapun contoh pemisahan karakter dapat dilihat pada gambar 2.5. Gambar 2.5Contoh pemisahan karakter Pengenalan Karakter dan Kata Bagian dari proses pengenalan pada pengenalan segala karakter adalah dengan mengidentifikasi bagaimana sebuah kata atau karakter disegmentasi menjadi karakter atau simbol-simbol (Aprilia, 2012). Hasil akhir dari segmentasi awal akan diklasifikasikan sisa terakhir dari proses ini hanya dilakukan pada teks yang non fixed-pitch. a. Pemisahan Karakter terhubung Apabila hasil dari pemisahan kata tidak memuaskan, Tesseract akan berusaha untuk memisahkan blob dengan kemugkinan terburuk dari classifier karakter (Smith, 2007). Kandidat dari titik potong di dapat dari simpul cekung dari pendekatan poligonal outline, dan dapat saja ditemukan simpul cekung lainnya dari titik yang berlawanan, atau garis segmen. Untuk karakter ASCII setidaknya menghabiskan sampai 3 pasang titik pemotongan untuk memisahkan karakter yang terhubung. Titik pemotongan dapat dilihat pada gambar 2.6. Gambar 2.6 Titik Pemotongan Karakter(Smith 2007) Pada gambar menampilkan sebuah set dari kandidat titik dengan panah dan pemisahan yang terpilih sebagai garis yang menelusuri outline dimana karakter r bersentuhan dengan karakter m. Pemotongan dilakukan Pada gambar menampilkan sebuah set dari kandidat titik dengan panah dan pemisahan
11 17 yang terpilih sebagai garis yang menelusuri outline dimana karakter r bersentuhan dengan karakter m. Pemotongan dilakukan. b. Menyatukan Karakter yang Rusak Ketika pemotongan yang dilakukan tidak mendapatkan hasil yang tepat, kata atau karakter masih belum cukup, maka akan diberikan kepada associator. Associator ini membuat pencarian A* (terbaik pertama) dari graph segmentasi untuk kombinasi yang memungkinkan dari pemotongan blob maksimal menjadi kandidat karakter. Hasil pencarian A* dengan menarik kandidat state baru dari antrian prioritas dan mengevaluasi kandidat dengan mengklasifikan kombinasi fragmen yang belum terklasifikasi dapat dilihat pada Gambar 2.7. Gambar 2.7Kata yang Mudah di kenali(smith 2007) Dengan segmentasi A* ini membuat tesseract dapat dengan mudah mengenali karakter yang rusak seperti pada gambar. 2.3 String Matching Pengertian String Matching String matching adalah pencarian sebuah pattern pada sebuah teks (Cormen, T.H. et al. 1994). String matching digunakan untuk menemukan suatu string yang disebut dengan pattern dalam string yang disebut dengan teks (Charras, C. & Lecroq, T. 1997). Prinsip kerja algoritma string matching (Effendi, D. et al. 2013) adalah sebagai berikut: 1. Memindai teks dengan bantuan sebuah window yang ukurannya sama dengan panjang pattern. 2. Menempatkan window pada awal teks. 3. Membandingkan karakter pada window dengan karakter dari pattern. Setelah pencocokan (baik hasilnya cocok atau tidak cocok) dilakukan pergeseran ke kanan pada window. Prosedur ini dilakukan berulang-ulang
12 18 sampai window berada pada akhir teks. Mekanisme ini disebut mekanisme sliding window. Algoritma string matching mempunyai tiga komponen utama (Effendi, D. et al. 2013), yaitu: 1. Pattern, yaitu deretan karakter yang akan dicocokkan dengan teks, dinyatakan dengan [0 m 1], panjang pattern dinyatakan dengan m. 2. Teks, yaitu tempat pencocokan pattern dilakukan. Dinyatakan dengan [0 n 1], panjang teks dinyatakan dengan n. 3. Alfabet, berisi semua simbol yang digunakan oleh bahasa pada teks dan pattern, dinyatakan dengan dengan ukuran dinyatakan ASIZE Cara kerja String Matching Cara yang jelas untuk mencari pattern yang cocok dengan teks adalah dengan mencoba mencari di setiap posisi awal dari teks dan mengabaikan pencarian secepat mungkin jika karakter yang salah ditemukan (Knuth, D.E. et al. 1977). Proses pertama adalah menyelaraskan bagian paling kiri dari pattern dengan teks. Kemudian dibandingkan karakter yang sesuai dari teks dan pattern. Setelah seluruhnya cocok maupun tidak cocok dari pattern, window digeser ke kanan sampai posisi (n m + 1) pada teks. Menurut Singh, R. & Verma, H.N. (2011), efisiensi dari algoritma terletak pada dua tahap: 1. Tahap praproses, tahap ini mengumpulkan informasi penuh tentang pattern dan menggunakan informasi ini pada tahap pencarian. 2. Tahap pencarian, pattern dibandingkan dengan window dari kanan ke kiri atau kiri ke kanan sampai kecocokan atau ketidakcocokan terjadi. Dengan sebuah nilai karakter (m < n) yang akan dicari dalam teks. Dalam Algoritma pencocokan string, teks diasumsikan berada di dalam memori, sehingga bila kita mencari string di dalam sebuah arsip, maka semua isi arsip perlu dibaca terlebih dahulu kemudian disimpan di dalam memori. Jika pattern muncul lebih dari sekali di dalam teks, maka pencarian hanya akan memberikan keluaran berupa lokasi pattern ditemukan pertama kali(wulan, 2011).
13 Klasifikasi Algoritma String Matching Algoritma string matching dapat diklasifikasikan menjadi tiga bagian menurut arah pencariannya (Charras, C. & Lecroq, T. 1997), yaitu: 1. From left to right dari arah yang paling alami, dari kiri ke kanan, yang merupakan arah untuk membaca. Algoritma yang termasuk dalam kategori ini adalah Algoritma Brute Force, Algoritma Morris dan Pratt yang kemudian dikembangkan menjadi Algoritma Knuth-Morris-Pratt. 2. From right to left dari arah kanan ke kiri, arah yang biasanya menghasilkan hasil terbaik secara partikal. Contoh algoritma ini adalah Algoritma Boyer-Moore, yang kemudian banyak dikembangkan menjadi Algoritma Tuned Boyer-Moore, algoritma Turbo Boyer-Moore, Algoritma Zhu Takaoka dan Algoritma Horspool 3. Dari arah yang ditentukan secara spesifik oleh algoritma tersebut, arah ini menghasilkan hasil terbaik secara teoritis. Algoritma yang termasuk kategori ini adalah Algoritma Colussi dan Algoritma Crochemore-perrin.
14 Algoritma Horspool Algoritma Boyer-Moore (BM) memposisikan pola pada karakter paling kiri. Dalam teks dan mencoba untuk mencocokkannya dari kanan ke kiri. Jika tidak terjadi ketidakcocokan, maka pola telah ditemukan. Jika tidak, algoritma menghitung pergeseran, jumlah dengan yang polanya dipindahkan ke kanan sebelum upaya pencocokan baru dilakukan.pergeseran ini bisa dihitung dengan dua heuristik. Pertandingan heuristik dan kemunculannya heuristis. Dalam tulisan ini kami hanya mempertimbangkan yang kedua; Ini terdiri dari menyelaraskan yang terakhir. Ketidakcocokan karakter dalam teks dengan karakter pertama dari pola pencocokannya.penyederhanaan diajukan pada tahun 1980 oleh Horspool. Untuk memaksimalkan rata-rata pergeseran setelah ketidakcocokan, karakternya dibandingkan dengan karakter terakhir dari pola dipilih untuk penyelarasan. Ini juga menyiratkan itu perbandingan dapat dilakukan dalam urutan apapun (kiri-ke-kanan, kanan-ke-kiri, acak. Hasil empiris menunjukkan bahwa versi yang lebih sederhana ini sama baiknya dengan algoritma aslinya.kode untuk Algoritma BayerMoore-Horspool sangat sederhana dan mudah Algoritma Horspool mempunyai nilai pergeseran karakter yang paling kanan dari window. Pada tahap observasi awal (preprocessing), nilai shift akan dihitung untuk semua karakter. Pada tahap ini, dibandingkan pattern dari kanan ke kiri hingga kecocokan atau ketidakcocokan pattern terjadi. Karakter yang paling kanan pada window digunakan sebagai indeks dalam melakukan nilai shift. Dalam kasus ketidakcocokan (karakter tidak terdapat pada pattern) terjadi, window digeser oleh panjang dari sebuah pattern. Jika tidak, window digeser menurut karakter yang paling kanan pada pattern (Baeza-Yates, R.A. & Regnier, M. 1992) Pencarian Dengan Algoritma Horspool Terdapat dua tahap pada pencocokan string menggunakan algoritma Horspool (Singh, R. & Verma, H.N. 2011), yaitu: 1. Tahap praproses
15 21 Pada tahap ini, dilakukan observasi pattern terhadap teks untuk membangun sebuah tabel bad-match yang berisi nilai shift ketika ketidak cocokan antara pattern dan teks terjadi. Secara sistematis, langkah-langkah yang dilakukan algoritma Horspool pada tahap praproses adalah: a. Algortima Horspool melakukan pencocokan karakter ter-kanan pada pattern. b. Setiap karakter pada pattern ditambah ke dalam tabel bad-match dan dihitung nilai shift-nya. c. Karakter yang berada pada ujung pattern tidak dihitung dan tidak dijadikan karakter ter-kanan dari karakter yang sama dengannya. d. Apabila terdapat dua karakter yang sama dan salah satunya bukan karakter terkanan, maka karakter dengan indeks terbesar yang dihitung nilai shift-nya. e. Algoritma Horspool menyimpan panjang dari pattern sebagai panjang nilai shift secara default apabila karakter pada teks tidak ditemukan dalam pattern. f. Nilai (value) shift yang akan digunakan dapat dicari dengan perhitungan panjang dari pattern dikurang indeks terakhir karakter dikurang 1, untuk masing-masing karakter, value=m 1. Sebagai contoh, dapat dilihat pada Tabel 2.1 berikut. Pattern: PELATIH P E L A T I H Tabel 2.1 Bad-Match Pada Praproses Karakter Index Value P 0 6 E 1 5 L 2 4 T 3 3 I 5 1 * - - Value =7-0-1= 6 Value =7-1-1= 5 Value =7-2-1= 4 Value =7-3-1= 3 Value =7-5-1= 1 *: Karakter yang tidak dikenali
16 22 2. Tahap pencarian Secara sistematis, langkah-langkah yang dilakukan algoritma Horspool pada tahap praproses adalah: a. Dilakukan perbandingan karakter paling kanan pattern terhadap window. b. Tabel bad-match digunakan untuk melewati karakter ketika ketidakcocokan terjadi. c. Ketika ada ketidakcocokan, maka karakter paling kanan pada window berfungsi sebagai landasan untuk menentukan jarak shift yang akan dilakukan. d. Setelah melakukan pencocokan (baik hasilnya cocok atau tidak cocok) dilakukan pergeseran ke kanan pada window. e. Prosedur ini dilakukan berulang-ulang sampai window berada pada akhir teks atau ketika pattern cocok dengan teks. Untuk menggambarkan rincian algoritma, akan diberikan contoh kasus dimana pattern P = PRATAMA dan teks T = DHIWA ARIEPRATAMA. Inisialisasi awal dan pembuatan bad-match terlihat pada Tabel 2.2 dan Tabel 2.3 berikut. Tabel 2.2Inisialisasi awal bad-match m T D H I W A A R I E P R A T A M A P P R A T A M A I Tabel 2.3Pembuatan Bad-match P P R A T M * I V Seperti yang terlihat pada Tabel 2.2 di atas, inisialisasi awal bad-match dilakukan. Setiap teks dan pattern masing-masing diberi nilai m dan i, dimana m sebagai panjang pattern dan i sebagai indeks. Tabel 2.3 menunjukkan nilai pergeseran bad-match dengan menghitung nilai v seperti yang telah dilakukan pada Tabel 2.1. Pada tahap awal pencarian, dilakukan perbandingan karakter
17 23 paling kanan pattern terhadap window. Apabila terjadi ketidak cocokan, akan dilakukan pergeseran ke kanan untuk melewati karakter yang tidak cocok dimana nilai pergeserannya terdapat pada tabel bad-match. Karakter paling kanan teks pada window berfungsi sebagai landasan untuk menentukan jarak geser yang akan dilakukan. Hal ini terlihat pada Tabel 2.4 berikut. Tabel 2.4Iterasi Algoritma Horspool Pertama m T D H I W A A R I E P R A T A M A P P R A T A M A I Terdapat ketidakcocokan seperti yang terlihat pada Tabel 2.4. Karakter A adalah karakter paling kanan teks pada window. Pada tabel bad-match, nilai geser karakter A adalah 4. Maka, dilakukan pergeseran ke kanan pada window sebanyak 4 kali. Hal ini terlihat pada Tabel 2.5. Tabel 2.5Iterasi Algoritma Horspool Kedua m T D H I W A A R I E P R A T A M A P P R A T A M A I Pada Tabel 2.5, terdapat ketidak cocokan kembali antara karakter P dan A. Pada tabel bad-match, nilai geser karakter R adalah 6. Maka, dilakukan pergeseran ke kanan pada window sebanyak 6 kali. Hal ini terlihat pada Tabel 2.6. Tabel 2.6Iterasi Algoritma Horspool Ketiga m T D H I W A A R I E P R A T A M A P P R A T A M A I Pada Tabel 2.6, window telah berada pada akhir teks dan semua pattern cocok dengan teks. Seluruh pencocokan karakter menggunakan algoritma Horspool telah selesai dan berhenti pada iterasi ketiga.
18 Huruf Jepang Jenis Katakana Huruf Jepang memiliki beberapa jenis huruf yaitu Hiragana, Katakana, Kanji dan Roomaji. Tentu saja ke semua jenis huruf itu memiliki perbedaan dalam bentuk huruf dan penggunaanya. Dalam penelitian ini menitik beratkan pada huruf Katakana saja Huruf Katakana Di jaman dahulu huruf Katakana hanya digunakan oleh kaum lelaki, oleh karena itu bentuk hurufnya lurus-lurus. Digunakan untuk kata-kata yang berasal dari bahasa asing yang kemudian diserap menjadi bahasa Jepang. Misalnya nama orang asing, nama negara dan kota asing (kecuali China dan Korea) dan bendabenda dari negara asing. Selain itu juga digunakan untuk menulis onomatope (bentuk kata yang menirukan suatu bunyi/suara, baik dari manusia, hewan atau benda Huruf Dasar Katakana Huruf dasar Katakana dapat dilihat pada gambar 2.8 di bawah ini : Gambar 2.8 Huruf Dasar Katakana
19 Huruf Tambahan Katakana Huruf tambahan Katakana dapat dilihat pada gambar 2.9 di bawah ini : Gambar 2.9 Huruf Tambahan Katakana
20 Huruf Gabungan Katakana Huruf gabungan Katakana dapat dilihat pada gambar 2.10 di bawah ini : Gambar 2.10 Huruf Gabungan Katakana
BAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1. Citra Citra (image) sebagai salah satu komponen multimedia memegang peranan sangat penting sebagai bentuk informasi visual. Citra mempunyai karakteristik yang tidak dimiliki oleh
Lebih terperinciBAB 2 LANDASAN TEORI
6 BAB 2 LANDASAN TEORI 2. Information Retrieval Information Retrieval atau sering disebut temu kembali infromasi adalah suatu sistem yang mampu melakukan penyimpanan, pencarian, dan pemeliharaan informasi.
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI Pada bab ini akan dibahas mengenai teori-teori yang akan digunakan dalam perancangan sistem pemindai meteran air pada platform android. Hal-hal ini meliputi sistematika pembacaan meteran
Lebih terperinciBAB 3 ANALISA DAN PERANCANGAN SISTEM
BAB 3 ANALISA DAN PERANCANGAN SISTEM 3.1 Analisa Program Aplikasi Dalam proses identifikasi karakter pada plat nomor dan tipe kendaraan banyak menemui kendala. Masalah-masalah yang ditemui adalah proses
Lebih terperinciBAB 2 LANDASAN TEORI. sangat penting sebagai bentuk informasi visual. Bila ditinjau dari sudut pandang
BAB 2 LANDASAN TEORI 2.1 Pengolahan Citra Citra (Image) sebagai salah satu komponen multimedia memegang peranan sangat penting sebagai bentuk informasi visual. Bila ditinjau dari sudut pandang matematis,
Lebih terperinciBAB 3 METODOLOGI PENELITIAN. a. Spesifikasi komputer yang digunakan dalam penelitian ini adalah
BAB 3 METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian 3.1.1 Alat Penelitian a. Spesifikasi komputer yang digunakan dalam penelitian ini adalah sebagai berikut: 1) Prosesor Intel (R) Atom (TM) CPU N550
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 String Matching 2.1.1 Pengertian String Matching String matching adalah pencarian sebuah pattern pada sebuah teks (Cormen, T.H. et al. 1994). String matching digunakan untuk menemukan
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Karakter ASCII ASCII (American Standard Code for Information Interchange) merupakan suatu standar internasional dalam kode huruf dan simbol seperti Hex dan Unicode. Kode ASCII
Lebih terperinci1.1. Latar Belakang. Universitas Sumatera Utara
2 BAB I PENDAHULUAN Bab ini akan menjelaskan mengenai latar belakang penelitian judul skripsi Implementasi Global Tresholding Metode Otsu Dan OCR Tesseract Engine Dengan Algoritma Horspool Untuk Menerjemahkan
Lebih terperinciOleh: Riza Prasetya Wicaksana
Oleh: Riza Prasetya Wicaksana 2209 105 042 Pembimbing I : Dr. I Ketut Eddy Purnama, ST., MT. NIP. 196907301995121001 Pembimbing II : Muhtadin, ST., MT. NIP. 198106092009121003 Latar belakang Banyaknya
Lebih terperinciBAB 3 IMPLEMENTASI SISTEM
BAB 3 IMPLEMENTASI SISTEM Bab ini akan membahas mengenai proses implementasi dari metode pendeteksian paranodus yang digunakan dalam penelitian ini. Bab ini terbagai menjadi empat bagian, bagian 3.1 menjelaskan
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1. Automatic Number Plate Recognition (ANPR) Berdasarkan penjelasan dari penelitian sebelumnya mengenai deteksi plat nomor, maka dapat disimpulkan bahwa pendeteksian ini sangat dibutuhkan
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Definisi Kamus Kamus adalah sejenis buku rujukan yang menerangkan makna kata-kata. Kamus berfungsi untuk membantu seseorang mengenal perkataan baru. Selain menerangkan maksud kata
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI Bab ini berisi analisis pengembangan program aplikasi pengenalan karakter mandarin, meliputi analisis kebutuhan sistem, gambaran umum program aplikasi yang
Lebih terperinciBAB 2 LANDASAN TEORI. metode yang digunakan sebagai pengawasan kendaraan yang menggunakan pengenalan
BAB 2 LANDASAN TEORI 2.1 Automatic Number Plate Recognition Automatic Number Plate Recognition atau yang disingkat dengan ANPR adalah metode yang digunakan sebagai pengawasan kendaraan yang menggunakan
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN SISTEM. Dalam pengerjaan tugas akhir ini memiliki tujuan untuk mengektraksi
BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1 Model Pengembangan Dalam pengerjaan tugas akhir ini memiliki tujuan untuk mengektraksi fitur yang terdapat pada karakter citra digital menggunakan metode diagonal
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1. Pengertian Aplikasi Berbasis Web Aplikasi merupakan program yang berisikan perintah-perintah untuk melakukan pengolahan data. Secara umum, aplikasi adalah suatu proses dari cara
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Definisi Kamus Kamus menurut KBBI (Kamus Besar Bahasa Indonesia) merupakan buku acuan yang memuat kata dan ungkapan, biasanya disusun menurut abjad berikut keterangan dan makna,
Lebih terperinciSISTEM REKOGNISI KARAKTER NUMERIK MENGGUNAKAN ALGORITMA PERCEPTRON
30 BAB IV SISTEM REKOGNISI KARAKTER NUMERIK MENGGUNAKAN ALGORITMA PERCEPTRON 4.1 Gambaran Umum Sistem Diagram sederhana dari program yang dibangun dapat diilustrasikan dalam diagram konteks berikut. Gambar
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN
48 BAB IV HASIL DAN PEMBAHASAN 4.1 Analisis Sistem Sistem yang akan dibangun dalam penelitian ini adalah Implementasi Algoritma Template Matching dan Feature Extraction untuk Pengenalan Pola Angka Untuk
Lebih terperinciAplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion
Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion Johan - 13514206 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10
Lebih terperinciPengenalan Aksara Lampung Menggunakan Jaringan Syaraf Tiruan
Pengenalan Aksara Lampung Menggunakan Jaringan Syaraf Tiruan Adhika Aryantio School of Electrical Engineering and Informatics Institute Technology of Bandung 10th Ganeca Street Bandung, Indonesia. Adhikaaryantio.x6@gmail.com
Lebih terperinciKLASIFIKASI TELUR AYAM DAN TELUR BURUNG PUYUH MENGGUNAKAN METODE CONNECTED COMPONENT ANALYSIS
Ikhwan Ruslianto KLASIFIKASI TELUR AYAM DAN TELUR BURUNG PUYUH MENGGUNAKAN METODE CONNECTED COMPONENT ANALYSIS IKHWAN RUSLIANTO Program Studi Teknik Informatika Sekolah Tinggi Manajemen Informatika dan
Lebih terperinciBAB 1 PENDAHULUAN. teks digital yang dapat dikenali oleh komputer maupun teks non digital seperti
BAB 1 PENDAHULUAN 1.1 Latar Belakang Informasi teks merupakan salah satu komponen penting dalam kehidupan manusia dalam hal berkomunikasi. Informasi teks dapat diperoleh dalam bentuk teks digital yang
Lebih terperinciDETEKSI NOMINAL MATA UANG DENGAN JARAK EUCLIDEAN DAN KOEFISIEN KORELASI
DETEKSI NOMINAL MATA UANG DENGAN JARAK EUCLIDEAN DAN KOEFISIEN KORELASI Marina Gracecia1, ShintaEstriWahyuningrum2 Program Studi Teknik Informatika Universitas Katolik Soegijapranata 1 esthergracecia@gmail.com,
Lebih terperinciBAB 3 ANALISA DAN PERANCANGAN
44 BAB 3 ANALISA DAN PERANCANGAN 3.1 Analisa Analisa yang dilakukan terdiri dari : a. Analisa terhadap permasalahan yang ada. b. Analisa pemecahan masalah. 3.1.1 Analisa Permasalahan Pengenalan uang kertas
Lebih terperinciBAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat
BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan
Lebih terperinciBAB II TINJAUAN PUSTAKA
7 BAB II TINJAUAN PUSTAKA 2.1. Algoritma Pencocokan String Algoritma pencocokan string merupakan komponen dasar dalam pengimplementasian berbagai perangkat lunak praktis yang sudah ada. String matching
Lebih terperinciImplementasi Metode Watershed Transformation Dalam Segmentasi Tulisan Aksara Bali Berbasis Histogram
Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Implementasi Metode Watershed Transformation Dalam Segmentasi Tulisan Aksara Bali Berbasis Histogram Komang Budiarta,
Lebih terperinciPenggunaan Jaringan Syaraf Tiruanuntuk Membaca Karakter pada Formulir Nilai Mata Kuliah
Vol. 14, No. 1, 61-68, Juli 2017 Penggunaan Jaringan Syaraf Tiruanuntuk Membaca Karakter pada Formulir Nilai Mata Kuliah La Surimi, Hendra, Diaraya Abstrak Jaringan syaraf tiruan (JST) telah banyak diaplikasikan
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN PROGRAM
BAB 3 ANALISIS DAN PERANCANGAN PROGRAM Program aplikasi ini dirancang dengan menggunakan perangkat lunak Microsoft Visual C# 2008 Express Edition. Proses perancangan menggunakan pendekatan Object Oriented
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Menginterprestasi sebuah citra untuk memperoleh diskripsi tentang citra tersebut melalui beberapa proses antara lain preprocessing, segmentasi citra, analisis
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Pengolahan Citra Pengolahan citra adalah kegiatan memanipulasi citra yang telah ada menjadi gambar lain dengan menggunakan suatu algoritma atau metode tertentu. Proses ini mempunyai
Lebih terperinciBAB 2 TINJAUAN PUSTAKA 2.1 Dasar Teori Citra Digital
4 BAB 2 TINJAUAN PUSTAKA 2.1 Dasar Teori Bab ini berisi tentang teori yang mendasari penelitian ini. Terdapat beberapa dasar teori yang digunakan dan akan diuraikan sebagai berikut. 2.1.1 Citra Digital
Lebih terperinciPERANCANGAN PROGRAM PENGENALAN BENTUK MOBIL DENGAN METODE BACKPROPAGATION DAN ARTIFICIAL NEURAL NETWORK SKRIPSI
PERANCANGAN PROGRAM PENGENALAN BENTUK MOBIL DENGAN METODE BACKPROPAGATION DAN ARTIFICIAL NEURAL NETWORK SKRIPSI Oleh Nama : Januar Wiguna Nim : 0700717655 PROGRAM GANDA TEKNIK INFORMATIKA DAN MATEMATIKA
Lebih terperinciDETEKSI DAN SEGMENTASI OTOMATIS DERET PADA CITRA METERAN AIR
DETEKSI DAN SEGMENTASI OTOMATIS DERET PADA CITRA METERAN AIR Naser Jawas STIKOM Bali Jl. Raya Puputan, No.86, Renon, Denpasar, Bali Email: naser.jawas@gmail.com ABSTRAK Meter air adalah sebuah alat yang
Lebih terperinciPengenalan Karakter Sintaktik menggunakan Algoritma Otsu dan Zhang-Suen
Pengenalan Karakter Sintaktik menggunakan Algoritma Otsu dan Zhang-Suen Yusfia Hafid Aristyagama (23214355) Electrical Engineering, Digital Media and Game Technology Institut Teknologi Bandung Bandung,
Lebih terperinci1 BAB I PENDAHULUAN. 1.1 Latar Belakang
1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi dibidang transportasi darat khususnya kendaraan bermotor, semakin membantu masyarakat penggunanya, sehingga menjadikan kendaraan bermotor sebagai
Lebih terperinciBINERISASI CITRA DOKUMEN DENGAN FILTERISASI HOMOMORPHIC
BINERISASI CITRA DOKUMEN DENGAN FILTERISASI HOMOMORPHIC Naser Jawas STMIK STIKOM BALI naser.jawas@stikom-bali.ac.id Abstrak Binerisasi citra dokumen adalah sebuah langkah awal yang sangat penting dalam
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1 Waktu dan Tempat Penelitian Waktu yang digunakan dalam penelitian ini yaitu dalam kurun waktu enam bulan terhitung mulai februari 2012 sampai juli 2012. Tempat yang digunakan
Lebih terperinciWEBSITE PERANCANGAN SCRAPBOOK DENGAN PEMOTONGAN GAMBAR OTOMATIS
WEBSITE PERANCANGAN SCRAPBOOK DENGAN PEMOTONGAN GAMBAR OTOMATIS C. Pickerling Teknik Informatika,Sekolah Tinggi Teknik Surabaya e-mail: pickerling@stts.edu ABSTRAK Scrapbook merupakan salah satu kegemaran
Lebih terperinci2 BAB II TINJAUAN PUSTAKA
9 2 BAB II TINJAUAN PUSTAKA 2.1 Penelitian Terkait Secara umum penelitian pengenalan plat nomor kendaraan terdiri dari tiga tahapan [1][7][11], yaitu deteksi plat nomor kendaraan, segmentasi karakter,
Lebih terperinciAPLIKASI DETEKSI MIKROKALSIFIKASI DAN KLASIFIKASI CITRA MAMMOGRAM BERBASIS TEKSTUR SEBAGAI PENDUKUNG DIAGNOSIS KANKER PAYUDARA
APLIKASI DETEKSI MIKROKALSIFIKASI DAN KLASIFIKASI CITRA MAMMOGRAM BERBASIS TEKSTUR SEBAGAI PENDUKUNG DIAGNOSIS KANKER PAYUDARA Yusti Fitriyani Nampira 50408896 Dr. Karmilasari Kanker Latar Belakang Kanker
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Pengenalan kata dalam dunia teknologi informasi merupakan suatu permasalahan yang tidak asing dalam bidang kecerdasan buatan. Pengenalan kata dalam bidang kecerdasan
Lebih terperinciPENERAPAN STRING MATCHING DENGAN ALGORITMA BOYER MOORE PADA APLIKASI FONT ITALIC UNTUK DETEKSI KATA ASING
PENERAPAN STRING MATCHING DENGAN ALGORITMA BOYER MOORE PADA APLIKASI FONT ITALIC UNTUK DETEKSI KATA ASING Rohmat Indra Borman 1), Agus Pratama 2) 1) Komputerisasi Akuntansi, STMIK Teknokrat 2) Teknik Informatika,
Lebih terperinciPENGENALAN BILANGAN ARAB MENGGUNAKAN TEMPLATE MATCHING
Powered by TCPDF (www.tcpdf.org) PENGENALAN BILANGAN ARAB MENGGUNAKAN TEMPLATE MATCHING Muhammad Hanif Dwiadi¹, Sofia Naning Hertiana², Gelar Budiman³ ¹Teknik Telekomunikasi,, Universitas Telkom Abstrak
Lebih terperinciBAB III METODE PENELITIAN. tangan dengan menggunakan metode Support Vector Machine (SVM).
BAB III METODE PENELITIAN 3.1 Desain Penelitian Di dalam desain penelitian ini akan menggambarkan proses pengenalan tulisan tangan dengan menggunakan metode Support Vector Machine (SVM). Praproses Input
Lebih terperinciBAB 1 PENDAHULUAN. Perkembangan pengetahuan dibidang kecerdasan buatan sedemikian
1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dibidang kecerdasan buatan sedemikian pesatnya, seperti penelitian segmentasi dokumen. Segmentasi dokumen membuat pengguna menjadi mudah
Lebih terperinciAnalisis Algoritma Knuth Morris Pratt dan Algoritma Boyer Moore dalam Proses Pencarian String
Analisis Algoritma Knuth Morris Pratt dan Algoritma Boyer Moore dalam Proses Pencarian String Rama Aulia Program Studi Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung
Lebih terperinciBAB 3 PENGENALAN KARAKTER DENGAN GABUNGAN METODE STATISTIK DAN FCM
BAB 3 PENGENALAN KARAKTER DENGAN GABUNGAN METODE STATISTIK DAN FCM 3.1 Gambaran Umum Gambar 3.1 Gambar Keseluruhan Proses Secara Umum 73 74 Secara garis besar, keseluruhan proses dapat dikelompokkan menjadi
Lebih terperinciBAB II DASAR TEORI. 2.1 Meter Air. Gambar 2.1 Meter Air. Meter air merupakan alat untuk mengukur banyaknya aliran air secara terus
BAB II DASAR TEORI 2.1 Meter Air Gambar 2.1 Meter Air Meter air merupakan alat untuk mengukur banyaknya aliran air secara terus menerus melalui sistem kerja peralatan yang dilengkapi dengan unit sensor,
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Sumatera Utara
BAB 1 PENDAHULUAN 1.1 Latar Belakang Dunia pendidikan dan ilmu pengetahuan pada saat ini semakin berkembang dengan pesat yang disertai dengan semakin banyaknya arus informasi dan ilmu pengetahuan ilmiah
Lebih terperinciPERBANDINGAN ALGORITMA TEMPLATE MATCHING DAN FEATURE EXTRACTION PADA OPTICAL CHARACTER RECOGNITION
Jurnal Komputer dan Informatika (KOMPUTA) 29 PERBANDINGAN ALGORITMA TEMPLATE MATCHING DAN FEATURE EXTRACTION PADA OPTICAL CHARACTER RECOGNITION Raden Sofian Bahri 1, Irfan Maliki 2 1,2 Program Studi Teknik
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pengenalan citra merupakan suatu ilmu yang berguna untuk melakukan klasifikasi berdasarkan ciri atau sifat-sifat dari suatu objek. OCR atau Optical Character
Lebih terperinciKombinasi Algoritma Pattern Matching dan BFS-DFS pada aplikasi Music Discovery
Kombinasi Algoritma Pattern Matching dan BFS-DFS pada aplikasi Music Discovery Disusun Oleh : Levanji Prahyudy / 13513052 Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung Kombinasi Algoritma
Lebih terperinciPENGEMBANGAN APLIKASI PERHITUNGAN JUMLAH OBJEK PADA CITRA DIGITAL DENGAN MENGGUNAKAN METODE MATHEMATICAL MORPHOLOGY
PENGEMBANGAN APLIKASI PERHITUNGAN JUMLAH OBJEK PADA CITRA DIGITAL DENGAN MENGGUNAKAN METODE MATHEMATICAL MORPHOLOGY DAN TEKNIK CONNECTED COMPONENT LABELING Oleh I Komang Deny Supanji, NIM 0815051052 Jurusan
Lebih terperinciBAB III PERANCANGAN SISTEM. Pada dewasa sekarang ini sangat banyak terdapat sistem dimana sistem tersebut
BAB III PERANCANGAN SISTEM 3.1 Definisi Masalah Pada dewasa sekarang ini sangat banyak terdapat sistem dimana sistem tersebut sudah terintegrasi dengan komputer, dengan terintegrasinya sistem tersebut
Lebih terperinciRekognisi karakter optik merupakan salah satu aplikasi pengenalan pola yang
17 BAB II REKOGNISI KARAKTER NUMERIK 2.1 Gambaran Singkat Rekognisi Karakter Optik Rekognisi karakter optik merupakan salah satu aplikasi pengenalan pola yang dirancang untuk menerjemahkan teks baik berupa
Lebih terperinciPENGKONVERSIAN IMAGE MENJADI TEKS UNTUK IDENTIFIKASI PLAT NOMOR KENDARAAN. Sudimanto
Media Informatika Vol. 14 No.3 (2015) Abstrak PENGKONVERSIAN IMAGE MENJADI TEKS UNTUK IDENTIFIKASI PLAT NOMOR KENDARAAN Sudimanto Sekolah Tinggi Manajemen Informatika dan Komputer LIKMI Jl. Ir. H. Juanda
Lebih terperinciImplementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara
Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Bima Laksmana Pramudita (13511042) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,
Lebih terperinciIMPLEMENTASI ALGORITMA BRUTE FORCE DALAM PENCARIAN DATA KATALOG BUKU PERPUSTAKAAN
IMPLEMENTASI ALGORITMA BRUTE FORCE DALAM PENCARIAN DATA KATALOG BUKU PERPUSTAKAAN Mesran Dosen Tetap Program Studi Teknik Informatika STMIK Budi Darma Medan Jl. Sisingamangaraja No.338 Simpang Limun Medan
Lebih terperinciBAB III PERANCANGAN SISTEM
BAB III PERANCANGAN SISTEM Dalam pengerjaan perancangan dan pembuatan aplikasi pengenalan karakter alfanumerik JST algoritma Hopfield ini menggunakan software Borland Delphi 7.0. 3.1 Alur Proses Sistem
Lebih terperinciAplikasi Pengolahan Citra Dalam Pengenalan Pola Huruf Ngalagena Menggunakan MATLAB
Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Aplikasi Pengolahan Citra Dalam Pengenalan Pola Huruf Ngalagena Menggunakan MATLAB Dani Rohpandi 1), Asep Sugiharto 2),
Lebih terperinciMKB3383 TEKNIK PENGOLAHAN CITRA Pemrosesan Citra Biner
MKB3383 TEKNIK PENGOLAHAN CITRA Pemrosesan Citra Biner Dosen Pengampu: Muhammad Zidny Naf an, M.Kom. Genap 2016/2017 Definisi Citra biner (binary image) adalah citra yang hanya mempunyai dua nilai derajat
Lebih terperinciPENGUJIAN PENGENALAN KARAKTER PADA KTP MENGGUNAKAN METODE TEMPLATE MATCHING
PENGUJIAN PENGENALAN KARAKTER PADA KTP MENGGUNAKAN METODE TEMPLATE MATCHING Michael Ryan dan Novita Hanafiah School of Computer Science, Bina Nusantara, Jl. Kebon Jeruk Raya No. 27,Kebon Jeruk, Jakarta
Lebih terperinciBAB I PENDAHULUAN. Diantara banyak fungsi komputer yang digunakan oleh manusia adalah. pencarian data serta pengurutan data (Handoyo, 2004).
BAB I PENDAHULUAN 1.1. Latar Belakang Pada zaman sekarang ini penggunaan komputer sudah merakyat dan hampir selalu digunakan untuk menjalankan berbagai aktivitas manusia. Diantara banyak fungsi komputer
Lebih terperinciAplikasi String Matching pada Plugin SMS Blocker untuk Validasi Pesan
Aplikasi String Matching pada Plugin SMS Blocker untuk Validasi Pesan Mario Tressa Juzar 13512016 1 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl.
Lebih terperinciPerbandingan Penggunaan Algoritma BM dan Algoritma Horspool pada Pencarian String dalam Bahasa Medis
Perbandingan Penggunaan BM dan Horspool pada Pencarian String dalam Bahasa Medis Evlyn Dwi Tambun / 13509084 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Pengertian Folder Sebuah directory (folder) adalah seperti ruangan-ruangan (kamar-kamar) pada sebuah komputer yang berfungsi sebagai tempat penyimpanan dari berkas-berkas (file).
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Meteran Air Meteran air merupakan alat untuk mengukur banyaknya aliran air secara terus menerus melalui sistem kerja peralatan yang dilengkapi dengan unit sensor, unit penghitung,
Lebih terperinciPenggunaan String Matching Dalam Mencari Kata Dalam Permainan Mencari Kata Dari Sebuah Matriks Huruf
Penggunaan String Matching Dalam Mencari Kata Dalam Permainan Mencari Kata Dari Sebuah Matriks Huruf Luthfi Kurniawan 13514102 1 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut
Lebih terperinciBAB 3 METODOLOGI PENELITIAN
BAB 3 METODOLOGI PENELITIAN 3.1. Penentuan Masalah Penelitian Masalah masalah yang dihadapi oleh penggunaan identifikasi sidik jari berbasis komputer, yaitu sebagai berikut : 1. Salah satu masalah dalam
Lebih terperinciBAB 4 HASIL DAN PEMBAHASAN
BAB 4 HASIL DAN PEMBAHASAN 4.1. Evaluasi Pada penelitian ini, algoritma untuk identifikasi sidik jari tersusun dari 3 tahapan proses yakni tahap preprocessing fingerprint image, minutiae extraction, dan
Lebih terperinciBAB I PENDAHULUAN. Pengenalan pola merupakan permasalahan kecerdasan buatan yang secara
BAB I PENDAHULUAN 1.1. Latar Belakang Pengenalan pola merupakan permasalahan kecerdasan buatan yang secara umum sering digunakan dalam sistem berbasis pengetahuan. Pengenalan pola memiliki peranan penting
Lebih terperinciSYSTEM IDENTIFIKASI GANGGUAN STROKE ISKEMIK MENGGUNAKAN METODE OTSU DAN FUZZY C-MEAN (FCM)
SYSTEM IDENTIFIKASI GANGGUAN STROKE ISKEMIK MENGGUNAKAN METODE OTSU DAN FUZZY C-MEAN (FCM) Jani Kusanti Program Studi Teknik Informatika, Fakultas Teknik Elektro dan Informatika Universitas Surakarta (UNSA),
Lebih terperinciPenerapan Algoritma Pattern Matching untuk Mengidentifikasi Musik Monophonic
Penerapan Algoritma Pattern Matching untuk Mengidentifikasi Musik Monophonic Fahziar Riesad Wutono (13512012) 1 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Algoritma Algoritma ditemukan oleh seorang ahli matematika dari Uzbekistan, yang bernama Abu Ja far Muhammad Ibnu Al-Kwarizmi (770-840). Dalam bukunya yang berjudul Al-Jabr
Lebih terperinciSEGMENTASI CITRA MEDIK MRI (MAGNETIC RESONANCE IMAGING) MENGGUNAKAN METODE REGION THRESHOLD
SEGMENTASI CITRA MEDIK MRI (MAGNETIC RESONANCE IMAGING) MENGGUNAKAN METODE REGION THRESHOLD Murinto, Resa Fitria Rahmawati Program Studi Teknik Informatika Fakultas Teknologi Industri Universitas Ahmad
Lebih terperinciBAB 2 LANDASAN TEORI. dari sudut pandang matematis, citra merupakan fungsi kontinyu dari intensitas cahaya
5 BAB 2 LANDASAN TEORI 2.1 Citra Secara harfiah citra atau image adalah gambar pada bidang dua dimensi. Ditinjau dari sudut pandang matematis, citra merupakan fungsi kontinyu dari intensitas cahaya pada
Lebih terperinciPEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK
PEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK Program Studi Matematika FMIPA Universitas Negeri Semarang Abstrak. Saat ini, banyak sekali alternatif dalam
Lebih terperinciMencari Pola dalam Gambar dengan Algoritma Pattern Matching
Mencari Pola dalam Gambar dengan Algoritma Pattern Matching Muhammad Farhan Majid (13514029) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI Pada bab ini akan dibahas teori yang berkaitan dengan sistem pendeteksi orang tergeletak mulai dari : pembentukan citra digital, background subtraction, binerisasi, median filtering,
Lebih terperinciPERANCANGAN PENGENALAN PLAT NOMOR MELALUI CITRA DIGITAL DENGAN OPENCV
PERANCANGAN PENGENALAN PLAT NOMOR MELALUI CITRA DIGITAL DENGAN OPENCV Abdillah Komarudin 1401139432 Program Studi Sistem Komputer, Universitas Bina Nusantara, abdee_dillah@yahoo.com Ahmad Teguh Satria
Lebih terperinciPenentuan Stadium Kanker Payudara dengan Metode Canny dan Global Feature Diameter
Penentuan Stadium Kanker Payudara dengan Metode Canny dan Global Feature Diameter Metha Riandini 1) DR. Ing. Farid Thalib 2) 1) Laboratorium Teknik Informatika, Fakultas Teknologi Industri, Universitas
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN Penelitian ini menggunakan jenis penelitian eksperimen, dengan tahapan penelitian sebagai berikut: 3.1 Pengumpulan Data Tahap ini merupakan langkah awal dari penelitian. Dataset
Lebih terperinciAplikasi Algoritma BFS dan String Matching pada Tag Suggestions di Facebook
Aplikasi Algoritma BFS dan String Matching pada Tag Suggestions di Facebook Catherine Pricilla 13514004 1 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl.
Lebih terperincipbab 4 IMPLEMENTASI DAN EVALUASI PROGRAM APLIKASI uji coba terhadap program aplikasi pengenalan plat nomor kendaraan roda empat ini,
pbab 4 IMPLEMENTASI DAN EVALUASI PROGRAM APLIKASI Bab ini berisi penjelasan tentang implementasi sistem meliputi kebutuhan perangkat lunak dan perangkat keras yang digunakan untuk melakukan perancangan
Lebih terperinciCOMPUTER VISION UNTUK PENGHITUNGAN JARAK OBYEK TERHADAP KAMERA
Seminar Nasional Teknologi Terapan SNTT 2013 (26/10/2013) COMPUTER VISION UNTUK PENGHITUNGAN JARAK OBYEK TERHADAP KAMERA Isnan Nur Rifai *1 Budi Sumanto *2 Program Diploma Elektronika & Instrumentasi Sekolah
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Citra Digital Citra digital didefinisikan sebagai fungsi f(x,y) dua dimensi, dimana x dan y adalah koordinat spasial dan f(x,y) adalah disebut dengan intensitas atau tingkat keabuan
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Sebagai tinjauan pustaka, berikut beberapa contoh penelitian telapak kaki yang sudah dilakukan oleh para peneliti yang dapat digunakan sebagai
Lebih terperinciPencarian Potongan Gambar Menggunakan Algoritma Boyer Moore
Pencarian Potongan Gambar Menggunakan Algoritma Boyer Moore Andrian Octavianus-13512602 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10
Lebih terperinciPENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION
Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2016, pp. 590~595 PENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION 590 Indra Gunawan
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sistem parkir khususnya untuk parkir mobil di tempat-tempat pusat perbelanjaan di Indonesia pada umumnya sudah menerapkan sistem otomatis. Setiap mobil yang
Lebih terperinciBAB IV PREPROCESSING
BAB IV PREPROCESSING 4.1 Langkah yang Dilakukan Interpretasi visual citra Pap smear merupakan hal yang sangat rumit. Hal ini disebabkan karena citra Pap smear memberikan hasil sel yang beragam mulai dari
Lebih terperinciPengenalan Benda di Jalan Raya dengan Metode Kalman Filter. Roslyn Yuniar Amrullah
Pengenalan Benda di Jalan Raya dengan Metode Kalman Filter Roslyn Yuniar Amrullah 7406040026 Abstrak Computer Vision merupakan disiplin ilmu perpanjangan dari pengolahan citra digital dan kecerdasan buatan.
Lebih terperinciTECHNICAL REPORT PENGGUNAAN ALGORITMA PENCOCOKAN STRING BOYER-MOORE DALAM MENDETEKSI PENGAKSESAN SITUS INTERNET TERLARANG
TECHNICAL REPORT PENGGUNAAN ALGORITMA PENCOCOKAN STRING BOYER-MOORE DALAM MENDETEKSI PENGAKSESAN SITUS INTERNET TERLARANG Ario Yudo Husodo Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung
Lebih terperinciUJI COBA PERBEDAAN INTENSITAS PIKSEL TIAP PENGAMBILAN GAMBAR. Abstrak
UJI COBA PERBEDAAN INTENSITAS PIKSEL TIAP PENGAMBILAN GAMBAR Teady Matius Surya Mulyana tmulyana@bundamulia.ac.id, teadymatius@yahoo.com Teknik Informatika Universitas Bunda Mulia Abstrak Kebutuhan binarisasi
Lebih terperinciBAB 3 PERANCANGAN DAN PEMBUATAN SISTEM
BAB 3 PERANCANGAN DAN PEMBUATAN SISTEM Dalam bab ini akan dibahas mengenai perancangan dan pembuatan sistem aplikasi yang digunakan sebagai user interface untuk menangkap citra ikan, mengolahnya dan menampilkan
Lebih terperinciBAB 1 PENDAHULUAN. memindahkan data secara manual ke dalam komputer untuk dapat diolah lebih
BAB 1 PENDAHULUAN 1.1 Latar Belakang Teknologi yang terus berkembang membuat sistem komputerisasi bergerak dengan cepat, namun hal ini tidak seimbang dengan kemampuan manusia memindahkan data secara manual
Lebih terperinciBAB II LANDASAN TEORI. Pengolahan Citra adalah pemrosesan citra, khususnya dengan menggunakan
BAB II LANDASAN TEORI 2.1. Citra Citra adalah gambar pada bidang dwimatra (dua dimensi). Ditinjau dari sudut pandang matematis, citra merupakan fungsi menerus dan intensitas cahaya pada bidang dwimatra
Lebih terperinci