Penyusun Tugas Akhir Alvian Adi Pratama [5106100108] Dosen Pembimbing Diana Purwitasari, S.Kom, M.Sc. Dr. Eng. Nanik Suciati, S.Kom., M.Kom.
Latar Belakang Batik merupakan harta kebudayaan Indonesia yang telah diakui UNESCO dan perlu dilindungi. Perhatian serius terhadap batik perlu dilakukan untuk mencegah hilangnya batik sebagai warisan budaya karena kurangnya informasi dan dokumentasi yang baik. Perlu dilakukan pengelompokkan data untuk batik yang mempunyai lebih dari satu motif. Penggunaan Grey Level Cooccurence Matrix (GLCM), Discrete Wavelet Transform (DWT), dan Rotated Wavelet Filter (RWF) mempunyai akurasi lebih baik dalam pengenalan tekstur dibandingkan dengan metode yang banyak digunakan sebelumnya (Hazra, D. 2011).
Rumusan Masalah Bagaimana mengekstraksi fitur suatu citra menggunakan GLCM, DWT, dan RWF. Bagaimana penerapan Fuzzy C-Means untuk klasifikasi citra batik.
Batasan Masalah Data yang digunakan adalah batik Indonesia yang berasal dari Pulau Jawa dengan motif parang, semen, ceplok, lereng, lung-lungan, dan buketan. Output dari aplikasi ini adalah tingkat kemiripan suatu citra dengan motif-motif di atas. Implementasi aplikasi dilakukan menggunakan bahasa Java dengan bantuan program Netbeans 7.1
Tujuan dan Manfaat Tugas akhir ini bertujuan untuk membuat suatu aplikasi yang mampu mengenali citra batik yang memiliki lebih dari satu motif. Sistem ini diharapkan mampu membantu pendataan batik multi-label di Indonesia dan mempermudah penyebaran informasinya.
Diagram Alir Sistem Proses Pengklasteran Citra Batik Training Preproses (Greyscaling) Ekstraksi Fitur GLCM, DWT dan RWF Pembuatan Vektor Fitur Pengklasteran Database Fitur pusat Cluster Informasi Pusat Kelas Citra Masukan Testing Preproses (Greyscaling) Ekstraksi Fitur GLCM, DWT dan RWF Hitung Jarak Nilai keanggotaan semua klaster Pengenalan Data Baru
Tampilan Amplikasi
Preproses Dalam tahap ini dilakukan proses greyscaling, yaitu proses pengubahan pixel berwarna menjadi skala abuabu (greyscale). Proses greyscaling dilakukan berdasarkan persamaan grey = 0.299 red + 0.587 green + 0.114 blue
Ekstraksi Fitur Fitur yang diambil dari setiap citra adalah 1. Homogenitas dari GLCM 2. Energi dari hasil transformasi DWT 3. Energi dari hasil transformasi RWF
Grey Level Coocurrence Matrix Anggota GLCM dengan alamat (i,j) dihitung berdasarkan berapa sering suatu pixel dengan grey-level i muncul di horisontal, vertikal, atau diagonal berpasangan dengan pixel dengan grey-level j. Contoh GLCM untuk arah horisontal ke kanan (θ = 0 o ) Nilai Homogenitas dari GLCM dihitung berdasarkan persamaan GLCM i, j Homogenitas = 1 + i j i,j Setiap citra diambil fitur homogenitasnya dari GLCM untuk empat arah yaitu horisontal ke kanan (θ = 0 o ), diagonal ke kanan bawah (θ = 45 o ), vertikal ke bawah (θ = 90 o ), dan diagonal ke kiri bawah (θ = 135 o ).
Discrete Wavelet Transform Discrete Wavelet Transform (DWT) adalah transformasi wavelet dimana data inputnya berupa nilai diskrit (nonkontinyu). Untuk kasus sinyal pada ruang 2-D biasanya dilakukan dengan menerapkan struktur bank filter secara terpisah terhadap sinyal citra. Digunakan Low-Pass Filter atau LPF (L) dan High-Pass Filter atau HPF (H). Dua filter diatas dikombinasikan untuk membuat 4 buah filter yang digunakan untuk proses dekomposisi citra sebagai berikut. 1. H LL = L T H menghasilkan Image Approximation (I ll ) 2. H LH = L T H menghasilkan Image Horizontal Detail (I lh ) 3. H HL = H T L menghasilkan Image Vertical Detail (I hl ) 4. H HH = H T H menghasilkan Image Diagonal Detail (I hh )
Discrete Wavelet Transform Proses dekomposisi suatu citra bisa di gambarkan sebagai berikut H ll I ll2 H lh I lh2 H ll I ll1 H hl I hl2 Citra H lh I lh1 H hh I hh2 H hl I hl1 Citra Citra yang akan di proses H hh I hh1 H ll Proses konvolusi citra dengan filter H ll Downsampling (Pengambilan nilai matrix berindeks genap)
Rotated Wavelet Filter Rotated Wavelet Filter (RWF) adalah filter transformasi yang dibuat dari rotasi filter-filter DWT. Dalam tugas akhir ini filter DWT dirotasi sebesar 45 0. Proses dekomposisi citra dengan menggunakan RWF langkahlangkahnya sama seperti DWT, yang membedakan adalah filterfilternya saja. HR ll I ll2 HR ll I ll1 HR lh I lh2 Citra HR lh I lh1 HR hl I hl2 2-D Downsampling Citra Citra yang akan di proses HR hl 2-D Downsampling I hl1 HR ll Proses konvolusi citra dengan filter HR ll Downsampling (Pengambilan nilai matrix berindeks genap)
Fitur Energi dari DWT dan RWF Nilai energi setiap subbidang hasil dekomposisi DWT dan RWF dihitung berdasarkan persamaan Energi = 1 MxN M i=1 N j=1 Dekomposisi dilakukan sebanyak 5 level. Untuk DWT setiap subbidang diambil energinya, sedangkan untuk RWF hanya bidang LH dan HL saja karena hanya dua subband ini yang mengandung informasi diagonal yang dibutuhkan. X ij
Fuzzy C-Means Fuzzy C-Means (FCM) adalah salah satu metode yang digunakan dalam proses pengelompokan data (Data Clustering). Data clustering adalah proses membagi elemenelemen data ke klaster-klaster sehingga elemenelemen di klaster yang sama menjadi semirip mungkin, sedangkan elemen di klaster yang berbeda menjadi setidak mirip mungkin. Algoritma FCM digunakan karena dengan FCM sebuah data mempunyai nilai keanggotaan ke semua klaster.
Fuzzy C-Means Algoritma FCM adalah sebagai berikut 1. Tentukan nilai keanggotaan suatu data dengan semua klaster secara random 2. Ulangi langkah-langkah berikut ini sampai terjadi konvergensi nilai keanggotaan a) Hitung pusat dari masing-masing klaster b) Hitung keanggotaan setiap data untuk masing-masing klaster
Fuzzy C-Means Pusat klaster c j dengan parameter fuzziness m dihitung berdasarkan persamaan n i=1 μ m ij x i c j = n i=1 μ ij m Sedangkan nilai keanggotaan data ke-i x i dengan klaster ke-j µ ij menggunakan persamaan 1 μ ij = 2 c d ik (m 1) k=1 d ij
Penghitungan Jarak Untuk jarak antara dua vektor x dan y dengan jumlah anggota p dihitung menggunakan Canberra Distance p x a y a d xy = x a + y a a=1 Persamaan ini digunakan karena nilai-nilai dalam satu vektor fitur mempunyai skala yang berbeda-beda sehingga diperlukan normalisasi yang sudah diperhitungkan dalam Canberra Distance.
FCM Modifikasi FCM biasa mempunyai kelemahan yang disebabkan oleh tiap data masih dipengaruhi klaster yang jaraknya jauh. Yang membedakan dengan FCM biasa adalah persamaan keanggotaan untuk FCM modifikasi menggunakan sebagai berikut. μ ij = n 2 1 d ij c k=1 1 m 1 1 d ik 1 m 1
Uji Coba Proses uji coba ini adalah setelah proses clustering selesai, dilakukan penentuan kelas secara manual berdasarkan banyaknya anggota kelompok data yang diketahui sebelumnya paling banyak ikut kelas tersebut. Setelah kelas-kelas tersebut ditentukan, baru dilakukan proses testing data baru. Pengukuran kinerja dari aplikasi ini menerapkan beberapa skenario uji coba sebagai berikut: Uji coba variabel fuzziness (m). Uji coba penggunaan FCM. Uji coba penggunaan fitur DWT saja, DWT & RWF, serta DWT, RWF, & GLCM. Uji coba untuk pengenalan multi-label
Hasil Uji Coba (1) Untuk m = 1.1 Parang Ceplok Lereng Semen Lung-Lungan Buketan Total B 0 17 1 1 2 1 22 S 6 2 2 2 19 5 36 % 0 89.47 33.33 33.33 9.52 16.66 37.93 Untuk m = 1.5 Parang Ceplok Lereng Semen Lung-Lungan Buketan Total B 2 17 0 1 9 2 31 S 4 2 3 2 12 4 27 % 33.33 89.47 0.00 33.33 42.86 33.33 53.45 Untuk m = 2 Parang Ceplok Lereng Semen Lung-Lungan Buketan Total B 0 18 2 2 4 1 27 S 6 1 1 1 17 5 31 % 0.00 94.74 66.67 66.67 19.05 16.67 46.55
Hasil Uji Coba (2) Penggunaan FCM yang dimodifikasi Parang Ceplok Lereng Semen Lung-Lungan Buketan Total B 1 18 2 2 4 1 28 S 5 1 1 1 17 5 30 % 16.67 94.74 66.67 66.67 19.05 16.67 48.28 FCM Normal Parang Ceplok Lereng Semen Lung-Lungan Buketan Total B 0 18 2 2 4 1 27 S 6 1 1 1 17 5 31 % 0.00 94.74 66.67 66.67 19.05 16.67 46.55
Hasil Uji Coba (3) Penggunaan fitur DWT, RWF, dan GLCM Parang Ceplok Lereng Semen Lung-Lungan Buketan Total B 0 18 2 2 4 1 27 S 6 1 1 1 17 5 31 % 0.00 94.74 66.67 66.67 19.05 16.67 46.55 Penggunaan fitur DWT dan RWF Parang Ceplok Lereng Semen Lung-Lungan Buketan Total B 1 18 0 2 4 1 26 S 5 1 3 1 17 5 32 % 16.67 94.74 0.00 66.67 19.05 16.67 44.83 Penggunaan fitur DWT saja Parang Ceplok Lereng Semen Lung-Lungan Buketan Total B 2 13 0 1 4 1 21 S 4 6 3 2 17 5 37 % 33.33 68.42 0.00 33.33 19.05 16.67 36.21
Uji Coba untuk multi-label Pada percobaan ini digunakan data hasil clustering dengan fuzziness 1.5 yang merupakan nilai akurasi terbesar. Percobaan hanya dilakukan berdasarkan pengamatan visual saja, sehingga ada kemungkinan hasilnya tidak objektif. Hanya contoh 4 buah data dari dataset testing yang ditunjukkan.
Hasil Uji Coba multi-label (1) Dari citra Diperoleh labelnya adalah Lereng, Ceplok, dan Buketan. Lereng : 0.32000891 Ceplok: 0.29608577 Buketan: 0.16174722 Lung-Lungan: 0.09470890 Parang : 0.07750342 Semen : 0.04994576
Hasil Uji Coba multi-label (2) Dari citra Diperoleh labelnya adalah Lung-Lungan, Lereng, dan Buketan. Lung-Lungan : 0.23120019 Lereng : 0.19799454 Buketan : 0.1941992 Semen : 0.15778538 Parang : 0.13752886 Ceplok : 0.08129177
Hasil Uji Coba multi-label (3) Dari citra Diperoleh labelnya adalah Lung-Lungan, Semen, dan Buketan. Lung-Lungan : 0.67931820 Semen : 0.15153598 Buketan : 0.12998466 Parang : 0.02508306 Lereng : 0.01055163 Ceplok : 0.00352644
Hasil Uji Coba multi-label (4) Dari citra Diperoleh labelnya adalah Semen, Parang, dan Lung- Lungan. Semen : 0.26606910 Parang : 0.24041014 Lung-Lungan : 0.17196684 Buketan : 0.16486041 Lereng : 0.09438052 Ceplok : 0.06231296
Kesimpulan 1. Penggunaan Grey Level Co-occurance Matrix, Discrete Wavelet Transform, dan Rotated Wavelet Filter dalam ekstraksi fitur memberikan hasil yang cukup efektif dalam mengenali suatu motif. 2. Fuzzy C-Means Clustering tidak terlalu cocok digunakan dalam mengklasifikasikan data yang terlalu tersebar seperti motif batik ini. Tetapi modifikasi dari FCM standar memberikan sedikit bantuan untuk menutupi kelemahan yang dimilikinya. Di sisi lain penggunaan FCM untuk klasifikasi multi-label cukup memuaskan. 3. Penentuan nilai fuzziness mempengaruhi hasil akurasi secara signifikan. Akurasi tertinggi didapat saat penggunaan fuzziness sebesar 1.5 dengan akursai yang di peroleh adalah 53.45%.
TERIMA KASIH