TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN MENGGUNAKAN JARINGAN BAYESIAN TESIS HENDRIK SIAGIAN 107038003 PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN MENGGUNAKAN JARINGAN BAYESIAN TESIS Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika HENDRIK SIAGIAN 107038003 PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
PENGESAHAN Judul : TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN MENGGUNAKAN JARINGAN BAYESIAN Kategori : TESIS Nama : HENDRIK SIAGIAN Nomor Induk Mahasiswa : 107038003 Program Studi : S2 TEKNIK INFORMATIKA Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Prof. Dr. Muhammad Zarlis Dr. Poltak Sihombing, M.Kom Diketahui/disetujui oleh Program Studi S2 Teknik Informatika Ketua, Prof. Dr. Muhammad Zarlis NIP: 19570701 198601 1 003
PERNYATAAN TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN MENGGUNAKAN JARINGAN BAYESIAN TESIS Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya. Medan, 28 Agustus 2013 Hendrik Siagian NIM. 107038003
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini : Nama : Hendrik Siagian NIM : 107038003 Program Studi : S2 Teknik Informatika Jenis Karya Ilmiah : Tesis Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royati Non-Eksklusif (Non-Exclusive Royalty Free Right) atas tesis saya yang berjudul: TEMU KEMBALI CITRA WAJAH BERDASARKAN PENGUKURAN KEMIRIPAN FITUR DENGAN MENGGUNAKAN JARINGAN BAYESIAN Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non- Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta. Demikan pernyataan ini dibuat dengan sebenarnya. Medan, 28 Agustus 2013 Hendrik Siagian NIM. 107038003
Telah diuji pada Tanggal : 28 Agustus 2013 PANITIA PENGUJI TESIS Ketua : Dr. Poltak Sihombing, M.Kom Anggota : 1. Prof. Dr. Muhammad Zarlis 2. Prof. Dr. Opim Salim Sitompul 3. Dr. Erna Budhiarti Nababan, M.I.T. 4. Prof. Dr. Herman Mawengkang
RIWAYAT HIDUP DATA PRIBADI Nama lengkap berikut gelar : Ir. Hendrik Siagian Tempat dan Tanggal Lahir : Balige, 28 Juli 1966 Alamat Rumah : Jalan Karya Amal No. 10 A Kelurahan Pangkalan Masyhur - Medan Telepon/Faks/HP : 081 265 488 48 e-mail : hendriksgn@gmail.com Instansi Tempat Bekerja : Universitas Prima Medan Alamat Kantor : Jalan Sekip Simpang Sikambing Medan Telepon : 061-4578870, 061-4578890 DATA PENDIDIKAN SD : SD Negeri No. 173524 Balige TAMAT : 1977 SLTP : SMP Negeri 2 Balige TAMAT : 1981 SLTA : SMA Negeri 1 Balige TAMAT : 1984 S1 : Teknik Elektro USU - Medan TAMAT : 1992 S2 : Teknik Informatika USU Medan TAMAT : 2013
UCAPAN TERIMA KASIH Puji syukur kehadirat Allah Yang Maha Kuasa, atas segala limpahan rahmat dan karunia-nya, penulis dapat menyelesaikan tesis ini dengan baik. Tesis dengan judul Temu Kembali Citra Wajah berdasarkan Pengukuran Kemiripan Fitur dengan Menggunakan Jaringan Bayesian diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatra Utara Medan. Dengan selesainya penulisan tesis ini, penulis mengucapkan terima kasih kepada: 1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. dr. Syahril Pasaribu, DTM&H, M.Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada saya untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2) 2. Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara sekaligus Ketua Program Studi Magister (S2) Teknik Informatika, Bapak Prof. Dr. Muhammad Zarlis dan sekretaris Program Studi Magister (S2) Teknik Informatika Bapak M. Andri Budiman, S.T, M.Comp.Sc., M.E.M. beserta seluruh staff pengajar pada Program Studi Magister (S2) Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Sumatra Utara Medan 3. Pembimbing utama Bapak Dr. Poltak Sihombing, M.Kom. dan pembimbing kedua Bapak Prof. Dr. Muhammad Zarlis atas kesediaan dan penuh kesabaran membimbing saya hingga selesainya tesis ini dengan baik 4. Pembanding tesis, Bapak Prof. Dr. Opim Salim Sitompul, Ibu Dr. Erna Budhiarti Nababan, M.I.T. dan Bapak Prof. Dr. Herman Mawengkang yang telah memberikan saran dan masukan serta arahan yang baik demi penyelesaian tesis ini 5. Staff Pegawai dan Administrasi pada Program Studi Magister (S2) Teknik Informatika Program Pascasarjana Fakultas Ilmu Komputer Universitas Sumatera Utara yang telah memberikan bantuan dan pelayanan terbaik kapada penulis selama mengikuti perkuliahan hingga saat ini 6. Istri tercinta Ir., Dra. Ellen Tampubolon MSi., dan seluruh keluarga besar penulis yang tidak dapat disebutkan satu persatu, atas perhatian dan segala pengorbanannya, baik moril maupun materil
7. Rekan mahasiswa/i angkatan kedua tahun 2010 pada Program Studi S2 Teknik Informatika, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Sumatra Utara yang telah banyak membantu penulis berupa dorongan semangat selama mengikuti perkuliahan 8. Seluruh pihak yang tidak dapat penulis sebutkan satu persatu, atas segala bantuan dan doa yang diberikan. Dengan segala kekurangan dan kerendahan hati, sekali lagi penulis mengucapkan terimakasih. Semoga kiranya Allah Yang Maha Kuasa membalas segala bantuan dan kebaikan yang telah diberikan kepada penulis. Medan, 28 Agustus 2013 Hendrik Siagian NIM:107038003
ABSTRAK Dalam penelitian ini, karakteristik citra wajah dinyatakan melalui tiga buah fitur citra yang diekstrak secara langsung dari citra wajah kunci yaitu fitur warna, fitur bentuk dan fitur tekstur. Fitur warna diekstraksi dengan menggunakan histogram warna HSI (hue, saturation, intensity); fitur bentuk diekstraksi dengan menggunakan operator Sobel dan disusun dalam edge direction histogram; fitur tekstur diekstraksi dengan menggunakan co-occurence matrix. Karakteristik citra query dan citra-citra yang ada di dalam database dapat dianggap sebagai node-node yang saling berhubungan dan membentuk sebuah jaringan Bayesian. Jaringan Bayesian merupakan struktur grafik yang menggambarkan peluang relasi diantara variabel-variabel dalam jumlah yang besar dan dapat menarik peluang inferensi atas variabel-variable tersebut. Link antara dua variabel atau node akan merepresentasikan peluang kejadian dari derajat kemiripan citra query dengan setiap citra dalam database dapat diukur dengan cara membandingkan karakteristik citra query dengan karakteristik citra-citra dalam database. Evaluasi terhadap precision hasil temu kembali citra wajah untuk setiap recall memperlihatkan kinerja jaringan Bayesian sangat baik. Kata Kunci : Temu Kembali Citra Wajah, Ekstraksi Fitur, Jaringan Bayesian
FACE IMAGE RETRIEVAL BASED ON FEATURE SIMILARITY MEASUREMENT USING BAYESIAN NETWORK ABSTRACT In this study, the characteristics of the face image is expressed through three image features extracted directly from the key facial image color features, shape features and texture features. Color feature extracted by using color histograms HSI (hue, saturation, intensity); shape features extracted by using Sobel operator and arranged in edge direction histogram; texture features extracted by using co-occurence matrix. Characteristics of the query image and the images in the database can be considered as the nodes that are interconnected and form a Bayesian network. Bayesian network is a graph illustrating the structure of relationships among chance variables in a large number of exciting opportunities and inference on the set of variables. Link between two variables or nodes will represent opportunities occurrence of the degree of similarity with the query image of each image in the database, can be measured by comparing the query image characteristics with the characteristics of the images in the database. The evaluation of the results of image retrieval precision for each recall faces show very good performance of Bayesian network. Keywords: Face Image Retrieval, Feature Extraction, Bayesian Network
DAFTAR ISI Halaman PENGESAHAN PERNYATAAN ORISINALITAS PERNYATAAN PERSETUJUAN PUBLIKASI PANITIA PENGUJI TESIS RIWAYAT HIDUP UCAPAN TERIMA KASIH ABSTRAK ABSTRACT DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR ii iii iv v vi vii ix x xi xiii xiv BAB 1 PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Rumusan Masalah 3 1.3 Batasan Masalah 3 1.4 Tujuan Penelitian 4 1.5 Manfaat Penelitian 4 BAB 2 TINJAUAN PUSTAKA 5 2.1 Information Retrieval 5 2.2 Image Retrieval Method 6 2.3 Citra Digital 6 2.4 Pengolahan Citra Digital 8 2.4.1. Ruang Warna (Color Space) 11 2.4.2. Operasi Ambang Batas (Thresholding) 15 2.4.3. Histogram Warna Konvensional 16 2.4.4. Pendeteksian Tepi 16 2.4.5. Tekstur 18 2.4.6. Co-ocurence Matrix 19 2.5 Cosine Similarity 21 2.6 Formula Bayes 22 2.6.1 Bayesian Network 22 2.7 Recall dan Precision 23 2.8 Riset-riset Terkait 26 2.9 Persamaan dengan Riset-riset Lain 28 2.10 Perbedaan dengan Riset-riset Lain 28 2.11 Kontribusi Riset 28 BAB 3 METODOLOGI PENELITIAN 30 3.1 Pelaksanaan Penelitian 30 3.2 Blok Diagram Proses 31
3.3 Proses Ekstraksi Fitur Citra 33 3.3.1 Ekstraksi Fitur Warna 34 3.3.2 Ekstraksi Fitur Bentuk 34 3.3.3 Ekstraksi Fitur Textur 35 3.3.4 Model Jaringan Bayesian 36 3.3.5 Evaluasi Hasil Temu-Kembali 37 3.4 Perancangan Sistem 37 3.4.1 Folder Sistem 38 3.4.2 Perancangan Antar-Muka Pemakai 38 BAB 4 HASIL DAN PEMBAHASAN 41 4.1 Pendahuluan 41 4.2 Data Citra 42 4.3 Aplikasi Face Image Retrieval 43 4.3.1 Menampilkan File Citra Wajah Query 44 4.3.2 Melaksanakan Proses Pencarian 45 4.3.3 Melihat Hasil Pencarian 46 4.3.4 Melihat Citra Sumber Wajah 47 4.4 Pembahasan 47 4.4.1 Pembangunan Indeks Fitur 47 4.4.2 Ekstraksi Fitur Warna 47 4.4.3 Ekstraksi Fitur Bentuk 57 4.4.4 Ekstraksi Fitur Tekstur 62 4.4.5 Pengukuran Kemiripan Fitur 67 4.5 Analisis Hasil 79 BAB 5 KESIMPULAN DAN SARAN 78 5.1 Kesimpulan 78 5.2 Saran 78 DAFTAR PUSTAKA 80 LAMPIRAN KODE PROGRAM 82
DAFTAR TABEL Halaman Tabel 2.1 Recall dan Precision 25 Tabel 4.1 Relasi File Citra Wajah dengan Citra Sumber 42 Tabel 4.2 Kuantisasi Ruang Warna dari Histogram HSI-162 bin 49 Tabel 4.3 Warna HSI dari Citra Wajah 54 Tabel 4.4 Histogram HSI-162 bin dari Citra Wajah 55 Tabel 4.5 Vektor Fitur Warna Citra Wajah 56 Tabel 4.6 Kuantisasi Sudut Tepi (θ) 61 Tabel 4.7 Vektor Fitur Bentuk Citra Wajah 62 Tabel 4.8 Vektor Fitur Tekstur Citra Wajah 66 Tabel 4.9 Ranking Citra Hasil Temu Kembali 76 Tabel 4.10 Nilai Recall dan Precision dari Pengukuran Fitur 77
DAFTAR GAMBAR Halaman Gambar 2.1 Interaksi User dengan Retrieval System 5 Gambar 2.2 Tahap-tahap Dasar Pengolahan Citra Digital 8 Gambar 2.3 Kedudukan dan Panjang Gelombang dari Cahaya Tampak 12 Gambar 2.4 Representasi Ruang Warna HSI (Hue, Saturation, Intensity) 14 Gambar 2.5 Matrik Konvolusi Pendeteksi Tepi Sobel 17 Gambar 2.6 Penyusunan Matriks co-occurence 20 Gambar 2.7 Model Umum Bayesian Network untuk CBIR 23 Gambar 2.8 Diagram Himpunan Dokumen 24 Gambar 2.9 Grafik Recall Precision 26 Gambar 3.1 Blok Diagram Proses Pencuplikan Citra Wajah 32 Gambar 3.2 Blok Diagram Proses Pembangunan Indeks Fitur 32 Gambar 3.3 Blok Diagram Proses Temu-Kembali Citra Wajah 33 Gambar 3.4 Model Jaringan Bayesian 37 Gambar 3.5 Struktur Folder Sistim Face Image Retrieval (FIR) 38 Gambar 3.6 Rancangan Menu 39 Gambar 3.7 Rancangan Jendela Utama 39 Gambar 3.8 Rancangan Jendela Hasil Temu-Kembali 40 Gambar 3.9 Rancangan Antarmuka Citra Sumber Wajah 40 Gambar 4.1 Jendela Utama Aplikasi Face Image Retrieval 43 Gambar 4.2 Kotak Dialog Open File 44 Gambar 4.3 Citra Wajah Query 45 Gambar 4.4 Pilihan Pengukuran yang Tersedia 46 Gambar 4.5 Hasil Temu-Kembali dengan Ranking 46 Gambar 4.6 Citra Sumber Wajah 47 Gambar 4.7 Contoh Citra Wajah 50 Gambar 4.8 Data Warna Merah (Red) 51 Gambar 4.9 Data Warna Hijau (Green) 51 Gambar 4.10 Data Warna Biru (Blue) 51 Gambar 4.11 Data Warna H (hue) 52 Gambar 4.12 Data Warna S (saturation) 52 Gambar 4.13 Data Warna I (intensity) 53 Gambar 4.14 Data Warna Grayscale 57 Gambar 4.15 Matriks Hasil Deteksi Tepi 59 Gambar 4.16 Matriks Gradien Arah Horizontal (gx) 59 Gambar 4.17 Matriks Gradien Arah Vertikal (gy) 60 Gambar 4.18 Edge Direction 60 Gambar 4.19 Matrik Co-occurence Sudut 0 0 64 0 Gambar 4.20 Matrik Co-occurence Sudut 45 65 0 Gambar 4.21 Matrik Co-occurence Sudut 90 65 0 Gambar 4.22 Matrik Co-occurence Sudut 135 66 Gambar 4.23 Jaringan Bayesian Pengukuran Fitur Citra 67 Gambar 4.24 Citra Query face000f.bmp 72
Gambar 4.25 Citra Relevan dengan Citra Query 73 Gambar 4.26 Hasil Temu Kembali dengan Pengukuran Fitur Warna (Color) 74 Gambar 4.27 Hasil Temu Kembali dengan Pengukuran Fitur Bentuk (Shape) 74 Gambar 4.28 Hasil Temu Kembali dengan Pengukuran Fitur Tekstur (Texture) 75 Gambar 4.29 Hasil Temu Kembali dengan Pengukuran Fitur Gabungan 75 Gambar 4.30 Grafik Recall Precision 77