4 TINJAUAN PUSTAKA 2.1 Studi Yang Terkait Penelitian ini dilakukan dengan mengacu tesis tentang proses reduksi wajah yang ditulis oleh Herdiyeni (2005) dan Pratiwi (2010). Pada penelitian tersebut, Herdiyeni menggunakan metode jarak garis wajah untuk sistem pengenalan wajah 3D menggunakan probabilitas AKU dan jaringan syaraf tiruan. Data yang pakai dalam penelitian ini sebanyak 100 citra yang terdiri dari 66 citra untuk data pelatihan dan 44 citra untuk data pengujian. Masing-masing citra wajah tersebut dicropping dan ditentukan secara manual 10 titik koordinat yang akan menghasilkan 5.151 garis wajah. Sedangkan untuk pengenalan wajah menggunakan piksel digunakan citra wajah berskala 25x36 piksel. Hasil penelitian Herdiyeni (2005) memperlihatkan bahwa tingkat akurasi sistem berbasis fitur lebih baik dari pada yang berbasis citra. Hasil perbandingan ini dapat dilihat pada Table 1. Tabel 1. Akurasi Pengenalan Wajah Sistem Berbasis Fitur Dan Berbasis Citra Sistem Pose Akurasi Pelatihan (%) Jarak garis Wajah (Berbasis Fitur) Tingkat Keabuan Wajah (Berbasis Citra) Sumber: Herdiyeni (2005) Akurasi Pengujian (%) MSE Waktu (detik) 0,1 100,00 55,00 0,04707 44,53 1,2 100,00 90,91 0,01836 44,02 2,3 100,00 88,86 0,02067 42,13 3,4 100,00 59,69 0,04333 39,70 0,1 100,00 54,09 0,04367 39,83 1,2 100,00 62,50 0,03596 38,26 2,3 100,00 77,05 0,03043 38,47 3,4 100,00 56,82 0,04001 37,66 Pratiwi (2010) melakukan penelitian tentang pengembangan model pengenalan citra wajah dengan jarak euclid pada ruang eigen dengan 2 Dimentional Principal Component Analysis (2DPCA). Penelitian ini menggunakan basis data ORL dengan menggunakan 40 individu dimana masingmasing memiliki 10 ekspresi yang berbeda. Total data yang digunakan sebanyak 400 citra wajah. Penelitian ini memperlihatkan rata-rata tingkat akurasi sebesar 98,75%.
5 2.2 Proses Pengenalan Wajah Pengenalan wajah adalah proses identifikasi yang berdasarkan citra wajah yang tersimpan dalam basis data dan sistem ini memberikan output berupa wajah siapa atau wajah yang tidak dikenali (Sudarmilah 2009). Ada dua sistem pengenalan wajah yaitu sistem pengenalan wajah berbasis fitur dan berbasis citra. Sistem pengenalan wajah berbasis fitur adalah pengenalan wajah yang dilakukan berdasarkan ciri geometri wajah seperti posisi alis mata, mata, hidung dan mulut. Kelebihan sistem berbasis fitur ini adalah tidak sensitif terhadap kondisi derau. Namun tingkat pengenalannya lebih rendah dibanding sistem pengenalan wajah berbasis citra karena sistem berbasis fitur hanya menggunakan posisi alis mata, mata, hidung dan mulut yang dapat disimpan dalam sebuah data citra untuk merepresentasikan sebuah citra wajah. Tahapan proses pengenalan wajah berbasis fitur (Herdiyeni 2005) adalah sebagai berikut: 1. Menentukan 10 titik wajah 2. Membuat 11 garis dari 10 titik wajah tersebut 3. Menghitung jarak garis wajah 4. Mengekstraksi ciri dengan menggunakan metode AKU 5. Mengklasifikasikan wajah dengan menggunakan algoritma k-nn Sistem pengenalan wajah berbasis citra merupakan sistem pengenalan wajah yang sangat sederhana karena menggunakan tingkat keabuan pada seluruh citra wajahnya (Roberto & Tomaso 1993). Sistem ini dapat mencapai tingkat akurasi lebih tinggi dibanding dengan sistem pengenalan wajah sebelumnya karena semua fitur yang dihasilkan dalam data citra direpresentasikan oleh pikselpiksel pada elemen data citra. Kelemahan sistem ini adalah sangat rentan terhadap derau. Tahapan proses pengenalan wajah berbasis citra (Fauzie 2010) adalah sebagai berikut: 1. Membaca citra wajah dengan ukuran m*n 2. Mengubah menjadi vector berukuran 1*N di mana N = m*n 3. Mengekstraksi ciri dengan menggunakan metode AKU 4. Mengklasifikasikan wajah dengan menggunakan algoritma k-nn
6 2.3 Proses Reduksi Citra Reduksi matriks data jarak garis wajah dan data wajah berbasis citra menggunakan metode Analisi Komponen Utama (AKU). AKU adalah salah satu teknik yang telah diaplikasikan pada pemrosesan citra dan pengenalan pola. AKU digunakan untuk mereduksi dimensi data sehingga menghasilkan peubah yang lebih sedikit dan lebih mudah untuk ditangani (Kartika dan Sonny 2001). Untuk data citra berdimensi N = m * n di mana m adalah baris dan n adalah kolom dengan m>n, maka langsung dilakukan perhitungan matriks peragam. Sebelum menghitung matriks peragam, ditentukan dahulu data latih dan data uji berdasarkan k-fold cross validation. Matriks peragam dilakukan dengan perhitungan sebagai berikut: (1) Dari matriks peragam tersebut, dihitung nilai eigen (λ) dan vektor eigen (V) yang memenuhi persamaan: NV i = λ iv i (2) di mana λ i merupakan nilai eigen yang bersesuaian dengan vektor eigen V i. Lalu didapatkan matriks V dengan nilai eigen yang terurut menurun berdasarkan nilai eigen yang bersesuaian dengannya, yaitu λ 1 λ 2 λ M. Kemudian dipilih sejumlah k kolom vektor eigen dari matriks V yang berasosiasi dengan sejumlah k nilai eigen terbesar. Pemilihan nilai eigen ini menghasilkan matriks transformasi atau matriks proyeksi V k, yang terdiri atas k kolom vektor eigen terpilih. Berikutnya sejumlah matriks vektor citra A dapat diesktraksi ke dalam fitur baru y yang berdimensi (k n) dengan memproyeksikan A searah dengan V sebagai berikut: y = AV (3) matriks y inilah yang berdimensi m*k yang menjadi eigenface. Untuk data yang dijadikan data pelatihan harus diproyeksikan ke eigenface ini. W train = y T A (4) sedangkan untuk data pengujiannya didapat dari W test = y T A test (5)
7 dengan A test adalah matriks vektor citra seperti matriks A dengan banyaknya citra yang diambil sebanyak m citra sebagai citra pengujian. Sedangkan untuk data citra berdimensi N = m * n dimana m<n, maka data citra tersebut akan dibuat menjadi vektor citra dengan dimensi 1*N terlebih dahulu. (6) Jika terdapat M buah citra pelatihan maka akan di dapat sebanyak M buah vector citra yang disusun sebagai berikut: (7) Kemudian untuk mendapatkan matriks peragam, setiap citra pelatihan harus dikurangi dengan rata-rata µ dari matriks X. Selanjutnya akan didapatkan model vektor citra yang baru Matriks peragam dibuat dari sekumpulan vector Ф dengan dimensi N * 1 yang disusun menjadi sebuah matriks seperti matriks X, misalnya matriks A dibentuk dengan N*M dimensi diambil dari vektor dan menempatkannya pada tiap kolom seperti persamaan (8). (8) Dari matriks A kita dapatkan sebuah matriks peragam dengan cara mengalikan matriks A dengan tansposnya sehingga dihasilkan matriks baru dengan dimensi N*N. C = AA t (9) atau C = A t A (10) Seperti telah disebutkan sebelumnya data citra yang digunakan dalam penelitian ini akan menghasilkan vektor citra yang berukuran sangat besar sehingga akan menghasilkan matriks peragam yang sangat besar pula. Tentu hal ini akan membutuhkan lebih banyak komputasi dan ruang media penyimpanan. Untuk mendapatkan matriks peragam yang lebih baik menggunakan persamaan (10) daripada persamaan (9). Persamaan (10) menghasilkan matriks peragam C dengan ukuran matriks M*M yang jauh lebih kecil. Dalam hal ini matriks peragam C
8 pada persamaan (9) dan (10) memiliki ciri yang sama (Yambor 2000). Selanjutnya dihitung nilai eigen pada persamaan (2) seperti yang dilakukan pada sistem berbasis fitur sampai dengan pengujian data wajah (5). 2.4 Proses Klasifikasi Citra Algoritma k-nn adalah sebuah metode yang digunakan untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut atau algoritma based-learning instant yang dapat menormalisasikan suatu data set (Hinneburg et al. 2000). Pada penelitian ini k- NN dipakai karena algoritma k-nn memberikan hasil yang mendekati optimal. Ada dua fase dalam algoritma k-nn yaitu fase pembelajaran dan fase klasifikasi. Data pembelajaran merupakan data jarak garis wajah yang diproyeksikan ke ruangan berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur suatu data. Pada fase pembelajaran, algoritma ini melakukan penyimpanan vektor-vektor fitur dan klasifikasi data jarak garis wajah. Pada fase klasifikasi, fitur-fitur yang sama dihitung untuk data test yang klasifikasinya tidak diketahui. Jarak dari vektor yang baru ini terhadap seluruh vektor data pembelajaran dihitung. Sejumlah k buah yang paling dekat yang diambil. k-nn akan menentukan hasil klasifikasi dengan melihat jumlah kemunculan dari kelas dalam k-nn yang dipilih. Kelas yang paling banyak muncul akan menjadi kelas hasil klasifikasi. Algoritma ini dapat dihitung dengan persamaan (11). (11) Pada data wajah berbasis fitur yang telah diurutkan dari kecil ke besar kemudian ditentukan k yang ke-5, k yang ke-10 dan k yang ke-20 dalam pengklasifikasian tersebut. Jarak terdekat dan yang paling sering muncul adalah kelas hasil klasifikasi. Hal yang sama juga dilakukan pada data wajah berbasis citra. 2.5 K-Fold Cross Validation Ada beberapa teknik untuk mengestimasi tingkat kesalahan yang telah dikembangkan pada bidang pengenalan pola, salah satunya adalah k-fold cross
9 validation. Cara kerjanya adalah melakukan pengelompokkan antara data latih dan data uji yang saling asing atau terpisah dan tidak ada irisan, kemudian dilakukan proses pengujian yang diulang sebanyak k kali. Hasil pengujian itu kemudian dirata-ratakan untuk menghasilkan sebuah nilai (Fauzie 2010). Langkah-langkah teknik k-fold cross validation (Pratiwi 2010) adalah sebagai berikut: 1. Membagi data yang ada menjadi k kelompok 2. Untuk setiap k, buat sejumlah T himpunan data yang memuat semua data latih kecuali yang berada di kelompok ke-k. 3. Kerjakan algoritma yang dimiliki dengan sejumlah T data latih. 4. Uji algoritma ini dengan menggunakan data pada kelompok k sebagai data uji. 5. Lakukan pencatatan hasil algoritma. K-fold cross validation sangat tepat dan berguna ketika menentukan nilai yang tepat untuk k. Teknik ini tidak membutuhkan waktu banyak untuk membuat data uji yang ada. Keuntungan teknik k-fold cross validation adalah bahwa semua elemen pada basis data digunakan untuk pelatihan sekaligus pengujian (Pratiwi 2010). 2.6 Salt and pepper Noise Noise atau derau menurut Alasdair (2004) adalah semacam penurunan kualitas sinyal citra wajah yang disebabkan oleh gangguan dari luar. Hal ini dimungkinkan terjadi pada saat pengiriman citra secara elektronik dalam sinyal wajah tersebut. Menurut Alasdair (2004), terdapat empat macam tipe derau yaitu Salt and pepper noise, Gaussian noise, Speckle noise dan periodic noise. Penelitian ini hanya memakai salt and pepper noise sebagai alat untuk melihat sejauh mana tingkat efektifitas keakurasian data berbasis citra.