PENGKLASIFIKASI GENUS PANTHERA (HARIMAU, SINGA, JAGUAR DAN MACAN TUTUL DENGAN METODE NAIVE BAYES Program Studi Informatika, Program Teknologi Informasi dan Ilmu Komputer, Agus Suryanto, Brian Andrianto, Ferdi Alvianda, Harim Adi Saputro, Maria Stevani Siregar E-mail 1,2,3,4,5 yuki.jhks@gmail.com 1, febriardianto10@gmail.com 2, epel2x@gmail.com 3, harim.adi12@gmail.com 4, mariastevanis@gmail.com 5 ABSTRAK Pengklasifikasian kingdom panthera dapat dilakukan dengan melihat warna kulit dari masing-masing spesies. Sehingga dapat ditemukan suatu pola tertentu untuk mengklasifikasikannya. Tujuan klasifikasi ini untuk membantu mempermudah manusia mengenali setiap jenis dari genus panthera. Karena kalau kita lihat sekilas ke empat hewan tersebut hampir mirip. Penelitian ini menggunakan pengenalan pola suatu citra warna kulit dari spesies untuk diklasifikasi. spesies yang digunakan adalah singa, harimau, leopard dan jaguar. Dalam penelitian ini, proses ekstraksi fitur menggunakan nilai RGB dari warna kulit dan menggunakan metode naïve bayes untuk melakukan proses klasifikasi terhadap singa, harimau, leopard dan jaguar. Hasil penelitian ini menunjukkan bahwa tingkat akurasi pada singa adalah 100%, harimau 100%, macan tutul 0% dan jaguar 100%. Kata kunci: Klasifikasi, warna kulit, naïve bayes ABSTRACT Panthera kingdom classification can be done by examining each species's colors. therefore some specific patterns used for classification can be found. The purpose of classification is to help facilitate human to recognize any kind of genus Panthera. Because if we see a glimpse into the four animals is similar. This research uses Image Pattern Recognition from some species' skin colors to be classified. Species used for this research are lion, tiger, leopard and jaguar. In this research, the feature extraction process uses the RGB from skin s colors and uses Naive Bayes Method for classifying lion, tiger, leopard and jaguar. This research shows that the classification accuracy level for lion is 100%, tiger is 100%, leopard is 0% and jaguar is 100% Key words: Classificatian, skin s color, naïve bayes. 1. Pendahuluan Keanekaragaman hewan yang ada di dunia telah mendorong para ahli biologi untuk membuat suatu sistem untuk mempelajari dan mengenali organisme dengan melalui klasifikasi. Pengklasifikasian merupakan pengelompokan organisme berdasarkan karakteristik tertentu. Pengklasifikasian
hewan bisa dilakukan dengan warna dan motif kulit. Pada beberapa sistem temu kembali citra, sebuah citra dapat diperbolehkan oleh beberapa fitur seperti warna. Untuk melakukan representasi terhadap bentuk objek pada citra dapat meggunakan ekstraksi warna. Setelah didapatkan fitur warna, maka akan terbentuk suatu pola tertentu darim RGB nya. Pola tersebut dapat digunakan untuk mengklasifikasikan. Pada penelitian ini digunakan metode naive bayes untuk menentukan klasifikasi dari binatang. Binatang yang kita gunakan pada penelitian ini adalah harimau, singa, macan tutul dan jaguar. Adapun ciri-ciri binatang tersebut antara lain : Harimau mempunyai motif loreng dengan garis-garis panjang Jaguar mempunyai motif dengan totol yang besar-besar dan tidak beraturan Leopard mempunyai motif yang sama dengan jaguar namun lebih berdekatan dan berukuran lebih kecil Singa tidak mempunyai motif pada tubuhnya sama sekali [3]. 2. Dasar Teori Naïve bayes adalah suatu metode pengklasifikasian paling sederhana dengan menggunakan peluang yang ada, dimana diasumsikan bahwa setiap variable X bersifat bebas (independence)[1]. Karena asumsi variabel tidak saling terikat, maka didapatkan persamaan (1). n P(X Ci) = P(xk Ci) (1) k=1 Data yang digunakan dapat bersifat kategorial (diskrit) maupun kontinyu. Namun, pada penelitian ini kita mengguakan data komtinyu. Untuk data kontinyu dapat diselesaikan dengan menggunakan langkah-langkah berikut. 1. Hitung probabilitas (Prior) tiap kelas yang ada dengan cara menghitung jumlah data tiap kelas dibagi jumlah total data secara keseluruhan. 2. Lalu hitung rata-rata (mean) tiap fitur dengan persamaan (2). N μ = 1 N x i i=1 (2) Dimana : i = banyaknya data N = nilai data 3. Kemudian hitung nilai varian dari fitur tersebut seperti pada persamaan (3). σ = 1 N N 1 (x i μ) 2 i=1 (3) 4. Selanjutnya menghitung densitas probabilitasnya menggunakan persamaan (4). φ μ,σ (x) = 1 2πσ 2 e(x μ)2 2σ 2 (4) 5. Setelah didapatkan nilai varian dan prior, hitung likelihood masing-masing kelas dengan menggunakan persamaan (5). P(d h) = P(a 1,, a T h) = P(a t h) (5) 6. Mengalikan nilai prior dan nilai likehood yang sudah dihitung pada langkah sebelumnya dengan persamaan (6). t
arg max V MAP = V j VP(a 1, a 2,, a n V j )P(V j ) (6) 7. Tahap Pengujian (Testing) Beberapa fitur (v1, v2,..., vk), pilih kelas yang memaksimalkan Posterior mengguakan persamaan (7) : P(C i A 1, A 2,, A n) = n i=1 P(A i C j )P(C j ) (7) P(A 1, A 2,, A n) Nilai hasil kali prior dan likelihood terbesar adalah kelas yang sesuai. Sedangkan untuk data kategorial, hanya memerlukan semua kemungkinan yang terjadi [4]. Naive Bayes mengedepankan penyederhanaan, sehingga kemungkinan hasil keputusan tidak sesuai realita yang ada. Namun metode ini bekerja dengan baik dan praktis [5]. 3. Metode Penelitian Langkah-langkah metodologi penelitian yang kami gunakan adalah sebagai berikut : 1. Studi literatur Studi literatur kami lakukan untuk melengkapi pengetahuan dan teori-teori dasar melalui media seperti internet dan paper-paper lain yang mendukung. 2. Pengumpulan data Data yang digunakan berupa gambar yang kami cari dari internet yang nantinya akan kami jadikan data training. 3. Identifikasi masalah Tahap identifikasi masalah ini kami lakukan setelah mendapat dataset yang sesuai dengan permasalahan yang kami selesaikan untuk kemudian dilakukan proses klasifikasi. 4. Proses klasifikasi dengan metode Naive Bayes Tahap ini merupakan proses dilakukannya klasifikasi berdasarkan atribut yang ada pada masalah pengklasifikasian ini yaitu RGB motif kulit dengan menggunakan metode Naïve Bayes. 5. Hasil Setelah proses klasifikasi, hasil yang didapat menunjukkan pengklasifikasian terhadap gambar yang kami pakai. 6. Evaluasi Tahap ini dilakukan untuk melakukan evaluasi apakah hasil yang didapat sesuai dan akurat sesuai dengan kenyataan yang ada atau tidak. 4. Hasil dan Pembahasan Data training yang kami gunakan pada penelitian ini sebanyak 76 dengan fitur RGB pada gambar. Adapun jumlah rincinya adalah harimau sebanyak 26 buah, leopard sebanyak 15 buah, jaguar sebanyak 19 buah, dan singa sebanyak 16 buah, seperti terlihat pada tabel 1. Tabel 1. Data Training No Nama Hewan jumlah 1 Harimau 26 2 Leopard 15 3 Jaguar 19 4 Singa 16 Total 76 Sedangkan data uji yang kami gunakan dalam penelitian ini sebanyak 16 buah dengan rincian harimau 5, leopard 3, jaguar 5 dan singa 3 seperti tabel 2, 3, 4 dan 5. Tabel 2. Data RGB Harimau 1 145 117 91 2 151 141 119 3 145 124 104 4 128 123 122 5 155 135 106
Tabel 3. Data RGB Jaguar 1 73 64 52 2 93 72 46 3 83 71 61 4 86 72 67 5 76 55 38 Tabel 4. Data RGB Leopard 1 41 39 32 2 55 43 34 3 63 55 44 Tabel 5. Data RGB Singa 1 200 169 120 2 198 181 146 3 199 177 151 Secara garis besar, sistem bekerja sebagai berikut. Pertama, pilih gambar jenis hewan yang ingin dikenali. Sebelum gambar diproses untuk mendapatkan nilai R, G, dan B, gambar akan melalui praproses antara lain, gambar akan di-resize untuk mendapatkan ukuran tertentu sehingga gambar lebih cepat untuk diproses selanjutnya. Kemudian gambar akan dipotong untuk mendapatkan objeknya saja dan mengurangi area yang tidak perlu dengan memotong bagian terluar gambar hingga bagian tertepi objek. Setelah mendapatkan nilai R, G, dan B, nilai tersebut akan diproses dengan Naive Bayes. [2] Dari 16 data sampel terdapat 3 data yang salah prediksi sehingga total akurasi dari pengujian adalah 81.25%. Keakurasiannya untuk tiap kelas harimau 100%, leopard 0%, jaguar 100% dan singa 100%. 5. Kesimpulan Hasil penelitian ini menunjukkan bahwa tingkat akurasi pada singa, harimau dan jaguar 100%, sedangkan pada leopard tingkat akurasinya 0%. Faktor kegagalan tersebut dikarenakan jaguar dan leopard memiliki kemiripan pada motif dan warna kulitnya. Daftar Pustaka [1] Cahyo Darujati dan Agustinus Bimo Gumelar, Pemanfaatan Teknik Supervised untuk Klasifikasi Teks Bahasa Indonesia, Sistem Informasi, Fakultas Ilmu Komputer, Universitas Narotama Surabaya, 2012. [2] How to: Crop an Image URL : http://msdn.microsoft.com/enus/library/ms752345.aspx, diakses tanggal 20 April 2013 [3] Learn to Identify the Big Cats URL : http://www.bigcats.com/learn-toidentify-the-big-cats,diakses tanggal 20 April 2013 [4] Tom M. Mitchell, (2010), Generatie and Discriminative Classifiers : Naïve Bayes and Logistic Regression, hal. 1-7. [5] M. Ammar Shadiq, (2011), Keoptimalan Naïve Bayes dalam Klasifikasi, hal. 1-8
Biodata Peneliti Agus Suryanto yang lahir di Nganjuk, 10 agustus 1993, tertarik dengan bidang yang berkaitan dengan Brian Andrianto yang lahir di Lamonga, 4 Juli 1993 dan sekarang berdomisili di Malang, tertarik dengan bidang yang berkaitan dengan Maria Stevani Siregar merupakan mahasiswi yang lahir di Tangerang, 8 September 1993 dan sekarang berdomisili di Malang, tertarik dengan bidang Rekayasa Perangkat Lunak Ferdi Alvianda yang lahir di Pasuruan, 10 Juni 1993 dan berdomisili di Malang, tertarik dengan bidang yang berkaitan dengan Komputasi Cerdas Harim Adi Saputro yang lahir di Tulungagung, 12 Februari 1992, tertarik dengan bidang yang berkaitan dengan