MACHINE LEARNING PENGENALAN CITRA DIGITAL DIGITAL IMAGE RECOGNITION MACHINE LEARNING

dokumen-dokumen yang mirip
MACHINE LEARNING MULTI KLASIFIKASI CITRA DIGITAL

SOFTWARE AS A SERVICE UNTUK MACHINE LEARNING KLASIFIKASI CITRA DIGITAL

DAFTAR ISI ABSTRAK... KATA PENGANTAR... DAFTAR ISI... DAFTAR GAMBAR... DAFTAR TABEL... DAFTAR LAMPIRAN Latar Belakang... 1

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK MENDETEKSI UANG LOGAM DENGAN METODE EUCLIDEAN

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

BAB III ANALISIS DAN PERANCANGAN SISTEM

ABSTRAK. Kata kunci : CBIR, GLCM, Histogram, Kuantisasi, Euclidean distance, Normalisasi. v Universitas Kristen Maranatha

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra

BAB I PENDAHULUAN 1.1 Latar Belakang

SISTEM PENGENALAN PENGUCAPAN HURUF VOKAL DENGAN METODA PENGUKURAN SUDUT BIBIR PADA CITRA 2 DIMENSI ABSTRAK

Vol. II, 26 November 2016, ISSN:

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

Versi Online tersedia di : JURNAL TECH-E (Online)

2.2. Fitur Produk Perangkat Lunak Fitur Pengolahan Data Fakultas Fitur Pengolahan Data Jurusan

BAB 3 PERANCANGAN DAN PEMBUATAN SISTEM

PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE

SISTEM KLASIFIKASI JENIS BERAS MENGGUNAKAN METODE LEARNING VECTOR QUANTIZATION

FACE RECOGNITION MENGGUNAKAN METODE TWO- DIMENSIONAL PRINCIPAL COMPONENTS ANALYSIS (2DPCA) ABSTRAK

IDENTIFIKASI TANDA TANGAN MENGGUNAKAN ALGORITMA DOUBLE BACKPROPAGATION ABSTRAK

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER

BAB 4 HASIL DAN PEMBAHASAN

BAB III METODOLOGI. Penelitian ini dilaksanakan di Ruang Server Biro Sistem Informasi (BSI)

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

APLIKASI IDENTIFIKASI ISYARAT TANGAN SEBAGAI PENGOPERASIAN E-KIOSK

PEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK

PENGENALAN GENDER MEMANFAATKAN WAJAH MANUSIA DENGAN MENGGUNAKAN METODE KLASIFIKASI NEAREST NEIGHBOR

PEMANFAATAN TRANSFORMASI WAVELET SEBAGAI EKSTRAKSI CIRI PADA KLASIFIKASI BERTINGKAT SINYAL EKG

DETEKSI NOMINAL MATA UANG DENGAN JARAK EUCLIDEAN DAN KOEFISIEN KORELASI

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

ABSTRAK. Kata Kunci : web kontes pemrograman, usort, metode LCS

KLASIFIKASI TELUR AYAM DAN TELUR BURUNG PUYUH MENGGUNAKAN METODE CONNECTED COMPONENT ANALYSIS

APLIKASI PENGENALAN WAJAH UNTUK VALIDASI PESERTA UJIAN ONLINE MENGGUNAKAN METODE HAAR CASCADE DAN EIGEN FACE VECTOR

IDENTIFIKASI WAJAH MANUSIA BERDASARKAN PERBANDINGAN PARAMETER TINGGI HIDUNG, LEBAR HIDUNG DAN JARAK MATA. Yusriani Laa Baan

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

PERANCANGAN PENDETEKSI KEDIPAN MATA UNTUK FUNGSI KLIK PADA MOUSE MELALUI KAMERA WEB ABSTRAK

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

PERBANDINGAN ANALISIS PENGENALAN HURUF ARAB MENGGUNAKAN METODE JARINGAN SYARAF TIRUAN BACKPROPAGATION DAN K-NEAREST NEIGHBOR

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB III METODE PENELITIAN. dan bahan, agar mendapatkan hasil yang baik dan terstruktur. Processor Intel Core i3-350m.

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

ABSTRAK. Kata kunci : Android, Basis Data, Web Service, SPMB, Try Out, EBTANAS. Universitas Kristen Maranatha

ARTIKEL APLIKASI KLASIFIKASI JENIS JENIS BUAH JERUK MENGGUNAKAN METODE K-NEAREST NEIGHBOR

PERANCANGAN PENDETEKSI WAJAH DENGAN ALGORITMA LBP (LOCAL BINARY PATTERN) BERBASIS RASPBERRY PI

PENGENALAN POLA GARIS DASAR KALIMAT PADA TULISAN TANGAN UNTUK MENGETAHUI KARAKTER SESEORANG DENGAN MENGGUNAKAN ALGORITMA RESILIENT BACKPROPAGATION

PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS

Pengembangan E-Lecture menggunakan Web Service Sikadu untuk Mendukung Perkuliahan di Universitas Negeri Semarang

Abidah Elcholiqi, Beta Noranita, Indra Waspada

IMPLEMENTASI DEEP LEARNING BERBASIS TENSORFLOW UNTUK PENGENALAN SIDIK JARI

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

ABSTRAK. Kata kunci : Principal Component Analysis, Linear Discriminant Analysis, Pengenalan wajah

BAB 1 Persyaratan Produk

Aplikasi Kamera Web Untuk Mengukur Luas Permukaan Sebuah Obyek 3D

PENGENALAN WAJAH DENGAN METODE ORTHOGONAL LAPLACIANFACES. Luhur Pribudhi ( )

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen

PENGENALAN DAN PEWARNAAN PADA CITRA GRAY-SCALE ABSTRAK

PENGENALAN POLA MARGINS TULISAN TANGAN UNTUK MENGIDENTIFIKASI KARAKTER SESEORANG MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM)

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

LAPORAN SKRIPSI DETEKSI KANKER OTAK PADA DATA MRI MELALUI JARINGAN SYARAF TIRUAN DENGAN EKSTRAKSI FITUR DISCRETE WAVELET TRANSFORM

VERIFIKASI SESEORANG BERDASARKAN CITRA PEMBULUH DARAH MENGGUNAKAN EKSTRAKSI FILTER GABOR ABSTRAK

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

PERBANDINGAN K-NEAREST NEIGHBOR DAN NAIVE BAYES UNTUK KLASIFIKASI TANAH LAYAK TANAM POHON JATI

BAB III METODE PENELITIAN. Tujuan tugas akhir ini akan membangun suatu model sistem yang

BAB II LANDASAN TEORI

PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN

PENGEMBANGAN APLIKASI BERGERAK UNTUK PENYEDIAAN INFORMASI LOKASI RUMAH SAKIT DI WILAYAH GARUT

ABSTRAK. Kata kunci: Sistem Pakar, Pembelajaran Mesin, Weka, Support Vector Machine, Regresi Logistik, Demam Berdarah, Malaria, Typhus

PENGENALAN WAJAH MENGGUNAKAN METODE REGRESI LINIER

SIMULASI DAN ANALISIS SISTEM PENGENALAN WAJAH TAMPAK SAMPING MENGGUNAKAN METODE LOCAL BINARY PATTERN (LBP)

Identifikasi Jenis Kayu Menggunakan Support Vector Machine Berbasis Data Citra

PERANCANGAN PROGRAM PENGENALAN BENTUK MOBIL DENGAN METODE BACKPROPAGATION DAN ARTIFICIAL NEURAL NETWORK SKRIPSI

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. Sistem Pakar (Expert System), Jaringan Saraf Tiruan (Artificial Neural Network), Visi

IDENTIFIKASI TANDA TANGAN DENGAN DETEKSI TEPI DAN KOEFISIEN KORELASI

KLASIFIKASI POLA UKIR KAYU JEPARA BERDASARKAN DETEKSI TEPI BERBASIS JARINGAN SYARAF TIRUAN

PEMBUATAN WEB SERVICE SEBAGAI LAYANAN PENDETEKSI KONTEN PORNOGRAFI PADA CITRA DIGITAL DENGAN METODE IMAGE ZONING

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

RANCANGAN AWAL SISTEM PRESENSI KARYAWAN STMIK BANJARBARU DENGAN PENDEKATAN EIGENFACE ALGORITHM

ABSTRAK. Kata kunci: Spam, Android, Pesan, Java, Webservice. Universitas Kristen Maranatha

MODUL 12 Model Prediktif

ABSTRAK. Kata kunci: diagram kelas, xml, java, kode sumber, sinkronisasi. v Universitas Kristen Maranatha

Oleh: Angger Gusti Zamzany( ) Dosen Pembimbing: Dr. Dwi Ratna Sulistyaningrum, S.Si, M.T.

PENGENALAN WAJAH DENGAN METODE TEMPLATE MATCHING SEBAGAI SISTEM STARTER SEPEDA MOTOR BERBASIS MIKROKONTROLER ATMEGA 16 Oleh : Margito Hermawan

BAB II LANDASAN TEORI

BAB III METODE PENELITIAN

Pengenalan Bahasa Isyarat Tangan Menggunakan Metode PCA dan Haar-Like Feature

SISTEM PENDETEKSI WAJAH MANUSIA PADA CITRA DIGITAL

KOMBINASI METODE K-NEAREST NEIGHBOR DAN NAÏVE BAYES UNTUK KLASIFIKASI DATA

Data Mining Terapan dengan Matlab

PENGENALAN WAJAH DENGAN MENERAPKAN ALGORITMA ADAPTIF K MEANS

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

PENGENALAN HURUF HASIL DARI TULISAN TANGAN MENGGUNAKAN ALGORITMA FORWARD-ONLY COUNTER PROPAGATION

ABSTRAK. v Universitas Kristen Maranatha

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

Pengenalan Pola Karakter Tulisan Tangan Dengan Menggunakan Metoda Clustering Melalui Similarity Measure Approach

Transkripsi:

MACHINE LEARNING PENGENALAN CITRA DIGITAL DIGITAL IMAGE RECOGNITION MACHINE LEARNING Andi Lukman 1, Syafaruddin 2, Merna Baharuddin 2 1 Program Studi Teknik Informatika, Sekolah Tinggi Multimedia dan Informatika Nusa Palapa 2 Jurusan Teknik Elektro, Fakultas Teknik, Universitas Hasanuddin Alamat Korespondensi : Andi Lukman Program Studi Teknik Informatika Sekolah Tinggi Multimedia dan Informatika (STIMED) Nusa Palapa Makassar, Sulawesi Selatan. HP : 08124255094 Email : uke@stimednp.ac.id

ABSTRAK Aplikasi pengenalan citra yang telah ada hanya dapat digunakan untuk kebutuhan khusus objek penelitian pengenalan citra tertentu. Penelitian ini bertujuan membangun aplikasi machine learning sebagai alat bantu bagi pengguna untuk mendapatkan algoritma klasifikasi terbaik dalam mengenali citra digital. Metode penelitian ini memanfaatkan data set citra wajah Caltech 101 yang diambil dari Computational vision Institut Teknologi California. Algoritma yang digunakan adalah algoritma klasifikasi Machine Learning WEKA yaitu: Support Vector Machine, K-Nearest Neighbor, Naïve Bayes, C4.5 Decision Tree, Logistic Regression dan Random Forest. Aplikasi dibangun menggunakan bahasa pemrograman java dimana untuk sisi client menggunakan Google Web Toolkit dan sisi server menggunakan Java Servlet. Modul/fungsi aplikasi diuji menggunakan pengujian black box. Persentasi keberhasilan pengenalan citra digital dihitung dengan membandingkan jumlah citra dikenali dengan total jumlah citra yang diberikan. Hasil penelitian memperlihatkan bahwa untuk membangun aplikasi, data set citra terlebih dahulu melalui proses filterisasi berupa normalisasi 64X64 pixel dan bag of words 16 bagian. Kemudian data set dikonversi ke bentuk ARFF agar dapat dilakukan proses pelatihan dan pengujian algoritma. Pengujian black box memperlihatkan setiap modul/fungsi aplikasi dapat berjalan sesuai keinginan. Hasil pengujian persentasi keberhasilan pengenalan citra memperlihatkan Logistic Regression mendapatkan persentase keberhasilan tertinggi yaitu 95%, 90% untuk kelas ya dan 100% untuk kelas bukan dalam mengenali wajah. Penelitian ini dapat disimpulkan bahwa aplikasi machine learning pengenalan citra digital sukses dibangun dan dapat digunakan oleh pengguna untuk mendapatkan algoritma klasifikasi terbaik dalam mengenali citra digital. Kata Kunci : Machine Learning, Pengenalan, Citra Digital, Klasifikasi ABSTRACT Image recognition applications that already exist can only be used for specific needs particular research object image recognition. This study aims to build a machine learning applications as a tool for users to get the best classification algorithm to recognize digital images. This research method utilizing face image data sets taken from the Caltech 101 Computational Vision California Institute of Technology. The algorithm used is WEKA Machine Learning classification algorithms, namely: Support Vector Machine, K-Nearest Neighbor, Naïve Bayes, C4.5 Decision Tree, Logistic Regression and Random Forest. Applications built using the Java programming language, client side using Google Web Toolkit and server side using Java Servlet.. Modules / applications function was tested using black box testing. Percentage of the successful recognition of the digital image is calculated by comparing the total number of images identified by the image of a given number. The results showed that for building applications, data sets of image filtering first through a normalization process of 64x64 pixels and 16 piece bag of words. Then the data set is converted into ARFF form that can be use in training and testing algorithms. Black box testing shows each module / function applications can run as desired. Percentage of successful recognize image test results shows that Logistic Regression algorithm get the highest percentage of success is 95%, 90% for class yes and 100% for classes no in recognizing faces. It can be concluded that the application of digital image recognition machine learning has built successfully and can be used by users to get the best classification algorithm in recognizing digital image. Key Words: Machine Learning, Recognition, Digital Image, Classification

PENDAHULUAN Pengenalan citra digital merupakan salah satu tema penelitian computer vision khususnya pattern recognition dan machine learning. Penelitian pengenalan citra sangat bermanfaat untuk kebutuhan klasifikasi objek di berbagai bidang, seperti: kedokteran, kelautan dan bisnis. Penelitian-penelitian sebelumnya membuat aplikasi khusus untuk mengenal citra digital tertentu menggunakan algoritma machine learning tertentu dengan nilai-nilai parameter optimal sesuai hasil penelitannya. Aplikasi tersebut hanya efektif digunakan untuk citra yang telah diteliti sebagai objek penelitiannya, sehingga setiap peneliti citra harus membangun aplikasi baru untuk objek penelitian baru. Hal ini membutuhkan keahlian dalam pemrograman, sementara para peneliti citra berasal dari berbagai bidang ilmu yang tidak semuanya programmer. Dengan adanya permasalah tersebut, kami menganggap perlu melakukan penelitian berjudul Machine Learning Pengenalan Citra Digital. Hasil penelitian ini diharapkan dapat membantu para peneliti pengenalan citra tanpa harus membangun sendiri aplikasi setiap melakukan penelitian dengan fleksibilitas dalam memilih algoritma dan dapat digunakan untuk berbagai objek citra digital. Beberapa penelitian yang telah dilakukan menjadi ide dasar dalam penelitan ini. Implementasi Pengolahan Citra dan Algoritma LVQ untuk Pengenalan Pola Buku. Penelitian ini menggunakan Algoritma Learning Vector Quantization (LVQ) untuk klasifikasi buku sesuai sampulnya. Sebelum diolah menggunakan LVQ, citra terlebih dahulu dinormalisasi dan dikonversi menjadi citra biner (Lukman, 2012). Breast Tissue Classification Using Gabor Filter, PCA and Support Vector Machine. Penelitian ini menggunakan algoritma Support Vector Machine (SVM) untuk klasifikasi citra mamografi dalam mengenali kanker payudara. Sebelum diklasifikasi, Citra terlebih dahulu melalui proses normalisasi, ekstraksi fitur menggunakan filter gabor dan reduksi dimensi citra menggunakan PCA (Hajare dkk., 2012). Using the K-Nearest Neighbor Algorithm for the Classification of Lymph Node Metastasis in Gastric Cancer. Citra terlebih dahulu melalui proses seleksi fitur untuk mereduksi dimesinya, kemudian digunakan K-Nearest Neighbor (KNN) untuk klasifikasi. Penelitian ini membuktikan kelayakan dan efektivitas dari metode machine learning untuk diagnosa kelenjar getah bening metastatis pada kanker lambung menggunakan data GSI (Li dkk., 2012). Comparing Image Classification Methods: K-Nearest-Neighbor and Support-Vector- Machines. Penelitian ini mencoba membandingkan kemampuan klasifikasi citra metode KNN dan SVM menggunakan model Bag of Word (BoW). Dengan menggunakan model BoW, SVM lebih unggul dari KNN (Kim dkk., 2012). Analisis Komparasi Algoritma Klasifikasi

Data Mining Untuk Prediksi Mahasiswa Non Aktif. Penelitian ini membandingkan 4 algoritma data maining yaitu logistic regression, decision tree, naïve bayes dan neural network untuk mendapatkan algoritma yang paling akurat dalam memprediksi mahasiswa non-aktif pada perguruan tinggi. Data set yang digunakan sebanyak 3861 mahasiswa Universitas Dian Nuswantoro terdiri dari data demografi dan akademik (Hastuti, 2012). Seleksi Fitur Menggunakan Random Forest Dan Neural Network. Penelitian ini menggabungkan algoritma Random Forest dan Neural Network untuk kebutuhan klasifikasi, agar data set yang mempunyai banyak fitur. Percobaan menggunakan seleksi fitur dengan menggunakan data set iris, lung cancer dan semeion handwriting digital (Saputra dkk., 2011). Analysis of Machine Learning Algorithms using WEKA. Penelitian ini mengimplementasikan aplikasi WEKA untuk klasifikasi dan membandingkan performa waktu learning dan ketepatan klasifikasi beberapa Algoritma Machine Learning (Desai dkk., 2012). Penelitian ini bertujuan membangun aplikasi pengenalan citra digital menggunakan algoritma machine learning untuk kebutuhan klasifikasi citra digital sebagai alat bantu bagi pengguna dalam mendapatkan algoritma klasifikasi terbaik dalam mengenali citra digital. BAHAN DAN METODE Lokasi dan Rancangan Penelitian Penelitian ini dilakukan di Laboratorium Komputer Jurusan Teknik Elektro Fakultas Teknik Universitas Hasanuddin Makassar. Lokasi ini dipilih karena penelitian menggunakan koneksi internet, perangkat lunak dan perangkat keras yang dapat di peroleh dari sebuah laboratorium komputer. Dalam penelitian ini, aplikasi Machine Learning Pengenalan Citra Digital menggunakan algoritma-algoritma Machine learning WEKA. Untuk menjelaskan rancangan aplikasi secara umum, digunakan diagram uses case seperti pada gambar 1. Diagram use case menunjukkan hubungan antara use case dan aktor-aktor maupun use case dan use case lainnya dalam sebuah sistem. Setiap use case menunjukkan fungsi yang dilakukan oleh sistem. Sedangkan aktor mewakili pihak-pihak yang berinteraksi dengan sistem. Terdapat 3 aktor yang berinteraksi dengan sistem yaitu peneliti citra, google app engine (GAE) dan Machine Learning WEKA. Peneliti citra merupakan orang yang menggunakan sistem. GAE merupakan mesin tempat mengerjakan setiap fungsi pada sistem (Sanderson, 2013). Machine Learning WEKA merupakan sebuah library java yang menyediakan algoritma-algoritma Machine Learning yang dibutuhkan oleh sistem (Witten dkk., 2011).

Garis kotak putus-putus menandakan batasan sistem yang dibangun, terlihat pada gambar 1, setiap aktor berada di luar sistem yang dibangun. Use case use case algoritma Machine Learning juga berada di luar sistem yang dibangun karena mereka berasal dari library Machine Learning WEKA yang digunakan oleh sistem. Use case use case yang berada di dalam yang merupakan fungsi-fungsi sistem yang dibangun dalam penelitian ini. Instrumen Penelitian Penelitian ini menggunakan instrumen meliputi seperangkat komputer berbasis core i3 yang kompatibel dengan perangkat lunak yang digunakan. Pemilihan perangkat keras tersebut berdasarkan kebutuhan processor minimum agar dalam membangun aplikasi, peneliti tidak terhambat oleh masalah akses yang lambat. Perangkat lunak yang digunakan yaitu : Java 2 SDK, Eclipse for Java EE Developer, Google Plugin for Eclipse, Google App Engine SDK, Google Web Toolkit dan Web Browser. Alasan pemilihan perangkat lunak disebabkan karena aplikasi yang dibangun berbasis software as a service google app engine yang membutuhkan perangkat lunak tersebut. Teknik Pengumpulan Data Teknik pengumpulan data yang digunakan adalah teknik kepustakaan dengan mencari bahan-bahan yang berkaitan dengan materi penelitian, baik dari buku, jurnal dan internet. Data citra yang digunakan untuk data set pelatihan, pengujian dan pengenalan citra adalah citra wajah pada direktori faces_easy Caltech 101 yaitu kumpulan objek citra digital wajah manusia baik laki-laki maupun perempuan bertipe PNG berasal dari computational vision Institut Teknologi California bagian penelitian yang diunduh dari url: http://www.vision.caltech.edu/image_datasets/caltech101/. Pengujian Sistem Kesuksesan Modul atau fungsi dari aplikasi sebagai indikator output akan diuji menggunakan metode pengujian black box sehingga dapat diketahui apakah aplikasi sukses berjalan sesuai yang diharapkan. Modul-modul yang akan diuji tersebut yaitu: proses login, memasukkan/unggah data citra untuk pelatihan dan pengujian, proses normalisasi dan Bag of Words citra digital, penyimpanan data set latih dan uji, menampilkan data set latih dan uji, memasukkan pengaturan data set latih dan uji, proses konversi data set menjadi format ARFF, proses pelatihan dan pengujian algoritma-algoritma machine learning yang digunakan, menampilkan hasil pelatihan dan pengujian, memasukkan/unggah data citra yang akan dikenali dan proses pengenalan citra digital sesuai hasil pelatihan Indikator ouput lainnya adalah persentasi keberhasilan aplikasi dalam mengenali citra digital sesuai data set pelatihan dan pengujian yang diberikan. Untuk menghitung persentasi

tersebut, digunakan pengujian keberhasilan pengenalan citra digital sebagai berikut: keberhasilan pengenalan citra digital adalah hasil perbandingan dari jumlah citra digital yang dikenali dengan jumlah citra digital yang diberikan. HASIL PENELITIAN Citra digital dapat dikenali melalui beberapa tahap, yang pertama adalah penginputan data set citra. Tahap kedua, setiap citra yang akan digunakan, terlebih dahulu melalui proses filterisasi yaitu normalisasi dan bag of words. Normalisasi digunakan untuk mengubah ukuran pixel citra menjadi 64X64 pixel. Hal ini dilakukan agar citra yang diinput mempunyai keseragaman sehingga lebih mudah diolah oleh proses selanjutnya. Bag of words yang digunakan yaitu membagi citra yang telah dinormalisasi menjadi 16 bagian. Tahap ketiga adalah proses pelatihan dan pengujian algoritma-algoritma learning untuk mendapatkan algoritma terbaik dalam mengenali citra sesuai model pelatihan. Sebelum memasuki tahap ini, terlebih dahulu data set dikonversi mengikuti format ARFF agar dapat diproses oleh algoritma klasifikasi WEKA. Setelah mendapatkan algoritma terbaik, model pelatihan akan digunakan untuk pengenalan citra digital. Hal ini juga membutuhkan penginputan data citra yang akan dikenali, filterisasi citra, ubah data set ke format ARFF dan aplikasi akan memberikan output berupa hasil pengenalan. Aplikasi machine learning pengenalan citra digital dapat diakses menggunakan web browser dengan alamat url http://recognizeimage.appspot.com. Aplikasi terdiri dari 2 bagian utama, bagian pertama adalah halaman login, overview dan logout. Sebelum menggunakan aplikasi, pengguna wajib melakukan login menggunakan akun google. Gambar 2 memperlihatkan halaman yang pertamakali diakses oleh pengguna. Jika pengguna belum login, maka halaman setting & pra-processing dan halaman training, testing & recognizing masih non-aktif. Untuk login, pengguna menekan link Sign In, kemudian akan tampil halaman login google. Jika pengguna berhasil login, maka halaman-halaman yang non-aktif akan diaktifkan kemudian menampilkan link Sign Out yang akan digunakan pengguna untuk Sign Out. Jika pengguna Sign Out, maka tampilan akan kembali seperti pada gambar 2. Gambar 2 juga menampilkan halaman overview. Halaman ini berfungsi sebagai penjelasan dan panduan penggunaan aplikasi. Bagian kedua adalah halaman setting & pra-processing, Pada halaman ini dilakukan pra-proses sebelum dilakukan pelatihan, pengujian dan pengenalan menggunakan machine learning. Metode pengujian black box digunakan untuk menguji kesuksesan modul-modul atau fungsi-fungsi dari aplikasi yang dibangun sebagai indikator output, sehingga dapat diketahui

apakah aplikasi telah sukses berjalan sesuai yang diharapkan.. Hasil pengujian black box dapat dilihat pada tabel 1. Tabel tersebut memperlihatkan bahwa setiap modul/fungsi beserta bagian-bagian input/output sukses melewati pengujian yang menandakan bahwa modul/fungsi tersebut sudah sesuai dengan harapan. Citra yang akan dikenali adalah citra wajah yang diberi nama wajah sahrul. Untuk kebutuhan pelatihan dan pengujian, citra wajah sahrul digunakan sebanyak 25 citra sebagai data kelas ya. Data yang bukan termasuk wajah sahrul atau kelas bukan terdiri dari: 5 citra wajah peter, 5 citra wajah sarah, 5 citra wajah mei, 5 citra wajah john dan 5 citra wajah laura. Keseluruhan data latih dan uji sebanyak 50 citra. Gambar 3 memperlihatkan data set citra latih dan uji. Persentasi pembagian data latih sebanyak 60% dari data set atau sebanyak 30 citra yang terdistribusi normal menjadi 15 kelas ya dan 15 kelas bukan. Data uji sebanyak 40% dari data set atau sebanyak 20 citra yang terdistribusi secara normal yaitu 10 untuk kelas ya dan 10 untuk kelas bukan. Tabel 2 memperlihatkan bahwa dalam mengenali citra wajah sahrul, algoritma logistic regression memiliki tingkat keberhasilan yang tertinggi yaitu 95%, dengan pengenalan untuk kelas ya 90% dan kelas bukan 100%. PEMBAHASAN Penelitian ini menunjukkan rancang bangun aplikasi machine learning pengenalan citra digital dengan fleksibilitas dalam mendapatkan algoritma terbaik yang telah disediakan sesuai objek penelitian masing-masing. Peneliti citra digital dapat menggunakan aplikasi ini dengan terlebih dahulu melatih dan menguji 6 algoritma machine learning untuk mendapatkan algoritma terbaik, kemudian menggunakan algoritma terbaik tersebut untuk mengenali citra digital. Tahap-tahapnya yaitu normalisasi, Bag of Words, Pembuatan data set WEKA, pelatihan, pengujian dan pengenalan citra digital. Normalisasi merupakan proses menyeragamkan ukuran citra digital inputan menjadi matriks ukuran M X N (Lukman, 2012). Teknik normalisasi dalam pembangunan aplikasi menggunakan google image API (Application Programming Interface) untuk bahasa pemrograman java. Ukuran citra ditransformasi ke ukuran 64X64 pixel. Teknik bag of words (BoW) berfungsi untuk memperkecil field-field setiap data set namun tetap mempertahankan posisi setiap pixel pada citra digital (Kim dkk., 2012). BoW diperoleh dari nilai rata-rata pixel citra yang dibagi menjadi 16 bagian. Setiap pixel citra terdiri dari 3 nilai yaitu merah (red), hijau (green) dan biru (blue) atau biasa disebut dengan RGB (Santi, 2011). Untuk mendapatkan satu nilai untuk setiap pixel, dihitung rata-rata dari nilai RGB (Lukman, 2012).

Data set tersimpan dalam bentuk tabel database yang terdiri dari 18 field yaitu nama pengenalan citra, BoW 1 sampai BoW 16 dan target klasifikasi. Agar data set dapat dikenali oleh algoritma-algoritma Machine Learning WEKA, diperlukan konversi data set ke ARFF (Desai dkk., 2012). Konversi ini terbagi menjadi 2 bagian yaitu header dan data. Bagian header terdiri dari nama-nama field dari data set. Bagian data digunakan untuk menyimpan isi data set (Witten dkk., 2011). Aplikasi ini diperuntukkan untuk mengenali citra digital. Sebelum mengenali citra, terlebih dahulu dilakukan pengujian algoritma-algoritma machine learning yang telah disediakan. Algoritma yang mempunyai tingkat keberhasilan tertinggilah yang akan digunakan untuk mengenali citra digital. Algoritma logistic regression mempunyai tingkat keberhasilan tertinggi dari setiap algoritma machine learning yang diuji. Hal ini sesuai dengan sifatnya yang memang diperuntukkan bagi klasifikasi biner (Hastuti, 2012). Salah satu faktor kesuksesan machine learning dalam mengenali citra digital adalah jenis algoritma machine learning yang digunakan. Pada aplikasi ini algoritma-algoritma machine learning yang digunakan adalah algoritma-algoritma klasifikasi Machine Learning WEKA dengan default setting. Padahal, algoritma-algoritma tersebut masih bisa diekplorasi dengan setting yang bervariasi, misalnya algoritma K-Nearest Neighbor, dimana nilai K dapat bervariasi, misalnya K=2, K=3, dan sebagainya, namun pada penelitian ini hanya menggunakan nilai K=1 (Li dkk., 2012). Selain jenis algoritma, ada dua hal yang mempengaruhi kesuksesan sebuah algoritma machine learning dalam mengenali citra digital yaitu jenis citra yang diberikan dan jenis filterisasi data set (Hajare dkk., 2012). Kefokusan dan kekonsistenan citra yang diberikan dapat meningkatkan kemampuan algoritma machine learning dalam mengenali citra digital. Metode filterisasi data set yang berbeda juga dapat mempengaruhi tingkat keberhasilan algoritma machine learning dalam mengenali citra digital. KESIMPULAN DAN SARAN Penelitian ini berhasil membangun machine learning pengenalan citra digital dengan fleksibilitas dalam mendapatkan algoritma terbaik yang telah disediakan sesuai objek penelitian masing-masing. Hal ini dibuktikan dengan kesuksesan aplikasi menggunakan pengujian black box dan pengujian keberhasilan algoritma dalam mengenali citra digital. Disarankan pada penelitian selanjutnya, machine learning dikembangkan untuk kebutuhan klasifikasi multi kelas. Pengguna aplikasi sebaiknya menguji coba keberhasilan setiap

algoritma yang ditawarkan untuk mendapatkan algoritma terbaik sebelum menggunakannya dalam pengenalan citra digital. DAFTAR PUSTAKA Desai, Aaditya; Rai, Sunil. (2012). Analysis of Machine Learning Algorithms using WEKA. Mumbai : International Journal of Computer Applications (IJCA). Hajare, Pravin S.; Dixit, Vaibhav V. (2012). Breast Tissue Classification Using Gabor Filter, PCA and Support Vector Machine. International Journal of advancement in electronics and computer engineering (IJAECE), Vol. 1 Issue 4 hal. 116-119. www.ijaece.com (diakses tanggal 24-1-2013 pukul 09.00 WITA) Hastuti, Khafiizh (2012). Analisis Komparasi Algoritma Klasifikasi Data Mining Untuk Prediksi Mahasiswa Non Aktif. Semarang: Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK), Vol. 2 No. 1, Hal. 241 249. Kim, Jinho; Kim, Byung-Soo; Savarese, Silvio. (2012). Comparing Image Classification Methods-K-Nearest-Neighbor and Support-Vector-Machines. Wisconsin : Proceedings of the 2012 American conference on Applied Mathematics, hal. 133-138. Li, Chao, dkk. (2012). Using the K-Nearest Neighbor Algorithm for the Classification of Lymph Node Metastasis in Gastric Cancer. Journal of Computational and Mathematical Methods in Medicine Vol. 2012. http://dblp.unitrier.de/db/journals/cmmm/cmmm2012.html (diakses tanggal 24-1-2013 pukul 12.00 WITA) Lukman, Andi. (2012). Implementasi Pengolahan Citra dan Algoritma LVQ Untuk Pengenalan Pola Buku. Medan: Seminar Nasional Informatika (SNIf) Hal. 145-151. Sanderson, Dan. (2013). Programming Google App Engine, Second Edition. Sebastopal: O Reilly Media Inc. Santi, Candra Noor. (2011). Mengubah Citra Berwarna Menjadi Gray-Scale dan Citra Biner. Semarang: Jurnal Teknologi Informasi DINAMIK Vol. 16 No.1 Hal. 14-19. Saputra, Wahyuni S.J; Sujatmika, Arif Rahman; Arifin, Agus Zainal. (2011). Seleksi Fitur Menggunakan Random Forest Dan Neural Network. Surabaya: The 13 th Industrial Electronics Seminar (IES), Hal. 93-97. Witten, Ian H.; Frank Eibe; Hall Mark A. (2011). Data Mining Practical Machine Learning Tools and Techniques, Third Edition. Burlington: Morgan Kaufmann Publishers.

Gambar 1 Diagram Use Case Sistem

Gambar 2 Tampilan Aplikasi

Gambar 3 Data Set Citra Wajah Tabel 1 Rekapitulasi Hasil Pengujian Black Box No. Jenis modul/fungsi yang diuji Jumlah input/output Hasil 1 Proses Login 5 Sukses 2 Memasukkan/unggah data citra untuk pelatihan dan pengujian 2 Sukses 3 Proses normalisasi dan bag of words citra digital 2 Sukses 4 Penyimpanan data set latih dan uji 1 Sukses 5 Menampilkan data set latih dan uji 1 Sukses 6 Memasukkan pengaturan data set latih dan uji 2 Sukses 7 Proses konversi data set menjadi format ARFF 2 Sukses 8 Proses pelatihan dan pengujian algoritma-algoritma machine 6 Sukses learning yang digunakan 9 Menampikan hasil pelatihan dan pengujian 1 Sukses 10 Memasukkan / unggah data citra yang akan dikenali 2 Sukses 11 Proses pengenalan citra digital sesuai hasil pelatihan 1 Sukses Tabel 2. Hasil Pengujian Algoritma Machine Learning Dalam Mengenali Citra Wajah No Algoritma Machine Learning Kelas Ya Kelas Bukan Persentasi Benar Salah Benar Salah Keberhasilan 1 Support Vector Machine 5 5 8 2 65 % 2 Naïve Bayes 8 2 8 2 80 % 3 C4.5 Decision Tree 7 3 9 1 80 % 4 K-Nearest Neigbours 6 4 7 3 65 % 5 Logistic Regression 9 1 10 0 95 % 6 Random Forest 9 1 4 6 65 %