Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika

dokumen-dokumen yang mirip
OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA

TEKNIK GENETIC MODIFIED K-NEAREST NEIGHBOR UNTUK ESTIMASI HASIL PRODUKSI GULA TEBU BERDASARKAN NILAI KLOROFIL DAUN TEBU

BAB I PENDAHULUAN 1.1 Latar Belakang

Deteksi Penyakit Kucing dengan Menggunakan Modified K-Nearest Neighbor Teroptimasi (Studi Kasus: Puskeswan Klinik Hewan dan Satwa Sehat Kota Kediri)

Jaringan Syaraf Tiruan dengan Pembelajaran Algoritma Genetika dan Diversitas untuk Deteksi Kelas Penyakit

Imputasi Misssing Data Menggunakan Metode K-Nearest Neighbour Dengan Optimasi Algoritma Memetika

IMPUTASI MISSING DATA MENGGUNAKAN METODE K-NEAREST NEIGHBOUR DENGAN OPTIMASI ALGORITMA GENETIKA. Abidatul Izzah 1) Nur Hayatin 2) 1)

K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN

Implementasi Modified K-Nearest Neighbor Dengan Otomatisasi Nilai K Pada Pengklasifikasian Penyakit Tanaman Kedelai

BAB II TINJAUAN PUSTAKA

ISSN: X 77 IMPUTASI MISSING DATA DENGAN K-NEAREST NEIGHBOR DANALGORITMA GENETIKA

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

PERFORMANCE ALGORITMA GENETIKA (GA) PADA PENJADWALAN MATA PELAJARAN

Keywords Algoritma, Genetika, Penjadwalan I. PENDAHULUAN

WEIGHT K-SUPPORT VECTOR NEAREST NEIGHBOR

BAB I PENDAHULUAN. kehidupan sehari-hari dan juga merupakan disiplin ilmu yang berdiri sendiri serta

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

PREDIKSI PENYAKIT MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DAN ALGORITMA GENETIKA UNTUK DATA BERDIMENSI TINGGI

Zbigniew M., Genetic Alg. + Data Structures = Evolution Program, Springler-verlag.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

Lingkup Metode Optimasi

ALGORITMA GENETIKA. Suatu Alternatif Penyelesaian Permasalahan Searching, Optimasi dan Machine Learning

BAB I PENDAHULUAN. 1.1 Latar Belakang

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Penyelesaian Puzzle Sudoku menggunakan Algoritma Genetik

60 Register: Jurnal Ilmiah Teknologi Sistem Informasi, Juli 2016, Volume 2, Nomor 2

IMPLEMENTASI ALGORITMA GENETIKA UNTUK PENCARIAN RUTE PALING OPTIMUM

PENERAPAN TEKNIK KLASIFIKASI PADA SISTEM REKOMENDASI MENGGUNAKAN ALGORITMA GENETIKA

INTELEGENSI BUATAN. Mesin Pembelajaran (Machine Learning)

Rancang Bangun Aplikasi Prediksi Jumlah Penumpang Kereta Api Menggunakan Algoritma Genetika

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

Deteksi Autisme pada Anak Menggunakan Metode Modified K-Nearest Neighbor (MKNN)

OPTIMASI PENJADWALAN CERDAS MENGGUNAKAN ALGORITMA MEMETIKA

APLIKASI PREDIKSI HARGA SAHAM APPLE, IBM, DELL DAN HP MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS

BAB 2 TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

PEMBELAJARAN BERTINGKAT PADA ARSITEKTUR JARINGAN SARAF FUNGSI RADIAL BASIS

PENENTUAN PARAMATER PADA ALGORITMA KLASIFIKASI K-NEAREST NEIGHBOR BERBASIS ALGORITMA GENETIKA

Abidah Elcholiqi, Beta Noranita, Indra Waspada

1. Pendahuluan 1.1. Latar Belakang

Peramalan Kebutuhan Beban Sistem Tenaga Listrik Menggunakan Algoritma Genetika

Penjadwalan Job Shop pada Empat Mesin Identik dengan Menggunakan Metode Shortest Processing Time dan Genetic Algorithm

PENERAPAN ALGORITMA GENETIKA UNTUK MENYELESAIKAN PERMASALAHAN PENJADWALAN DOSEN DENGAN FUZZY

PENENTUAN JARAK TERPENDEK PADA JALUR DISTRIBUSI BARANG DI PULAU JAWA DENGAN MENGGUNAKAN ALGORITMA GENETIKA. Abstraksi

PENCOCOKAN KATA SECARA ACAK DENGAN METODE ALGORITMA GENETIKA MENGGUNAKAN PROGRAM PASCAL

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PERBANDINGAN KINERJA ALGORITMA GENETIK DAN ALGORITMA BRANCH AND BOUND PADA TRAVELLING SALESMAN PROBLEM

ALGORITMA GENETIKA Suatu Alternatif Penyelesaian Permasalahan Searching, Optimasi dan Machine Learning

Kata Kunci : Optimasi, Naïve Bayes, Risiko Kredit, Algoritma Genetika, Seleksi Fitur.

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

PENYELESAIAN KNAPSACK PROBLEM MENGGUNAKAN ALGORITMA GENETIKA

BAB I PENDAHULUAN Latar Belakang

Analisis Komparasi Genetic Algorithm dan Firefly Algorithm pada Permasalahan Bin Packing Problem

PENERAPAN ALGORITMA GENETIKA PADA PERENCANAAN LINTASAN KENDARAAN Achmad Hidayatno Darjat Hendry H L T

Algoritma Evolusi Real-Coded GA (RCGA)

Prediksi Harga Saham Dengan Algoritma Genetika

OPTIMASI QUERY DATABASE MENGGUNAKAN ALGORITMA GENETIK

Bandung, Indonesia Bandung, Indonesia

ERWIEN TJIPTA WIJAYA, ST.,M.KOM

Penjadwalan Mata Kuliah Menggunakan Algoritma Genetika di Jurusan Sistem Informasi ITS

OPTIMASI PENJADWALAN KEGIATAN BELAJAR MENGAJAR DENGAN ALGORITMA GENETIK

Versi Online tersedia di : JURNAL TECH-E (Online)

Optimasi Penjadwalan Ujian Menggunakan Algoritma Genetika

8. Evaluasi Solusi dan Kriteria Berhenti Perumusan Masalah METODE PENELITIAN Studi Pustaka Pembentukan Data

PEMAMPATAN MATRIKS JARANG DENGAN METODE ALGORITMA GENETIKA MENGGUNAKAN PROGRAM PASCAL

PERANCANGAN APLIKASI PENJADWALAN TRAVELING SALESMAN PROBLEM DENGAN ALGORITMA GENETIKA

Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

HASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.

Optimalisasi Pengantaran Barang dalam Perdagangan Online Menggunakan Algoritma Genetika

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

Klasifikasi Kelompok Varietas Unggul Padi Menggunakan Modified K- Nearest Neighbor

PERBANDINGAN K-SUPPORT VECTOR NEAREST NEIGHBOR TERHADAP DECISION TREE DAN NAIVE BAYES

APLIKASI ALGORITMA GENETIKA DALAM PENENTUAN DOSEN PEMBIMBING SEMINAR HASIL PENELITIAN DAN DOSEN PENGUJI SKRIPSI

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

Prosiding ISSN : Algoritma Penjadwalan Perkuliahan dengan Kasus Team Teaching dengan Metode Vertex Coloring Graph

BAB 2 LANDASAN TEORI

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI)

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

MENGUKUR KINERJA ALGORITMA GENETIK PADA PEMAMPATAN MATRIKS JARANG

Genetic Algorithme. Perbedaan GA

ANALISIS PENGATURAN INDIVIDU CROSSOVER DAN MUTASI ALGORITMA GENETIKA STUDI KASUS TRAVELLING SALESMAN PROBLEM

OPTIMASI PENEMPATAN KAPASITOR PADA SALURAN DISTRIBUSI 20 kv DENGAN MENGGUNAKAN METODE KOMBINASI FUZZY DAN ALGORITMA GENETIKA

Pendekatan Algoritma Genetika pada Peminimalan Fungsi Ackley menggunakan Representasi Biner

BAB 2 TINJAUAN PUSTAKA

Optimasi Cluster Pada Fuzzy C-Means Menggunakan Algoritma Genetika Untuk Menentukan Nilai Akhir

BAB I PENDAHULUAN 1.1 Latar Belakang

MEMBANGUN TOOLBOX ALGORITMA EVOLUSI FUZZY UNTUK MATLAB

SWARM GENETIC ALGORITHM, SUATU HIBRIDA DARI ALGORITMA GENETIKA DAN PARTICLE SWARM OPTIMIZATION. Taufan Mahardhika 1

Algoritma Evolusi Dasar-Dasar Algoritma Genetika

PENGELOMPOKAN GAMBAR BERDASARKAN WARNA DAN BENTUK MENGGUNAKAN FGKA (FAST GENETIC KMEANS ALGORITHM) UNTUK PENCOCOKAN GAMBAR

Bab II Konsep Algoritma Genetik

Analisis Sistem Cerdas Pengambilan Keputusan untuk Perawatan Mesin dengan Penggabungan Metode Algoritma Genetika dan Decision Making Grid

Identifikasi Penyakit Diabetes Mellitus Menggunakan Metode Modified K- Nearest Neighbor (MKNN)

Optimasi Artificial Neural Network dengan Algorithm Genetic pada Prediksi Approval Credit Card

PENERAPAN ALGORITMA GENETIKA PADA PENYELESAIAN CAPACITATED VEHICLE ROUTING PROBLEM

Sistem Rekomendasi Psikotes untuk Penjurusan Siswa SMA menggunakan Metode Modified K-Nearest Neighbor

Transkripsi:

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Siti Mutrofin 1, Arrie Kurniawardhani 2, Abidatul Izzah 3, Mukhamad Masrur 4 Universitas Pesantren Tinggi Darul Ulum (Unipdu), Jombang 1,4 Universitas Islam Indonesia (UII), Yogyakarta 2 Poli Teknik (Poltek), Kediri 3 Abstrak Salah satu tugas dari data mining adalah klasifikasi, banyak peneliti yang sudah melakukan penelitian tentang metode klasifikasi. Metode klasifikasi yang biasa digunakan adalah k-nearest Neighbor (knn). knn memiliki beberapa kelebihan, diantaranya adalah pelatihan sangat cepat, sederhana dan mudah dipelajari, tahan terhadap data pelatihan yang memiliki derau, dan efektif jika data pelatihan besar. Sedangkan, kekurangan dari knn adalah nilai k bias, komputasi kompleks, keterbatasan memori, dan mudah tertipu dengan atribut yang tidak relevan. Salah satu perbaikan knn adalah Modified knn (MKNN), yang bertujuan untuk meningkatkan akurasi dari knn, dengan menambahkan perhitungan validity, karena dianggap perhitungan bobot yang terdapat pada knn, memiliki permasalahan outlier. Namun, MKNN juga memiliki kelemahan yang sama dengan knn yaitu nilai k bias dan komputasi yang kompleks. Berdasarkan permasalahan MKNN tersebut, penulis bermaksud untuk melakukan perbaikan dalam hal, optimasi nilai k menggunakan Genentic Algorithm (GA), karena GA sudah terbukti dapat digunakan untuk melakukan optimasi pada nilai k untuk knn. Selanjutnya algoritma tersebut akan dinamakan algoritma GMKNN (Genetic Modified k Nearest Neighbor). Evaluasi tingkat kebenaran hasil didasarkan pada nilai akurasi, baik menggunakan algoritma knn, MKNN maupun GMKNN menggunakan data UCI machine learning. Berdasarkan hasil uji menggunakan data Iris dan Wine MKNN lebih unggul dari pada knn, baik menggunakan data latih 60%, 70%, 80%, maupun 90%, dengan akurasi paling rendah adalah sebesar 93,78% dan paling tinggi 97,28%, masih lebih tinggi dibandingkan dengan knn dengan akurasi terendah sebesar 82,92% dan paling tinggi 84,82% untuk data Iris, begitu juga ketika menggunakan data wine MKNN masih lebih unggul dibandingkan knn. Sedangkan untuk GMKNN dapat menentukan nilai k secara otomasi, dibandingkan MKNN yang penentuan k-nya masih manual. Kata kunci: knn, Modified knn, Genetic Algorithm, Genetic Modified knn, UCI machine Learning Pendahuluan Klasifikasi adalah salah satu tugas dari data mining yang bertujuan untuk memprediksi label kategori benda yang tidak diketahui sebelumnya, dalam membedakan antara objek yang satu dengan yang lainnya berdasarkan atribut atau fitur [1,2]. Salah satu teknik klasifikasi yang paling dasar dan sederhana adalah k Nearest Neighbor (knn) [1]. knn memiliki beberapa keunggulan dan kelemahan [3], keunggulannya yaitu: 1) Pelatihan sangat cepat, 2) Sederhana dan mudah dipelajari, 3) Tahan terhadap data pelatihan yang memiliki derau, dan 4) Efektif jika data pelatihan besar. Sedangkan, kekurangan dari knn adalah: 1) Nilai k bias, 2) Komputasi kompleks, 3) Keterbatasan memori, dan 4) Mudah tertipu dengan atribut yang tidak relevan. Banyak peneliti yang sudah melakukan penelitian tentang perbaikan knn, baik dalam memperbaiki nilai akurasi knn maupun dalam hal optimasi nilai k pada knn. Penelitian terkait peningkatan nilai akurasi knn adalah Modified knn (MKNN), di mana dalam MKNN ditambahkan perhitungan nilai validity yang berguna untuk mengatasi permasalahan outlier dalam perhitungan nilai bobot pada knn tradisional. Namun MKNN juga memiliki kelemahan, yaitu nilai k yang bias dan komputasi yang kompleks [1]. Sedangkan, penelitian terkait optimasi nilai k pada knn adalah Genetic knn (GKNN), selain dapat menentukan nilai k secara otomatis, GKNN dapat meningkatkan nilai akurasi dan dapat mengurangi kompleksitas [4]. Berdasarkan latar belakang tersebut, penulis mengusulkan perbaikan pada algoritma MKNN, dengan cara mengoptimasi nilai k menggunakan algoritma genetika, selanjutnya algoritma tersebut dinamakan algoritma Genetic Modified k Nearest Neighbor (GMKNN). Metode Penelitian Siti Mutrofin, Arie Kurnia Wardhani, Abidatul Izzah, Mukhamad Masrur GAMMA, Volume 10, No1 1

Untuk mendukung penelitian, maka perlu mengkaji berbagai referensi tentang tugas dari data mining, di mana salah satu tugas dari data mining adalah klasifikasi. Tenik klasifikasi yang umum digunakan adalah knn, namun dengan segala kelebihan dari knn, knn masih memiliki kelemahan, diantara banyak penelitian tentang perbaikan knn, algoritma GA diusulkan untuk penentuan nilai k otomatis pada knn (GKNN), yang juga berdampak dapat meningkatkan akurasi dan mengurangi kompleksitas [4]. Selain GKNN sebagai perbaikan akurasi dari knn, MKNN juga bertujuan untuk memperbaiki algoritma knn dalam segi perbaikan nilai akurasi knn, karena nilai k dari MKNN masih bersifat bias [1], maka penulis mengusulkan peningkatan kinerja MKNN dengan optimasi nilai k menggunakan GA. Data yang akan diteliti adalah data UCI machine learning yaitu data iris dan data wine. Data iris adalah data bunga iris yang terdiri dari 4 atribut, 3 kelas dan 150 data. Sedangkan, data wine terdiri dari 13 atribut, 3 kelas, dan 178 data. Tahap awal desain sistem adalah merumuskan kontribusi utama dari penelitian ini. Dari studi literatur yang telah dilakukan, diketahui bahwa MKNN merupakan algoritma yang memiliki akurasi yang lebih baik dibandingkan knn. Namun, MKNN masih belum mampu mengatasi permasalahan knn dalam hal nilai k yang masih bias. Oleh karena itu perlu dilakukan optimasi menggunakan GA sebagai operator dalam menentukan nilai k yang bertujuan mengatasi kelemahan tersebut (untuk selanjutnya MkNN dengan adanya penambahan operator GA disebut dengan GMKNN). Kemudian algoritma hybrid ini digunakan sebagai model pada saat klasifikasi. Desain sistem yang diusulkan pada makalah ini terdiri dari beberapa tahap, yakni sebagai berikut: 1) Menentukan data latih. Misal data latih yang digunakan adalah data Iris sebanyak 12 data, sedangkan data uji sebanyak 3 data. 2) Tentukan populasi dari kromosom (solusi). Misal populasi yang diinginkan adalah 3. Maka secara random akan dibangkitkan kromosom (kemungkinan solusi) sebanyak 3 buah, dengan ketentuan, nilai k < 11. Misal hasil kromosom didapatkan 3, 9, 4. Selanjutnya nilai kromosom tersebut dibinerkan, misal menjadi 0011 untuk kromosom 3, 0100 untuk kromosom 4 dan 1001 untuk kromosom 9. 3) Hitung nilai fitness dengan menggunakan nilai akurasi, nilai akurasi tertinggi adalah nilai fitness terbaik. Misal yang terbaik adalah kromosom 4. 4) Lakukan proses seleksi menggunakan roulette wheel, misalkan yang terpilih adalah kromosom 4 dan 9. 5) Lakukan proses crossover dari dua kromosom yang telah terpilih pada langkah no. 4, dikarenakan operasi ini diharapkan memiliki keberhasilan tinggi, maka digunakan probabilitas sebesar 0,8 [5]. 6) Lakukan proses mutasi dari hasil anakan pada langkah no. 5, dikarenakan operasi ini diharapkan memiliki kemungkinan kecil, maka digunakan probabilitas sekecil-kecilnya, misal 0,1 [5]. 7) Didapatkan individu baru dari nilai fitness yang terbaik. 8) Ulangi tahapan di operasi GA sampai memiliki nilai k (kromosom) yang optimal. Misal didapatkan k optimal = 3. 9) Hitung normalisasi dari pola data, menggunakan normalisasi min-max, perhatikan Persamaan 1. (1) data x = Data yang akan dinormalisasi. data max = Data maksimal pada kolom tersebut. data min = Data minimal pada kolom tersebut. 10) Hitung jarak euclidean antar data latih, pilih jarak yang paling dekat dengan k = 3, semakin kecil nilai jarak, maka semakin bagus. Persamaan jarak ditunjukkan pada Persamaan 2 [6]. (2) d(x,y) = Jarak antar data latih x = Data latih yang akan dihitung dengan data latih lain (y) Siti Mutrofin, Arie Kurnia Wardhani, Abidatul Izzah, Mukhamad Masrur GAMMA, Volume 10, No1 2

y = Data latih sebagai tetangga dari data latih x i = Data latih kolom awal n = Jumlah kolom data latih 11) Hitung nilai similaritas (Persamaan 3 [1]). S = Similaritas; a; dan b label kelas antar data latih 12) Hitung validitas (Persamaan 4 [1]). (4) Validitas = Validitas antar data latih i = Validitas data latih ke-i k = Jumlah tetangga antar data latih dari similaritas yang terbaik (nilai 1 = terbaik) S = Similaritas target = Label kelas a dan b = Label kelas antar data latih n = Banyaknya label 13) Hitung jarak antara data latih dengan data uji (Persamaan 2 [1]), pilih 3 jarak terbaik. 14) Hitung bobot berdasarkan nilai validitas (Persamaan 5). (5) w i validitas d(i) (3) = Bobot antara data uji dengan data latih ke-i = Jumlah data latih = Validitas data latih = Jarak data latih = 0,5; untuk menghindari penyebut dibagi dengan 0. 15) Hitung vote berdasarkan bobot tiap kelas dari data data uji (Persamaan 6 [6]). (6) vote = Voting kelas berdasarkan bobot data uji dengan data latih label = Kelas data latih x = data uji y = data latih i = bobot ke-i n = banyaknya bobot dengan kelas yang sama w = bobot antara data uji dengan data latih 16) Pilih nilai vote terbesar dari kelas. Jika dalam sebuah perhitungan bobot hanya cenderung ke 1 kelas, maka tanpa perhitungan vote, data uji tersebut cenderung ke kelas data latih tersebut. Namun jika dalam perhitungan bobot ada kecenderungan ke beberapa kelas, maka harus di hitung vote tiap kelas, vote dari kelas data latih tersebutlah yang dimungkinkan sebagai kelas dari data uji. Hasil Penelitian dan Pembahasan Dataset yang digunakan adalah dataset bunga Iris yang terdiri dari 150 data, 4 atribut, 3 kelas, setiap kelas memiliki 50 data. Selain menggunakan data Iris, juga menggunakan data Wine dengan data sejumlah 178, 13 atribut, dan 3 kelas, kelas 1 sebanyak 59, kelas 2 sebanyak 71, dan kelas 3 sebanyak 48. Berdasarkan uji coba pada kedua dataset, dengan beberapa skenario uji coba baik untuk data latih 90%, 80%, 70%, dan 60%. Untuk dataset bunga Iris MKNN lebih unggul dibandingkan dengan knn, dengan akurasi paling rendah adalah sebesar 93,78% dan paling tinggi 97,28%, masih lebih tinggi dibandingkan dengan knn dengan akurasi terendah sebesar 82,92% dan paling tinggi 84,82% untuk data Iris, begitu juga ketika menggunakan data Wine MKNN masih lebih unggul Siti Mutrofin, Arie Kurnia Wardhani, Abidatul Izzah, Mukhamad Masrur GAMMA, Volume 10, No1 3

Akurasi Akurasi Siti Mutrofin 1, Arrie Kurniawardhani 2, Abidatul Izzah 3, Mukhamad Masrur 4 JURNAL GAMMA, ISSN 0216-9037 dibandingkan knn, dengan akurasi paling rendah adalah sebesar 88,84% dan paling tinggi 92,08%, masih lebih tinggi dibandingkan dengan knn dengan akurasi terendah sebesar 80,15% dan paling tinggi 84,24% (Perhatikan Tabel 1). Tabel 1 Hasil Uji Coba Klasifikasi knn pada data Iris Data Jumlah Per kelas Data Jumlah Rata-rata Akurasi (%) Kelas1 Kelas2 Kelas3 Latih tetangga knn MKNN (%) 60% 89 82.92% 93.78% Iris (150) 50 50 50 70% 104 84.59% 96.39% 80% 119 84.82% 97.28% 90% 134 83.88% 96.42% 60% 106 80.15% 84.88% Wine (178) 59 71 48 70% 124 80.92% 87.02% 80% 141 80.36% 88.12% 90% 159 84.24% 92.80% Perbandingan Akurasi knn & MKNN dengan Data Iris 100.00% 95.00% 90.00% 85.00% 80.00% 75.00% 60% 70% 80% 90% Jumlah data latih knn MkNN Gambar 1 Grafik perbandingan akurasi knn dan MKNN dengan menggunakan data Iris Perbandingan Akurasi knn & MKNN dengan Data Wine 95.00% 90.00% 85.00% 80.00% 75.00% 70.00% 60% 70% 80% 90% Jumlah Data Latih MKNN knn Gambar 2 Grafik perbandingan akurasi knn dan MKNN dengan menggunakan data Iris Tabel 2 Hasil Uji Coba Klasifikasi MKNN dan GMKNN pada data Iris Data Latih K MKNN K Optimal GMKNN 60% 1 96.67% 4 98.33% 2 98.33% 70% 1 100% 2 100% 80% 1 100% 4 100% Siti Mutrofin, Arie Kurnia Wardhani, Abidatul Izzah, Mukhamad Masrur GAMMA, Volume 10, No1 4

90% 1 100% 2 100% Sedangkan untuk GMKNN dapat menentukan nilai k secara otomasi, dibandingkan MKNN yang penentuan k-nya masih manual, ketika menggunakan populasi sebesar 10, Pm 0,95, Pc 0,05, gen 5, GMKNN dapat mendapatkan k optimal di k = 2, dengan nilai akurasi 100% untuk data latih sebesar 70% dan 90%. Ketika data 60% dan 80% k optimal berada pada k = 4 (Perhatikan pada Tabel 2). Berdasarkan pada uji coba baik knn maupun MKNN ketika knn akurasinya naik MKNN juga naik, begitu juga sebaliknya, baik pada data Iris maupun Wine (perhatikan Gambar 1 dan Gambar 2). Kesimpulan Prosentase data latih maupun data uji mempengaruhi hasil kinerja algoritma, dimana semakin banyak data latih yang digunakan semakin baik kinerja algoritma tersebut. MKNN masih lebih unggul dibandingkan algoritma KNN dalam menganalisis data Iris dan data Wine. Kekurangan dari MKNN dari pada knn adalah komputasi menjadi lebih besar. GMKNN juga berhasil mendapatkan nilai k optimal. Referensi [1] Parvin H, Alizadeh H, Bidgoli B M. MKNN: Modified K-Nearest Neighbor. Proceedings of the Word Congress on Engineering and Computer Science 2008 (WCECS 2008). San Francisco. 2008: 831-834. [2] Ngai E W T, Hu Y, Wong Y H, Chen Y, Sun X. The Application of Data Mining Techniques in Financial Fraud Detection: A Classification Framework and An Academic Review of Literature. Decision Support Systems. 2011; 50(3): 559-569. [3] Bhatia N, Vandana. Survey of Nearest Neighbor Techniques. International Journal of Computer Science and Information Security. 2010. 8(2): 302-305. [4] Suguna N, Thanushkodi K. An Improved k-nearest Neighbor Classification Using Genetic Algorithm. International Journal of Computer Science Issues. 2010. 7(4): 18-21. [5] Izzah A., Dewi R K., Mutrofin S., 2013. Hybrid Artificial Bee Colony: Penyeleseian Baru Pohon Rentang Berbatas Derajat. Seminar Nasional Teknologi Informasi dan Multimedia 2013 (Semnasteknomedia 2013), pp.18-39 s/d 18-44. [6] Larose D T., 2005. Discovering Knowledge in Data An Introduction to Data Mining.Wiley Interscience, pp.90-106. Siti Mutrofin, Arie Kurnia Wardhani, Abidatul Izzah, Mukhamad Masrur GAMMA, Volume 10, No1 5