BAB II TINJAUAN PUSTAKA

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II TINJAUAN PUSTAKA"

Transkripsi

1 2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan: 1. A Modification on K-Nearest Neighbor Classifier (Parvin 2010) Pada penelitian ini diperkenalkan modifikasi metode KNN yang diberi nama Modified K-Nearest Neighbor. Modifikasi yang dilakukan pada algoritma KNN bertujuan untuk meningkatkan kinerja algoritma KNN salah satunya mengatasi masalah tingkat akurasi yang rendah pada algoritma KNN. Modifikasi algoritma KNN dilakukan dengan menambahkan proses validasi dataset dan pembobotan dataset untuk menentukan kelas dari sebuah objek baru. Metode ini di evaluasi pada 9 data set yakni Wine, Isodata, Iris, Bupa, Inospehre dan 3 data set Monk s Problem. Hasil evaluasi yang diperoleh metode MKNN yang diusulkan lebih baik dari algoritma tradisional KNN terutama dari segi ketahanan dan akurasi. Metode MKNN lebih baik untuk data set yang memiliki noise dan juga dalam kasus outlier. 2. Penerapan Algoritma K-Nearest Neighbor untuk Penentuan Resiko Kredit Kepemilikan Kendaraan Bemotor (Leidiyana, 2013). Pada penelitian tersebut dilakukan proses klasifikasi pada data konsumen yang menggunakan jasa keuangan kredit kendaraan bermotor untuk mengevaluasi resiko kredit. Untuk mengukur performa algoritma KNN dalam klasifikasi resiko kredit kepemilikan kendaraan bermotor dilakukan pengujian menggunakan metode cross validation, confusion matrix dan kurva ROC. Hasil pengujian mendapatkan tingkat akurasi sebesar 81,46% dan nilai AUC sebesar Hal ini menunjukan bahwa algoritma KNN termasuk dalam kategori yang sangat baik untuk melakukan klasifikasi. 22

2 23 3. Perbandingan Algortima Backpropagation dan K-Nearest Neighbor (K-NN) untuk Identifikasi Penyakit (Redjeki, 2013) Pada penelitian ini dilakukan perbandingan terhadap dua algoritma klasifikasi yang bersifat supervised learning (pembelajaran terawasi). Objek penelitian yang digunakan adalah 10 jenis penyakit dengan gejala awal demam dan 38 gejala lainnya, sehingga total 39 gejala untuk setiap penyakit. Data penelitian yang digunakan berjumlah 82 data yang dibagi menjadi 2 bagian yaikni 72 data testing dan 10 dataset. Hasil pengujian untuk performa kedua metode mendapatkan tingkat akurasi 90% untuk metode Back Propagation dan 100% untuk metode K-NN. Hal ini menunjukan bahwa algoritma K-NN memiliki nilai akurasi yang lebih baik dibandingkan dengan algoritma Back Propagation dalam melakukan identifikasi penyakit. 2.2 Tinjauan Teoritis Klasifikasi Klasifikasi adalah pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dengan proses klasifikasi kita dapat menemukan model (fungsi) yang menjelaskan dan membedakan kelaskelas atau konsep. Dalam klasifikasi ada dua pekerjaan utama yang dilakukan yaitu pembangunan model sebagai prototipe untuk disimpan sebagai memori dan penggunaan model tersebut untuk melakukan klasifikasi pada suatu objek data lain agar diketahui kelas dari data objek tersebut dalam model yang telah disimpan. Klasifikasi bertujuan untuk memprediksikan objek yang tidak memiliki kelas menggunakan model yang telah ditemukan. Model yang digunakan didasarkan pada analisis dari dataset. (Prasetyo: 2012) Metode Perhitungan Jarak Jarak dalam metode Intansce-Based Classifier adalah fungsi yang digunakan untuk menentukan seberapa dekat vektor inputan baru y dengan setiap

3 24 data sampel dan menggunakan kelas data sampel terdekat untuk memprediksi output kelas y. Terdapat banyak fungsi perhitungan jarak yang digunakan untuk memilih data sampel terdekat dengan vaktor inputan baru, diantaranya ialah sebagai berikut: 1. City Blok Dinstance Pada Manhattan atau City Block jarak antara dua titik dihitung dengan menggunakan rumus sebagai berikut: ( )...(2.1) Dimana n adalah dimensi data. 2. Euclidean Distance Untuk Euclidean distance, jarak antara dua titik dihitung menggunakan rumus sebagai berikut: ( ) ( )...(2.2) Dimana n adalah dimensi data. 3. Minskowsky Distance Untuk Minkowsky distance space, jarak antara dua titik dihitung menggunakan rumus sebagai berikut: ( )...(2.3) Dimana n adalah dimensi data dan adalah parameter jarak Minkowsky. Secara umum merupakan parameter karakteristik jarak. Jika, maka jaraknya sama dengan Manhattan. Jika, maka ruang jaraknya sama dengan Euclidean. 4. Tchebychev Distance Tchebychev Distance disebut juga dengan jarak nilai maksimum. Tchebychev Distance adalah peringkat mutlak maksimum.

4 25...(2.4) 5. Cosine Distance Cosine distance memberikan jarak sudut antara cosinus, jarak kosinus ditulis sebagai berikut: ( )...(2.5) 6. Correlation Distance Korelasi jarak dua variabel acak diperoleh dengan membagi kovarians jarak mereka dengan produk jarak deviasi standar mereka. Perhitungan korelasi jarak dituliskan sebagai berikut: ( )...(2.6) di mana c adalah koefisien korelasi Pearson. Dari berbagai metode perhitungan jarak diatas, metode perhitungan jarak yang paling sering digunakan adalah euclidean distance. Metode perhitungan jarak diatas bekerja dengan baik untuk mendefinisikan jarak pada data dengan atribut numerik, tetapi memiliki kelemahan yakni tidak tepat diaplikasikan untuk mengukur jarak antar data dengan atribut nominal atau kategorikal. (Wilson : 1997) Value Difference Metric Value Difference Metric (VDM) diperkenalkan oleh Stanfill dan Waltz pada tahun 1986 untuk memberikan fungsi perhitungan jarak yang tepat untuk data dengan atribut kategorikal. VDM mendefinisikan jarak antara dua value x dan y dari atribut sebagai berikut:...(2.7) Dimana :

5 26 : Jumlah instance dalam dataset yang memiliki value x untuk atribut a : Jumlah instance dalam dataset yang memiliki value x untuk atribut a dan kelas c : jumlah kelas q : konstanta, bernilai 1 atau 2 Dengan menggunakan metode perhitungan jarak VDM jarak antara dua value (x,y) dianggap lebih dekat jika memiliki tingkat kesamaan (similarity) klasifikasi yang lebih tinggi. Kelemahan dari metode perhitungan jarak VDM ini ialah jarak antara dua value akan dianggap 0 ketika value yang muncul dalam vektor inputan baru tidak terdapat pada training set. Jika value x tidak pernah muncul dalam atribut, maka nilai untuk setiap C (kelas) akan 0 dan juga akan bernilai 0. Fungsi jarak VDM ini tidak tepat digunakan langsung pada data dengan atribut kontinue. Jika metode VDM digunakan langsung pada atribut kontinue, semua value dapat bernilai unik. Nilai dapat bernlai 1 untuk semua value x dan dapat bernilai 1 untuk kelas 1 (C=1) dan bernilai 0 untuk kelas lainnya. Vektor inputan baru cenderung memiliki value yang unik, sehingga perhitungan jarak dapat menghasilkan nilai 0 dan nilai yang dihasilkan menjadi tidak berguna, maka dari itu metode perhitungan jarak ini tidak tepat diaplikasikan untuk mengukur jarak antar data dengan atribut kontinue. (Wilson : 1997) Heterogeneous Value Difference Metric (HVDM) Heterogeneous Value Difference Metric (HVDM) ialah metode perhitungan jarak yang diusulkan oleh Wilson dan Martinez pada tahun Metode ini diusulkan untuk menghitung jarak pada data dengan atribut yang heterogen yakni atribut kontinue dan nominal (kategorikal). Metode ini menjawab kelemahan dari metode perhitungan jarak Euclidean Distance yang tidak tepat diaplikasikan untuk data dengan atribut nominal dan menjawab kelemahan metode VDM (Value Difference Metric) yang tidak dapat menangani atribut

6 27 kontinue ataupun numerik. Metode perhitungan jarak HVDM didefinisikan sebagai berikut:...(2.8) dimana m merupakan jumlah atribut. Fungsi jarak antara dua nilai x dan y dan didefinisikan sebagai: mengembalikan {...(2.9) Fungsi normalized_diff didefinisikan sebagai:...(2.10) dimana merupakan standari deviasi dari value numerik untuk atribut a. Terdapat tiga fungsi normalized_vdm yang dapat digunakan dalam metode perhitungan jarak heterogen. Tiga fungsi tersebut diberi label N1, N2, N3 dan berikut ini ialah definisi dari ketiga fungsi tersebut:...(2.11)...(2.12)...(2.13) Fungsi N1 merupakan fungsi pada persamaan 7 dengan nilai q=1. Fungsi N2 menggunakan nilai q=2 dan mengkuadratkan hasil perhitungan jarak. Fungsi N3 adalah fungsi yang digunakan dalam Heterogeneous Radial Basis Function Networks dimana HVDM pertama kali diperkenalkan. (Wilson : 1997)

7 28 Pengujian terhadap ketiga fungsi normalisasi diatas telah dilakukan oleh Wilson dan Martinez untuk mengetahui fungsi normalisasi yang paling baik. Pengujian dilakukan pada 15 basisdata dari database repository Univerity of California dengan mengimplementasikan metode K-Nearest Neighbor dengan K=1 dan ten-fold cross validation. Hasil pengujian menunjukan bahwa fungsi normalisasi N2 mencapai akurasi general yang lebih tinggi dibandingkan dengan fungsi normalisasi N1 maupun N3, maka dari itu fungsi normalisasi N2 akan digunakan sebagai skema normalisasi untuk metode perhitungan jarak HVDM K-Nearest Neighbor (KNN) K-Nearest Neighbor (KNN) merupakan salah satu algoritma klasifikasi yang melakukan klasifikasi berdasarkan kedekatan jarak suatu data dengan data yang lain. Pada algoritma KNN data berdimensi q, jarak dari data tersebut ke data yang lain dapat dihitung. Nilai jarak digunakan sebagai nilai kedekatan atau kemiripan antara data testing dengan dataset. Nilai K pada algoritma KNN merupakan jumlah data yang terdekat dari data testing. Jika K bernilai 1, maka kelas dari suatu data testing adalah kelas dari tetangga yang terdekat. Jika k bernilai 2, akan diambil 2 tetangga terdekat dari dataset. Apabila dalam K- tetangga terdapat dua kelas yang berbeda, maka kelas untuk data traning akan ditentukan berdasarkan jumlah data terbanyak (voting mayoritas). (Prasetyo:2012) KNN merupakan salah satu algoritma yang paling banyak digunakan dalam machine learning. KNN adalah metode pembelajaran yang berbasis pada pada kasus dan tidak diperlukan fase pembelajaran (training). Model yang dikembangkan dalam algoritma KNN adalah sampel pelatihan berkaitan dengan fungsi jarak dan fungsi pilihan kelas berdasarkan kelas tetangga terdekat. Berfungsinya metode tergantung pada pilihan beberapa jumlah parameter seperti parameter K yang mewakili jumlah tetangga yang dipilih untuk menetapkan kelas data baru dan metode perhitungan jarak yang digunakan. (Medjahed : 2013) Algoritma K-Nearest Neighbor (KNN) Klasifikasi menggunakan metode KNN ini secara umum dilakukan dengan algoritma dasar sebagai berikut :

8 29 Input : K : nilai untuk parameter K D Y : dataset yang berjumlah N dengan setiap kelasnya : data objek baru Output : c : kelas dari data objek baru 1. Hitung jarak data objek baru dengan seluruh dataset 2. Urutkan data berdasarkan data yang memiliki jarak terkecil. 3. Tentukan label kelas c berdasarkan kelas mayoritas Kelebihan dan Kelemahan Algoritma K-Nearest Neighbor (KNN) (Yan : 2013) Algoritma KNN memiliki beberapa kelebihan diantaranya algoritma KNN adalah algoritma klasifikasi yang sederhana, ketahahanan dari gangguan pada dataset, dan efektivitas dalam dataset yang memadai. Namun, algoritma KNN juga memiliki kekurangan diantaranya: 1. Algortima KNN memiliki kompleksitas perhitungan yang tinggi. Untuk mengetahui k-tetangga terdekat dari sebuah data testing, semua kesamaan antara data testing dan dataset harus dihitung. Ketika jumlah dataset kurang algoritma KNN tidak akan berjalan secara optimal, namun ketika dataset berjumlah besar maka algoritma KNN akan membutuhkan lebih banyak waktu untuk menghitung kesamaan. 2. Algoritma KNN memeliki ketergantungan pada dataset. Klasifikasi yang dihasilkan hanya berdasarkan sampel dataset dan tidak menggunakan data tambahan. Hal ini membuat algoritma KNN sangat bergantung pada dataset. 3. Algoritma KNN mengangap semua dataset sama. Pada algoritma KNN tidak ada pembobotan untuk setiap dataset. Seluruh dataset diperlakukan sama, tidak ada perbedaan antar sampel. 4. Algoritma KNN juga memiliki kelemahan dari segi akurasi yang rendah dalam data set multidimensi, parameter K, dan metode perhitungan jarak.

9 Modified K-Nearest Neighbor (KNN) Algoritma Modified K-Nearest Neighbor (MKNN) ialah pengembangan dari metode KNN yang diusulkan oleh Parvin dkk yang sebagian bertujuan untuk mengatasi masalah tingkat akurasi yang rendah pada algoritma KNN. Pengembangan dilakukan dengan melakukan modifikasi pada algoritma KNN yang bertujuan untuk meningkatkan kinerja algortima KNN. Ide utama dari pengembangan algoritma KNN yang dilakukan adalah untuk menggunakan tetangga yang kuat dalam dataset. Metode MKNN menambahkan proses validasi pada setiap dataset. Selanjutnya proses klasifikasi dijalankan dengan melakukan pembobotan pada dataset dengan menggunakan nilai validasi sebagai faktor perkalian. (Parvin : 2010) Validasi Dataset Dalam algoritma Modified K-Nearest Neighbor setiap dataset akan melalui tahap validasi terlebih dahulu. Validasi setiap titik dihitung sesuai dengan tetangganya dan dilakukan hanya satu kali. Nilai validasi setiap dataset kemudian akan digunakan untuk melakukan pembobotan pada dataset yang akan digunakan untuk menentukan kelas suatu data testing. Untuk memvalidasi sebuah dataset, harus ditentukan terlebih dahulu parameter H yang akan digunakan. Parameter H ini merupakan sebuah nilai yang merepresentasikan jumlah tetangga yang digunakan untuk melakukan proses validasi. Diantara H tetangga terdekat dari dataset x, nilai validasi validity(x) setiap dataset dilakukan dengan menghitung jumlah data yang memiliki label yang sama dengan label x. Berikut ialah rumus untuk menghitung nilai validasi setiap dataset: ( )...(2.14) Dimana H adalah jumlah tetangga yang digunakan, yakni bernilai 10% dari jumlah dataset. lbl(x) merupakan label dari dari dataset, dan label dari tetangga terdekat dengan i = 1,2,3... H. Fungsi S memperhitungkan kesamaan antara satu dataset dan dataset lainnya. Berikut ialah definisi dari fungsi S:

10 31 {...(2.15) Pembobotan Dataset Pembobotan dataset dalam KNN merupakan salah satu dari variasi metode KNN. Variasi metode KNN ini melakukan penentuan kelas dari data objek baru tidak dengan cara melakukan voting mayoritas kelas pada K tetangga terdekat, melainkan dengan cara melakukan voting berdasarkan bobot pada dataset. Setiap dataset akan diberikan bobot dengan melalukan perhitungan. Misalnya, bobot setiap dataset dihitung menggunakan persamaan:...(2.16) Dimana w merupakan bobot, dan merupakan jarak euclidean. Bobot ini kemudian akan dijumlahkan untuk setiap kelas dan kelas dengan bobot tertinggi akan dipilih untuk menentukan kelas dari data objek baru. Dalam metode Modified K-Nearest Neighbor bobot masing-masing tetangga dilakukan dengan perhitungan sebagai berikut:...(2.17) Dimana merupakan sebuah konstanta yang disebut sebagai smoothing regulator. Kemudian nilai yang peroleh dari perhitungan diatas akan dikalikan dengan nilai validasi untuk mendapatkan nilai bobot akhir. Berikut ialah perhitungan bobot akhir:...(2.18) Dimana W(i) dan validity(i) merupakan bobot dan nilai validasi dari i tetangga terdekat antara dataset dan data testing. Teknik pembobotan diatas akan memberikan nilai yang tinggi untuk dataset yang memiliki nilai validasi yang besar dan kesamaan yang tinggi dengan data testing. (Parvin : 2010)

11 Algoritma Modified K-Nearest Neighbor Berikut ini ialah tahapan proses klasifikasi menggunakan algoritma Modified K-Nearest Neighbor: Input : K : nilai untuk parameter K a D Y : nilai untuk alfa (smoothing regulator) : dataset yang berjumlah N dengan setiap kelasnya : data objek baru Output : c : kelas dari data objek baru 1. For i = 1 to training_size a. Hitung nilai validasi setiap dataset b. Hitung jarak antara data objek baru dan dataset c. Hitung bobot setiap dataset 2. Jumlahkan nilai bobot untuk setiap kelas 3. Label kelas c = kelas data yang memiliki bobot tertinggi.

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang 1.1 Latar Belakang BAB I PENDAHULUAN Kartu Perlindungan Sosial (KPS) adalah kartu yang diterbitkan oleh Pemerintah Indonesia dalam Percepatan dan Perluasan Perlindungan Sosial (P4S). Rumah tangga yang

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI)

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI) K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI) Disusun Oleh : Alfian Sukma 081116007 Dian Ramadhan 081211631003 Bagus Puji Santoso 081211631061 Tiara Ratna Sari 081211632014 Ni

Lebih terperinci

KLASIFIKASI RUMAH TANGGA UNTUK PENENTUAN PENERIMA KPS (KARTU PERLINDUNGAN SOSIAL) DENGAN MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR (MKNN) SKRIPSI

KLASIFIKASI RUMAH TANGGA UNTUK PENENTUAN PENERIMA KPS (KARTU PERLINDUNGAN SOSIAL) DENGAN MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR (MKNN) SKRIPSI KLASIFIKASI RUMAH TANGGA UNTUK PENENTUAN PENERIMA KPS (KARTU PERLINDUNGAN SOSIAL) DENGAN MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR (MKNN) SKRIPSI NI WAYAN EKA AYUNINGSIH 1208605001 PROGRAM STUDI TEKNIK

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

Pengolahan Citra untuk Bidang Pertanian(Menentukan Kematangan Buah) Oleh Nama:Wahyu Abid A. NRP : Kelas :2D4 IT(B)

Pengolahan Citra untuk Bidang Pertanian(Menentukan Kematangan Buah) Oleh Nama:Wahyu Abid A. NRP : Kelas :2D4 IT(B) Pengolahan Citra untuk Bidang Pertanian(Menentukan Kematangan Buah) Oleh Nama:Wahyu Abid A. NRP :2110151042 Kelas :2D4 IT(B) Latar Belakang Buah pisang dan alpukat sangatlah familiar dengan warga asia,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Defenisi Sistem Menurut (Marimin, 2004) yang dikutip oleh (Febrealty, 2011) sistem adalah suatu kesatuan usaha yang terdiri dari bagian-bagian yang berkaitan satu sama lain yang

Lebih terperinci

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Siti Mutrofin 1, Arrie Kurniawardhani 2, Abidatul Izzah 3, Mukhamad Masrur 4 Universitas Pesantren Tinggi Darul Ulum

Lebih terperinci

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE Warih Maharani Fakultas

Lebih terperinci

ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO

ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO Olha Musa 1 dan Alang 2 1 0lh4mu54@gmail.com, 2 virus.stimik@gmail.com 12 STMIK Ichsan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

Penerapan Algoritme Modified K-Nearest Neighbour Pada Pengklasifikasian Penyakit Kejiwaan Skizofrenia

Penerapan Algoritme Modified K-Nearest Neighbour Pada Pengklasifikasian Penyakit Kejiwaan Skizofrenia Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 10, Oktober 2018, hlm. 3957-3961 http://j-ptiik.ub.ac.id Penerapan Algoritme Modified K-Nearest Neighbour Pada Pengklasifikasian

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Algorima Learning Vector Quantization yang dikembangkan oleh Kohonen merupakan metode pembelajaran terawasi (supervised learning) dan dikhususkan untuk klasifikasi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Klasifikasi merupakan salah satu bidang kajian pada machine learning. Klasifikasi adalah proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama pembuatan penelitian tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

( ) ( ) (3) II-1 ( ) ( )

( ) ( ) (3) II-1 ( ) ( ) BAB II LANDASAN TEORI 2.1 Naïve Bayes Classifier 2.1.1 Teorema Bayes Bayes merupakan teknik prediksi berbasis probabilistik sederhana yang berdasar pada penerapan teorema Bayes (atau aturan Bayes) dengan

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK PERBANDINGAN KLASIFIKASI KNN DAN NAIVE BAYESIAN SERTA PERBANDINGAN CLUSTERING SIMPLE K-MEANS YANG MENGGUNAKAN DISTANCE FUNCTION MANHATTAN DISTANCE DAN EUCLIDIAN DISTANCE PADA DATASET Dresses_Attribute_Sales

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN Bab ini membahas langkah-langkah dari implementasi dan pembahasan dari hasil penelitian yang telah dilakukan tentang klasifikasi aktivitas menggunakan algoritma k-nearest neighbor

Lebih terperinci

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN K- NEAREST NEIGHBOR

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN K- NEAREST NEIGHBOR ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 2870 SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN K- NEAREST NEIGHBOR SIMULATION AND ANALYSIS OF MUSIC GENRE

Lebih terperinci

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA Optimization Techniques Modi ed k Nearest Neighbor Classi cation Using Genetic Algorithm Siti Mutro n 1, Abidatul

Lebih terperinci

Algoritma Dasar. 4.1 Naive Bayes

Algoritma Dasar. 4.1 Naive Bayes 4 Algoritma Dasar It is a capital mistake to theorize before one has data. Arthur Conan Doyle Sebelum masuk ke algoritma machine learning yang cukup modern/ matematis, kami akan memberi contoh algoritma

Lebih terperinci

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS Yudis Anggara Putra Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada BAB II ini akan disampaikan materi-materi yang berkaitan dengan konsep data mining, yang merupakan landasan bagi pembahasan klasifikasi untuk evaluasi kinerja pegawai. 2. 1 Tinjauan

Lebih terperinci

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor PENGENALAN KADAR TOTAL PADAT TERLARUT PADA BUAH BELIMBING BERDASAR CITRA RED-GREEN-BLUE MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS (PCA) SEBAGAI EKSTRAKSI CIRI DAN KLASIFIKASI K-NEAREST NEIGHBORHOOD (KNN)

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Istilah kredit berasal dari bahasa Yunani Credere yang berarti

BAB II TINJAUAN PUSTAKA. Istilah kredit berasal dari bahasa Yunani Credere yang berarti BAB II TINJAUAN PUSTAKA 2.1 Kredit Istilah kredit berasal dari bahasa Yunani Credere yang berarti kepercayaan, oleh karena itu dasar dari kredit adalah kepercayaan. Seseorang atau semua badan yang memberikan

Lebih terperinci

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN I.1. Latar Belakang Masalah BAB I PENDAHULUAN I.1. Latar Belakang Masalah Data mining merupakan sebuah proses ekstraksi untuk mendapatkan suatu informasi yang sebelumnya tidak diketahui dari sebuah data (Witten et al., 2011). Mempersiapkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya pembangunan gedung sekolah maupun perguruan tinggi menjadi tanda berkembangnya pendidikan. Jumlah pendaftar

Lebih terperinci

Principal Component Analysis

Principal Component Analysis Perbandingan Ukuran Jarak pada Proses Pengenalan Wajah Berbasis Principal Component Analysis (PCA) Pembimbing: Dr.Ir.Wirawan, DEA (Ir. Hendra Kusuma, M.Eng) Nimas Setya Yaniar 2208.100.616 POSE (posisi

Lebih terperinci

BAB II TINJAUAN PUSTAKA. menggunakan PCA, kemudian penelitian yang menggunakan algoritma Fuzzy C-

BAB II TINJAUAN PUSTAKA. menggunakan PCA, kemudian penelitian yang menggunakan algoritma Fuzzy C- 8 BAB II TINJAUAN PUSTAKA 2.1 Studi Pendahuluan Sebelumnya telah ada penelitian tentang sistem pengenalan wajah 2D menggunakan PCA, kemudian penelitian yang menggunakan algoritma Fuzzy C- Means dan jaringan

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Data mining adalah salah satu teknik dan proses untuk menemukan suatu pola dan pengetahuan dari data yang berjumlah besar (Han dkk., 2011). Proses yang dilakukan

Lebih terperinci

Sistem Rekomendasi Psikotes untuk Penjurusan Siswa SMA menggunakan Metode Modified K-Nearest Neighbor

Sistem Rekomendasi Psikotes untuk Penjurusan Siswa SMA menggunakan Metode Modified K-Nearest Neighbor Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 1, Januari 2018, hlm. 282-287 http://j-ptiik.ub.ac.id Sistem Rekomendasi Psikotes untuk Penjurusan Siswa SMA menggunakan

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Pengolahan Citra Digital [3] Citra atau gambar didefinisikan sebagai sebuah fungsi dua dimensi, f(x,y), di mana x dan y adalah koordinat bidang datar, dan harga fungsi f di setiap

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Riskesdas (Riset Kesehatan Dasar) p ermasalahan gizi balita di Indonesia sampai saat ini masih merupakan masalah nasional. Anak usia di bawah lima tahun merupakan

Lebih terperinci

Implementasi Modified K-Nearest Neighbor Dengan Otomatisasi Nilai K Pada Pengklasifikasian Penyakit Tanaman Kedelai

Implementasi Modified K-Nearest Neighbor Dengan Otomatisasi Nilai K Pada Pengklasifikasian Penyakit Tanaman Kedelai Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 2, Februari 2017, hlm. 75-79 http://j-ptiik.ub.ac.id Implementasi Modified K-Nearest Neighbor Dengan Otomatisasi

Lebih terperinci

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman Online di:

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman Online di: ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman 161-170 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian ANALISIS CREDIT SCORING MENGGUNAKAN METODE BAGGING K-NEAREST

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Sebagai tinjauan pustaka, berikut beberapa contoh penelitian telapak kaki yang sudah dilakukan oleh para peneliti yang dapat digunakan sebagai

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB 3 METODOLOGI PENELITIAN

BAB 3 METODOLOGI PENELITIAN BAB 3 METODOLOGI PENELITIAN 3.1. Data Yang Digunakan Dalam melakukan penelitian ini, penulis membutuhkan data input dalam proses jaringan saraf tiruan backpropagation. Data tersebut akan digunakan sebagai

Lebih terperinci

BAB 3 METODOLOGI. seseorang. Hal inilah yang mendorong adanya perkembangan teknologi

BAB 3 METODOLOGI. seseorang. Hal inilah yang mendorong adanya perkembangan teknologi BAB 3 METODOLOGI 3.1. Kerangka Berpikir Pengenalan ekspresi wajah adalah salah satu bentuk representasi kecerdasan manusia yang dapat digunakan untuk mendeteksi kondisi emosi seseorang. Hal inilah yang

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB 3 PENGENALAN WAJAH

BAB 3 PENGENALAN WAJAH 28 BAB 3 PENGENALAN WAJAH DENGAN PENGENALAN DIMENSION WAJAH BASED DENGAN FNLVQ DIMENSION BASED FNLVQ Bab ini menjelaskan tentang pemodelan data masukan yang diterapkan dalam sistem, algoritma FNLVQ secara

Lebih terperinci

Deteksi Kualitas Pemasangan Ubin Berbasis Ekstraksi Ciri Bunyi Dengan Klasifikasi K-Nearest Neighbor

Deteksi Kualitas Pemasangan Ubin Berbasis Ekstraksi Ciri Bunyi Dengan Klasifikasi K-Nearest Neighbor Deteksi Kualitas Pemasangan Ubin Berbasis Ekstraksi Ciri Bunyi Dengan Klasifikasi K-Nearest Neighbor Regha Julian Pradhana 1,*, Bambang Hidayat 1, Ratri Dwi Atmaja 1 1 Fakultas Teknik Elektro, Universitas

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali BAB I PENDAHULUAN 1.1. Latar Belakang Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali objek 3 dimensi. Sistem penglihatan manusia dapat membedakan berbagai macam objek 3 dimensi

Lebih terperinci

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

Apa itu is K-Nearest Neighbor (KNN) Algorithm? K-Nearest Neighbor Pendahuluan K-Nearest Neighbour atau KNN adalah salah dari algoritma instance based learning atau case-based reasoning. Definisi case based reasoning: KNN digunakan dalam banyak aplikasi

Lebih terperinci

Pengenalan Plat Nomor Berdasarkan Klasikasi K-Nearest Neighbor (KNN)

Pengenalan Plat Nomor Berdasarkan Klasikasi K-Nearest Neighbor (KNN) Pengenalan Plat Nomor Berdasarkan Klasikasi K-Nearest Neighbor (KNN) Iman Ilmawan Muharam Manajemen Sistem Informasi Universitas Gunadarma Jl. Margonda Raya No. 100, Depok 16424, Jawa Barat ilmawan@sta.gunadarma.ac.id

Lebih terperinci

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1  Abstract Penerapan K-Optimal Pada Algoritma Knn untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Ilmu Komputer Fmipa Unlam Berdasarkan IP Sampai Dengan Semester 4 Mutiara Ayu Banjarsari 1, H. Irwan

Lebih terperinci

PENERAPAN ALGORITMA K-NEAREST NEIGHBOR (K-NN) UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

PENERAPAN ALGORITMA K-NEAREST NEIGHBOR (K-NN) UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA PENERAPAN ALGORITMA K-NEAREST NEIGHBOR (K-NN) UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Andi Gita Novianti 1, Dian Prasetyo 2 1,2 Program Studi Teknik Informatika, Fakultas Ilmu Komputer dan Manajemen,

Lebih terperinci

Aplikasi Berbasis M-KNN untuk Mendukung Keputusan Perekrutan Pemain yang Sesuai dengan Kebutuhan Tim Sepakbola

Aplikasi Berbasis M-KNN untuk Mendukung Keputusan Perekrutan Pemain yang Sesuai dengan Kebutuhan Tim Sepakbola Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 6, Juni 2018, hlm. 2051-2057 http://j-ptiik.ub.ac.id Aplikasi Berbasis M-KNN untuk Mendukung Keputusan Perekrutan

Lebih terperinci

INTELEGENSI BUATAN. Mesin Pembelajaran (Machine Learning)

INTELEGENSI BUATAN. Mesin Pembelajaran (Machine Learning) INTELEGENSI BUATAN Mesin Pembelajaran (Machine Learning) M. Miftakul Amin, M. Eng. e-mail: mmiftakulamin@gmail.com website : http://mafisamin.web.ugm.ac.id Jurusan Teknik Komputer Politeknik Negeri Sriwijaya

Lebih terperinci

APLIKASI PREDIKSI HARGA SAHAM APPLE, IBM, DELL DAN HP MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS

APLIKASI PREDIKSI HARGA SAHAM APPLE, IBM, DELL DAN HP MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS APLIKASI PREDIKSI HARGA SAHAM APPLE, IBM, DELL DAN HP MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS Naila Fitriah 52409455 Teknologi Industri Teknik Informatika AGENDA Saham? Manfaat Prediksi Saham KNN? 2

Lebih terperinci

K-NN merupakan instance-based learning, Maksudnya: data training disimpan sehingga klasifikasi untuk record baru yg belum diklasifikasi dpt ditemukan

K-NN merupakan instance-based learning, Maksudnya: data training disimpan sehingga klasifikasi untuk record baru yg belum diklasifikasi dpt ditemukan K-NN merupakan instance-based learning, Maksudnya: data training disimpan sehingga klasifikasi untuk record baru yg belum diklasifikasi dpt ditemukan dengan membandingkan kemiripan yang paling banyak dalam

Lebih terperinci

SISTEM INFORMASI REKOMENDASI TEMPAT PKL MENGGUNAKAN METODE NEAREST NEIGHBOUR DI SMK PEMUDA PAPAR

SISTEM INFORMASI REKOMENDASI TEMPAT PKL MENGGUNAKAN METODE NEAREST NEIGHBOUR DI SMK PEMUDA PAPAR SISTEM INFORMASI REKOMENDASI TEMPAT PKL MENGGUNAKAN METODE NEAREST NEIGHBOUR DI SMK PEMUDA PAPAR SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom.) Pada Program

Lebih terperinci

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO ANALISIS PERBANDINGAN PROSES CLUSTER MENGGUNAKAN K- MEANS CLUSTERING DAN K-NEAREST NEIGHBOR PADA PENYAKIT DIABETES MELLITUS SKRIPSI RONNY BENEDIKTUS SIRINGORINGO 131421021 PROGRAM STUDI S1 ILMU KOMPUTER

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

BAB IV PERANCANGAN DAN IMPLEMENTASI PERANGKAT LUNAK

BAB IV PERANCANGAN DAN IMPLEMENTASI PERANGKAT LUNAK BAB IV PERANCANGAN DAN IMPLEMENTASI PERANGKAT LUNAK Bab ini menjelaskan perancangan dan implementasi yang dilakukan. Tahap pertama dimulai dengan merancang beberapa classifier yaitu jaringan saraf tiruan

Lebih terperinci

Klasifikasi Kelompok Varietas Unggul Padi Menggunakan Modified K- Nearest Neighbor

Klasifikasi Kelompok Varietas Unggul Padi Menggunakan Modified K- Nearest Neighbor Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 8, Agustus 2018, hlm. 292-299 http://j-ptiik.ub.ac.id Klasifikasi Kelompok Varietas Unggul Padi Menggunakan Modified

Lebih terperinci

Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang

Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang 1 Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang Ari Sulistiyo 1 1,3 Jurusan Teknik Informatika, FASILKOM UDINUS Jln. Nakula 1 No.5-11 Semarang

Lebih terperinci

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN) Klasifikasi Helpdesk Universitas Jenderal Achmad ni... (Herawan dkk.) KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Jaringan Syaraf Tiruan Artificial Neural Network atau Jaringan Syaraf Tiruan (JST) adalah salah satu cabang dari Artificial Intelligence. JST merupakan suatu sistem pemrosesan

Lebih terperinci

Identifikasi Diagnosis Gangguan Autisme Pada Anak Menggunakan Metode Modified K-Nearest Neighbor (MKNN)

Identifikasi Diagnosis Gangguan Autisme Pada Anak Menggunakan Metode Modified K-Nearest Neighbor (MKNN) Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 9, Juni 2017, hlm. 825-831 http://j-ptiik.ub.ac.id Identifikasi Diagnosis Gangguan Autisme Pada Anak Menggunakan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka tentang identifikasi iris mata ataupun identifikasi citra digital sudah pernah dilakukan sebelumnya, berikut merupakan tabel perbandingan terhadap

Lebih terperinci

K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN

K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN Eko Prasetyo 1) 1 Program Studi Teknik Informatika, Fakultas Teknik, Universitas Bhayangkara Surabaya 2 Jalan A. Yani 11, Surabaya, 60231

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN)

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) Fitri Yunita Fakultas Teknik dan Ilmu Komputer, Universitas Islam Indragiri Email:Fitriyun@gmail.com Abstrak Diabetes

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN Latar Belakang Kredit merupakan salah satu usaha sekunder yang dapat dilakukan untuk pemenuhan kebutuhan sehari-hari. Pada umumnya, proses kredit dapat dilayani melalui lembaga keuangan

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Jurnal Teknik Komputer Unikom Komputika Volume 3, No.2-2014 TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Selvia Lorena Br Ginting 1), Wendi Zarman

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI BAB III LANDASAN TEORI 3.1. Citra Digital Citra digital adalah suatu citra elektronik yang diambil dari dokumen, seperti foto, buku, maupun sebuah video. Proses perubahan citra analog menjadi citra digital

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

Diagnosis Penyakit Kulit Pada Kucing Menggunakan Metode Modified K- Nearest Neighbor

Diagnosis Penyakit Kulit Pada Kucing Menggunakan Metode Modified K- Nearest Neighbor Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1797-1803 http://j-ptiik.ub.ac.id Diagnosis Penyakit Kulit Pada Kucing Menggunakan Metode

Lebih terperinci

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA ISSN : 2338-4018 PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA Agus Panoto ( ragilpanoto@gmail.com ) Yustina Retno Wahyu Utami ( yustina.retno@gmail.com

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM).

Lebih terperinci

BAB IV EKSPERIMEN. 4.1 Tujuan

BAB IV EKSPERIMEN. 4.1 Tujuan BAB IV EKSPERIMEN Pada bab ini dibahas mengenai eksperimen penggunaan SVM dalam pendeteksian intrusi pada jaringan. Pembahasan ini meliputi tujuan yang ingin dicapai melalui eksperimen ini, parameter evaluasi

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR

KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR Technologia Vol 8, No.3, Juli September 2017 146 KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR Fakultas Teknologi Informasi Universitas Islam Kalimantan Muhammad

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes

Lebih terperinci

BAB 2 LANDASAN TEORI. fuzzy logic dengan aplikasi neuro computing. Masing-masing memiliki cara dan proses

BAB 2 LANDASAN TEORI. fuzzy logic dengan aplikasi neuro computing. Masing-masing memiliki cara dan proses 8 BAB 2 LANDASAN TEORI 2.1 Teori Neuro Fuzzy Neuro-fuzzy sebenarnya merupakan penggabungan dari dua studi utama yaitu fuzzy logic dengan aplikasi neuro computing. Masing-masing memiliki cara dan proses

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

PENERAPAN ALGORITMA K-NEAREST NEIGHBOR UNTUK PENENTUAN RESIKO KREDIT KEPEMILIKAN KENDARAAN BEMOTOR ABSTRAK

PENERAPAN ALGORITMA K-NEAREST NEIGHBOR UNTUK PENENTUAN RESIKO KREDIT KEPEMILIKAN KENDARAAN BEMOTOR ABSTRAK Jurnal Penelitian Ilmu Komputer, System Embedded & Logic 1(1) : 65-76 (2013) PENERAPAN ALGORITMA K-NEAREST NEIGHBOR UNTUK PENENTUAN RESIKO KREDIT KEPEMILIKAN KENDARAAN BEMOTOR Henny Leidiyana Program Pasca

Lebih terperinci

PENENTUAN PARAMATER PADA ALGORITMA KLASIFIKASI K-NEAREST NEIGHBOR BERBASIS ALGORITMA GENETIKA

PENENTUAN PARAMATER PADA ALGORITMA KLASIFIKASI K-NEAREST NEIGHBOR BERBASIS ALGORITMA GENETIKA PENENTUAN PARAMATER PADA ALGORITMA KLASIFIKASI K-NEAREST NEIGHBOR BERBASIS ALGORITMA GENETIKA Karno Pusat Inovasi, Lembaga Ilmu Pengetahuan Indonesia Jln. Raya Jakarta-Bogor Km. 47 Cibinong 16912, Bogor,

Lebih terperinci