KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA

Ukuran: px
Mulai penontonan dengan halaman:

Download "KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA"

Transkripsi

1 KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Debitur Kartu Kredit Menggunakan Algoritme K-Nearest Neighbor untuk Kasus Imbalanced Data adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2013 Fiqrotul Ulya NIM G

4 ABSTRAK FIQROTUL ULYA. Klasifikasi Debitur Kartu Kredit Menggunakan Algoritme K- Nearest Neighbor untuk Kasus Imbalanced Data. Dibimbing oleh AZIZ KUSTIYO. Data dikatakan tidak seimbang apabila terdapat distribusi jumlah data yang tidak merata, dengan suatu kelas memiliki jumlah data yang jauh lebih besar dari kelas lainnya. Dalam kasus ini, kelas minoritas lebih sulit diprediksi daripada kelas mayoritas. Padahal kelas minoritas inilah yang terkadang memiliki informasi penting. Pada penelitian ini dilakukan analisis klasifikasi debitur kartu kredit menggunakan k-nearest neighbor untuk kasus imbalanced data yang mampu mengklasifikasikan calon debitur ke dalam kategori baik atau buruk. Analisis kelayakan calon debitur sangat penting untuk meminimalisir terjadinya risiko kredit. Salah satu pendekatan yang dilakukan untuk menangani permasalahan pada kasus imbalanced data adalah dengan memodifikasi distribusi data menggunakan metode oversampling dan undersampling. Dalam penelitian ini dilakukan perbandingan nilai parameter k, akurasi, precision, recall serta F- measure dan diketahui bahwa teknik oversampling menunjukkan nilai terbaik dengan akurasi sebesar 96.24% ketika k = 3, recall 99.23% ketika k = 2, precision 95.21% ketika k = 1, dan F-measure sebesar 96.30% ketika k = 3. Kata Kunci: imbalanced data, k-nearest neighbor, oversampling, undersampling ABSTRACT FIQROTUL ULYA. Credit Card Debtor Classification Based On K-Nearest Neighbor Algorithm for Imbalanced Data. Supervised by AZIZ KUSTIYO. Data is said to suffer the class imbalanced problem when the class distribution are highly imbalance. In this case, minority class is more difficult to predict then the majority class. Though the minority class sometime has important information. In this paper, classification analysis of credit card debtors is conducted by using k-nearest neighbor that can classify debtors into two categories, good or bad. Analysis of a prospective debtor is essential to minimize credit risk. One approach taken to overcome imbalanced data problems is to modify instance distribution using oversampling and undersampling method. The evaluation is conducted by comparing the value of parameter k, accuracy, precision, recall, and F-measure. The evaluation results show that oversampling technique gives the best result of 96.24% with k = 3, 99.23% recall with k = 2, 95.21% precision with k = 1, and 96.30% F-measure with k = 3. Keywords: imbalanced data, k-nearest neighbor, oversampling, undersampling

5 KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

6 Penguji: 1. Toto Haryanto, MKom 2. M Asyhar Aglamaro, MKom

7 Judul Skripsi : Klasifikasi Debitur Kartu Kredit Menggunakan Algoritme K-Nearest Neighbor untuk Kasus Imbalanced Data Nama : Fiqrotul Ulya NIM : G Disetujui oleh Aziz Kustiyo, SSi MKom Pembimbing Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

8 PRAKATA Puji syukur kehadirat Allah Subhanahu Wa Taala yang telah melimpahkan rahmat dan hidayah-nya, sehingga penulis dapat menyelesaikan skripsi yang berjudul Klasifikasi Debitur Kartu Kredit Menggunakan Algoritme K-Nearest Neighbor untuk Kasus Imbalanced Data. Skripsi ini merupakan salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer, Institut Pertanian Bogor. Terima kasih penulis ucapkan kepada kepada ayah, ibu, serta seluruh keluarga, atas segala doa dan dukungannya. Ungkapan terima kasih juga disampaikan kepada Bapak Aziz Kustiyo, SSi MKom selaku pembimbing yang telah memberikan arahan, bimbingan, saran dan motivasi dengan sabar dan membantu penulis dalam menyelesaikan skripsi ini. Penulis juga mengucapkan terima kasih kepada dosen penguji, Bapak Toto Haryanto, MKom dan Bapak M Asyhar Aglamaro, MKom atas saran dan bimbinganya, serta teman-teman satu bimbingan, Retno Wijayanti, Dhieta Anggraini serta Ilkomerz 46 atas bantuan, saran, kritik, dan dukungannya kepada penulis. Semoga karya ilmiah ini bermanfaat. Bogor, Agustus 2013 Fiqrotul Ulya

9 DAFTAR ISI DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 2 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 TINJAUAN PUSTAKA 2 Risiko Kredit 2 Imbalanced Data 3 Sampling 3 K-Fold Cross Validation 3 K-Nearest Neighbor 3 Normalisasi 4 Confusion Matrix 5 METODE 6 Kerangka Penelitian 6 Pengadaan Data 7 Praproses Data 7 10-Fold Cross Validation 8 Proses Klasifikasi Metode KNN 8 Analisis Hasil Klasifikasi 8 HASIL DAN PEMBAHASAN 8 Praproses Data 8 Hasil Klasifikasi 9 Analisis Hasil Klasifikasi 12 Perbandingan dengan Penelitian Sebelumnya 14 SIMPULAN DAN SARAN 15

10 Simpulan 15 Saran 16 DAFTAR PUSTAKA 16 LAMPIRAN 17 RIWAYAT HIDUP 21

11 DAFTAR TABEL 1 Confusion matrix dua kelas 5 2 Karakteristik atribut 9 3 Hasil akurasi rata-rata 12 4 Hasil precision, recall dan F-measure 12 5 Perbandingan dengan penelitian lain 14 DAFTAR GAMBAR 1 Alur penelitian 6 2 Imbalanced data 7 3 Hasil percobaan data asli 9 4 Hasil percobaan oversampling replikasi 10 5 Hasil percobaan oversampling acak 10 6 Hasil percobaan undersampling acak 11 7 Hasil percobaan undersampling cluster 11 DAFTAR LAMPIRAN 1 Daftar atribut 17 2 Nilai akurasi undersampling acak 18 3 Nilai precision undersampling acak 18 4 Nilai recall undersampling acak 18 5 Nilai F-measure undersampling acak 18 6 Akurasi undersampling cluster 2 sampai cluster Precision undersampling cluster 2 sampai cluster Recall undersampling cluster 2 sampai cluster F-measure undersampling cluster 2 sampai cluster 10 20

12

13 1 PENDAHULUAN Latar Belakang Data Bank Indonesia (2013) menyebutkan bahwa daftar penerbit kartu kredit meningkat menjadi 20 penerbit. Banyaknya bank yang mengembangkan bisnis kartu kredit menandakan bahwa bisnis ini masih memiliki peluang yang baik bagi bank penerbit sebagai sumber keuntungan. Kartu kredit menawarkan kemudahan bagi nasabahnya untuk melakukan berbagai macam transaksi. Pemegang kartu kredit diwajibkan untuk melakukan pelunasan kewajiban pada waktu yang telah disepakati baik secara sekaligus ataupun angsuran (Sayono et al. 2009). Aturan dan sistem yang diterapkan terhadap analisis kelayakan calon debitur sangat penting untuk meminimalisir terjadinya risiko kredit. Debitur yang lancar dalam memenuhi kewajibannya mampu memberikan keuntungan kepada bank. Sementara itu, permasalahan dapat terjadi apabila debitur tidak mampu memenuhi kewajibannya dalam batas waktu yang telah disepakati sehingga dapat merugikan bank. Data debitur kartu kredit merupakan salah satu data skala besar dengan distribusi kelas yang tidak merata antara debitur kategori baik dan buruk. Kumpulan data yang memiliki kelas tidak terdistribusi secara merata atau data yang jumlahnya didominasi oleh salah satu kelas disebut imbalanced data. Penggunaan metode sampling dalam imbalanced data dapat memberikan distribusi data yang seimbang untuk setiap kelas (He dan Edwardo 2009). Salah satu metode yang digunakan untuk membangun model klasifikasi dalam mengidentifikasi debitur ke dalam kategori baik atau buruk adalah k - nearest neighbor (KNN). KNN merupakan teknik yang lebih fleksibel karena mampu mengklasifikasikan data uji ke dalam kelas label dengan cara mencari data latih yang relatif sama dengan data uji (Tan et al. 2006). Penelitian terkait tentang klasifikasi debitur kartu kredit dilakukan oleh Natasia (2013) menggunakan metode voting feature intervals 5 (VFI5) untuk melakukan pemilihan fitur serta mengukur tingkat akurasinya yang menghasilkan model terbaik dengan pengukuran akurasi, recall, precision, dan F-measure sebesar 70.40%, 38.58%, 24.38%, dan 29.88%. Namun, penelitian tersebut tidak melakukan pendekatan dari sisi teknik sampling sebagai solusi mengatasi kasus imbalanced data yang terjadi pada dua kelas debitur baik dan buruk. Penelitian terkait lainnya mengenai ekstraksi informasi untuk kasus imbalanced data menyatakan bahwa KNN sensitif terhadap persentase jumlah data minoritas, dan bekerja secara baik pada distribusi data undersampling (Zhang dan Mani 2003). Tingkat akurasi dari pemodelan tersebut bergantung pada nilai k jumlah ketetanggaan. Pengembangan model KNN pada penelitian ini dapat menjadi pertimbangan bank dalam mengklasifikasikan calon debitur sehingga dapat mengurangi tingkat risiko terjadinya kredit bermasalah. Penelitian ini diharapkan dapat membantu pihak bank sebagai pertimbangan dalam mengidentifikasi debitur yang berpotensi tidak memenuhi kewajibannya tepat waktu sehingga dapat mengurangi tingkat risiko terjadinya kredit bermasalah.

14 2 Perumusan Masalah Masalah yang dianalisis dalam penelitian ini adalah : 1 Bagaimana metode KNN dapat mengklasifikasikan nasabah kartu kredit ke dalam kategori debitur baik atau debitur buruk? 2 Bagaimana akurasi, precision, recall, dan F-measure metode KNN dalam mengklasifikasikan debitur Bank X pada kasus imbalanced data? Tujuan Penelitian Penelitian ini bertujuan untuk menerapkan algoritme KNN untuk mengklasifikasikan debitur kartu kredit ke dalam kategori debitur baik atau debitur buruk pada kasus imbalanced data. Manfaat Penelitian Penelitian ini diharapkan dapat membantu pihak penerbit kartu kredit sebagai pertimbangan dalam mengidentifikasi debitur yang berpotensi tidak memenuhi kewajibannya tepat waktu sehingga dapat mengurangi tingkat risiko terjadinya kredit bermasalah. Ruang Lingkup Penelitian Data dalam penelitian ini merupakan data penelitian Setiawati (2011), yaitu data debitur Bank X mengenai status kelancaran pembayaran utang kartu kredit antara tahun 2008 dan Data yang diamati berjumlah 3895 dengan 14 atribut, 3259 termasuk ke dalam kategori debitur baik, yaitu debitur yang tepat membayar hutangnya dalam kurun waktu 90 hari serta 636 debitur buruk yang menunggak utang lebih dari 90 hari. Terdapat ketidakseimbangan data dengan jumlah data debitur yang termasuk ke dalam kategori baik mendominasi keseluruhan data. TINJAUAN PUSTAKA Risiko Kredit Menurut Undang-Undang No. 14 Tahun 1967 tentang Pokok-pokok Perbankan, yang dimaksud dengan kredit adalah penyediaan uang atau tagihantagihan berdasarkan persetujuan pinjam-meminjam antara bank dengan pihak lain dalam hal mana pihak peminjam berkewajiban melunasi utangnya setelah jangka waktu tertentu dengan jumlah bunga yang telah ditetapkan. Pada perjalanannya tidak sedikit pihak yang berhutang terlambat dalam memenuhi kewajibannya sehingga bank menderita kerugian. Berdasarkan Peraturan Bank Indonesia No.11/25/BI/2009, risiko kredit adalah risiko akibat kegagalan debitur dalam memenuhi kewajiban kepada bank. Oleh karena itu, manajemen risiko kredit

15 3 diperlukan dalam melakukan pemantauan terhadap nasabah untuk menekan kerugian. Imbalanced Data Imbalanced data merupakan keadaan data dengan salah satu kelas memiliki porsi yang tidak sebanding dengan kelas yang lainnya. Bentuk ketidakseimbangan tersebut pada beberapa data menunjukkan perbandingan yang sangat signifikan jumlah antar kelasnya, yaitu 100:1, 1000:1, bahkan ada yang mencapai :1. Hal tersebut berpengaruh pada algoritme klasifikasi yang menghasilkan akurasi prediksi yang baik pada kelas data yang memiliki jumlah instance besar atau kelas mayoritas tetapi menghasilkan akurasi prediksi yang kurang baik terhadap kelas dengan jumlah instance lebih kecil atau kelas minoritas, sehingga dapat pula terjadi penyimpangan prediksi, yaitu kelas minoritas di prediksikan ke dalam kelas mayoritas. Salah satu solusi dari masalah imbalanced data adalah penggunaan metode sampling yang dapat memberikan distribusi data seimbang untuk setiap kelas (He dan Edwardo 2009). Sampling Metode sampling untuk menangani masalah pada imbalanced data diantaranya adalah undersampling dan oversampling (He dan Edwardo 2009). Undersampling adalah proses membuang sebagian data dari kelas minoritas agar diperoleh data yang seimbang, sedangkan oversampling adalah proses menduplikasi data dari kelas minoritas untuk mendapatkan data dengan kelas yang seimbang. Dalam kasus Undersampling, dapat menyebabkan classifier melewatkan informasi penting karena sebagian data pada kelas mayoritas dihilangkan (He dan Edwardo 2009). K-Fold Cross Validation Data dalam metode k-fold cross validation akan dibagi menjadi k subset dengan ukuran yang sama. Pelatihan dan pengujian dilakukan sebanyak k kali. Pada iterasi pertama, subset 1 akan menjadi data uji, sedangkan subset 2, subset 3,..., subset k akan menjadi data latih. Proses selanjutnya, subset 2 akan menjadi data uji, subset 1, subset 3,..., subset k menjadi data latih, dan seterusnya sebanyak k iterasi (Han dan Kamber 2006). Metode evaluasi standar yang banyak digunakan adalah 10-fold cross validation. Menurut penelitian Kohavi (1995) dari berbagai percobaan menunjukkan bahwa 10-fold cross validation adalah pilihan terbaik untuk mendapatkan hasil validasi yang akurat. K-Nearest Neighbor Nilai k atau jumlah tetangga terdekat pada metode ini bergantung pada data yang digunakan. Nilai k yang tinggi akan mengurangi noise pada klasifikasi, namun akan membuat batasan antara setiap klasifikasi menjadi semakin kabur. Fungsi jarak yang umumnya digunakan adalah jarak Euclidean dengan menggunakan rumus sebagai berikut :

16 4 d(x,y) = (x i -y i ) 2 keterangan : x = x 1, x 2,..., x m adalah instance data uji y = y 1, y 2,..., y m adalah instance data latih x i -y i = kuadrat selisih data uji dan data latih Penggunaan rumus jarak Euclidean tidak tepat digunakan untuk atribut bertipe nominal. Berbeda dengan atribut pendidikan, yang termasuk atribut ordinal tetap dihitung dengan rumus perhitungan jarak Euclidean karena nilai tingkatan tinggi rendahnya pendidikan masih relevan dengan konsep perhitungan jarak Euclidean. Atribut yang bertipe nominal terlebih dahulu dilambangkan dengan nilai numerik untuk mempermudah perbandingan pengukuran jarak, kemudian digunakan fungsi sebagai berikut : n i=1 d i = 0 jika x i = y i 1 selainnya jika data latih sama dengan data uji jaraknya 0, selainnya berjarak 1 (Larose 2005). Setelah itu dilakukan penggabungan atau agregate ketidaksamaan berat rata-rata dari jarak masing-masing atribut hasil perhitungan jarak Euclidean dan atribut nominal dengan rumus sebagai berikut : S ij = n k=1 n k=1 w ijk w ijk s ijk dengan k merupakan variabel fitur, ij merupakan selisih data latih dan data uji, S ij merupakan kesamaan dan ketidaksamaan antara objek dengan W ijk bernilai 1 untuk nilai numerik dan 0.5 untuk nilai nominal (Teknomo 2006). Nilai pembobotan tersebut diberikan agar jarak atribut nominal tidak terlalu mendominasi hasil perhitungan. Normalisasi Atribut dengan nilai rentang yang cukup panjang dibandingkan dengan nilai atribut lainnya memiliki pengaruh besar terhadap atribut berskala pendek (Nurjayanti 2011). Oleh karena itu, untuk menghindari perbedaan rentang tersebut dilakukan tahap normalisasi data untuk atribut pendapatan, jumlah tanggungan, masa kerja, lama tinggal, dan umur, sehingga didapatkan range antara 0 sampai 1 menggunakan teknik min-max normalization, dengan rumus sebagai berikut (Larose 2005) : X * X - min(x) = max(x) - min(x)

17 5 Keterangan : X * = nilai setelah normalisasi X = nilai sebelum normalisasi min(x) = nilai minimum atribut max(x) = nilai maksimum dari suatu atribut Confusion Matrix Evaluasi hasil klasifikasi didapatkan dari confusion matrix pada Tabel 1 (Weng dan Poon 2008). Tabel 1 Confusion matrix dua kelas Kelas hasil prediksi Kelas aktual Kelas positif Kelas negatif Kelas positif True Positive False Negative Kelas negatif False Positive True Negative Keterangan : - True Positive (TP) adalah jumlah dari kelas positif, yaitu kelas yang mempunyai jumlah instance lebih sedikit yang benar diklasifikasikan. - False Negative (FN) adalah jumlah kelas positif yang salah diklasifikasikan dalam kelas negatif. - False Positive (FP) adalah jumlah kelas negatif yang diklasifikasikan ke dalam kelas positif. - True Negative (TN) adalah jumlah kelas negatif yang benar diklasifikasikan. Kinerja metode klasifikasi yang dijelaskan lebih lanjut berdasarkan nilai akurasi, precision, recall, dan F-measure dengan rumus berikut (Weng dan Poon 2008) : Akurasi (Ac) TP+TN Ac = TP+TN+FP+FN 100% Precision (P) Recall (R) F-Measure (F) F = P = R = TP TP+FP 100% TP TP+FN 100% 2 Recall Precision Recall + Precision 100%

18 6 METODE Kerangka Penelitian Metode pada penelitian ini memiliki beberapa tahapan yang disajikan dalam Gambar 1. Mulai Identifikasi Masalah Pengadaan Data Praproses Data 10-Fold Cross Validation Data Latih Data Uji KNN Hasil Prediksi Analisis Hasil Selesai Gambar 1 Alur penelitian

19 7 Pengadaan Data Penelitian ini menggunakan data sekunder debitur Bank X mengenai status kelancaran pembayaran utang kartu kredit tahun 2008 sampai dengan tahun Keseluruhan data asli yang belum mengalami praproses data berjumlah 4413 dengan 2 kelas, yaitu, 3574 data kelas debitur baik dan 839 data kelas debitur buruk. Terdapat ketidakseimbangan data dengan jumlah data debitur yang termasuk ke dalam kategori baik mendominasi sebesar 81% dari keseluruhan data, yang disajikan pada Gambar 2. 19% 81% Debitur baik Debitur buruk Gambar 2 Imbalanced data Praproses Data Eksplorasi data dilakukan untuk mengetahui karakteristik data serta permasalahan keberadaan missing value. Data awal berjumlah 4413 dengan 14 atribut, 7 atribut diantaranya termasuk ke dalam kategori atribut rasio, yaitu pendapatan, jumlah tanggungan, umur, masa kerja, lama tinggal, banyaknya kartu kredit lain, dan persentase utang kartu kredit lain, serta 6 atribut lainnya termasuk ke dalam kategori atribut bertipe nominal, yaitu jenis kelamin, status pekerjaan, jenis pekerjaan, tipe perusahaan, status rumah, dan status pernikahan, sedangkan pendidikan tergolong ke dalam atribut ordinal. Penghapusan data dilakukan terhadap record yang memiliki missing value dan nilai yang tidak relevan, seperti pada atribut pendapatan yang memiliki nilai minus, sehingga data yang diproses dalam penelitian ini berjumlah 3895 dengan 14 atribut, dengan 3259 termasuk ke dalam kategori debitur baik dan 636 debitur buruk. Ketidakseimbangan yang terjadi pada masing-masing kelas dengan data pada kelas kategori debitur baik memiliki jumlah yang jauh lebih besar dibandingkan dengan kategori debitur buruk, sehingga harus dilakukan modifikasi distribusi data dengan teknik oversampling dan undersampling (He dan Edwardo 2009). Dalam penelitian ini, teknik oversampling dilakukan dengan 2 cara, yaitu dengan cara membangkitkan data kelas minoritas secara acak sehingga jumlahnya sama dengan kelas mayoritas dan teknik oversampling kedua dengan mereplikasi kelas minoritas sebanyak data pada kelas mayoritas. Modifikasi distribusi data teknik undersampling dilakukan dengan mengurangi jumlah kelas mayoritas sehingga jumlahnya sama dengan kelas minoritas. Dalam penelitian ini, dilakukan 2 cara teknik undersampling. Cara pertama, data mayoritas diambil secara acak sebanyak data minoritas yang dilakukan sebanyak 3 kali percobaan. Cara kedua,

20 8 dilakukan proses clustering untuk data mayoritas sebanyak 9 kali percobaan, mulai dari 2 cluster sampai 10 cluster. Percobaan dilakukan pada setiap cluster dengan mengambil beberapa sampel dari setiap cluster yang banyaknya diperoleh dari rumus berikut : jumlah data cluster i = jumlah data kelas minoritas jumlah data kelas mayoritas Jumlah total data yang digunakan untuk teknik oversampling adalah 6518, sedangkan untuk teknik undersampling adalah 1272 data. 10-Fold Cross Validation Data dibagi menjadi data uji dan data latih secara acak dengan pemilihan 10 fold. Metode ini membagi data menjadi 10 bagian. Masing-masing bagian tersebut secara bergantian digunakan sebagai data latih dan data uji sampai dengan total 10 iterasi. Pemilihan jumlah 10 fold ini atas dasar pertimbangan jumlah data yang digunakan cukup besar, sehingga dibagi menjadi 10 bagian. Proses Klasifikasi Metode KNN Tahapan selanjutnya adalah proses klasifikasi menggunakan KNN dengan mencari jarak terdekat antara data uji dengan K tetangga terdekatnya dalam data latih. Langkah-langkah pada metode KNN adalah : 1. Menghitung jarak Euclidean untuk data numerik yang sebelumnya telah dilakukan normalisasi data. 2. Atribut nominal yang sudah dilambangkan dengan nilai numerik, dihitung jaraknya dengan membandingkan data latih dan data uji. 3. Penggabungan jarak dari hasil perhitungan jarak Euclidean dan perhitungan data atribut nominal. 4. Penentuan nilai k sebagai jumlah tetangga terdekat dalam metode KNN. Analisis Hasil Klasifikasi Kinerja metode klasifikasi dievaluasi dari hasil perhitungan akurasi, precision, recall, dan F-measure. Dalam penelitian ini, nilai akurasi, precision, recall, dan F-measure dinyatakan dalam persen, semakin tinggi persentase akurasi, precision, recall, dan F-measure, maka semakin baik kinerja metode klasifikasi. HASIL DAN PEMBAHASAN Praproses Data Berdasarkan eksplorasi data yang dilakukan, diketahui bahwa tidak semua atribut memiliki nilai yang relevan dan lengkap. Oleh karena itu, dilakukan penghapusan data terhadap instance yang memiliki missing value dan nilai yang

21 9 tidak relevan. Banyaknya instance yang tidak digunakan dalam proses klasifikasi adalah 518, sehingga sehingga data yang diproses dalam penelitian ini berjumlah 3895 dengan 14 atribut, dengan 3259 termasuk ke dalam kategori debitur baik dan 636 debitur buruk. Dari praproses data ini diketahui bahwa jumlah instance debitur baik berkurang dari 3574 menjadi 3259, sedangkan kelas debitur buruk berkurang dari 839 menjadi 636. Pada tahap praproses data diketahui pula karakteristik dari atribut, selengkapnya dapat dilihat pada Tabel 2. Tabel 2 Karakteristik atribut Rasio Nominal Ordinal 1. Pendapatan 1. Jenis kelamin 1. Pendidikan 2. Jumlah tanggungan 2. Status pekerjaan 3. Umur 3. Jenis pekerjaan 4. Masa kerja 4. Tipe perusahaan 5. Lama tinggal 5. Status rumah 6. Banyaknya kartu kredit lain 6. Status pernikahan 7. Persentase utang kartu kredit lain Hasil Klasifikasi Percobaan Data Asli Data asli yang dimaksud dalam percobaan ini adalah data yang sudah melalui tahap praproses data dan belum mengalami proses sampling, dengan 636 data minoritas merupakan kategori debitur buruk atau yang digolongkan kedalam kelas minoritas atau kelas positif dan 3259 data mayoritas merupakan debitur baik atau kelas negatif, sehingga total untuk percobaan data asli berjumlah 3895 data. Akurasi, recall, precision dan F-measure terbaik percobaan data asli dapat dilihat pada Gambar % 80% 80.87% 60% 40% 20% 42.19% 28.86% 29.81% 0% Akurasi Recall Precision F-measure Gambar 3 Hasil percobaan data asli Percobaan Oversampling Replikasi Pada percobaan ini, distribusi data minoritas akan dibangkitkan dengan cara mereplikasi kelas minoritas sehingga jumlahnya menjadi 2623 data. Data tersebut

22 10 akan digabungkan dengan 636 data asli kelas minoritas dan 3259 data asli pada kelas mayoritas sehingga jumlah total sebanyak 3259 data. Perbedaan dengan teknik oversampling acak adalah susunan data akan sama dengan data kelas minoritas karena hanya melakukan replikasi saja. Akurasi, recall, precision dan F- measure terbaik percobaan oversampling replikasi dapat dilihat pada Gambar % 96.24% 99.23% 95.21% 96.30% 80% 60% 40% 20% 0% Gambar 4 Hasil percobaan oversampling replikasi Percobaan Oversampling Acak Teknik oversampling acak dilakukan dengan cara membangkitkan data kelas minoritas sehingga jumlahnya sama dengan kelas mayoritas. Pada percobaan ini, distribusi data minoritas akan dibangkitkan secara acak sebanyak 2623 data. Data pada atribut rasio dibangkitkan dengan sampel acak, sedangkan data pada atribut nominal dibangkitkan dengan sampel acak diskret yang mempertimbangkan nilai peluang pada setiap kemunculan nilainya, 2623 data tersebut akan digabungkan dengan 636 data asli kelas minoritas dan 3259 data asli pada kelas mayoritas sehingga jumlah kelas minoritas sama dengan kelas mayoritas, yaitu sebanyak 3259 data. Akurasi, recall, precision dan F-measure terbaik percobaan oversampling acak dapat dilihat pada Gambar % 80% 60% 40% 20% Akurasi Recall Precision F-measure 84.27% 90.40% 86.23% 83.91% 0% Akurasi Recall Precision F-measure Gambar 5 Hasil percobaan oversampling acak Percobaan Undersampling Acak Proses undersampling acak dilakukan dengan mengurangi jumlah data kelas mayoritas secara acak menjadi 636 data sesuai jumlah pada kelas minoritas.

23 11 Pengurangan data dilakukan sebanyak 2623 data pada kelas mayoritas sehingga jumlahnya menjadi 636 data. Kemudian, 636 data pada kelas mayoritas tersebut digabung dengan 636 data kelas minoritas sehingga total data yang diproses adalah Akurasi, recall, precision dan F-measure terbaik percobaan undersampling acak dapat dilihat pada Gambar % 80% 77.28% 83.60% 82.86% 75.99% 60% 40% 20% 0% Akurasi Recall Precision F-measure Gambar 6 Hasil percobaan undersampling acak Percobaan Undersampling Cluster Proses clustering pada percobaan ini dilakukan untuk 3259 data kelas mayoritas dengan 9 kali percobaan clustering, yaitu data tersebut dibagi menjadi 2 cluster, 3 cluster, 4 cluster dan seterusnya sampai 10 cluster. Untuk setiap cluster tersebut akan diambil sejumlah data dari masing-masing cluster sehingga jumlahnya menjadi 636 data yang kemudian akan digabungkan dengan 636 data kelas minoritas sehingga total data adalah Akurasi, recall, precision dan F- measure terbaik percobaan undersampling cluster dapat dilihat pada Gambar % 80% 66.66% 81.45% 67.52% 68.87% 60% 40% 20% 0% Akurasi Recall Precision F-measure Gambar 7 Hasil percobaan undersampling cluster

24 12 Analisis Hasil Klasifikasi Evaluasi digunakan untuk mengukur kinerja metode klasifikasi, dalam penelitian ini digunakan untuk mengukur keakuratan metode klasifikasi yang diukur dengan akurasi, precision, recall, dan F-measure. Recall didefinisikan sebagai persentase antara data kelas debitur buruk yang dikelaskan dengan benar dan data kelas debitur buruk yang salah diprediksi ke kelas debitur baik. Precision adalah persentase dari kelas debitur buruk yang dikelaskan dengan benar dan kelas yang seharusnya termasuk kelas debitur baik tetapi dikelaskan sebagai kelas debitur buruk, sedangkan untuk F-Measure yang memiliki nilai tinggi menyatakan bahwa nilai recall dan precision juga tinggi. Berdasarkan hasil klasifikasi, diperoleh nilai akurasi percobaan pada data asli, oversampling replikasi, oversampling acak, undersampling acak dan undersampling cluster yang diperlihatkan pada Tabel 3, untuk precision, recall, dan F-measure diperlihatkan pada Tabel 4. Nilai akurasi, precision, recall, dan F- measure dinyatakan dalam persen, semakin tinggi persentase nilainya, maka semakin baik kinerja metode klasifikasi. Tabel 3 Hasil akurasi rata-rata Teknik sampling k = 1 k = 2 k = 3 k = 4 k = 5 Data asli 74.89% 67.76% 79.92% 76.46% 80.87% Oversampling replikasi 96.13% 95.73% 96.24% 95.77% 95.93% Oversampling acak 84.12% 81.28% 84.27% 82.13% 82.05% Undersampling acak 74.21% 73.42% 76.02% 74.92% 77.28% Undersampling cluster 65.18% 63.12% 65.62% 64.44% 66.66% Tabel 4 Hasil precision, recall dan F-measure Teknik sampling k = 1 k = 2 k = 3 k = 4 k = 5 Precision Data asli 23.64% 23.05% 28.86% 27.03% 27.65% Oversampling replikasi 95.21% 92.78% 94.32% 92.87% 93.80% Oversampling acak 85.07% 76.47% 86.23% 79.56% 83.75% Undersampling acak 74.21% 69.65% 79.73% 73.89% 82.86% Undersampling cluster 65.18% 59.70% 66.09% 61.91% 67.52% Recall Data asli 23.83% 42.19% 15.91% 26.61% 10.64% Oversampling replikasi 97.13% 99.23% 98.36% 99.14% 98.38% Oversampling acak 82.78% 90.40% 81.53% 86.54% 79.58% Undersampling acak 72.23% 83.60% 70.57% 76.88% 68.42% Undersampling cluster 64.88% 81.45% 64.44% 76.37% 65.20% F-Measure Data asli 23.73% 29.81% 20.52% 26.82% 15.36% Oversampling replikasi 96.16% 95.90% 96.30% 95.90% 96.04% Oversampling acak 83.91% 82.85% 83.82% 82.91% 81.61% Undersampling acak 73.65% 75.99% 74.87% 75.36% 74.95% Undersampling cluster 65.12% 68.87% 65.24% 68.32% 66.29%

25 Berdasarkan Tabel 3 dan Tabel 4, dapat diketahui bahwa hasil klasifikasi pada data asli tidak lebih baik dari hasil klasifikasi pada data yang sudah mengalami modifikasi distribusi data. Akurasi pada percobaan data asli diperoleh sebesar 80.87% untuk k = 5. Namun, nilai precision, recall, dan F-measure yang dihasilkan dari percobaan data asli tidak sebaik hasil akurasinya. Precision tertinggi diperoleh ketika nilai k =3 yaitu sebesar 28.86%, sementara itu recall dan F-measure tertinggi diperoleh ketika nilai k = 2, yaitu sebesar 42.19% dan 29.81%. Hal tersebut terjadi karena distribusi data pada kelas mayoritas yang jumlahnya lima kali lebih besar dibandingkan kelas minoritas terlalu mendominasi keseluruhan data, padahal yang menjadi fokus penelitian ini adalah data minoritas, yaitu data debitur kategori buruk. Ketika percobaan metode distribusi data undersampling dengan clustering diterapkan pada data kelas debitur baik, jarak antara satu instance dengan instance yang lain diukur kedekatannya pada saat proses clustering sehingga diperoleh akurasi yang cukup stabil untuk percobaan dengan nilai k = 1 sampai dengan k = 5. Hasil undersampling cluster pada Tabel 4 merupakan hasil rata-rata dari percobaan yang dilakukan pada data yang sudah melalui proses clustering 2 cluster sampai dengan 10 cluster. Akurasi tertinggi diperoleh ketika nilai k = 5 yaitu sebesr 66.66%, sedangkan untuk nilai precision tertinggi sebesar 67.52% ketika nilai k = 5, recall tertinggi sebesar 81.45% untuk nilai k = 2 serta F- measure tertinggi sebesar 68.87% untuk nilai k = 2. Hasil undersampling acak yang diperoleh dari rata-rata 3 kali percobaan memiliki nilai akurasi, precision, recall, dan F-measure lebih baik jika dibandingkan dengan hasil pada undersampling cluster. Akurasi tertinggi diperoleh ketika nilai k = 5 yaitu sebesar 77.28%, sedangkan untuk nilai precision tertinggi sebesar 82.86% ketika nilai k = 5, recall tertinggi sebesar 83.60% untuk nilai k = 2 serta F-measure tertinggi sebesar 75.99% untuk nilai k = 2. Berdasarkan Tabel 3 dan Tabel 4, dapat diketahui untuk evaluasi nilai akurasi yang tertinggi diperoleh dari percobaan data oversampling replikasi dengan nilai k =1 yaitu sebesar 96,13%. Begitu juga dengan hasil akurasi oversampling acak yang masih lebih unggul dibandingkan dengan modifikasi distribusi data undersampling yaitu sebesar 84.27% untuk nilai k = 3. Namun, akurasi dapat mengalami penurunan seiring bertambahnya nilai k. Keunggulan distribusi data dengan teknik oversampling dibuktikan pula dengan hasil precision, recall, dan F-measure, yaitu sebesar 95.21% ketika nilai k = 1, 99.23% ketika nilai k = 2, 96.30% ketika nilai k =3 untuk oversampling replikasi dan 86.23% ketika nilai k = 3, 90.40% ketika nilai k = 2, 83.91% ketika nilai k = 1 untuk oversampling acak. Dari beberapa teknik distribusi data yang diujikan, diketahui bahwa data yang didistribusikan melalui teknik oversampling memiliki nilai akurasi, precision, recall, dan F-measure lebih baik. Jika dikaitkan dengan konsep algoritme KNN yang merepresentasikan data dalam k ruang dimensi serta mengklasifikasikan data berdasarkan ukuran kedekatan jarak, pada percobaan data oversampling, data minoritas yang jumlahnya jauh lebih sedikit dibangkitkan dan ketika sebuah data uji dihitung kedekatannya dengan titik lain pada data latih, kemungkinan data tersebut membandingkan jarak dengan dirinya sendiri, sehingga berdampak juga pada hasil confusion matrix. 13

26 14 Perbandingan dengan Penelitian Sebelumnya Jika dibandingkan dengan penelitian sebelumnya yang dilakukan oleh Natasia (2013), terjadi perbedaan yang cukup tinggi untuk tingkat akurasi, precision, recall, dan F-measure yang perlihatkan dalam Tabel 5. Penelitian tersebut dilakukan pada data dan jumlah atribut yang sama, namun dengan pendekatan berbeda, yaitu dari sisi algoritme VFI5 tanpa melakukan modifikasi distribusi data kelas minoritas maupun kelas mayoritas dalam mengatasi kasus imbalanced data. Tabel 5 Perbandingan dengan penelitian lain Pendekatan Akurasi Recall Precision F-Measure Model % 40.63% 21.14% 27.81% Algoritme Model % 46.88% 24.69% 32.81% Model % 38.58% 24.38% 29.88% Data asli 80.87% 42.19% 28.86% 29.81% Oversampling replikasi 96.24% 99.23% 95.21% 96.30% Sampling Oversampling acak 84.27% 90.40% 86.23% 83.91% Undersampling acak 77.28% 83.60% 82.86% 75.99% Undersampling cluster 66.66% 81.45% 67.52% 68.87% Keterangan : Model 1 : model VFI5 menggunakan semua fitur Model 2 : model VFI5 menggunakan semua fitur berakurasi > 50% (best subset regression) Model 3 : model VFI5 hasil pemilihan fitur bertahap (forward selection) Sampling : metode KNN Dalam penelitian tersebut, dibuat 3 model VFI5, yaitu model 1 menggunakan semua fitur meghasilkan nilai akurasi, precision, recall, dan F- measure sebesar 65.30%, 40.63%, 21.14%, dan 27.81%. Sementara itu, untuk model 2 menggunakan fitur dengan akurasi kurang dari 50% menggunakan metode best subset regression, menghasilkan nilai masing-masing sebesar 67.74%, 46.88%, 24.69%, dan 32.35%, sedangkan model 3 merupakan hasil pemilihan fitur bertahap dengan hasil akurasi 70.40%, precision 38.58%, recall 24.38%, dan F-measure 29.88%. Hasil akurasi, precision, recall, dan F-measure dari ketiga model tersebut tidak jauh berbeda dengan percobaan data asli pada pendekatan sampling untuk klasifikasi dengan metode KNN. Pada percobaan menggunakan data asli akurasi tertinggi didapat ketika nilai k = 5 yaitu sebesar 80.87%, untuk recall tertinggi yaitu sebesar 42.19% saat k = 2, precision tertinggi sebesar 28.86% ketika k = 3 dan nilai F-measure tertinggi didapat ketika nilai k =

27 15 2 yaitu sebesar 29.81%. Dari hasil tersebut dapat diketahui bahwa percobaan pada data asli menggunakan metode KNN memiliki nilai akurasi, precision, recall, dan F-measure yang lebih baik dari ketiga model menggunakan metode VFI5. Jika hasil percobaan dengan metode VFI5 tersebut dibandingkan dengan hasil percobaan pada data yang sudah mengalami modifikasi dengan teknik oversampling dan undersampling, hasil evaluasi memiliki perbedaan yang cukup besar. Perbedaan yang sangat sigifikan terlihat pada hasil percobaan oversampling replikasi dengan nilai akurasi 96.24% ketika k = 3, nilai recall 99.23% ketika k = 2, nilai precision 95.21% ketika k = 1, dan nilai F-measure sebesar 96.30% ketika k = 3. Teknik modifikasi distribusi data oversampling dan undersampling menghasilkan nilai akurasi, precision, recall, dan F-measure yang lebih baik, tetapi jika dilihat dari sisi algoritme, VFI5 memiliki keunggulan untuk waktu pelatihan dan klasifikasi yang lebih singkat jika dibandingkan dengan metode KNN. SIMPULAN DAN SARAN Simpulan Berdasarkan penelitian yang telah dilakukan dengan metode KNN dapat diperoleh kesimpulan sebagai berikut : 1. Percobaan menggunakan data asli menghasilkan akurasi tertinggi ketika k = 5 yaitu sebesar 80.87% serta recall tertinggi sebesar 42.19% ketika k = 2, precision tertinggi sebesar 28.86% ketika k = 3 dan F-measure tertinggi sebesar 29.81% ketika k = Percobaan menggunakan data oversampling replikasi menghasilkan nilai akurasi yang baik, yaitu sebesar 96.24% ketika k =3. Hasil yang baik ditunjukan pula pada recall, precision, dan F-measure dengan nilai masingmasing sebesar 99.23% ketika k = 2, 95.21% ketika k = 1, dan 96.30% ketika k = Percobaan menggunakan data oversampling acak menghasilkan akurasi tertinggi ketika k = 3, yaitu sebesar 84.27%, untuk nilai recall, precision, dan F-measure data minoritas diperoleh hasil sebesar 90.40% ketika k = 2, 86.23% ketika k = 3, dan 83.91% ketika k = Percobaan menggunakan data undersampling acak menghasilkan akurasi tertinggi sebesar 77.28% ketika k = 5, untuk recall, precision, dan F-measure dengan nilai masing masing sebesar 83.60% ketika k = 2, 82.86% ketika k = 5, dan 75.99% ketika k = Percobaan menggunakan data undersampling cluster menghasilkan akurasi tertinggi sebesar 66.66% ketika k = 5, untuk recall, precision, dan F-measure dengan nilai masing-masing sebesar 81.45% ketika k = 2, 68.87% ketika k = 5, dan 68.87% ketika k = 2. Berdasarkan percobaan klasifikasi dengan KNN diketahui bahwa sampel yang sudah mengalami modifikasi distribusi data melalui teknik oversampling dan undersampling memiliki nilai akurasi, precision, recall, dan F-measure lebih baik dibandingkan dengan data asli yang belum mengalami modifikasi. Hasil percobaan terbaik diperoleh dari percobaan teknik oversampling replikasi,

28 16 sehingga dapat disimpulkan bahwa modifikasi distribusi data pada kasus imbalance data dapat meningkatkan kinerja klasifikasi dengan metode KNN. Saran Pada penelitian selanjutnya diharapkan dapat dilakukan percobaan dengan teknik sampling lain seperti SMOTE (synthetic minority oversampling technique) dalam mengatasi imbalanced data, serta algoritme modifikasi KNN, seperti weighted KNN. DAFTAR PUSTAKA Bank Indonesia Daftar penerbit kartu kredit. [diunduh 2013 Maret 18]. Tersedia pada: Han J, Kamber M Data Mining Concept and Tehniques. San Fransisco (US): Morgan Kauffman. He H, Edwardo AG Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering. 21(9): Kohavi R A study of cross validation and bootstrap for accuracy estimation and model selection. Di dalam: Proceedings of the International Joint Conference on Articial Intelligence (IJCAI). 2: Larose DT Discovering Knowledge in Data : An Introduction to Data Mining. Canada (US) : John Wiley & Sons, Inc. Natasia SR Klasifikasi debitur kartu kredit dengan pemilihan fitur menggunakan Voting Feature Intervals 5 [skripsi]. Bogor (ID): Institut Pertanian Bogor. Nurjayanti B Identifikasi shorea menggunakan K-Nearest Neighbour berdasarkan karakteristik morfologi daun [skripsi]. Bogor (ID): Institut Pertanian Bogor. Sayono JA, Sumarwan U, Achsani NA, Hartoyo Analisis faktor-faktor yang mempengaruhi kepemilikan, penggunaan, pembayaran, dan peluang terjadinya gagal bayar dalam bisnis kartu kredit. Jurnal Ekonomi dan Bisnis. 3 (1): Setiawati PA Penelusuran banyaknya unit dan lapisan tersembunyi jaringan saraf tiruan pada data tidak seimbang [skripsi]. Bogor (ID): Institut Pertanian Bogor. Tan PN, Steinbach M, Kumar V Introduction to Data Mining. Boston (US): Pearson Education. Teknomo K Similarity measurement. [diunduh 2012 Des 9]. Tersedia pada : Weng CG, Poon J A new evaluation measure for imbalanced datasets. Di dalam: Proceedings of the 7th Australasian Data Mining Conference. 87: Zhang J, Mani I knn Approach do Unbalanced Data distributif : A Case Study involving Information Extraction*. Workshop on Learning krom Imbalanced datasets II ICML. Washington DC (US).

29 17 Lampiran 1 Daftar atribut Jenis Atribut Nama Atribut Keterangan Rasio Nominal Ordinal Pendapatan Masa Kerja Lama Tinggal Jumlah Tanggungan Umur Banyaknya Kartu Kredit Lain Persentase Utang Kartu Kredit Lain Jenis Kelamin Status Pekerjaan Jenis Pekerjaan Tipe Perusahaan Status Rumah Status Pernikahan Pendidikan Status Dalam rupiah per tahun Dalam bulan Dalam bulan Jumlah orang Dalam tahun Dalam persen 1 = Pria 2 = Wanita 1 = Permanen 2 = Kontrak 1 = Conversion 2 = Pegawai Negeri Sipil 3 = Profesional 4 = Wiraswasta 5 = Perusahaan swasta 1 = Kontraktor 2 = Conversion 3 = Industri Berat 4 = Pertambangan 5 = Jasa 6 = Transportasi 0 = Bukan rumah sendiri 1 = Milik sendiri 1 = Lajang 2 = Menikah 3 = Bercerai 1 = SMP/SMA 2 = Akademi 3 = S1/S2 1 = Debitur Buruk 2 = Debitur Baik

30 18 Lampiran 2 Nilai akurasi undersampling acak k = 1 k = 2 k = 3 k = 4 k = 5 Undersampling acak Undersampling acak Undersampling acak Lampiran 3 Nilai precision undersampling acak k = 1 k = 2 k = 3 k = 4 k = 5 Undersampling acak Undersampling acak Undersampling acak Lampiran 4 Nilai recall undersampling acak k = 1 k = 2 k = 3 k = 4 k = 5 Undersampling acak Undersampling acak Undersampling acak Lampiran 5 Nilai F-measure undersampling acak k = 1 k = 2 k = 3 k = 4 k = 5 Undersampling acak Undersampling acak Undersampling acak

31 19 Lampiran 6 Akurasi undersampling cluster 2 sampai cluster 10 k = 1 k = 2 k = 3 k = 4 k = 5 Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Rata-rata Lampiran 7 Precision undersampling cluster 2 sampai cluster 10 k = 1 k = 2 k = 3 k = 4 k = 5 Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Rata-rata Lampiran 8 Recall undersampling cluster 2 sampai cluster 10 k = 1 k = 2 k = 3 k = 4 k = 5 Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Rata-rata

32 20 Lampiran 9 F-measure undersampling cluster 2 sampai cluster 10 k = 1 k = 2 k = 3 k = 4 k = 5 Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Undersampling cluster Rata-rata Keterangan : nilai akurasi, recall, precision dan F-measure dinyatakan dalam persen.

33 21 RIWAYAT HIDUP Penulis dilahir di Indramayu pada tanggal 27 Juli 1991 sebagai anak kedua dari pasangan Bapak Moh. Hariri dan Ibu Suparti. Pada tahun 2009 penulis lulus dari SMA Negeri 1 Sindang Indramayu kemudian melanjutkan pendidikan jenjang S1 sebagai mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor pada tahun yang sama melalui jalur USMI. Selama menjalani perkuliahan, penulis aktif dalam berbagai kepanitiaan, diantaranya kegiatan masa perkenalan mahasiswa baru angkatan 47 untuk divisi sponsorship, serta kepanitiaan IT TODAY divisi dekorasi dan dokumentasi yang diselenggarakan oleh Himalkom pada tahun 2011 dan Selain itu, penulis menjalani praktek kerja lapangan di Divisi Teknologi Perangkat Lunak PT Dirgantara Indonesia, Bandung pada bulan Juni sampai Agustus Dalam kompetisi Pekan Kreativitas Mahasiswa bidang Karsa Cipta, penulis bersama tim I-Blood Bank berhasil terpilih sebagai salah satu tim yang didanai DIKTI untuk merealisasikan sistem informasi persediaan darah di PMI pada tahun 2013.

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA

KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik Morfologi dan Tingkah Laku

Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik Morfologi dan Tingkah Laku Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 4 Nomor 1 halaman 6-13 ISSN: 2089-6026 Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

KLASIFIKASI BAHAN PANGAN BERDASARKAN KANDUNGAN ZAT GIZI BAHAN PANGAN MENGGUNAKAN FUZZY K-NEAREST NEIGHBOR ANISAUL MUAWWANAH

KLASIFIKASI BAHAN PANGAN BERDASARKAN KANDUNGAN ZAT GIZI BAHAN PANGAN MENGGUNAKAN FUZZY K-NEAREST NEIGHBOR ANISAUL MUAWWANAH KLASIFIKASI BAHAN PANGAN BERDASARKAN KANDUNGAN ZAT GIZI BAHAN PANGAN MENGGUNAKAN FUZZY K-NEAREST NEIGHBOR ANISAUL MUAWWANAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI

SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4725 Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel Handling Imbalanced Data

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1  Abstract Penerapan K-Optimal Pada Algoritma Knn untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Ilmu Komputer Fmipa Unlam Berdasarkan IP Sampai Dengan Semester 4 Mutiara Ayu Banjarsari 1, H. Irwan

Lebih terperinci

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine. ABSTRAK Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Metode Klasifikasi Data Mining dan Teknik Sampling Smote... METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Hairani

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Klasifikasi merupakan salah satu bidang kajian pada machine learning. Klasifikasi adalah proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep

Lebih terperinci

BAB I PENDAHULUAN. Dalam dunia perbankan, bank bertindak sebagai kreditur, di mana bank memberikan

BAB I PENDAHULUAN. Dalam dunia perbankan, bank bertindak sebagai kreditur, di mana bank memberikan 1 BAB I PENDAHULUAN A. Latar Belakang Dalam dunia perbankan, bank bertindak sebagai kreditur, di mana bank memberikan bantuan kepada nasabah yang membutuhkan pinjaman dengan memberikan kredit pinjaman.

Lebih terperinci

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) SKRIPSI Disusun Oleh : DESY RATNANINGRUM 24010211140097 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Muh. Safri Juliardi Program Studi Informatika Universitas Sebelas Maret Jl. Ir. Sutami No. 36 A Surakarta juliardi@student.uns.ac.id

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA

KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor PENGENALAN KADAR TOTAL PADAT TERLARUT PADA BUAH BELIMBING BERDASAR CITRA RED-GREEN-BLUE MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS (PCA) SEBAGAI EKSTRAKSI CIRI DAN KLASIFIKASI K-NEAREST NEIGHBORHOOD (KNN)

Lebih terperinci

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman Online di:

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman Online di: ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman 161-170 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian ANALISIS CREDIT SCORING MENGGUNAKAN METODE BAGGING K-NEAREST

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Jurnal Teknik Komputer Unikom Komputika Volume 3, No.2-2014 TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Selvia Lorena Br Ginting 1), Wendi Zarman

Lebih terperinci

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 1 PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 Dina Maurina, Ahmad Zainul Fanani S.Si, M.Kom Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Penelitian mengenai pengenalan wajah termotivasi oleh banyaknya aplikasi praktis yang diperlukan dalam identifikasi wajah. Pengenalan wajah sebagai salah satu dari teknologi

Lebih terperinci

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian Implementasi Sistem Clustering FCM diimplementasikan pada program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Tahap implementasi sistem mengikuti langkahlangkah melakukan clustering dengan FCM,

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED Studi Kasus Perilaku Seksual Remaja di Indonesia Hasil SDKI 2012 Yogo Aryo Jatmiko 1, Septiadi Padmadisastra 2, Anna Chadidjah 3 Prodi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan:

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : D22.5411 / Healthcare Datamng Revisi 1 Satuan Kredit Semester : 2 sks Tgl revisi : 1 Agustus 2014 Jml Jam kuliah dalam seminggu

Lebih terperinci

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Chandra Purnamaningsih Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami No 36 A Surakarta cpurnamaningsih@gmail.com

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

IDENTIFIKASI VARIETAS DURIAN BERDASARKAN TEKSTUR DAUN MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN CIRI STATISTICAL TEXTURES ROSITA TRI INDRATI

IDENTIFIKASI VARIETAS DURIAN BERDASARKAN TEKSTUR DAUN MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN CIRI STATISTICAL TEXTURES ROSITA TRI INDRATI IDENTIFIKASI VARIETAS DURIAN BERDASARKAN TEKSTUR DAUN MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN CIRI STATISTICAL TEXTURES ROSITA TRI INDRATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

ii

ii KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun

Lebih terperinci

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data Setelah dilakukan analisis clustering maka algoritme tersebut akan dibandingkan berdasarkan cluster yang terbentuk dari hasil analisis cluster-nya. Hasil perbandingan diharapkan dapat membuktikan bahwa

Lebih terperinci

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA Yasinta Agustyani, Yuliana Susanti, dan Vika Yugi Program Studi Matematika Fakultas

Lebih terperinci

ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS

ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) Meriska Defriani 1, Noviyanti 2 1 STT Wastukancana 2 Teknik Informatika,

Lebih terperinci

EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA

EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009 EKSPLORASI

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI

PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2016 PERNYATAAN

Lebih terperinci

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0 PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C.0 Rachma Fauzia Azhary, Isnandar Slamet, Supriyadi Wibowo Program Studi Matematika Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG Andri 1), Yesi Novaria Kunang 2), Sri Murniati 3) 1,2,3) Jurusan Sistem Informasi Universitas

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

Perbandingan Metode Ekstraksi Ciri Histogram dan PCA untuk Mendeteksi Stoma pada Citra Penampang Daun Freycinetia

Perbandingan Metode Ekstraksi Ciri Histogram dan PCA untuk Mendeteksi Stoma pada Citra Penampang Daun Freycinetia Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 20-28 ISSN: 2089-6026 Perbandingan Metode Ekstraksi Ciri Histogram dan PCA untuk Mendeteksi Stoma pada Citra

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Deposito merupakan salah satu tabungan berjangkaayangamodel pengambilannya berdasarkan pada kesepakatan dari pihak bank dengan nasabah deposito [1].Suku bunga

Lebih terperinci

ABSTRACT. Keywords : Shorea, k-nearest Neighbour. iii

ABSTRACT. Keywords : Shorea, k-nearest Neighbour. iii ABSTRACT BRYAN NURJAYANTI. Identification Using k-nearest Neighbour Based on Morphological Characteristics of Leaves. Supervised by AZIZ KUSTIYO. Dipterocarpaceae is a group of tropical plants that is

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

2. Data & Proses Datamining

2. Data & Proses Datamining 2. Data & Proses Datamining Data 1. Input (Dataset) 2. Pengolahan Data Awal 3. Metode Learning Tahapan Utama Proses Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/ Knowledge)

Lebih terperinci

PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) ABSTRAK

PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) ABSTRAK PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) Atik Pawestri Sulistyo 1, Aziz Kustiyo 1, Agus Buono 2 1 Departemen Ilmu Komputer, Fakultas Matematika dan IPA Institut Pertanian

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : 56601 / Data Warehouse dan Data Mng Revisi 1 Satuan Kredit Semester : 3 sks Tgl revisi : 1 September 2014 Jml Jam kuliah

Lebih terperinci

BAB IV EKSPERIMEN. 4.1 Tujuan

BAB IV EKSPERIMEN. 4.1 Tujuan BAB IV EKSPERIMEN Pada bab ini dibahas mengenai eksperimen penggunaan SVM dalam pendeteksian intrusi pada jaringan. Pembahasan ini meliputi tujuan yang ingin dicapai melalui eksperimen ini, parameter evaluasi

Lebih terperinci

PENERAPAN DATA MINING KLASIFIKASI DENGAN MENGGUNAKAN ALGORITNMA C 4.5 PADA DATA NASABAH KREDIT KOPERASI SIMPAN PINJAM GRAHA MANDIRI TEGAL

PENERAPAN DATA MINING KLASIFIKASI DENGAN MENGGUNAKAN ALGORITNMA C 4.5 PADA DATA NASABAH KREDIT KOPERASI SIMPAN PINJAM GRAHA MANDIRI TEGAL PENERAPAN DATA MINING KLASIFIKASI DENGAN MENGGUNAKAN ALGORITNMA C 4.5 PADA DATA NASABAH KREDIT KOPERASI SIMPAN PINJAM GRAHA MANDIRI TEGAL Yunita Handayani Utoyo 1, Yuniarsi Rahayu 2 Univeritas Dian Nuswantoro,

Lebih terperinci

ALGORITMA K-NEAREST NEIGHBOR BERBASIS FORWARD SELECTION UNTUK MENDIAGNOSIS PENYAKIT JANTUNG KORONER

ALGORITMA K-NEAREST NEIGHBOR BERBASIS FORWARD SELECTION UNTUK MENDIAGNOSIS PENYAKIT JANTUNG KORONER KOMPUTAKI Vol.3, No.1 Februari 2017 ALGORITMA K-NEAREST NEIGHBOR BERBASIS FORWARD SELECTION UNTUK MENDIAGNOSIS PENYAKIT JANTUNG KORONER Achmad Nuruddin Safriandono email : udinozz@gmail.com Abstrak K-Nearest

Lebih terperinci

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes

Lebih terperinci

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 3 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2015 Definisi Set Data Set Data / Data Set / Himpunan Data Kumpulan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA

PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

PENDUGAAN PARAMETER BEBERAPA SEBARAN POISSON CAMPURAN DAN BEBERAPA SEBARAN DISKRET DENGAN MENGGUNAKAN ALGORITME EM ADE HARIS HIMAWAN

PENDUGAAN PARAMETER BEBERAPA SEBARAN POISSON CAMPURAN DAN BEBERAPA SEBARAN DISKRET DENGAN MENGGUNAKAN ALGORITME EM ADE HARIS HIMAWAN PENDUGAAN PARAMETER BEBERAPA SEBARAN POISSON CAMPURAN DAN BEBERAPA SEBARAN DISKRET DENGAN MENGGUNAKAN ALGORITME EM ADE HARIS HIMAWAN SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN

Lebih terperinci

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA Harry Dhika 1), Tri Yani Akhirina 2), Surajiyo 3) 1), 2),3) Teknik Informatika Universitas Indraprasta PGRI Jl Nangka No. 58B, Jakarta, DKI Jakarta 12530 Email

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA Laily Hermawanti Program Studi Teknik Informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro No. 1B

Lebih terperinci

ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI

ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ZK. Abdurahman Baizal 1, Moch. Arif Bijaksana 2, Angelina Sagita Sastrawan 3 Telp (022)7564108 ext 2298 Fax

Lebih terperinci

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak DATA MINING MELIHAT POLA HUBUNGAN NILAI TES MASUK MAHASISWA TERHADAP DATA KELULUSAN MAHASISWA UNTUK MEMBANTU PERGURUAN TINGGI DALAM MENGAMBIL KEBIJAKAN DALAM RANGKA PENINGKATAN MUTU PERGURUAN TINGGI Timor

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Pendahuluan Sebelum melakukan pembahasan mengenai permasalahan dari skripsi ini, akan diuraikan beberapa teori penunjang antara lain: Kredit Macet, Regresi Logistik, Model Terbaik

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Perkembangan teknologi sekarang ini semakin pesat. Kebutuhan akan informasi dan komunikasi bertambah. Telah ditemukan berbagai perangkat teknologi yang memudahkan manusia

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 1, Januari 2018, hlm. 184-189 http://j-ptiik.ub.ac.id Klasifikasi Standar Produk Baja PT. Krakatau Steel (Persero)

Lebih terperinci

Bulu mata. Generalisasi= Jumlah pola dikenali dengan benar x 100% Jumlah total pola

Bulu mata. Generalisasi= Jumlah pola dikenali dengan benar x 100% Jumlah total pola Generalisasi Hasil penelitian ini diukur menggunakan nilai konvergen dan generalisasi. Nilai konvergen adalah tingkat kecepatan jaringan untuk mempelajari pola input yang dinyatakan dalam satuan iterasi

Lebih terperinci

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

PENENTUAN PARAMATER PADA ALGORITMA KLASIFIKASI K-NEAREST NEIGHBOR BERBASIS ALGORITMA GENETIKA

PENENTUAN PARAMATER PADA ALGORITMA KLASIFIKASI K-NEAREST NEIGHBOR BERBASIS ALGORITMA GENETIKA PENENTUAN PARAMATER PADA ALGORITMA KLASIFIKASI K-NEAREST NEIGHBOR BERBASIS ALGORITMA GENETIKA Karno Pusat Inovasi, Lembaga Ilmu Pengetahuan Indonesia Jln. Raya Jakarta-Bogor Km. 47 Cibinong 16912, Bogor,

Lebih terperinci

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci