ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai Salah Satu Persyaratan Guna Memperoleh Gelar Sarjana Sains Disusun oleh: Ahadiyah Nurul Kholifah 12305144027 PROGRAM STUDI MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI YOGYAKARTA 2016 i
PERSETUJUAN ii
PENGESAHAN iii
SURAT PERNYATAAN iv
MOTTO Waktu itu bagaikan pedang, jika kamu tidak memanfaatkannya menggunakan untuk memotong, ia akan memotongmu (menggilasmu) (H.R. Muslim) Janganlah meminta bukti bahwa doamu akan dijawab oleh Tuhan,tapi buktikanlah kesungguhan dari doamu. Kegagalan hanya terjadi bila kita menyerah When action is equivalent to success v
PERSEMBAHAN Kupersembahkan karya kecil ini untuk Ibunda Murwantini dan Ayahanda Mulyono tercinta yang senantiasa mendo akan dan memberi motivasi Saudara-saudaraku tercinta, Shofiyah dan Emy Tamaroh terimakasih atas dukungan dan nasihatnya Keponakan terganteng Ahmad Zaky Abyan Teman-teman Matswa 12 UNY dan seluruh teman-teman yang tak bisa disebutkan satu persatu, trimakasih atas do a dan dukungannya. vi
ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES Oleh: Ahadiyah Nurul Kholifah NIM.12305144027 ABSTRAK Salah satu penyebab kredit bermasalah adalah kurang telitinya pihak koperasi dalam survei dan analisis pemberian kredit. Hal tersebut dapat diminimalisir dengan analisis kredit menggunakan teknik data mining. Teknik data mining yang digunakan pada penelitian ini untuk klasifikasi kredit lancar dan bermasalah dengan menerapkan metode decision tree C4.5 dan naïve bayes. Dari penerapan kedua metode dapat diketahui perbandingan model klasifikasi yang dihasilkan dengan melihat tingkat akurasi masing-masing metode. Pada penelitian ini sumber data yang digunakan adalah data peminjam kredit Koperasi X tahun 2011-Maret 2016 dan data laporan nominatif pinjaman perbulan tahun 2014-Maret 2016 yang berjumlah 1076 data, setelah dilakukan preprocessing diperoleh data yang siap diolah berjumlah 979 data. Proses pembentukan model dibantu dengan software WEKA menggunakan klasifikasi decision tree C4.5 dan naïve bayes. Hasil pengujian model klasifikasi decision tree C4.5 menggunakan use training set, 10-fold cross validation, dan percentage split berurutan sebesar 71,91%, 68,03%, dan 66,84%, sedangkan pada naïve bayes sebesar 67,01%, 64,66%, dan 65,82%. Waktu komputasi klasifikasi decision tree C4.5 dengan beberapa model tes sebesar 0,25 detik, 0,14 detik, dan 0,02 detik, sedangkan pada naïve bayes sebesar 0,01 detik, mendekati 0 detik, dan mendekati 0 detik. Decision tree C4.5 memberikan tingkat akurasi lebih baik, namun untuk waktu komputasi, naïve bayes lebih baik. Kata kunci: data mining, decision tree C4.5, naïve bayes, data kredit, software WEKA vii
KATA PENGANTAR Alhamdulillah, puji syukur penulis panjatkan kehadirat Allah SWT atas limpahan rahmat, karunia, dan hidayah-nya sehingga penulis mampu menyelesaikan tugas akhir skripsi yang berjudul Analisis Klasifikasi Pada Nasabah Kredit Koperasi X Menggunakan Decission Tree C4.5 dan Naïve Bayes. Tugas akhir ini disusun sebagai salah satu syarat untuk memperoleh gelar sarjana sains pada Program Studi Matematika Jurusan Pendidikan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Negeri Yogyakarta. Penulis menyadari sepenuhnya bahwa dalam penulisan skripsi ini tidak lepas dari dukungan, motivasi, kerjasama maupun bimbingan dari berbagai pihak. Oleh karena itu, penulis menyampaikan terima kasih kepada: 1. Prof. Dr. Rochmat Wahab, M.Pd., MA., selaku Rektor Universitas Negeri Yogyakarta. 2. Dr. Hartono, M.Si. selaku Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta. 3. Dr. Ali Mahmudi, M.Pd. selaku Ketua Jurusan Pendidikan Matematika FMIPA Universitas Negeri Yogyakarta. 4. Dr. Agus Maman Abadi, M.Si. selaku Ketua Program Studi Matematika FMIPA Universitas Negeri Yogyakarta. 5. Bapak Kus Prihantoso K, M.Si. selaku Penasehat Akademik yang telah memberi arahan, dukungan dan motivasi. viii
ix
DAFTAR ISI HALAMAN JUDUL... i HALAMAN PERSETUJUAN... ii HALAMAN PENGESAHAN... iii HALAMAN PERNYATAAN... iv HALAMAN MOTTO... v HALAMAN PERSEMBAHAN... vi ABSTRAK... vii KATA PENGANTAR... viii DAFTAR ISI... x DAFTAR TABEL... xii DAFTAR GAMBAR... xiii DAFTAR LAMPIRAN... xiv BAB I PENDAHULUAN... 1 A. Latar Belakang... 1 B. Rumusan Masalah... 4 C. Batasan Masalah... 4 D. Tujuan Penelitian... 5 E. Manfaat Penelitian... 5 BAB II KAJIAN TEORI... 7 A. Kredit... 7 B. Basis Data (Database)... 11 C. Penambangan Data (Data Mining)... 13 D. Klasifikasi... 18 1. Pohon Keputusan (Decision Tree)... 21 2. Naïve Bayes... 33 E. Pengujian dan Evaluasi Model... 38 F. Waikato Environment for Knowledge (WEKA)... 40 G. Penelitian yang Relevan... 44 x
BAB III PEMBAHASAN... 46 A. Sumber Data... 46 B. Pembersihan Data (Data Cleaning) dan Integrasi Data (Data Integration)...48 C. Seleksi Data (Data Selection) dan Transformasi Data (Data Transformation)... 50 D. Proses Klasifikasi Menggunakan Decision Tree C4.5... 56 E. Proses Klasifikasi Menggunakan Naïve Bayes... 72 F. Pengujian Model... 80 BAB IV KESIMPULAN DAN SARAN... 83 A. Kesimpulan... 83 B. Saran... 84 DAFTAR PUSTAKA... 85 LAMPIRAN... 87 xi
DAFTAR TABEL Tabel 2.1 Banyaknya Kelas pada Tupel D... 26 Tabel 2.2 Contoh Perhitungan Info(D)... 27 Tabel 2.3 Kelas Tupel D Berdasarkan Partisi Atribut A... 27 Tabel 2.4 Keputusan Membeli Komputer... 30 Tabel 2.5 Kelas Membeli Komputer... 30 Tabel 2.6 Kelas Membeli Komputer Berdasarkan Partisi Atribut Age... 31 Tabel 2.7 Tabel Confusion Matrix Dua Kelas... 39 Tabel 3.1 Transformasi Atribut Umur... 50 Tabel 3.2 Transformasi Atribut Pendapatan Keluarga... 51 Tabel 3.3 Transformasi Atribut Pengeluaran Keluarga... 51 Tabel 3.4 Transformasi Atribut Pinjaman... 51 Tabel 3.5 Transformasi Atribut Kemampuan Angsuran %... 51 Tabel 3.6 Transformasi Atribut Jangka Waktu... 52 Tabel 3.7 Transformasi Atribut Nilai Jaminan... 52 Tabel 3.8 Transformasi Atribut Pekerjaan... 52 Tabel 3.9 Transformasi Atribut Pekerjaan Suami/Istri... 53 Tabel 3.10 Transformasi Atribut Agunan... 53 Tabel 3.11 Transformasi Atribut Status Agunan... 53 Tabel 3.12 Transformasi Atribut Tujuan... 53 Tabel 3.13 Transformasi Atribut Kolektibilitas... 54 Tabel 3.14 Contoh Data yang Telah Mengalami Preprocessing... 55 Tabel 3.15 Proses Pembentukan Simpul Akar... 57 Tabel 3.16 Nilai Gain Ratio pada Pembentukan Simpul Internal (1.1)... 62 Tabel 3.17 Nilai Gain Ratio pada Pembentukan Simpul Internal (2.2)... 64 Tabel 3.18 Nilai Gain Ratio pada Pembentukan Simpul Internal (3.3)... 66 Tabel 3.19 Data Prediksi... 72 Tabel 3.20 Hasil Klasifikasi Data... 78 Tabel 3.21 Hasil Evaluasi Decision Tree C4.5 dan Naïve Bayes... 81 xii
DAFTAR GAMBAR Gambar 2.1 Tahap-tahap Knowledge Discovery in Data... 14 Gambar 2.2 Proses Klasifikasi... 20 Gambar 2.3 Bentuk Pohon Keputusan... 21 Gambar 2.4 Ilustrasi Model Pohon Keputusan Berdasarkan Tipe Atributnya... 22 Gambar 2.5 Algoritma Dasar Pohon Keputusan... 23 Gambar 2.6 Pohon Keputusan Sebelum Pemangkasan... 32 Gambar 2.7 Pohon Keputusan Sesudah Pemangkasan... 32 Gambar 2.8 Ilustrasi 4-Fold Cross Validation... 38 Gambar 2.9 Tampilan Awal GUI WEKA... 41 Gambar 3.1 Pohon Keputusan Sementara Perhitungan Simpul Akar... 62 Gambar 3.2 Pohon Keputusan Sementara Perhitungan Simpul Internal (1.1)... 63 Gambar 3.3 Pohon Keputusan Sementara Perhitungan Simpul Internal (2.2)... 65 Gambar 3.4 Pohon Keputusan Sementara Perhitungan Simpul Internal (3.3)... 67 Gambar 3.5 Decision tree C4.5 menggunakan WEKA... 68 Gambar 3.6 Hasil Output WEKA Berupa Model dan Aturan 979 dataset... 69 Gambar 3.7 Visualisasi Pohon Keputusan... 70 Gambar 3.8 Naïve Bayes menggunakan WEKA... 79 Gambar 3.9 Hasil Output WEKA Klasifikasi Menggunakan Naïve Bayes... 80 xiii
DAFTAR LAMPIRAN Lampiran 1 Atribut-Atribut pada Data Peminjam dan Laporan Nominatif Pinjaman Perbulan... 87 Lampiran 2 Contoh Data yang Dikumpulkan... 88 Lampiran 3 Tabel Proses Pembentukan Simpul Internal (1,1)... 90 Lampiran 4 Tabel Proses Pembentukan Simpul Internal (2,2)... 93 Lampiran 5 Tabel Proses Pembentukan Simpul Internal (3,3)... 96 Lampiran 6 Output Program WEKA Model Decision Tree C4.5... 98 Lampiran 7 Output Program WEKA Model Naïve Byes... 100 Lampiran 8 Output Evaluasi Model Menggunakan Use Training Set... 102 Lampiran 9 Output Evaluasi Model Menggunakan 10-Fold Cross Validation. 104 Lampiran 10 Output Evaluasi Model Menggunakan Perscentage Split... 106 Lampiran 11 Hasil Ekstraksi Pohon Keputusan...108 xiv