APLIKASI KLASIFIKASI KOLEKTIBILITAS KREDIT PEMILIKAN RUMAH (KPR) MENGGUNAKAN DECISION TREE C5.0 SKRIPSI MASLIMONA HARIMITA RITONGA 101402016 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA 2016
APLIKASI KLASIFIKASI KOLEKTIBILITAS KREDIT PEMILIKAN RUMAH (KPR) MENGGUNAKAN DECISION TREE C5.0 SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi MASLIMONA HARIMITA RITONGA 101402016 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA 2016
PERSETUJUAN Judul :APLIKASI KLASIFIKASI KOLEKTIBILITAS KREDIT PEMILIKAN RUMAH (KPR) MENGGUNAKAN DECISION TREE C5.0 Kategori : SKRIPSI Nama : MASLIMONA HARIMITA RITONGA Nomor Induk Mahasiswa : 101402016 Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI..UNIVERSITAS SUMATERA UTARA Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Sajadin Sembiring, S.Si., M.Comp.Sc Dr. Syahril Efendi, S.Si.,M.I.T NIP. - NIP. 196711101996021001 Diketahui/Disetujui oleh Program Studi S1 Teknologi Informasi Ketua, Muhammad Anggia Muchtar, ST., MM.IT NIP. 19800110200801 1 010
PERNYATAAN APLIKASI KLASIFIKASI KOLEKTIBILITAS KREDIT PEMILIKAN RUMAH (KPR) MENGGUNAKAN DECISION TREE C5.0 SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya. Medan, 11 Februari 2016 Maslimona Harimita Ritonga 101402016
UCAPAN TERIMA KASIH Alhamdulillah, segala puji bagi Allah SWT yang telah memberikan rahmat, karunia, dan hidayah-nya sehingga penulis dapat menyelesaikan skripsi ini. Penulis mengucapkan banyak terima kasih kepada : 1. Ayahanda, Hasan BP. Ritonga, SE dan Ibunda Mimi Syahroni Tanjung yang senantiasa sabar, selalu mendoakan, memotivasi, menasehati, mendukung dan memberikan kasih sayang sepanjang masa, serta kepada saudara-saudara penulis Muhammad Raja Akbar Ritonga, Sutan Rafsanjani Ritonga dan Pasikoi Tacika Ritonga atas motivasi dan dukungannya selama ini. 2. Bapak Dr. Syahril Efendi, S.Si, M.IT, selaku pembimbing I dan Bapak Sajadin Sembiring, S.Si, M.Comp.Sc, selaku pembimbing II yang telah banyak memberikan bimbingan, motivasi dan dukungan serta selalu sabar dalam membimbing penulis selama penyusunan dan penulisan skripsi ini. 3. Bapak Dani Gunawan,ST.,MT selaku Dosen Penguji I dan Ibu Sarah Purnamawati, ST, M.Sc selaku Dosen Penguji II yang telah memberikan segala koreksi, kritik dan saran dalam penyempurnaan penulisan skripsi ini. 4. Bapak Muhammad Anggia Muchtar, ST., MM.IT. selaku Ketua Program Studi S1 Teknologi Informasi dan Bapak Mohammad Fadly Syahputra, B.Sc., M.Sc.IT. selaku Sekretaris Program Studi S1 Teknologi Informasi. 5. Seluruh Dosen Program Studi S1 Teknologi Informasi yang telah memberikan ilmu yang bermanfaat bagi penulis dari awal perkuliahan. 6. Bapak dan Ibu karyawan PT. Bank Sumut yang telah membimbing dan memotivasi selama masa riset. 7. Sahabat-sahabat penulis Faradilla Savitri, Nadya Amelia, Sonya Lirizky Akbar, Utami Mardiyah Dinanti, M.Naufal Afif, Rahadian Ilham Pelani, Rini Jannati, Sharfina Faza, Tri Annisa, Nurul Putri Ibrahim, Dian Puspitasari, Farid Rakhman, Fitry Hayani, Fadhillah Aini,Ihda Adila yang selalu memberikan dukungan selama ini. 8. Seluruh staf TU (Tata Usaha) serta pegawai di Program Studi S1 Teknologi Informasi 9. Teman-teman seperjuangan program studi Teknologi Informasi khususnya angkatan 2010 atas segala kebersamaan, doa dan dukungannya. Akhirnya, penulis berharap agar skripsi ini berguna dan memberikan manfaat kepada seluruh pembaca
v ABSTRAK Banyaknya kredit macet yang terjadi membuat pihak bank kesulitan untuk memprediksi sejauh mana debitur melakukan pembayaran kredit serta menentukan nasabah mana yang berpotensi mencapai kredit macet di kemudian hari, mengingat banyaknya nasabah yang melakukan berbagai macam jenis kredit salah satunya adalah kredit pemilikan rumah (KPR). Decision tree C5.0 merupakan teknik data mining untuk mengubah data menjadi pohon keputusan dan aturan-aturan keputusan (rules). Metode ini menggunakan struktur pohon yang merepresentasikan atribut, nilai dari atribut dan kelas. Atribut dengan nilai entropy tertinggi dijadikan sebagai root atau akar pohon keputusan. Dari hasil pengujian klasifikasi decision tree pada data KPR nasabah bank diketahui bahwa atribut yang memiliki nilai gain tertinggi adalah jumlah tunggakan sehingga jumlah tunggakan menjadi atribut yang paling berpengaruh terhadap prediksi KPR. Akurasi data yang diperoleh adalah 99,16% dan error rate 0,83%. Kata kunci : Data mining, Decision Tree C5.0, Kredit Pemilikan Rumah (KPR).
vi APPLICATION CLASSIFICATION KPR COLLECTIBILITY BY USING DECISION TREE C5.0 ABSTRACT Number of bad loan/credit that happened make the bank difficulties to predict the extent to which the debitur making payment by credit as well as determining which clients could potentially reach the bad debts at a later given the large number of clients who did a wide variety of credit one of which is KPR. Decision C5.0 is data mining techniques as to transform data into decision tree rules and rules of decision. This method uses a tree structure which present the attribute, the value of attribute and class. Attribute with the value of the highest entropy as the root or the the root of the decision tree. From the results of testing on data bank of KPR note that the attributes value is the highest gain value is the amount of arrears become the most influential attribute against predictions of KPR. The accuracy of the data obtained is 99,16% and the error rate is 0,83%. Key words : Data mining, Decision Tree C5.0, KPR.
vii DAFTAR ISI Hal. PERSETUJUAN ii PERNYATAAN iii UCAPAN TERIMA KASIH iv ABSTRAK v ABSTRACT vi DAFTAR ISI vii DAFTAR TABEL x DAFTAR GAMBAR xi BAB 1 PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Rumusan Masalah 3 1.3 Batasan Masalah 4 1.4 Tujuan Penelitian 4 1.5 Manfaat Penelitian 4 1.6 Metodologi 5 1.7 Sistematika Penulisan 6 BAB 2 LANDASAN TEORI 7 2.1 Data Mining 7 2.1.1 Tahap-tahap data mining 8 2.1.2 Pengelompokan data mining 9 2.2 Decision Tree (Pohon Keputusan) 11 2.2.1 Konsep Decision Tree 11 2.2.2 Manfaat Decision Tree 12 2.2.3 Kelebihan Decision Tree 12 2.2.4 Kekurangan Decision Tree 13 2.3 Algoritma C5.0 13 2.4 Bank 14
viii 2.4.1 Kredit 14 2.4.2 Analisa Kredit 18 2.4.3 Kredit Pemilikan Rumah (KPR) 19 2.5 Penilitian Terdahulu 19 BAB 3 ANALISIS DAN PERANCANGAN SISTEM 21 3.1 Identifikasi Masalah 21 3.2 Data yang digunakan 21 3.3 Data Mining 21 3.3.1 Penentuan atribut 21 3.3.2 Pembentukan pohon keputusan 24 3.3.3 Knowledge Presentation 51 3.4 Analisis Sistem 53 3.4.1 Diagram alir system 53 3.4.2 Diagram alir pohon keputusan 55 3.5 Perancangan Sistem 55 3.5.1 Rancangan halaman utama 56 3.5.2 Rancangan menu data training 57 3.5.3 Form input training 58 3.5.4 Form data training 58 3.5.5 Rancangan menu data testing 59 3.5.6 Rancangan menu tree 60 BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 61 4.1 Implementasi Sistem 61 4.1.1 Spesifikasi perangkat keras dan lunak yang digunakan 61 4.1.2 Implementasi Perancangan Antarmuka 61 4.1.2.1 Halaman file 62 4.1.2.2 Halaman data training 62 4.1.2.3 Halaman data testing 64 4.1.2.4 Halaman tree 67 4.2 Pengujian Sistem 68 BAB 5 KESIMPULAN DAN SARAN 72 5.1 Kesimpulan 72
ix 5.2 Saran 72 DAFTAR PUSTAKA 73
x DAFTAR TABEL Hal. Tabel 2.1 Kolektibilitas kredit 16 Tabel 3.1 Ketentuan condition 22 Tabel 3.2 Ketentuan plafond 23 Tabel 3.3 Pembagian kasus 24 Tabel 3.4 Sample perhitungan entropy condition 27 Tabel 3.5 Perhitungan node akar 28 Tabel 3.6 Perhitungan node 1 29 Tabel 3.7 Perhitungan node 1.1 31 Tabel 3.8 Perhitungan node 1.1.1 32 Tabel 3.9 Perhitungan node 1.2 34 Tabel 3.10 Perhitungan node 1.2.1 36 Tabel 3.11 Perhitungan node 1.2.2 38 Tabel 3.12 Perhitungan node 1.2.2.1 40 Tabel 3.13 Perhitungan node 1.3 41 Tabel 3.14 Perhitungan node 1.3.1 43 Tabel 3.15 Perhitungan node 1.3.1.1 44 Tabel 3.16 Perhitungan node 1.3.1.2 46 Tabel 3.17 Perhitungan node 1.3.2 47 Tabel 3.18 Perhitungan node 1.3.2.1 48 Tabel 3.19 Perhitungan node 1.3.2.2 49 Tabel 4.1 Confusion matrix data testing 70
xi DAFTAR GAMBAR Hal. Gambar 2.1 Tahap-tahap penambangan data 8 Gambar 2.2 Konsep decision tree 11 Gambar 3.1 Pembentukan node akar 29 Gambar 3.2 Pembentukan node 1 30 Gambar 3.3 Pembentukan node 1.1 32 Gambar 3.4 Pembentukan node 1.1.1 33 Gambar 3.5 Pembentukan node 1.2 35 Gambar 3.6 Pembentukan node 1.2.1 37 Gambar 3.7 Pembentukan node 1.2.2 39 Gambar 3.8 Pembentukan node 1.2.2.1 41 Gambar 3.9 Pembentukan node 1.3 42 Gambar 3.10 Pembentukan node 1.3.1 44 Gambar 3.11 Pembentukan node 1.3.1.1 45 Gambar 3.12 Pembentukan node 1.3.1.2 46 Gambar 3.13 Pembentukan node 1.3.2 48 Gambar 3.14 Pembentukan node keseluruhan 50 Gambar 3.15 Diagram alir system 54 Gambar 3.16 Diagram alir pohon keputusan 55 Gambar 3.17 Rancangan halaman utama 56 Gambar 3.18 Rancangan menu file 56 Gambar 3.19 Rancangan pengaturan database 57 Gambar 3.20 Rancangan menu data training 57 Gambar 3.21 Rancangan form input data training 58 Gambar 3.22 Rancangan form data training 58 Gambar 3.23 Rancangan form cek kolektibilitas 59 Gambar 3.24 Rancangan form data kolektibilitas 59 Gambar 3.25 Rancangan menu tree 60 Gambar 3.26 Rancangan tree view 60
xii Gambar 4.1 Halaman file 62 Gambar 4.2 Halaman data training 62 Gambar 4.3 Form input data training 63 Gambar 4.4 Form data training 64 Gambar 4.5 Halaman data testing 64 Gambar 4.6 Form cek kolektibilitas 65 Gambar 4.7 Hasil prediksi cek kolektibilitas 66 Gambar 4.8 Halaman data kolektibilitas 67 Gambar 4.9 Halaman tree 67 Gambar 4.10 Sub menu decision tree 68 Gambar 4.11 Tree view 68 Gambar 4.12 Data training 69 Gambar 4.13 Data testing 69 Gambar 4.14 Grafik Kolektibilitas KPR pada data testing 71