BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM). Kredit ini bisa diperoleh melalui tahapan pengajuan proposal, survei ke lokasi usaha, wawancara, dan analisis terhadap kelayakan usaha. Semua tahapan ini sebagai proses seleksi untuk meminimalkan terjadinya kredit bermasalah, karena adanya kredit bermasalah akan mengganggu kondisi keuangan PT. Telkom dan menyebabkan berkurangnya jumlah dana yang disalurkan kepada para pelaku UKM periode berikutnya. Sistem seleksi pemberian kredit yang ada saat ini belum efektif menurunkan angka kredit bermasalah, hal ini terlihat pada data kredit PT. Telkom CDC (Community Development Centre) Sub Area Kupang dari tahun 2003 s/d triwulan II tahun 2010, dari 1.054 Mitra Binaan (MB) yang kreditnya disetujui, 46,8% (493 MB) berstatus bermasalah dan 53,2% (561 MB) berstatus lancar. Pengertian bermasalah adalah MB yang setelah tanggal jatuh tempo pelunasan kredit (per triwulan II tahun 2012), belum melunasi kreditnya. Menurut Bro (2011), salah satu penyebab kredit bermasalah disebabkan oleh pihak internal, yaitu kurang telitinya tim melakukan survei dan analisis, atau bisa juga karena penilaian dan analisis yang bersifat subjektif. Hal ini dapat diatasi dengan teknik seleksi lain yang memiliki ketelitian analisis, dan penilaian yang bersifat objektif, yaitu aplikasi komputer yang menggunakan teknik data mining. Teknik ini digunakan karena mampu mengekstrak knowledge dari datadata pelaku usaha sebelumnya (Han dan Kamber, 2006). Knowledge ini, lalu digunakan untuk menyelesaikan permasalahan. Data kredit pelaku usaha sebelumnya, diproses menggunakan sebuah algoritma untuk membangun model, lalu model ini digunakan untuk mengklasifikasi kemungkinan kredit bermasalah terhadap pelaku usaha baru yang mengajukan kredit. 1
2 Metode yang digunakan dalam data mining untuk klasifikasi disebut metode klasifikasi atau Supervised Learning. Beberapa algoritma dari metode ini yang telah digunakan untuk mengklasifikasi resiko pemberian kredit antara lain Naive Bayes (Antonakis, 2009) dan Support Vector Machnine (SVM) (Chen dan Shih, 2006; Shin dkk, 2005; Xu dkk, 2010). Terdapat algoritma lain untuk klasifikasi, salah satu diantaranya adalah Classification Based On Assosiations (CBA) (Liu, 2011). Algoritma ini memiliki 2 kelebihan, yaitu (1) memiliki akurasi yang lebih baik dibandingkan beberapa algoritma klasifikasi lainnya (C4.5, RIPPER, NB, PART, SVM, REG, dan HIVdb) (Liu dkk, 1998; Liu dkk, 2001; Thabtah dan Cowling, 2008; Srisawat dan Kijsirikul, 2004), dan (2) menghasilkan sekumpulan rule yang mudah dipahami dan diinterpretasikan oleh pengguna, dan mampu menggunakan atribut literal untuk membangun model (Srisawat dan Kijsirikul, 2004). Penelitian ini menggunakan algoritma CBA, sebuah pendekatan dari teknik data mining untuk mengklasifikasi resiko pemberian kredit terhadap pelaku usaha baru yang mengajukan kredit di PT. Telkom CDC Sub Area Kupang. Hasil pengujian pengaplikasian algoritma CBA pada aplikasi yang dibangun, akan dibandingkan akurasinya dengan algoritma SVM dan Naive Bayes dari perangkat lunak Rapid Miner 5.3. Perbandingan akurasi ini untuk mengetahui performa algoritma CBA jika dibandingkan dengan algoritma SVM dan Naive Bayes untuk klasifikasi resiko pemberian kredit di PT. Telkom CDC Sub Area Kupang. 1.2 Rumusan Masalah Berdasarkan latar belakang, permasalahan yang diteliti: 1. Bagaimana mengaplikasikan algoritma CBA untuk mengklasifikasi resiko pemberian kredit terhadap pelaku usaha baru yang mengajukan kredit di PT. Telkom CDC Sub Area Kupang? 2. Bagaimana performa algoritma CBA jika dibandingkan dengan algoritma Naive Bayes dan SVM dari perangkat lunak Rapid Miner 5.3 untuk klasifikasi resiko pemberian kredit di PT. Telkom CDC Sub Area Kupang?
3 1.3 Batasan Masalah Batasan masalah pada penelitian ini yaitu menggunakan data kredit PT. Telkom CDC Sub Area Kupang dari tahun 2003 s/d triwulan II tahun 2010. 1.4 Tujuan dan Manfaat Penelitian Tujuan yang ingin dicapai adalah membuat model menggunakan algoritma CBA untuk klasifikasi resiko pemberian kredit terhadap pelaku usaha baru yang mengajukan kredit di PT. Telkom CDC Sub Area Kupang. Hasil penelitian diharapkan dapat membantu PT. Telkom CDC Sub Area Kupang, khususnya Manajer CDC dalam memilih calon mitra binaan untuk diusulkan kepada Manajer CDC Area Makasar, yang selanjutnya diusulkan lagi ke Senior General Manager CDC di pusat untuk ditetapkan sebagai penerima bantuan kredit. 1.5 Keaslian Penelitian Penelitian tentang algoritma CBA yang pernah dilakukan: 1. Membandingkan performa algoritma CBA dengan algoritma C4.5 (Tree dan Rules) menggunakan 26 dataset yang bersumber dari UCI ML Repository. 2. Membandingkan performa algoritma CBA dengan algoritma C4.5 (Tree dan Rules), CBA(2), RIPPER, Naive Bayes, dan Large Bayes menggunakan 34 dataset yang bersumber dari UCI ML Repository. 3. Membandingkan performa algoritma CBA dengan algoritma HIVdb, SVM dan REG untuk prediksi ketahanan obat HIV-1. 4. Membandingkan performa algoritma CBA dengan algoritma MCAR, MMAC, C4.5, RIPPER dan PART menggunakan 16 dataset. 1.6 Metode Penelitian Tahapan-tahapan yang dilakukan dalam pelaksanaan penelitian: 1.6.1 Pengumpulan data Data yang digunakan dalam penelitian ini adalah data kredit PT. Telkom CDC Sub Area Kupang dari tahun 2003 s/d triwulan II tahun 2010. Data tersebut diperoleh dari Sistem Informasi Manajemen Program Kemitraan dan Bina Lingkungan (SIM PKBL) PT. Telkom. Data mitra binaan yang mengajukan kredit
4 dan data mitra binaan yang kreditnya disetujui, diekspor dari SIM PKBL ke file excel. Kedua file excel ini lalu digabung dan dipilih atribut-atribut yang sesuai dengan kebutuhan penelitian. Hasilnya, diperoleh sebuah file excel yang merupakan sumber data dari penelitian ini. 1.6.2 Analisis dan perancangan sistem Tahap analisis sistem digunakan untuk melakukan analisis kebutuhankebutuhan perangkat lunak dari sistem yang dikembangkan. Berdasarkan hasil analisis sistem, lalu dibuat perancangan sistem yang meliputi perancangan proses preprosesing, perancangan DFD (Data Flow Diagram), perancangan basis data, dan perancangan antarmuka. Kegiatan preprocessing yang dilakukan sebanyak 4 kegiatan, yaitu (1) pemilihan data, (2) pembersihan data, (3) transformasi data, dan (4) mengidentifikasi kesalahan klasifikasi. 1.6.3 Implementasi sistem Rancangan proses dan antarmuka yang telah dibuat, selanjutnya diimplementasikan menggunakan kode-kode program. Implementasinya terdiri atas 4 bagian: 1. Implementasi load data kredit awal, bagian ini dilakukan pengambilan data yang bersumber dari file excel, lalu data tersebut diproses dan disimpan ke database. 2. Implementasi data kredit baru, bagian ini dilakukan penginputan data kredit baru untuk disimpan ke database. Data tersebut akan digunakan untuk proses klasifikasi. 3. Implementasi pembangunan model, bagian ini membaca data kredit awal di database, lalu membaginya menjadi 2 bagian, yaitu data training dan data testing. Data training diproses menggunakan algoritma CBA untuk membangun model, lalu model tersebut diuji dengan data testing menggunakan teknik k-fold cross validation untuk menghasilkan akurasi model. Model yang dihasilkan, selanjutnya disimpan ke database agar dapat digunakan untuk proses klasifikasi terhadap data kredit baru.
5 4. Implementasi klasifikasi, bagian ini membaca data kredit baru dan model di database. Data kredit baru (data tanpa label kelas), diklasifikasi menggunakan model yang dibaca dari database. Hasilnya, diperoleh data kredit baru yang telah mempunyai label kelas. 1.6.4 Pengujian sistem Pengujian terhadap sistem yang dilakukan: 1. Pengujian kebenaran implementasi algoritma CBA, untuk mengetahui kebenaran implementasi algoritma CBA pada aplikasi yang dibuat, maka dilakukan perbandingan dengan aplikasi lain yang menggunakan algoritma CBA yaitu aplikasi LUCS KDD CBA. Aplikasi ini dapat didownload pada http://cgi.csc.liv.ac.uk/~frans/kdd/software/cba/cba.html. Pengujian menggunakan nilai minimum confidence 50% dan minimum support 10%. 2. Pengujian waktu pemrosesan dan jumlah ruleitem yang dihasilkan, pengujian dilakukan untuk mengetahui waktu yang dibutuhkan, dan jumlah ruleitem yang dihasilkan dalam membangun model. Nilai minimum confidence yang digunakan sebesar 50% dengan 5 buah nilai minimum support, yaitu 0,5%, 0,8%, 1%, 3% dan 5%. 3. Pengujian akurasi model, pengujian ini menggunakan teknik k-fold cross validation, dan untuk pengisian data ke setiap fold menggunakan metode Standard Stratified Cross-Validation (SCV). Nilai k yang digunakan adalah 10, yang berarti dilakukan 10 kali pengujian akurasi model. Berikut tahaptahap metode SCV dan k-fold cross validation: a. Membuat partisi sebanyak 10 buah. b. Mengelompokan sampel berdasarkan label kelas. c. Mendistribusikan sampel per kelas secara merata ke semua partisi yang dilakukan secara acak. d. Setiap partisi dijadikan tepat 1 kali sebagai data testing dan partisi yang lain dijadikan sebagai data training untuk membangun model. e. Model yang dihasilkan diuji menggunakan data testing untuk memperoleh nilai akurasi model.
6 f. Nilai akurasi model diperoleh menggunakan persamaan (3.1) untuk setiap partisi. g. Nilai akurasi keseluruhan diperoleh dengan merata-ratakan nilai akurasi untuk semua partisi. 4. Pengujian dengan perangkat lunak lain, perangkat lunak lain yang digunakan untuk mengklasifikasi data kredit awal adalah aplikasi Rapid Miner 5.3. Pengujian menggunakan 2 buah metode, yaitu metode naive bayes dan support vector machine. Hasil pengujian kedua metode ini, lalu dibandingkan rata-rata nilai akurasinya dengan rata-rata nilai akurasi dari aplikasi yang dibuat. 5. Pengujian klasifikasi, pengujian ini dilakukan untuk mengetahui nilai akurasi dari model yang dihasilkan apabila diklasifikasi terhadap data kredit baru yang label kelasnya sudah diketahui. Pengujian menggunakan 15 buah data kredit baru yang diambil secara acak dari data kredit awal. 1.7 Sistematika Penulisan Sistematika penulisan untuk penelitian: 1. BAB I PENDAHULUAN Bab ini menjelaskan secara singkat mengenai latar belakang masalah, rumusan dan batasan masalah, tujuan dan manfaat penelitian, metodologi penelitian, serta sistematika penulisan. 2. BAB II TINJAUAN PUSTAKA Bab ini membahas hasil dari penelitian-penelitian terdahulu yang mendukung penelitian yang sedang dilakukan. 3. BAB III LANDASAN TEORI Bab ini memuat teori-teori dasar pendukung yang dikumpulkan dari berbagai literatur, sebagai dasar untuk pemecahan masalah. 4. BAB IV ANALISIS DAN RANCANGAN SISTEM Bab ini diuraikan mengenai analisis dan desain sistem yang dibangun, meliputi perancangan proses, basis data, dan antarmuka sistem. 5. BAB V IMPLEMENTASI SISTEM Bab ini berisi implementasi dari desain proses dalam bentuk kode program.
7 6. BAB VI HASIL DAN PEMBAHASAN Bab ini membahas pengujian-pengujian yang dilakukan terhadap sistem yang dibangun berdasar pada skenario pengujian yang telah ditetapkan sebelumnya dan hasil yang diperoleh dari pengujian tersebut. 7. BAB VII KESIMPULAN DAN SARAN Bab ini berisikan kesimpulan dari penelitian yang telah dilakukan dan saran untuk pengembangan sistem yang telah dibangun.