BAB I PENDAHULUAN 1.1 Latar Belakang

dokumen-dokumen yang mirip
BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

DAFTAR ISI PHP... 15

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang ,

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Hal ini dibuktikan dengan adanya fakta yang diungkap oleh World Health

DAFTAR ISI Transformasi data... 47

BAB III METODOLOGI PENELITIAN. Dataset

BAB 3 METODE PENELITIAN

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

BAB I PENDAHULUAN 1-1

BAB I PENDAHULUAN Latar Belakang

DATA MINING UNTUK REKOMENDASI KERJA BAGI ALUMI DENGAN ALGORITMA GARC(GAIN BASED ASSOCIATION RULE CLASSIFICTION)

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB III METODE PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

1. BAB I PENDAHULUAN 1.1. Latar Belakang

1. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB III METODOLOGI PENELITIAN. Berikut adalah gambaran desain penelitian pengklasifikasian konsumen

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

BAB I PENDAHULUAN. sistem peredaran darah orang lain. Sebelum ditransfusikan, periksa kembali sifat

Sekip Utara Yogyakarta * 1 2

KLASIFIKASI KELAYAKAN KREDIT CALON DEBITUR BANK MENGGUNAKAN ALGORITMA DECISION TREE C4.5

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III METODOLOGI PENELITIAN

Abidah Elcholiqi, Beta Noranita, Indra Waspada

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB 1 PENDAHULUAN 1-1

DAFTAR ISI. ABSTRAK...i. ABSTRACT...ii. KATA PENGANTAR...iii. UCAPAN TERIMAKASIH...iv. DAFTAR ISI...vi. DAFTAR TABEL...ix. DAFTAR GAMBAR...

BAB 1 PENDAHULUAN 1.1 Latar Belakang

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB III METODOLOGI PENELITIAN

BAB II TINJAUAN PUSTAKA

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

BAB I PENDAHULUAN Latar Belakang

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

BAB III METODE PENELITIAN. Metode penelitian merupakan suatu prosedur beserta tahapan-tahapan yang

DAFTAR ISI... LEMBAR PENGESAHAN PEMBIMBING... LEMBAR PENGESAHAN PENGUJI... HALAMAN PERSEMBAHAN... HALAMAN MOTTO... KATA PENGANTAR...

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

Komparasi Algoritma Klasifikasi untuk dataset iris dengan rapid miner

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 4 IMPLEMENTASI DAN PENGUJIAN

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODE PENELITIAN

ABSTRAK. Kata kunci : sistem pakar, penyakit gigi, konsultasi, algoritma ID3. vi Universitas Kristen Maranatha

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

BAB II TINJAUAN PUSTAKA

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PROMOSI (Studi kasus Universitas Bina Darma Palembang)

BAB I PENDAHULUAN. beli sepeda motor bermerek Honda. Dalam kegiatan operaisonalnya, PD. Wijaya

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB I PENDAHULUAN. masalah kecerdasan, desain, pemilihan, implementasi, dan monitoring (Tripathi,

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Universitas Sumatera Utara

BAB 1 PENDAHULUAN 1-1

BAB 3. METODOLOGI PENELITIAN

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

3.1 Metode Pengumpulan Data

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

BAB III METODE PENELITIAN

CONTOH KASUS DATA MINING

TINJAUAN PUSTAKA. Definisi Data Mining

BAB 2 LANDASAN TEORI

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

DAFTAR ISI HALAMAN JUDUL HALAMAN PENGESAHAN HALAMAN PERNYATAAN KATA PENGANTAR PERSEMBAHAN DAFTAR TABEL DAFTAR GAMBAR ARTI LAMBANG DAN SINGKATAN

BAB II TINJAUAN PUSTAKA

BAB III ANALISIS DAN PENYELESAIAN MASALAH

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES

BAB I PENDAHULUAN. dari pemikiran-pemikiran manusia yang semakin maju, hal tersebut dapat. mendukung bagi pengembangan penyebaran informasi.

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM). Kredit ini bisa diperoleh melalui tahapan pengajuan proposal, survei ke lokasi usaha, wawancara, dan analisis terhadap kelayakan usaha. Semua tahapan ini sebagai proses seleksi untuk meminimalkan terjadinya kredit bermasalah, karena adanya kredit bermasalah akan mengganggu kondisi keuangan PT. Telkom dan menyebabkan berkurangnya jumlah dana yang disalurkan kepada para pelaku UKM periode berikutnya. Sistem seleksi pemberian kredit yang ada saat ini belum efektif menurunkan angka kredit bermasalah, hal ini terlihat pada data kredit PT. Telkom CDC (Community Development Centre) Sub Area Kupang dari tahun 2003 s/d triwulan II tahun 2010, dari 1.054 Mitra Binaan (MB) yang kreditnya disetujui, 46,8% (493 MB) berstatus bermasalah dan 53,2% (561 MB) berstatus lancar. Pengertian bermasalah adalah MB yang setelah tanggal jatuh tempo pelunasan kredit (per triwulan II tahun 2012), belum melunasi kreditnya. Menurut Bro (2011), salah satu penyebab kredit bermasalah disebabkan oleh pihak internal, yaitu kurang telitinya tim melakukan survei dan analisis, atau bisa juga karena penilaian dan analisis yang bersifat subjektif. Hal ini dapat diatasi dengan teknik seleksi lain yang memiliki ketelitian analisis, dan penilaian yang bersifat objektif, yaitu aplikasi komputer yang menggunakan teknik data mining. Teknik ini digunakan karena mampu mengekstrak knowledge dari datadata pelaku usaha sebelumnya (Han dan Kamber, 2006). Knowledge ini, lalu digunakan untuk menyelesaikan permasalahan. Data kredit pelaku usaha sebelumnya, diproses menggunakan sebuah algoritma untuk membangun model, lalu model ini digunakan untuk mengklasifikasi kemungkinan kredit bermasalah terhadap pelaku usaha baru yang mengajukan kredit. 1

2 Metode yang digunakan dalam data mining untuk klasifikasi disebut metode klasifikasi atau Supervised Learning. Beberapa algoritma dari metode ini yang telah digunakan untuk mengklasifikasi resiko pemberian kredit antara lain Naive Bayes (Antonakis, 2009) dan Support Vector Machnine (SVM) (Chen dan Shih, 2006; Shin dkk, 2005; Xu dkk, 2010). Terdapat algoritma lain untuk klasifikasi, salah satu diantaranya adalah Classification Based On Assosiations (CBA) (Liu, 2011). Algoritma ini memiliki 2 kelebihan, yaitu (1) memiliki akurasi yang lebih baik dibandingkan beberapa algoritma klasifikasi lainnya (C4.5, RIPPER, NB, PART, SVM, REG, dan HIVdb) (Liu dkk, 1998; Liu dkk, 2001; Thabtah dan Cowling, 2008; Srisawat dan Kijsirikul, 2004), dan (2) menghasilkan sekumpulan rule yang mudah dipahami dan diinterpretasikan oleh pengguna, dan mampu menggunakan atribut literal untuk membangun model (Srisawat dan Kijsirikul, 2004). Penelitian ini menggunakan algoritma CBA, sebuah pendekatan dari teknik data mining untuk mengklasifikasi resiko pemberian kredit terhadap pelaku usaha baru yang mengajukan kredit di PT. Telkom CDC Sub Area Kupang. Hasil pengujian pengaplikasian algoritma CBA pada aplikasi yang dibangun, akan dibandingkan akurasinya dengan algoritma SVM dan Naive Bayes dari perangkat lunak Rapid Miner 5.3. Perbandingan akurasi ini untuk mengetahui performa algoritma CBA jika dibandingkan dengan algoritma SVM dan Naive Bayes untuk klasifikasi resiko pemberian kredit di PT. Telkom CDC Sub Area Kupang. 1.2 Rumusan Masalah Berdasarkan latar belakang, permasalahan yang diteliti: 1. Bagaimana mengaplikasikan algoritma CBA untuk mengklasifikasi resiko pemberian kredit terhadap pelaku usaha baru yang mengajukan kredit di PT. Telkom CDC Sub Area Kupang? 2. Bagaimana performa algoritma CBA jika dibandingkan dengan algoritma Naive Bayes dan SVM dari perangkat lunak Rapid Miner 5.3 untuk klasifikasi resiko pemberian kredit di PT. Telkom CDC Sub Area Kupang?

3 1.3 Batasan Masalah Batasan masalah pada penelitian ini yaitu menggunakan data kredit PT. Telkom CDC Sub Area Kupang dari tahun 2003 s/d triwulan II tahun 2010. 1.4 Tujuan dan Manfaat Penelitian Tujuan yang ingin dicapai adalah membuat model menggunakan algoritma CBA untuk klasifikasi resiko pemberian kredit terhadap pelaku usaha baru yang mengajukan kredit di PT. Telkom CDC Sub Area Kupang. Hasil penelitian diharapkan dapat membantu PT. Telkom CDC Sub Area Kupang, khususnya Manajer CDC dalam memilih calon mitra binaan untuk diusulkan kepada Manajer CDC Area Makasar, yang selanjutnya diusulkan lagi ke Senior General Manager CDC di pusat untuk ditetapkan sebagai penerima bantuan kredit. 1.5 Keaslian Penelitian Penelitian tentang algoritma CBA yang pernah dilakukan: 1. Membandingkan performa algoritma CBA dengan algoritma C4.5 (Tree dan Rules) menggunakan 26 dataset yang bersumber dari UCI ML Repository. 2. Membandingkan performa algoritma CBA dengan algoritma C4.5 (Tree dan Rules), CBA(2), RIPPER, Naive Bayes, dan Large Bayes menggunakan 34 dataset yang bersumber dari UCI ML Repository. 3. Membandingkan performa algoritma CBA dengan algoritma HIVdb, SVM dan REG untuk prediksi ketahanan obat HIV-1. 4. Membandingkan performa algoritma CBA dengan algoritma MCAR, MMAC, C4.5, RIPPER dan PART menggunakan 16 dataset. 1.6 Metode Penelitian Tahapan-tahapan yang dilakukan dalam pelaksanaan penelitian: 1.6.1 Pengumpulan data Data yang digunakan dalam penelitian ini adalah data kredit PT. Telkom CDC Sub Area Kupang dari tahun 2003 s/d triwulan II tahun 2010. Data tersebut diperoleh dari Sistem Informasi Manajemen Program Kemitraan dan Bina Lingkungan (SIM PKBL) PT. Telkom. Data mitra binaan yang mengajukan kredit

4 dan data mitra binaan yang kreditnya disetujui, diekspor dari SIM PKBL ke file excel. Kedua file excel ini lalu digabung dan dipilih atribut-atribut yang sesuai dengan kebutuhan penelitian. Hasilnya, diperoleh sebuah file excel yang merupakan sumber data dari penelitian ini. 1.6.2 Analisis dan perancangan sistem Tahap analisis sistem digunakan untuk melakukan analisis kebutuhankebutuhan perangkat lunak dari sistem yang dikembangkan. Berdasarkan hasil analisis sistem, lalu dibuat perancangan sistem yang meliputi perancangan proses preprosesing, perancangan DFD (Data Flow Diagram), perancangan basis data, dan perancangan antarmuka. Kegiatan preprocessing yang dilakukan sebanyak 4 kegiatan, yaitu (1) pemilihan data, (2) pembersihan data, (3) transformasi data, dan (4) mengidentifikasi kesalahan klasifikasi. 1.6.3 Implementasi sistem Rancangan proses dan antarmuka yang telah dibuat, selanjutnya diimplementasikan menggunakan kode-kode program. Implementasinya terdiri atas 4 bagian: 1. Implementasi load data kredit awal, bagian ini dilakukan pengambilan data yang bersumber dari file excel, lalu data tersebut diproses dan disimpan ke database. 2. Implementasi data kredit baru, bagian ini dilakukan penginputan data kredit baru untuk disimpan ke database. Data tersebut akan digunakan untuk proses klasifikasi. 3. Implementasi pembangunan model, bagian ini membaca data kredit awal di database, lalu membaginya menjadi 2 bagian, yaitu data training dan data testing. Data training diproses menggunakan algoritma CBA untuk membangun model, lalu model tersebut diuji dengan data testing menggunakan teknik k-fold cross validation untuk menghasilkan akurasi model. Model yang dihasilkan, selanjutnya disimpan ke database agar dapat digunakan untuk proses klasifikasi terhadap data kredit baru.

5 4. Implementasi klasifikasi, bagian ini membaca data kredit baru dan model di database. Data kredit baru (data tanpa label kelas), diklasifikasi menggunakan model yang dibaca dari database. Hasilnya, diperoleh data kredit baru yang telah mempunyai label kelas. 1.6.4 Pengujian sistem Pengujian terhadap sistem yang dilakukan: 1. Pengujian kebenaran implementasi algoritma CBA, untuk mengetahui kebenaran implementasi algoritma CBA pada aplikasi yang dibuat, maka dilakukan perbandingan dengan aplikasi lain yang menggunakan algoritma CBA yaitu aplikasi LUCS KDD CBA. Aplikasi ini dapat didownload pada http://cgi.csc.liv.ac.uk/~frans/kdd/software/cba/cba.html. Pengujian menggunakan nilai minimum confidence 50% dan minimum support 10%. 2. Pengujian waktu pemrosesan dan jumlah ruleitem yang dihasilkan, pengujian dilakukan untuk mengetahui waktu yang dibutuhkan, dan jumlah ruleitem yang dihasilkan dalam membangun model. Nilai minimum confidence yang digunakan sebesar 50% dengan 5 buah nilai minimum support, yaitu 0,5%, 0,8%, 1%, 3% dan 5%. 3. Pengujian akurasi model, pengujian ini menggunakan teknik k-fold cross validation, dan untuk pengisian data ke setiap fold menggunakan metode Standard Stratified Cross-Validation (SCV). Nilai k yang digunakan adalah 10, yang berarti dilakukan 10 kali pengujian akurasi model. Berikut tahaptahap metode SCV dan k-fold cross validation: a. Membuat partisi sebanyak 10 buah. b. Mengelompokan sampel berdasarkan label kelas. c. Mendistribusikan sampel per kelas secara merata ke semua partisi yang dilakukan secara acak. d. Setiap partisi dijadikan tepat 1 kali sebagai data testing dan partisi yang lain dijadikan sebagai data training untuk membangun model. e. Model yang dihasilkan diuji menggunakan data testing untuk memperoleh nilai akurasi model.

6 f. Nilai akurasi model diperoleh menggunakan persamaan (3.1) untuk setiap partisi. g. Nilai akurasi keseluruhan diperoleh dengan merata-ratakan nilai akurasi untuk semua partisi. 4. Pengujian dengan perangkat lunak lain, perangkat lunak lain yang digunakan untuk mengklasifikasi data kredit awal adalah aplikasi Rapid Miner 5.3. Pengujian menggunakan 2 buah metode, yaitu metode naive bayes dan support vector machine. Hasil pengujian kedua metode ini, lalu dibandingkan rata-rata nilai akurasinya dengan rata-rata nilai akurasi dari aplikasi yang dibuat. 5. Pengujian klasifikasi, pengujian ini dilakukan untuk mengetahui nilai akurasi dari model yang dihasilkan apabila diklasifikasi terhadap data kredit baru yang label kelasnya sudah diketahui. Pengujian menggunakan 15 buah data kredit baru yang diambil secara acak dari data kredit awal. 1.7 Sistematika Penulisan Sistematika penulisan untuk penelitian: 1. BAB I PENDAHULUAN Bab ini menjelaskan secara singkat mengenai latar belakang masalah, rumusan dan batasan masalah, tujuan dan manfaat penelitian, metodologi penelitian, serta sistematika penulisan. 2. BAB II TINJAUAN PUSTAKA Bab ini membahas hasil dari penelitian-penelitian terdahulu yang mendukung penelitian yang sedang dilakukan. 3. BAB III LANDASAN TEORI Bab ini memuat teori-teori dasar pendukung yang dikumpulkan dari berbagai literatur, sebagai dasar untuk pemecahan masalah. 4. BAB IV ANALISIS DAN RANCANGAN SISTEM Bab ini diuraikan mengenai analisis dan desain sistem yang dibangun, meliputi perancangan proses, basis data, dan antarmuka sistem. 5. BAB V IMPLEMENTASI SISTEM Bab ini berisi implementasi dari desain proses dalam bentuk kode program.

7 6. BAB VI HASIL DAN PEMBAHASAN Bab ini membahas pengujian-pengujian yang dilakukan terhadap sistem yang dibangun berdasar pada skenario pengujian yang telah ditetapkan sebelumnya dan hasil yang diperoleh dari pengujian tersebut. 7. BAB VII KESIMPULAN DAN SARAN Bab ini berisikan kesimpulan dari penelitian yang telah dilakukan dan saran untuk pengembangan sistem yang telah dibangun.