PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI

Ukuran: px
Mulai penontonan dengan halaman:

Download "PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI"

Transkripsi

1 PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Perbandingan Algoritme C4.5 dan CART pada Data Tidak Seimbang untuk Kasus Prediksi Risiko Kredit Debitur Kartu Kredit adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juli 2013 Dhieta Anggraini NIM G

4 ABSTRAK DHIETA ANGGRAINI. Perbandingan Algoritme C4.5 dan CART pada Data Tidak Seimbang untuk Kasus Prediksi Risiko Kredit Debitur Kartu Kredit. Dibimbing oleh AZIZ KUSTIYO. Risiko kredit merupakan risiko ketidakmampuan nasabah atas kewajiban pembayaran utangnya. Risiko kredit dapat menyebabkan kredit bermasalah sehingga mengurangi pendapatan bank. Beberapa teknik dapat membantu dalam pemodelan penerimaan debitur, salah satunya adalah pohon keputusan. Beberapa algoritme pohon keputusan seperti C4.5 dan CART dapat digunakan sebagai classifier. Namun, hasil klasifikasi menjadi tidak akurat disebabkan data yang digunakan tidak seimbang. Salah satu cara yang dapat digunakan untuk menangani permasalahan ini adalah dengan strategi sampling diantaranya metode over-sampling dan under-sampling. Penelitian ini menunjukkan bahwa penerapan strategi sampling pada pohon keputusan C4.5 dan CART dapat meningkatkan performa yaitu akurasi, precision, recall, dan F-measure. Kata kunci: C4.5, CART, data tidak seimbang, pohon keputusan, risiko kredit, strategi sampling ABSTRACT DHIETA ANGGRAINI. Comparison of C4.5 and CART Algorithms in Imbalanced Dataset to Predicting Credit Risk. Supervised by AZIZ KUSTIYO. Credit risk is the risk of customers inability regarding their debt payment obligations. Credit risk can lead to non-performing loans, thereby reducing bank earnings. Various techniques can model the revenue of a debtor. One of them is the decision tree. There are several decision tree algorithms that can be used as classifiers, for example: C4.5 and CART. However, the classification results may be inaccurate due to the imbalanced in the used data. One way that can be used to address this problem is to include methods of sampling strategies: for examples over-sampling and under-sampling. This research found that the implementation of sampling strategy on the use of C4.5 and CART can improve the average accuracy, precision, recall, and F-measure. Keywords: C4.5, CART, credit risk, decision tree, imbalance data, sampling strategy

5 PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

6 Penguji : 1. Toto Haryanto, SKom MSi 2. Muhammad Ashyar Agmalaro, SSi MKom

7 Judul Skripsi : Perbandingan Algoritme C4.5 dan CART pada Data Tidak Seimbang untuk Kasus Prediksi Risiko Kredit Debitur Kartu Kredit Nama : Dhieta Anggraini NIM : G Disetujui oleh Aziz Kustiyo, SSi MKom Pembimbing Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

8 PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta ala atas segala karunia-nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Oktober 2012 ini ialah klasifikasi, dengan judul Perbandingan Algoritme C4.5 dan CART pada Data Tidak Seimbang untuk Kasus Prediksi Risiko Kredit Debitur Kartu Kredit. Terima kasih penulis ucapkan kepada kedua orangtua penulis, saudarasaudara penulis yaitu Anggun dan Angga, serta seluruh anggota keluarga atas segala doa dan kasih sayangnya, Bapak Aziz Kustiyo, SSi MKom selaku pembimbing yang telah banyak memberi ide, saran, nasihat dan dukungan. Bapak Toto Haryanto, SKom MSi dan Bapak Muhammad Ashyar Agmalaro, SSi MKom selaku penguji yang telah memberi saran dan nasihat. Di samping itu, penulis juga mengucapkan terima kasih kepada rekan-rekan satu bimbingan atas diskusidiskusi selama bimbingan, Maulita, Nadya, Srividola, Putri Mushandri, Wara, Intan, Retno Wijayanti dan Fiqrotul Ulya atas semangat, bantuan, kritik dan saran yang diberikan kepada penulis, Ilkomerz 46 atas segala suka duka dalam kebersamaan. Semoga karya ilmiah ini bermanfaat. Bogor, Juli 2013 Dhieta Anggraini

9 DAFTAR ISI DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 2 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 TINJAUAN PUSTAKA 2 Klasifikasi 2 Data Tidak Seimbang 3 K-fold cross validation 3 Strategi Sampling 3 Pohon Keputusan 4 Algoritme C4.5 4 Algoritme CART 5 Akurasi, Precision, Recall, dan F-measure 6 METODE 6 Pengumpulan Data 7 Praproses Data 8 Strategi Sampling 8 Pembagian Data Latih dan Uji 9 Pembangunan Pohon Keputusan C4.5 dan CART 9 Analisis Hasil 10 Pembangunan Decision Support System (DSS) 10 HASIL DAN PEMBAHASAN 10 Praproses Data 10 Analisis Hasil 11 Perbandingan dengan Penelitian Sebelumnya 14

10 SIMPULAN DAN SARAN 15 Simpulan 15 Saran 16 DAFTAR PUSTAKA 16 RIWAYAT HIDUP 30

11 DAFTAR TABEL 1 Confusion matrix untuk 2 kelas 6 2 Keterangan atribut independen penentuan risiko kredit 8 3 Keterangan set data yang digunakan pada penelitian 9 4 Perfomansi akurasi (%) 12 5 Perfomansi precision (%) 12 6 Perfomansi recall (%) 12 7 Perfomansi F-measure (%) 12 8 Jumlah node pohon keputusan 12 9 Perbandingan analisis hasil dengan penelitian sebelumnya 15 DAFTAR GAMBAR 1 Metode penelitian 7 2 Sebaran data 11 DAFTAR LAMPIRAN 1 Daftar atribut 18 2 Akurasi hasil seluruh percobaan 19 3 Precision hasil seluruh percobaan 19 4 Recall hasil seluruh percobaan 20 5 F-measure hasil seluruh percobaan 20 6 Pohon keputusan algoritme C4.5 menggunakan strategi under-sampling cluster 21 7 Aturan yang terbentuk berdasarkan pohon keputusan algoritme C4.5 menggunakan strategi under-sampling cluster 22 8 Pohon keputusan algoritme CART menggunakan strategi undersampling cluster 25 9 Aturan yang terbentuk berdasarkan pohon keputusan algoritme CART menggunakan strategi under-sampling cluster Ilustrasi pohon keputusan algoritme CART Ilustrasi pohon keputusan algoritme C Antarmuka decision support system prediksi risiko kredit Hasil decision support system prediksi risiko kredit 29

12

13 1 PENDAHULUAN Latar Belakang Salah satu sumber pendapatan dalam kegiatan perbankan adalah memberikan kredit pada debitur. Salah satu kredit yang diberikan bank berupa kartu kredit. Pemberian kredit kepada debitur bisa menimbulkan risiko ketidakmampuan debitur atas kewajiban pembayaran utangnya, baik utang pokok maupun bunganya atau keduanya yang disebut risiko kredit (Rahayu 2008). Debitur dengan risiko kredit tinggi disebut debitur bad. Secara umum, jumlah debitur bad lebih sedikit dibanding jumlah debitur good. Risiko kredit tinggi dapat menyebabkan ketidaklancaran pembayaran utang oleh debitur sehingga dapat memunculkan kredit bermasalah. Hal ini bisa menyebabkan pengurangan pendapatan bank. Perkembangan teknologi informasi dapat digunakan dalam klasifikasi risiko kredit. Penelitian mengenai klasifikasi debitur kartu kredit dilakukan oleh Setiawati (2011). Setiawati mengklasifikasikan debitur menjadi 2 kelas, yaitu kelas debitur bad dan debitur good. Debitur bad merupakan debitur yang mengalami keterlambatan dalam pembayaran utangnya sedangkan debitur good merupakan debitur yang lancar pembayaran utangnya. Penelitian ini menggunakan data yang tidak seimbang. Untuk mengatasi ketidakseimbangan data ini dilakukan pengambilan sampel sebanyak 50 kali. Metode klasifikasi yang digunakan ialah jaringan saraf tiruan propagasi balik. Akurasi terbaik yang diperoleh sebesar 73.39%, recall, precision, dan F-measure kelas bad sebesar 56.26%, 36.90%, dan 44.57%. Pohon keputusan merupakan salah satu teknik yang populer dalam data mining. Hal ini dikarenakan pohon keputusan terbukti menghasilkan akurasi yang baik pada beberapa penelitian sebelumnya dalam hal klasifikasi. Yusuf (2007) melakukan klasifikasi risiko kredit dengan pohon keputusan algoritme C5.0, CART dan CHAID. Algoritme C5.0 memberikan rata-rata tingkat keakuratan sebesar 87.72%, CART 87.27%, dan CHAID 87.15%. Ada beberapa algoritme pohon keputusan di antaranya ID3, C4.5, CART, CHAID, SPRINT dan SLIQ. Ada dua kondisi pada himpunan data yaitu data seimbang dan data tidak seimbang. Data seimbang merupakan kondisi distribusi data pada dua kelas mendekati sama dan data tidak seimbang merupakan kondisi sebuah himpunan data terdapat satu kelas yang memiliki jumlah instance yang lebih kecil dibandingkan kelas lainnya (Chawla 2003). Penelitian yang dilakukan Chawla menggunakan 5 set data dengan distribusi data minority sebagai berikut pima 35%, phoneme 29%, satimage 10%, mammography 2%, dan krkopt 1%. Untuk mengatasi ketidakseimbangan data ini, Chawla melakukan strategi sampling yaitu Synthetic Minority Over-sampling Technique (SMOTE), over-sampling, dan under-sampling. Pada SMOTE membangkitkan data dengan memperhitungkan jarak tetangga data minority, over-sampling dilakukan duplikasi pada data minority, dan under-sampling dilakukan pemilihan instance pada data majority sehingga jumlahnya sama dengan data minority. Pohon keputusan C4.5 merupakan model klasifikasi yang digunakan pada penelitian ini dan AUC

14 2 merupakan analisis hasil. Penelitian ini menyimpulkan bahwa SMOTE paling baik, dan under-sampling lebih baik dari over-sampling. Dengan latar belakang ini, pengembangan model pada penelitian ini menggunakan pohon keputusan dengan algoritme C4.5 dan CART untuk mengklasifikasikan calon debitur ke dalam kategori good atau bad. Data pada penelitian ini merupakan data tidak seimbang sehingga dilakukan strategi sampling yaitu over-sampling dan under-sampling untuk mengatasinya.. Perumusan Masalah Bank memiliki kemungkinan menerima debitur dengan risiko kredit tinggi. Jumlah debitur yang memiliki risiko kredit tinggi biasanya jauh lebih sedikit dibanding debitur dengan risiko kredit yang rendah. Namun, hal ini bisa menyebabkan pengurangan pendapatan bank. Tujuan Penelitian Tujuan penelitian ini ialah menerapkan over-sampling dan under-sampling pada data tidak seimbang dengan metode klasifikasi pohon keputusan algoritme C4.5 dan CART. Penelitian ini juga membandingkan nilai akurasi, precision, recall, F-measure dan jumlah node yang terbentuk pada pohon keputusan algoritme C4.5 dan CART serta pembuatan decision support sistem (DSS). Manfaat Penelitian Manfaat penelitian ini ialah membuat suatu model serta decision support system (DSS) yang dapat memprediksi risiko kredit pada penerimaan debitur kartu kredit sehingga dapat meminimalkan potensi kerugian. Ruang Lingkup Penelitian Ruang lingkup dalam penelitian ini ialah set data yang digunakan merupakan data pada penelitian Setiawati (2011) yaitu data debitur kartu kredit Bank X tahun Data ini juga digunakan pada penelitian Natasia (2013). Metode yang digunakan pada penelitian ini ialah pohon keputusan dengan algoritme C4.5 dan CART. TINJAUAN PUSTAKA Klasifikasi Menurut Tan et al. (2006) teknik klasifikasi merupakan pendekatan sistematik untuk membentuk model klasifikasi dari set data. Contoh teknik klasifikasi di antaranya pohon keputusan, neural network, support vector machines, naïve Bayes, dan lainnya. Model klasifikasi digunakan untuk mengetahui label kelas dari instance yang belum diketahui.

15 Set data yang digunakan pada klasifikasi tediri atas data latih dan data uji. Data latih merupakan instance yang diketahui kelasnya. Data latih digunakan untuk pembuatan model, sedangkan data uji digunakan untuk mengevaluasi model. Evaluasi dari model klasifikasi didasarkan perhitungan prediksi yang benar dan prediksi yang salah oleh model klasifikasi. Data Tidak Seimbang Data tidak simbang merupakan kondisi sebuah himpunan data terdapat satu kelas yang memiliki jumlah instance yang kecil bila dibandingkan dengan kelas lainnya. Kelas yang memiliki jumlah instance yang kecil disebut minority dan kelas yang memiliki jumlah instance besar disebut majority (Chawla 2003). Permasalahannya hal yang ingin diamati ialah kelas minority sehingga sering terjadi kesalahan klasifikasi pada kelas minority. Ketidakseimbangan data ini dapat diatasi dengan beberapa cara, di antaranya dengan pengambilan sampel pada tiap kelas dan strategi sampling seperti over-sampling dan under-sampling. K-fold cross validation Dalam membagi data latih dan data uji, K-fold cross validation ialah metode yang umum digunakan. Metode ini membagi data menjadi k bagian yang berukuran sama, kemudian sebanyak k-1 bagian akan digunakan sebagai data latih dan 1 bagian akan digunakan sebagai data uji. Proses ini diulangi sebanyak k kali sehingga setiap bagian pernah dijadikan data uji sebanyak 1 kali. Akurasi ditentukan dengan menjumlahkan akurasi untuk semua k proses tersebut (Tan et al. 2006). Strategi Sampling Strategi sampling merupakan salah satu teknik yang populer dalam mengatasi ketidakseimbangan data. Strategi sampling akan mendistribusikan data pada 2 kelas mendekati sama. Teknik strategi sampling di antaranya oversampling kelas minority atau under-sampling kelas majority (Chawla 2003). Strategi over-sampling dilakukan pada data kelas minority sehingga jumlah kelas minority mendekati jumlah kelas majority. Strategi ini dapat dilakukan dengan menduplikasi kelas minority. Strategi over-sampling dengan duplikasi memiliki beberapa instance yang sama sehingga tidak memiliki variasi data. Oleh karena itu, strategi over-sampling juga dilakukan dengan pembangkitan data acak untuk masing-masing atribut independen. Hal ini menghasilkan instance dengan kombinasi nilai atribut berbeda dengan data aslinya. Strategi under-sampling dilakukan pada kelas majority sehingga jumlah instance kelas majority sama dengan jumlah kelas minority. Strategi ini dapat dilakukan dengan memilih secara acak kelas majority. Strategi under-sampling dengan pemilihan acak dapat menyebabkan pemilihan instance tidak mewakili populasi. Oleh karena itu, dilakukan cluster pada data majority sebelum dilakukan pemilihan data. 3

16 4 Pohon Keputusan Pohon keputusan merupakan salah satu teknik yang populer dan banyak digunakan dalam data mining. Pohon keputusan merupakan model prediksi menggunakan struktur pohon atau berhirarki. Konsep dari pohon keputusan ialah mengubah data menjadi pohon keputusan dan aturan-aturan keputusan. Pohon keputusan digunakan untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon atribut input dengan satu atribut target. Pohon keputusan terdiri atas root node, internal node, dan leaf node. Root node merupakan atribut yang paling atas pada pohon keputusan, internal node menggambarkan atribut data yang akan diuji, dan leaf node merupakan kelas dari data yang dinginkan. Proses pembentukan pohon keputusan memiliki 2 tahap, yaitu pembentukan pohon keputusan dan pemangkasan pohon. Pada pembentukan pohon keputusan, diawali dengan pembentukan root node, kemudian dicari internal node berdasar atribut-atribut yang sesuai sehingga diperoleh atribut target yaitu leaf node. Setelah pohon keputusan terbentuk, dilakukan pemangkasan pohon. Hal ini dilakukan untuk meningkatkan nilai akurasi dari proses klasifikasi data. Algoritme C4.5 Algoritme C4.5 merupakan perkembangan dari algoritme ID3, dikembangkan oleh Quinlan Ross pada tahun Algoritme C4.5 merupakan penerapan dari algoritme Hunt yang juga diterapkan pada ID3 dan CART. Kelebihan algoritme C4.5 dibandingkan algoritme ID3 yaitu, dapat mengolah nilai data kategorik dan data numerik. Algoritme C4.5 juga dapat menangani nilai atribut yang hilang. Algoritme dari pohon keputusan C4.5 dimulai dengan pemilihan node tunggal sebagai akar/root dari pohon keputusan. Setelah node akar dibentuk, maka data pada node akar diukur dengan information gain untuk dipilih atribut mana yang dijadikan atribut pemecahannya. Sebuah cabang dibentuk dari atribut yang dipilih menjadi pembagi kemudian data didistribusikan ke dalam cabang masing-masing. Algoritme ini menggunakan proses rekursif dalam membentuk sebuah pohon keputusan. Ketika sebuah atribut dipilih menjadi node pemecahan atau cabang, maka atribut tersebut tidak diikutkan lagi dalam perhitungan nilai information gain. Proses rekursif berhenti ketika atribut memiliki cabang berupa kelas atau tidak ada lagi atribut yang bisa dipecah untuk menjadi cabang pohon keputusan. Jika dalam satu cabang anggotanya berasal dari satu kelas maka cabang ini disebut pure. Semakin pure suatu cabang semakin baik. Ukuran purity dinyatakan dengan tingkat impurity. Algoritme C4.5 menggunakan information gain dan entrophy untuk kriteria impurity penggunaan atribut sebagai node dari pohon keputusan (Kantardzic 2003). Persamaan entrophy dapat dilihat pada persamaan di bawah ini. dengan : T = Himpunan Kasus p j = Proporsi dari T i terhadap T ( ) - ( 1 )

17 5 Jika kandidat pemecahan A terdiri atas beberapa kandidat. Pada data latih T terdiri atas beberapa bagian, yaitu T 1, T 2, T 3,.T k maka informasi dapat dihitung dengan bobot entrophy dari masing-masing bagian tersebut dan information gain (A) dapat dihitung dengan persamaan 2. dengan: T = Himpunan Kasus A = Atribut n = Jumlah Partisi atribut A T i = Jumlah kasus pada partisi ke i T = Jumlah Kasus dalam T n Gain, A ( )- T i i i ) ( 2 ) Nilai Gain merupakan nilai kesamaan dari partisi data. Semakin besar nilai Gain dari sebuah data maka, nilai keanekaragaman data semakin kecil. Pemecahan terbaik merupakan pemecahan yang menghasilkan nilai Gain terbesar. Algoritme CART Algoritme Classification And Regression Tree (CART) merupakan algoritme pohon keputusan yang dikembangkan oleh Breiman et al. (1984). Algoritme CART Pada klasifikasi pohon keputusan menghasilkan pohon keputusan berupa binary tree (Larose 2005). Hal pertama yang dilakukan pada pembentukan pohon keputusan algoritme CART ialah menentukan atribut independen yang menjadi pemecahan terbaik. Pemecahan terbaik merupakan pemecahan yang menurunkan keanekaragaman set data dengan penurunan terbesar. Pemecahan awal akan menghasilkan dua node. Pada tiap node, akan dicari pemecahan terbaik berikutnya. Proses pemecahan ini dilakukan secara rekursif sampai semua leaf node berupa kelas. Algoritme CART menentukan pemecahan yang paling optimal menggunakan ukuran kesamaan nilai Gini yang dapat dilihat pada persamaan di bawah ini. T * Gini i Gini( i ) i ( 3 ) Gini( i ) - dengan : Gini(D i ) = nilai Gini dari data jika dipartisi dengan parameter A. k = jumlah pembagian data pada CART k = 2 i m i ( 4 ) = nilai perbandingan jumlah data D dengan jumlah data pertisi ke-i = jumlah kelas yang ada = nilai perbandingan jumlah data D i i dengan jumlah data kelas ke-j Nilai Gini merupakan nilai keanekaragaman dari partisi data. Semakin kecil nilai Gini dari sebuah data, nilai keanekaragaman data semakin kecil. Pemecahan terbaik merupakan pemecahan yang menghasilkan nilai Gini terkecil.

18 6 Akurasi, Precision, Recall, dan F-measure Pengukuran kemampuan algoritme dilakukan dengan confusion matrix yang dapat dilihat pada Tabel 1. Confusion matrix mengandung informasi tentang data kelas aktual dan hasil prediksi. Confusion matrix digunakan sebagai dasar dari variasi ukuran penilaian seperti precision dan recall. Kombinasi precision dan recall merepresentasikan nilai F-measure yang biasanya menggunakan bobot yang sama pada keduanya. Persamaan precision, recall dan F-measure dapat dilihat pada persamaan 5, persamaan 6, persamaan 7, dan persamaan 8 (Weng dan Poon 2006). Recall merupakan persentase kelas data positif yang berhasil diprediksi dengan benar dari keseluruhan instance di kelas positif. Precision merupakan proporsi dari kelas data positif yang berhasil diprediksi dengan benar dari keseluruhan hasil prediksi kelas positif. Nilai F-measure yang tinggi menunjukkan bahwa recall dan precision juga tinggi. METODE Pada penelitian ini hal utama yang dilakukan yaitu identifikasi masalah, pengumpulan data, praproses data, strategi sampling, 10-fold cross validation untuk menentukan data latih dan data uji, pembangunan model dengan pohon keputusan C4.5 dan CART, analisis hasil, pembuatan decision support system dan pengujian. Ilustrasinya dapat dilihat pada Gambar 1. n a a i T T T T ( 5 ) n a i i n T T ( 6 ) Tabel 1 Confusion matrix untuk 2 kelas Kelas hasil prediksi Kelas aktual Kelas positif Kelas negatif Kelas positif TP FN Kelas negatif FP TN Keterangan : TP = jumlah instance kelas positif yang diprediksi benar sebagai kelas positif FN = jumlah instance kelas positif yang diprediksi salah sebagai kelas negatif FP = jumlah instance kelas negatif yang diprediksi salah sebagai kelas positif TN = jumlah instance kelas negatif yang diprediksi benar sebagai kelas negatif

19 7 n a a T T ( 7 ) n a - a ( 8 ) Pengumpulan Data Data yang digunakan pada penelitian ini ialah data sekunder yang digunakan juga pada penelitian Setiawati (2011) dan Natasia (2013). Data penelitian ini merupakan data dari Bank X yaitu data debitur kartu kredit tahun Identifikasi masalah pada penelitian ialah pengklasifikasian risiko kredit penerimaan debitur kartu kredit pada Bank X. Pada data ini debitur dikategorikan menjadi dua yaitu good berarti debitur tersebut lancar dalam memenuhi kewajibannya, dan debitur bad mengalami tunggakan lebih dari 90 hari. Data yang digunakan merupakan data debitur yang sudah selesai kewajibannya. Mulai Pengumpulan Data Praproses Data Under-sampling Strategi Sampling Data Asli Over-sampling Data Uji Pembagian Data 10-fold cross validation Data Latih Pengujian Model Pembangunan Pohon Keputusan C4.5 dan CART Analisis Hasil Pembangunan decision support system Pengujian Sistem Selesai Gambar 1 Metode penelitian

20 8 Penelitian ini menggunakan 14 atribut independen. Atribut tersebut ialah pendidikan, jenis kelamin, status pernikahan, tipe perusahaan, status pekerjaan, pekerjaan, masa kerja, lama tinggal, status pemilikan rumah, banyaknya tanggungan, pendapatan, banyaknya kartu kredit lain, persentase utang kartu kredit, umur dan 1 atribut kelas yaitu debitur bad atau debitur good. Atribut tersebut bertipe ordinal, nominal, atau rasio riciannya ditunjukkan pada Tabel 2. Praproses Data Beberapa atribut memiliki missing value, contohnya pada atribut persentase utang kartu kredit, banyaknya kartu kredit lain, dan lainnya. Untuk mengatasi missing value dilakukan penghapusan instance yang memiliki missing value dan nilai yang tidak valid sehingga terjadi pengurangan jumlah instance. Setelah dilakukan praproses data diperoleh 1 set data asli. Strategi Sampling Pada penelitian ini, strategi sampling digunakan karena data pada kedua kelas tidak seimbang. Strategi sampling yang digunakan ialah over-sampling dan under-sampling. Pada strategi over-sampling jumlah instance pada data minority ditambah sehingga jumlahnya mendekati data majority. Strategi ini dilakukan dua cara yaitu dengan menduplikasi data minority dan pembangkitan data acak sebanyak Pada strategi over-sampling diperoleh 2 set data, yaitu 1 set data over-sampling duplikasi dan 1 set data over-sampling acak. Pada strategi under-sampling, jumlah instance pada data majority dikurangi sehingga jumlahnya sama dengan data minority. Strategi ini dilakukan dua cara, yaitu dengan memilih secara acak data majority dan pemilihan dilakukan berdasar hasil cluster data majority. Pada pemilihan acak data majority, dilakukan Tabel 2 Keterangan atribut independen penentuan risiko kredit Atribut Pendidikan Jenis Kelamin Status Pernikahan Tipe Perusahaan Status Pekerjaan Pekerjaan Masa Kerja Lama Tinggal Status Pemilikan Rumah Banyaknya Tanggungan Pendapatan Banyaknya Kartu Kredit Lain Persentase Utang Kartu Kredit Umur Kelas Keterangan Ordinal Nominal Nominal Nominal Nominal Nominal Rasio Rasio Rasio Rasio Rasio Rasio Rasio Rasio Nominal

21 percobaan sebanyak 3 kali sehingga diperoleh 3 set data. Pemilihan yang dilakukan berdasar hasil cluster dilakukan beberapa percobaan untuk mencari jumlah cluster yang paling maksimal. Percobaan cluster dilakukan mulai dari 2 cluster sampai 11 cluster. Setelah itu, dilakukan pemilihan data secara acak pada tiap cluster sesuai dengan proporsi instance pada tiap cluster. Setelah diperoleh jumlah cluster yang menghasilkan akurasi tertinggi, maka dilakukan percobaan sebanyak 3 kali dengan jumlah cluster tersebut. Pada strategi under-sampling diperoleh 15 set data yaitu 10 set data hasil cluster 2 sampai 11, 2 set data lain setelah diperoleh jumlah cluster paling maksimal, 3 set data under-sampling acak. Rincian set data pada penelitian ini dapat dilihat pada Tabel 3. Pembagian Data Latih dan Uji Teknik yang digunakan untuk membagi data latih dan data uji ialah 10-fold cross validation. Teknik ini membagi data menjadi 10 bagian terpisah. Data pelatihan menggunakan 9 bagian dan data pengujian menggunakan 1 bagian. Hal ini dilakukan berulang-ulang sampai semua subsampel pernah menjadi data uji. Pembangunan Pohon Keputusan C4.5 dan CART Data latih yang diperoleh dengan 10-fold cross validation selanjutnya digunakan untuk pembuatan model pohon keputusan C4.5 dan CART. Penelitian ini memiliki 18 set data. Data asli 1 set data, data under-sampling 15 set data, over-sampling 2 set data. Pada tiap set data dilakukan percobaan terhadap pohon Tabel 3 Keterangan set data yang digunakan pada penelitian Asli Over-sampling Set Data Keterangan Asli Duplikasi Pembangkitan Acak Under-sampling Pemilihan Acak 1 Pemilihan Acak 2 Pemilihan Acak 3 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8 Cluster 9 Cluster 10-1 Cluster 10-2 Cluster 10-3 Cluster 11 9

22 10 keputusan algoritme C4.5 dan CART yang dilakukan pruning dan unpruning. Analisis Hasil Analisis hasil dilakukan dengan membandingkan hasil dari pohon keputusan yang dihasilkan oleh algoritme C4.5 dan CART yang menerapkan metode oversampling dan under-sampling. Penilaian yang digunakan dalam menganalisis model yaitu akurasi untuk melihat secara keseluruhan. Pada data asli yang merupakan data tidak seimbang, akurasi dapat didominasi oleh kelas majority sehingga dilakukan juga perhitungan precision, recall, dan F-measure untuk kelas bad. Pohon keputusan dengan algoritme C4.5 dan CART merupakan classifier yang digunakan pada penelitian ini sehingga jumlah node yang terbentuk pada pohon keputusan juga dijadikan ukuran penilaian. Pembangunan Decision Support System (DSS) Setelah analisis terhadap pohon keputusan yang dihasilkan, dipilih 1 pohon yang menerapkan algoritma C4.5 dan 1 pohon yang menerapkan algoritme CART untuk diambil aturannya dan dibangun decision support system. Pemilihan pohon dilakukan berdasar nilai F-measure dan jumlah node yang dihasilkan pada pohon keputusan. HASIL DAN PEMBAHASAN Praproses Data Dari hasil analisis data, diketahui bahwa tidak semua atribut memiliki nilai yang lengkap, dimana kelengkapan atribut ini menentukan seberapa baik hasil dari klasifikasi. Jumlah instance pada kedua kelas berkurang setelah praproses data. Jumlah data yang diperoleh sebanyak 4413 dengan 518 data yang memiliki nilai tidak lengkap pada atributnya. Untuk mengatasi nilai yang tidak lengkap pada data maka dilakukan penghapusan terhadap data yang tidak lengkap. Setelah penghapusan data, jumlah data yang digunakan pada penelitian ini sebanyak 3895 data. Data kelas bad sebanyak 636 data dan data kelas good sebanyak 3259 data. Sebaran datanya dapat dilihat pada Gambar 2. Pada strategi over-sampling dilakukan 2 cara, yaitu duplikasi dan pembangkitan data secara acak. Metode over-sampling duplikasi menduplikasi data dari kelas bad sebanyak 4 kali sehingga jumlah data kelas bad yang semula sebanyak 636 data menjadi 3180 data. Metode over-sampling membangkitkan data secara acak untuk setiap atribut berdasarkan nilai data yang sudah ada sebanyak 2600 sehingga data bad yang semula 636 menjadi Strategi under-sampling juga menggunakan dua cara pemilihan instance sampling, yaitu menggunakan cluster dan secara acak. Pada pemilihan undersampling acak data kelas good dipilih secara acak sehingga jumlah data kelas good yang semula 3259 menjadi 636. Strategi under-sampling acak dapat menyebabkan pemilihan instance tidak mewakili populasi. Oleh karena itu, strategi under-sampling cluster dilakukan dengan mengelompokkan data kelas

23 good menjadi beberapa cluster. Pada tiap cluster tersebut diambil sampel secara acak sesuai proporsi jumlahnya sehingga data kelas good menjadi 636. Pada percobaan pemilihan cluster terbaik dilakukan percobaan dari 2 cluster sampai 11 cluster. Hasil yang diperoleh menunjukkan bahwa cluster 10 menghasilkan akurasi paling maksimal baik menggunakan algoritme C4.5 maupun CART. Setelah cluster 10 diperoleh sebagai cluster terbaik, percobaan dengan cluster 10 dilakukan lagi sebanyak 2 kali. Hal ini dilakukan agar set data yang diperoleh merupakan set data yang menghasilkan akurasi dan F-measure paling maksimal. Analisis Hasil Analisis hasil percobaan dengan membandingkan pohon keputusan yang menggunakan strategi over-sampling duplikasi, over-sampling acak, undersampling acak, under-sampling cluster dan data asli dengan algoritme C4.5 dan CART baik dilakukan pruning maupun unpruning. Dari hasil pengolahan dan uji coba menggunakan WEKA dalam menerapkan algoritme C4.5 dan CART dihasilkan dihasilkan kinerja berupa nilai akurasi, precision, recall, F-measure, dan banyaknya jumlah node pada pohon keputusan. Berdasarkan akurasi yang diperoleh pada Tabel 4 terlihat bahwa akurasi antara data asli dan data yang sudah dilakukan strategi sampling tidak memiliki perbedaan yang signifikan. Algoritme C4.5 memiliki akurasi tertinggi pada pohon keputusan yang dihasilkan unpruning dan dilakukan strategi over-sampling duplikasi yaitu sebesar 88.65%. Algoritme CART memiliki akurasi tertinggi pada pohon keputusan yang dihasilkan pruning dan dilakukan strategi under-sampling cluster yaitu sebesar 88.52%. Pada strategi under-sampling yang ditampilkan merupakan hasil terbaik, baik under-sampling cluster maupun under-sampling acak. Secara global akurasi tertingi diperoleh pada saat dilakukan strategi oversampling duplikasi dan under-sampling cluster walaupun hasil akurasi dengan metode lain juga cukup tinggi rata-rata di atas 80%. Akurasi saat dilakukan strategi over-sampling acak merupakan akurasi yang paling kecil hal ini dikarenakan data yang diperoleh merupakan data yang dibangkitkan secara acak pada masing-masing atribut sehingga mempengaruhi kombinasi antara atribut independen dan atribut dependen yang juga mempengaruhi purity pada saat membangun pohon keputusan. 11 Gambar 2 Sebaran data

24 12 Tabel 4 Performa akurasi (%) C4.5 Pruning C4.5 Unpruning CART Pruning CART Unpruning Asli Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling acak Tabel 5 Performa precision (%) C4.5 Pruning C4.5 Unpruning CART Pruning CART Unpruning Asli Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling acak Tabel 6 Performa recall (%) C4.5 Pruning C4.5 Unpruning CART Pruning CART Unpruning Asli Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling acak Tabel 7 Performa F-measure (%) C4.5 Pruning C4.5 Unpruning CART Pruning CART Unpruning Asli Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling acak Tabel 8 Jumlah node pohon keputusan C4.5 CART Pruning Unpruning Pruning Unpruning Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling acak

25 Precision yang diperoleh pada Tabel 5 menunjukkan perbedaan yang cukup signifikan antara data asli dan data yang dilakukan strategi sampling. Hal ini berbeda dengan akurasi yang tidak memiliki perbedaan signifikan. Precision merupakan proporsi dari kelas data positif yang berhasil diprediksi dengan benar dari keseluruhan hasil prediksi kelas positif. Precision yang diperoleh menunjukkan bahwa kesalahan prediksi pada kelas good kecil. Hal ini dikarenakan nilai precision besar berarti salah prediksi kelas good pun kecil. Hasil precision menunjukkan bahwa pada saat menghitung akurasi diperoleh akurasi yang tinggi pada data asli dikarenakan data good yang jauh lebih besar dari data bad mempengaruhi hasil akurasi tersebut. Setelah dilakukan over-sampling, dan under-sampling nilai precision mengalami peningkatan yang cukup signifikan. Precision tertinggi pada algoritme C4.5 diperoleh pada pohon keputusan yang dilakukan pruning dan menggunakan strategi under-sampling cluster, yaitu sebesar 92.50%. Precision tertinggi pada algoritme CART diperoleh pada pohon keputusan yang dilakukan pruning dan mengunakan strategi under-sampling acak, yaitu sebesar 95.00%. Secara global, nilai precision tertinggi diperoleh pada saat dilakukan strategi under-sampling walaupun hasil akurasi dengan metode lain juga cukup tinggi. Seperti akurasi, precision yang dihasilkan pada saat menggunakan strategi over-sampling acak merupakan nilai precision yang paling kecil diantara yang lainnya. Recall merupakan merupakan persentase kelas data positif yang berhasil diprediksi dengan benar dari keseluruhan instance di kelas positif. Bedasarkan hasil recall yang diperoleh terlihat bahwa jumlah data bad yang dikelaskan dengan benar sangat kecil, baik menggunakan algoritme C4.5 maupun CART. Hasil recall yang diperoleh dapat dilihat pada Tabel 6. Nilai recall yang dihasilkan juga memiliki perbedaan yang signifikan antara data asli dan data yang dilakukan strategi sampling. Nilai recall menunjukkan bahwa data bad pada data asli yang dikelaskan dengan benar sangat kecil, baik menggunakan algoritme C4.5 maupun CART. Nilai recall tertinggi menggunakan algoritme C4.5 diperoleh pada pohon keputusan yang dihasilkan tanpa dilakukan pruning dan menggunakan strategi over-sampling duplikasi, yaitu sebesar 99.10%. Algoritme CART menghasilkan nilai recall tertinggi pada pohon keputusan yang dihasilkan tanpa dilakukan pruning dan menggunakan strategi over-sampling duplikasi, yaitu sebesar Secara global, nilai recall tertinggi diperoleh pada saat dilakukan stategi over-sampling duplikasi. F-measure merupakan perbandingan antara nilai precision dan recall. Nilai F-measure dapat dilihat pada Tabel 7. Perhitungan F-measure menggunakan nilai precision dan recall, sehingga nilai F-measure juga memiliki perbedaan yang signifikan antara data asli dan data yang dilakukan strategi sampling. Nilai F- measure tinggi merepresentasikan bahwa nilai precision dan recall juga tinggi. Nilai F-measure tertinggi menggunakan algoritme C4.5 diproleh pada pohon keputusan yang dihasilkan tanpa dilakukan pruning dan menggunakan strategi over-sampling duplikasi, yaitu sebesar Algoritme CART menghasilkan nilai F-measure tertinggi pada pohon keputusan yang dihasilkan tanpa dilakukan pruning dan menggunakan strategi over-sampling duplikasi, yaitu sebesar Secara global, nilai F-measure tertinggi diperoleh pada saat dilakukan stategi over-sampling duplikasi. 13

26 14 Secara global diperoleh bahwa nilai akurasi, recall dan F-measure tertinggi diperoleh pada saat dilakukan strategi over-sampling duplikasi sedangkan nilai precision tertinggi diperoleh pada saat dilakukan strategi under-sampling. Hasil akurasi, precision, recall, maupun F-measure yang dilakukan strategi sampling cukup tinggi dan tidak memiliki perbedaan yang cukup signifikan. Oleh karena itu, pada penelitian ini dapat disimpulkan bahwa strategi sampling, yaitu oversampling dan under-sampling dapat meningkatkan perfomansi dalam mengklasifikasikan data tidak seimbang pada kasus prediksi risiko kredit. Dengan dilakukan pruning pada pohon keputusan, rata-rata akurasi, precision, recall, dan F-measure mengalami sedikit peningkatan pada strategi over-sampling acak dan under-sampling. Namun, pada strategi over-sampling duplikasi dengan dilakukan pruning pada pohon keputusan menurunkan akurasi, precision, recall, dan F- measure. Jumlah node yang dihasilkan pada pohon keputusan dapat dilihat pada Tabel 8. Jumlah node paling sedikit menggunakan algoritme C4.5 diperoleh pada pohon keputusan yang dihasilkan dilakukan pruning dan menggunakan undersampling cluster, yaitu sebanyak 78 node dengan jumlah rules sebanyak 42. Jumlah node paling sedikit pada algoritme CART diperoleh pada pohon keputusan yang dihasilkan dilakukan pruning dan menggunakan under-sampling cluster, yaitu sebanyak 37 node dengan jumlah rules sebanyak 12. Berdasarkan jumlah node pada Tabel 8, dapat disimpulkan bahwa rata-rata jumlah node yang dihasilkan oleh algoritme CART lebih kecil dibandingkan dengan C4.5. Hal ini dikarenakan pohon keputusan yang dihasilkan merupakan binary tree. Setelah dilakukan analisis terhadap akurasi, precision, recall, dan F- measure dilanjutkan dengan pembuatan decision support system. Berdasarkan nilai F-measure, strategi over-sampling duplikasi merupakan nilai F-measure tertinggi dibandingkan yang lainnya. Namun, jumlah node yang dihasilkan sangat besar. Nilai F-measure menggunakan strategi under-sampling cluster cukup tinggi bahkan mendekati nilai F-measure yang dihasilkan menggunakan strategi over-sampling duplikasi dan jumlah node yang dihasilkan jauh lebih kecil dibandingkan over-sampling duplikasi. Oleh karena itu, aturan yang digunakan pada pembuatan decision support system merupakan aturan yang dihasilkan oleh pohon keputusan menggunakan strategi under-sampling cluster. Perbandingan dengan Penelitian Sebelumnya Setiawati (2011) dan Natasia (2013) melakukan penelitian menggunakan data yang sama dengan penelitian ini. Pada penelitian yang dilakukan Setiawati, jaringan saraf tiruan propagasi balik merupakan classifier. Pengambilan sampel sebanyak 50 kali dilakukan untuk mengatasi data yang tidak seimbang. Model terbaik dari penelitian ini menghasilkan akurasi sebesar 73.4%, precision kelas bad sebesar 36.90, recall kelas bad sebesar 56.26% dan F-measure sebesar 44.57%. Pada penelitian yang dilakukan Natasia, voting feature intervals 5 merupakan classifier. Pengambilan sampel sebanyak 50 kali dilakukan untuk mengatasi data tidak seimbang. Penelitian Natasia menggunakan 3 model. Model 1 merupakan model VFI5 tanpa pemilihan fitur. Model 2 merupakan model VFI5 dengan pemilihan fitur berdasarkan akurasi. Pemilihan fitur yang dipilih pada saat fitur memiliki akurasi lebih besar dari 50%. Model 3 merupakan model VFI5

27 15 Tabel 9 Perbandingan analisis hasil dengan penelitian sebelumnya Metode Akurasi Precison Recall F-measure JST propagasi balik 1) VFI5 model 1 2) VFI5 model 2 2) VFI5 model 3 2) C4.5 over-sampling duplikasi CART over-sampling duplikasi C4.5 under-sampling cluster CART under-sampling cluster Keterangan: 1) Penelitian Setiawati (2011) 2) Penelitian Natasia (2013) dengan pemilihan fitur secara bertahap dan hanya menggunakan 2 fitur. Akurasi tertinggi diperoleh pada model 3 yaitu sebesar 70.40%. Nilai recall tertinggi diperoleh pada model 2 yaitu sebesar 46.88%. Nilai precision tertinggi diperoleh pada model % dan nilai F-measure tertinggi diperoleh pada model 2 sebesar 32.35%. Perbandingan akurasi, precision, recall, dan F-measure pada penelitian ini terhadap penelitian yang sudah dilakukan sebelumnya dapat dilihat pada Tabel 9. Berdasarkan Tabel 9 terlihat bahwa secara global akurasi, precision, recall dan F-measure yang dihasilkan menggunakan over-sampling dan under-sampling lebih baik dibandingkan penelitian yang dilakukan sebelumnya. SIMPULAN DAN SARAN Simpulan Penelitian yang menerapkan algoritme C4.5 dan CART dalam mengklasifikasikan calon debitur ke dalam kategori good atau bad telah dilakukan. Berdasarkan penelitian yang telah dilakukan, dapat disimpulkan bahwa pemodelan yang menggunakan data tidak seimbang dengan strategi sampling yaitu under-sampling dan over-sampling mampu meningkatkan precision, recall, dan F-measure pada kelas bad. Nilai precision, recall, dan F-measure yang diperoleh setelah dilakukan strategi sampling rata-rata lebih dari 80%. Pohon keputusan yang dilakukan pruning menggunakan strategi over-sampling acak dan under-sampling rata-rata mengalami peningkatan pada akurasi, precision, recall, dan F-measure dibandingkan yang tidak dilakukan pruning. Namun, pohon keputusan yang dilakukan pruning menggunakan strategi over-sampling duplikasi mengalami penurunan pada akurasi, precision, recall, dan F-measure. Decision support system menggunakan pohon keputusan C4.5 dan CART dengan strategi under-sampling cluster telah berhasil dibuat. Sistem menerima inputan berupa 14 atribut seperti pendidikan, jenis kelamin, status pernikahan, tipe perusahaan, status pekerjaan, pekerjaan, masa kerja, lama tinggal, status

28 16 pemilikan rumah, banyaknya tanggungan, pendapatan, banyaknya kartu kredit lain, persentase utang kartu kredit, dan umur. Decision support system akan memberikan output risiko kredit calon debitur yaitu tinggi atau rendah. Risiko kredit tinggi merupakan debitur bad. Perbandingan dengan penelitian sebelumnya menunjukkan bahwa akurasi, precision, recall, dan F-measure yang dihasilkan menggunakan over-sampling dan under-sampling dengan pohon keputusan sebagai classifier paling baik. Hal ini dikarenakan akurasi, precision, recall, dan F-measure yang dihasilkan lebih tinggi dibandingkan penelitian yang dilakukan Setiawati (2011) dan Natasia (2013) menggunakan data yang sama. Saran Penelitian ini dapat dikembangkan lebih lanjut untuk mendapatkan hasil akurasi, precision, recall, dan F-measure yang lebih baik. Hal-hal yang dapat dilakukan di antaranya ialah melakukan strategi sampling yang lain untuk mengatasi ketidakseimbangan data misal SMOTE atau melakukan perbandingan pada pohon keputusan dengan algoritme lain seperti supervised learning in quest (SLIQ) atau scalable parallelizable induction of decision tree (SPRINT). DAFTAR PUSTAKA Chawla VN C4.5 and Imbalance Data sets: Investigating the effect of sampling method, probabilistic estimate, and decision tree structure. Di dalam: Workshop on Learning from Imbalanced Datasets II [Internet]; 2003 Aug 21; Washington DC, Amerika Serikat. Washington DC(US). [diunduh 2013 Mar 27]. Tersedia pada: ~nat/workshop2003/chawla.pdf Kantardzic M Data Mining Concepts, Models, Methods, and Algorithms. Kartalopoulos VS, editor. New Jersey(US):IEEE Press Wiley-Interscience Larose TD Discovering Knowledge in Data an Introduction to Data Mining. New Jersey (US): John Wiley & Sons, Inc Natasia RS Klasifikasi debitur kartu kredit dengan pemilihan fitur mengunakan voting feature intervals5 [skripsi]. Bogor (ID). Institut Pertanian Bogor Rahayu U Klasifikasi Nasabah Kredit dengan Regresi Logistik [skripsi]. Bogor (ID). Institut Pertanian Bogor Setiawati AP Penelusuran banyaknya unit dan lapisan tersembunyi jaringan saraf tiruan pada data tidak seimbang (Studi kasus debitur kartu kredit Bank Mandiri tahun ) [skripsi].bogor (ID). Institut Pertanian Bogor Tan NP, Steinbach M, Kumar V Introduction to Data Mining. Goldstein M, editor. London (UK) : Pearson Education, Inc Weng GC, Poon J A New Evaluation Measure for Imbalanced Datasets. Dalam :Roddick FJ, Li J, Christen P, Kennedy P, editor. Data Mining and Analytics Volume 87. Conference Seventh Australian Data Mining Conference (AusDM 2008) [Internet]; 2008 Nov 27; Glenelg Australia.

29 Adelaide (AU). [diunduh 2013 Mar 21]. Tersedia pada: Yusuf Y Perbandingan Perfomansi Algoritma Decision Tree C5.0, CART, dan CHAID : Kasus Prediksi Status Risiko Kredit di Bank X. Seminar Nasional Aplikasi Teknologi Informasi 2007 (SNATI 2007) [Internet]; 2007 Jun 16; Yogyakarta. Indonesia. Yogyakarta(ID). ;[diunduh 2013 Mar 27]. Tersedia pada: 1628/

30 18 Lampiran 1 Daftar atribut Atribut Pendidikan Jenis Kelamin Status Pernikahan Tipe Perusahaan Status Pekerjaan Pekerjaan Masa Kerja Lama Tinggal Status Pemilikan Rumah Banyaknya Tanggungan Pendapatan Banyaknya Kartu Kredit Lain Persentase Utang Kartu Kredit Umur Kelas Keterangan 1 = SMP/SMA 2 = Akademi 3 = S1/S2 1 = Pria 2 = Wanita 1 = Lajang 2 = Menikah 3 = Bercerai 1 = Kontraktor 2 = Conversion 3 = Industri Berat 4 = Pertambangan 5 = Jasa 6 = Transportasi 1 = Permanen 2 = Kontrak 1 = Conversion 2 = PNS 3 = Professional 4 = Wiraswasta 5 = Perusahaan Swasta Dalam bulan Dalam bulan 0 = Bukan Milik Sendiri 1 = Milik Sendiri Rupiah Dalam tahun 1 = Debitur bad 2 = Debitur good

31 19 Lampiran 2 Akurasi hasil seluruh percobaan C4.5 Pruning C4.5 Unpruning CART Pruning CART Unpruning Asli Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster10_ Under-sampling cluster10_ Under-sampling cluster10_ Under-sampling cluster Under-sampling acak Under-sampling acak Under-sampling acak Lampiran 3 Precision hasil seluruh percobaan C4.5 Pruning C4.5 Unpruning CART Pruning CART Unpruning Asli Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster10_ Under-sampling cluster10_ Under-sampling cluster10_ Under-sampling cluster Under-sampling acak Under-sampling acak Under-sampling acak

32 20 Lampiran 4 Recall hasil seluruh percobaan C4.5 Pruning C4.5 Unpruning CART Pruning CART Unpruning Asli Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster10_ Under-sampling cluster10_ Under-sampling cluster10_ Under-sampling cluster Under-sampling acak Under-sampling acak Under-sampling acak Lampiran 5 F-measure hasil seluruh percobaan C4.5 Pruning C4.5 Unpruning CART Pruning CART Unpruning Asli Over-sampling duplikasi Over-sampling acak Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster Under-sampling cluster10_ Under-sampling cluster10_ Under-sampling cluster10_ Under-sampling cluster Under-sampling acak Under-sampling acak Under-sampling acak

33 21 Lampiran 6 Pohon keputusan algoritme C4.5 menggunakan strategi undersampling cluster pendidikan = 1: 1 pendidikan = 2: 1 pendidikan = 3 lama tinggal <= 59 persentase utang kartu kredit <= 49.8: 2 persentase utang kartu kredit > 49.8 pekerjaan = 1: 2 pekerjaan = 2: 2 pekerjaan = 3: 1 pekerjaan = 4 status pernikahan = 1: 1 status pernikahan = 2 status pekerjaan = 1 status pemilikan rumah = 0 persentase utang kartu kredit <= 72: 2 persentase utang kartu kredit > 72: 1 status pemilikan rumah = 1 masa kerja <= 49 persentase utang kartu kredit <= 73.33: 2 persentase utang kartu kredit > 73.33: 1 masa kerja > 49: 2 status pekerjaan = 2 status pemilikan rumah = 0 persentase utang kartu kredit <= 77.89: 2 persentase utang kartu kredit > 77.89: 1 status pemilikan rumah = 1 jenis kelamin = 1: 1 jenis kelamin = 2 persentase utang kartu kredit <= 82: 1 persentase utang kartu kredit > 82: 2 status pernikahan = 3: 2 pekerjaan = 5 pendapatan <= lama tinggal <= 11: 2 lama tinggal > 11 banyaknya tanggungan <= 1 banyaknya tanggungan <= 0 persentase utang kartu kredit <= jenis kelamin = 1: 1 (4.0) jenis kelamin = 2 pendapatan <= : 1 pendapatan > : 2 persentase utang kartu kredit > 68.57: 2 banyaknya tanggungan > 0 lama tinggal <= 25: 2

34 22 lama tinggal > 25: 1 banyaknya tanggungan > 1: 2 pendapatan > : 2 lama tinggal > 59 umur <= 39 lama tinggal <= 84 umur <= 29: 1 (16.0) umur > 29 banyaknya tanggungan <= 0 status pekerjaan = 1 masa kerja <= 59: 2 masa kerja > 59 masa kerja <= 109: 1 masa kerja > 109: 2 status pekerjaan = 2: 2 banyaknya tanggungan > 0 umur <= 38: 1 umur > 38: 2 lama tinggal > 84: 1 umur > 39 lama tinggal <= 120 pendapatan <= : 1 pendapatan > : 2 lama tinggal > 120 umur <= 47: 1 umur > 47 masa kerja <= 49: 1 masa kerja > 49 lama tinggal <= 240 pendapatan <= : 2 pendapatan > : 1 lama tinggal > 240: 1 Lampiran 7 Aturan yang terbentuk berdasarkan pohon keputusan algoritme C4.5 menggunakan strategi under-sampling cluster 1. If pendidikan = 1 then kelas = 1 2. If pendidikan = 2 then kelas = 1 3. If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit <= 49.8 then kelas = 2 4. If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 1 then kelas = 2 5. If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 2 then kelas = 2 6. If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 3 then kelas = 1 7. If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 1 then kelas = 1

35 8. If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 3 then kelas = 2 9. If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 1 and status pemilikan rumah = 0 and persentase utang kartu kredit <= 72 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 1 and status pemilikan rumah = 0 and persentase utang kartu kredit > 72 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 1 and status pemilikan rumah = 1 and masa kerja > 49 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 1 and status pemilikan rumah = 1 and masa kerja < 49 and persentase utang kartu kredit <= then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 1 and status pemilikan rumah = 1 and masa kerja < 49 and persentase utang kartu kredit > then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 2 and status pemilikan rumah = 0 and persentase utang kartu kredit <= then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 2 and status pemilikan rumah = 0 and persentase utang kartu kredit > then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 2 and status pemilikan rumah = 1 and jenis kelamin = 1 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 2 and status pemilikan rumah = 1 and jenis kelamin = 2 and persentase utang kartu kredit <= 82 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 4 and status pernikahan = 2 and status pekerjaan = 2 and status pemilikan rumah = 1 and jenis kelamin = 2 and persentase utang kartu kredit > 82 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan > then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan <= and lama tinggal <= 11 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan <= and lama tinggal > 11 and banyaknya tanggungan > 1 then kelas = 2 23

36 If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan <= and lama tinggal > 11 and banyaknya tanggungan = 0 and persentase utang kartu kredit > then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan <= and lama tinggal > 11 and banyaknya tanggungan = 0 and persentase utang kartu kredit <= and jenis kelamin = 1 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan <= and lama tinggal > 11 and banyaknya tanggungan = 0 and persentase utang kartu kredit <= and jenis kelamin = 2 and pendapatan > then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan <= and lama tinggal > 11 and banyaknya tanggungan = 0 and persentase utang kartu kredit <= and jenis kelamin = 2 and pendapatan <= then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan <= and lama tinggal > 11 and banyaknya tanggungan = 1 and lama tinggal <= 25 then kelas = If pendidikan = 3 and lama tinggal <= 59 and persentase utang kartu kredit > 49.8 and pekerjaan = 5 and pendapatan <= and lama tinggal > 11 and banyaknya tanggungan = 1 and lama tinggal > 25 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur <= 39 and lama tinggal > 84 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur <= 39 and lama tinggal <= 84 and umur <= 29 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur <= 39 and lama tinggal <= 84 and umur > 29 and banyaknya tanggungan = 0 and status pekerjaan = 2 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur <= 39 and lama tinggal <= 84 and umur > 29 and banyaknya tanggungan = 0 and status pekerjaan = 1 and masa kerja <= 59 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur <= 39 and lama tinggal <= 84 and umur > 29 and banyaknya tanggungan = 0 and status pekerjaan = 1 and masa kerja > 59 and masa kerja > 109 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur <= 39 and lama tinggal <= 84 and umur > 29 and banyaknya tanggungan = 0 and status pekerjaan = 1 and masa kerja > 59 and masa kerja <= 109 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur <= 39 and lama tinggal <= 84 and umur > 29 and banyaknya tanggungan > 0 and umur > 38 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur <= 39 and lama tinggal <= 84 and umur > 29 and banyaknya tanggungan > 0 and umur <= 38 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur > 39 and lama tinggal <= 120 and pendapatan > then kelas = If pendidikan = 3 and lama tinggal > 59 and umur > 39 and lama tinggal <= 120 and pendapatan <= then kelas = 1

37 38. If pendidikan = 3 and lama tinggal > 59 and umur > 39 and lama tinggal > 120 and umur <= 47 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur > 39 and lama tinggal > 120 and umur > 47 and masa kerja <= 49 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur > 39 and lama tinggal > 120 and umur > 47 and masa kerja > 49 and lama tinggal > 240 then kelas = If pendidikan = 3 and lama tinggal > 59 and umur > 39 and lama tinggal > 120 and umur > 47 and masa kerja > 49 and lama tinggal <= 240 and pendapatan > then kelas = If pendidikan = 3 and lama tinggal > 59 and umur > 39 and lama tinggal > 120 and umur > 47 and masa kerja > 49 and lama tinggal <= 240 and pendapatan <= then kelas = 2 Lampiran 8 Pohon keputusan algoritme CART menggunakan strategi undersampling cluster pendidikan=(3) lama tinggal < 59.5: 2 lama tinggal >= 59.5 umur < 39.5 lama tinggal < 77.5 umur < 29.5: 1 umur >= 29.5 banyaknya tanggungan < 1: 2 banyaknya tanggungan >= 1 umur < 38.5: 1 umur >= 38.5: 2 lama tinggal >= 77.5: 1 umur >= 39.5 lama tinggal < pendapatan < : 1 pendapatan >= : 2 lama tinggal >= umur < 47.5: 1 umur >= 47.5 masa kerja < 54.0: 1 masa kerja >= 54.0 lama tinggal < 245.0: 2 lama tinggal >= 245.0: 1 pendidikan!=(3): 1 Lampiran 9 Aturan yang terbentuk berdasarkan pohon keputusan algoritme CART menggunakan strategi under-sampling cluster 1. If pendidikan!= 3 then kelas 1 2. If pendidikan = 3 and lama tinggal < 59.5 then kelas = 2 3. If pendidikan = 3 and lama tinggal >= 59.5 and umur < 39.5 and lama tinggal >= 77.5 then kelas = 1 25

38 26 4. If pendidikan = 3 and lama tinggal >= 59.5 and umur < 39.5 and lama tinggal < 77.5 and umur < 29.5 then kelas = 1 5. If pendidikan = 3 and lama tinggal >= 59.5 and umur < 39.5 and lama tinggal < 77.5 and umur >= 29.5 and tanggungan < 1 then kelas = 2 6. If pendidikan = 3 and lama tinggal >= 59.5 and umur < 39.5 and lama tinggal < 77.5 and umur >= 29.5 and tanggungan >= 1 and umur < 38.5 then kelas = 1 7. If pendidikan = 3 and lama tinggal >= 59.5 and umur < 39.5 and lama tinggal < 77.5 and umur >= 29.5 and tanggungan >= 1 and umur >= 38.5 then kelas = 2 8. If pendidikan = 3 and lama tinggal >= 59.5 and umur >= 39.5 and lama tinggal < and pendapatan < then kelas = 1 9. If pendidikan = 3 and lama tinggal >= 59.5 and umur >= 39.5 and lama tinggal < and pendapatan >= then kelas = If pendidikan = 3 and lama tinggal >= 59.5 and umur >= 39.5 and lama tinggal >= and umur < 47.5 then kelas = If pendidikan = 3 and lama tinggal >= 59.5 and umur >= 39.5 and lama tinggal >= and umur >= 47.5 and masa kerja < 54 then kelas = If pendidikan = 3 and lama tinggal >= 59.5 and umur >= 39.5 and lama tinggal >= and umur >= 47.5 and masa kerja >= 54 and lama tinggal < 245 then kelas = If pendidikan = 3 and lama tinggal >= 59.5 and umur >= 39.5 and lama tinggal >= and umur >= 47.5 and masa kerja >= 54 and lama tinggal >= 245 then kelas = 1

39 Lampiran 10 Ilustrasi pohon keputusan algoritme CART 27

40 28 Lampiran 11 Ilustrasi pohon keputusan algoritme C4.5 P = Pendidikan PK = Pekerjaan SPR = Status Pemilikan Rumah LT = Lama Tinggal SP = Status Pernikahan MK = Masa Kerja PU = Persentase Utang Kartu Kredit SPK = Status Pekerjaan JK = Jenis Kelamin PD = Pendapatan JT = Jumlah Tanggungan U = Umur B = Kelas Bad G = Kelas Good

41 29 Lampiran 12 Antarmuka decision support system prediksi risiko kredit Lampiran 13 Hasil decision support system prediksi risiko kredit

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA

KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES)

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES) PERBANDINGAN ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES) SKRIPSI Oleh : AGUNG WALUYO 24010210141020 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Metode Klasifikasi Data Mining dan Teknik Sampling Smote... METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Hairani

Lebih terperinci

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering. BAB I PENDAHULUAN 1.1. Latar Belakang Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA SKRIPSI OKTAVIYANI DASWATI 1308230003 PROGRAM STUDI S-1 EKSTENSI MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

HASIL dan PEMBAHASAN. Data

HASIL dan PEMBAHASAN. Data distribusi kelas dan batang yang menggambarkan hasil keluaran dari pengujian. Pengujian dilakukan pada atribut tertentu dari data. Pemilihan atribut dilakukan setiap kali kedalaman tree bertambah. Pemilihan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,

Lebih terperinci

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Muh. Safri Juliardi Program Studi Informatika Universitas Sebelas Maret Jl. Ir. Sutami No. 36 A Surakarta juliardi@student.uns.ac.id

Lebih terperinci

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN Latar Belakang Kredit merupakan salah satu usaha sekunder yang dapat dilakukan untuk pemenuhan kebutuhan sehari-hari. Pada umumnya, proses kredit dapat dilayani melalui lembaga keuangan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG Andri 1), Yesi Novaria Kunang 2), Sri Murniati 3) 1,2,3) Jurusan Sistem Informasi Universitas

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) SKRIPSI Disusun Oleh : DESY RATNANINGRUM 24010211140097 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2017, pp. 368~372 368 PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI Adhika Novandya AMIK BSI Bekasi e-mail:

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0 PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C.0 Rachma Fauzia Azhary, Isnandar Slamet, Supriyadi Wibowo Program Studi Matematika Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 1 PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 Dina Maurina, Ahmad Zainul Fanani S.Si, M.Kom Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART ( CLASSIFICATION AND REGRESSION TREES ) ( STUDI KASUS PENYAKIT DIABETES SUKU PIMA INDIAN )

PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART ( CLASSIFICATION AND REGRESSION TREES ) ( STUDI KASUS PENYAKIT DIABETES SUKU PIMA INDIAN ) PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART ( CLASSIFICATION AND REGRESSION TREES ) ( STUDI KASUS PENYAKIT DIABETES SUKU PIMA INDIAN ) PT Jasa Marga ro) C abang Semarang SKRIPSI Disusun Oleh

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

Perbandingan Algoritme Pruning pada Decision Tree yang Dikembangkan dengan Algoritme CART

Perbandingan Algoritme Pruning pada Decision Tree yang Dikembangkan dengan Algoritme CART Jurnal Ilmiah Ilmu Komputer, Vol 15 No. 2, Desember 21 : 7-13 Perbandingan Algoritme Pruning pada Decision Tree yang Dikembangkan dengan Algoritme CART Martin Budi, Rindang Karyadin, Sony Hartono Wijaya

Lebih terperinci

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh

Lebih terperinci

Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Model. Pengklasifikasian: Definisi. Catatan Kuliah untuk Bab 4

Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Model. Pengklasifikasian: Definisi. Catatan Kuliah untuk Bab 4 Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Catatan Kuliah untuk Bab 4 Pengantar Data Mining oleh Tan, Steinbach, Kumar dialihbahasakan oleh Tim Pengajar Konsep Data Mining

Lebih terperinci

Penggunaan Pohon Keputusan untuk Data Mining

Penggunaan Pohon Keputusan untuk Data Mining Penggunaan Pohon Keputusan untuk Data Mining Indah Kuntum Khairina NIM 13505088 Program Studi Teknik Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jalan Ganesha

Lebih terperinci

PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI

PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

MODUL 12 Model Prediktif

MODUL 12 Model Prediktif MODUL 12 Model Prediktif Prediktif Analytics adalah teknologi yang menangkap proses data mining dalam rutinitas sederhana. Kadang-kadang disebut "one-click data mining," Model ini menyederhanakan dan mengotomatisasi

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini

Lebih terperinci

Seminar Tugas Akhir. Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING. Surabaya, Juli 2011

Seminar Tugas Akhir. Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING. Surabaya, Juli 2011 Surabaya, Juli 2011 Seminar Tugas Akhir Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING Ibrahim Widyandono 1307 100 001 Pembimbing : Dr. Bambang Widjanarko

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien 1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio 21 BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) 3.1 Regresi Logistik Biner Regresi logistik berguna untuk meramalkan ada atau tidaknya karakteristik berdasarkan prediksi

Lebih terperinci

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

POHON KEPUTUSAN DENGAN ALGORITMA C4.5 POHON KEPUTUSAN DENGAN ALGORITMA C4.5 1. Pengantar Algoritma C4.5 Klasifikasi merupakan salah satu proses pada data mining yang bertujuan untuk menemukan pola yang berharga dari data yang berukuran relatif

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa Seno Setiyawan 1, Yuliana Susanti 2,Tri Atmojo Kusmayadi 3 1,3 Program Studi Matematika FMIPA, Universitas Sebelas Maret 2 Program

Lebih terperinci

MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN ALGORITMA C5.

MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN ALGORITMA C5. ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.2 Agustus 2017 Page 3138 MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN Penelitian ini adalah penelitian eksperimen dengan langkah-langkah atau metode penelitian sebagai berikut: 1. Penentuan Masalah Penentuan masalah ini diperoleh dari studi literature

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh : ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI Oleh : Frista Yulianora 1401128832 Muchammad Hasbi Latif 1401136065 Rika Jubel Febriana

Lebih terperinci

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI Disusun Oleh : ATIKA ELSADINING TYAS 24010211120013 JURUSAN STATISTIKA

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA Laily Hermawanti Program Studi Teknik Informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro No. 1B

Lebih terperinci

PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA

PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL Besse Helmi Mustawinar Teknik Informatika FTKOM Universitas Cokroaminoto Palopo Jl Latamacelling Nomor 19 Palopo,

Lebih terperinci

Pemanfaatan Educational Data Mining (EDM)...

Pemanfaatan Educational Data Mining (EDM)... PEMANFAATAN EDUCATIONAL DATA MINING (EDM) UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS: TI-S1 UDINUS) Defri Kurniawan 1*, Wibowo Wicaksono 1 dan Yani Parti Astuti 1 1

Lebih terperinci

ii

ii KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE Putri Kurnia Handayani Program Studi Sistem Informasi, Fakultas Teknik, Universitas Muria Kudus Gondangmanis, PO Box

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

SKRIPSI. Disusun Oleh : ZULFA WAHYU MARDIKA NIM. J2E

SKRIPSI. Disusun Oleh : ZULFA WAHYU MARDIKA NIM. J2E PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART (CLASSIFICATION AND REGRESSION TREES) (STUDI KASUS KREDIT MACET DI PD. BPR-BKK PURWOKERTO UTARA) SKRIPSI Disusun Oleh : ZULFA WAHYU MARDIKA NIM.

Lebih terperinci

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom DATA MINING KLASIFIKASI BERBASIS DECISION TREE Ramadhan Rakhmat Sani, M.Kom Text Book Outline 1. Algoritma Data Mining Algoritma ID3 Algoritma C4.5 Algoritma C4.5 Introduction Algoritma C4.5 merupakan

Lebih terperinci

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PPDAFTAR GAMBAR Gambar Halaman Yuni Melawati, 2013

PPDAFTAR GAMBAR Gambar Halaman Yuni Melawati, 2013 PPDAFTAR GAMBAR Gambar 2.1 Contoh Pohon Keputusan untuk Mengklasifikasikan Pembelian Komputer... 19 3.1 Diagram CART... 29 3.2 Pohon Keputusan Sementara... 37 3.3 Pohon Keputusan Optimum... 38 3.4 Pohon

Lebih terperinci

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA Yasinta Agustyani, Yuliana Susanti, dan Vika Yugi Program Studi Matematika Fakultas

Lebih terperinci

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine. ABSTRAK Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi

Lebih terperinci

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED Studi Kasus Perilaku Seksual Remaja di Indonesia Hasil SDKI 2012 Yogo Aryo Jatmiko 1, Septiadi Padmadisastra 2, Anna Chadidjah 3 Prodi

Lebih terperinci

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret 2013 12 PENERAPAN ALGORITMA C 4.5 DALAM MEMPEROLEH DECISION TREE UNTUK MEMPREDIKSI PENENTUAN RESIKO KREDIT PADA BANK BPR BUKITTANDANG MANDIRI PADANG MENGGUNAKAN

Lebih terperinci

BAB I PENDAHULUAN 1.1.Latar Belakang Masalah

BAB I PENDAHULUAN 1.1.Latar Belakang Masalah BAB I PENDAHULUAN 1.1.Latar Belakang Masalah Mengingat kondisi perekonomian saat ini sedang tumbuh dan berkembang secara signifikan, di negara khususnya Indonesia, memiliki peningkatan permintaan produk

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan Sistem Pendukung Keputusan (SPK) / Decision Support Sistem (DSS) adalah sistem komputer yang saling berhubungan dan menjadi alat bantu bagi seorang

Lebih terperinci

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA 53 ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA Marwana*) Abstract : Abstract-This study is a simulation for memperiksi victory in a football game using the C4.5 data

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4725 Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel Handling Imbalanced Data

Lebih terperinci

KLASIFIKASI KARAKTERISTIK MAHASISWA UNIVERSITAS COKROAMINOTO PALOPO MENGGUNAKAN METODE NAÏVE BAYES DAN DECISION TREE. Yuli Hastuti

KLASIFIKASI KARAKTERISTIK MAHASISWA UNIVERSITAS COKROAMINOTO PALOPO MENGGUNAKAN METODE NAÏVE BAYES DAN DECISION TREE. Yuli Hastuti Jurnal Dinamika, September 2016, halaman 34-41 P-ISSN: 2087 7889 E-ISSN: 2503 4863 Vol. 07. No.2 KLASIFIKASI KARAKTERISTIK MAHASISWA UNIVERSITAS COKROAMINOTO PALOPO MENGGUNAKAN METODE NAÏVE BAYES DAN DECISION

Lebih terperinci

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING Moh Ahsan Universitas Kanjuruhan Malang ahsan@unikama.ac.id ABSTRAK. Universitas Kanjuruhan Malang

Lebih terperinci

Manfaat Pohon Keputusan

Manfaat Pohon Keputusan DECISION TREE (POHON KEPUTUSAN) Latar Belakang Pohon Keputusan Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan oleh berbagai macam masalah dari berbagai macam bidang. Masalah-masalah

Lebih terperinci