KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA

Ukuran: px
Mulai penontonan dengan halaman:

Download "KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA"

Transkripsi

1 KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA* Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Debitur Kartu Kredit dengan Pemilihan Fitur Menggunakan Voting Feature Intervals 5 adalah benar karya saya dengan arahan dari pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Januari 2013 Sri Rahayu Natasia NIM G

4 ABSTRAK SRI RAHAYU NATASIA. Klasifikasi Debitur Kartu Kredit dengan Pemilihan Fitur Menggunakan Voting Feature Intervals 5. Dibimbing oleh AZIZ KUSTIYO. Penyediaan kartu kredit bagi nasabah merupakan salah satu cara untuk memperoleh keuntungan dalam kegiatan perbankan yang berisiko menimbulkan kerugian jika nasabah sering melakukan tunggakan pembayaran. Oleh karena itu penting untuk mengetahui riwayat perbankan nasabah yang akan mengajukan permohonan kartu kredit. Riwayat perbankan digunakan sebagai input algoritma Voting Feature Intervals 5 (VFI5) dalam pembangunan model klasifikasi yang bertujuan untuk mengelompokkan calon debitur berdasarkan status kelancaran membayar utang. Data debitur yang digunakan dalam penelitian ini tergolong imbalanced data, sehingga diperlukan metrik pengukuran selain akurasi untuk menilai keberhasilan model. Data ini terdiri atas 14 fitur, tetapi tidak semua fitur tersebut memiliki informasi yang penting dalam pengelompokan debitur, sehingga dalam pembuatan model dilakukan pemilihan fitur yang berpengaruh terhadap tingkat akurasi. Pemilihan fitur dilakukan melalui 2 pendekatan, yaitu berdasarkan akurasi masing-masing fitur dan pemilihan fitur secara bertahap. Model terbaik diperoleh dari pemilihan fitur berdasarkan akurasi dengan akurasi sebesar 67.74% serta recall dan precision untuk kelas debitur bad adalah 46.88% dan 24.69%. Kata kunci: debitur kartu kredit, imbalanced data, klasifikasi, pemilihan fitur, Voting Feature Intervals 5 ABSTRACT SRI RAHAYU NATASIA. The Classification of Credit Card Debtor by Feature Selection Using Voting Feature Intervals 5. Supervised by AZIZ KUSTIYO. Provision of credit cards for customers is one of the ways to obtain profit in banking activities which cause risks of losses if the customer frequently delinquent the payments. Therefore, it is important to know the banking profile of the customer who will apply for a credit card. The banking profile data is used as input for Voting Feature Intervals 5 (VFI5) algorithm in the development of classification models that aim to classify potential debtor based on the payment status of the debtor. The debtor data used in this research is categorized as imbalanced data, hence it is necessary to have other performance measures beside accuracy; in this research we also used recall and precision. The input data consist of 14 features, however each features has different significance in classifying debtor. Therefore a feature selection process is conducted before the development of the model. The feature selection is conducted using two approaches: feature selection based on the accuracy of each feature and stepwise feature selection. The former method provides the better accuracy of 67.74%, and the values of recall and precision for the class of bad debtor are 46.88% and 24.69%, respectively. Keywords: classification, credit card debtor, feature selection, imbalanced data, Voting Feature Intervals 5

5 KLASIFIKASI DEBITUR KARTU KREDIT DENGAN PEMILIHAN FITUR MENGGUNAKAN VOTING FEATURE INTERVALS 5 SRI RAHAYU NATASIA Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

6

7 Judul Skripsi : Klasifikasi Debitur Kartu Kredit dengan Pemilihan Fitur Menggunakan Voting Feature Intervals 5 Nama : Sri Rahayu Natasia NIM : G Disetujui oleh Aziz Kustiyo, S.Si, M.Kom Pembimbing Diketahui oleh Dr. Ir. Agus Buono, M.Si, M.Kom Ketua Departemen Tanggal Lulus:

8 PRAKATA Segala puji bagi Allah subhanahu wata ala atas segala limpahan rahmat dan karunia-nya sehingga penulis mampu menyelesaikan skripsi yang berjudul Klasifikasi Debitur Kartu Kredit dengan Pemilihan Fitur Menggunakan Voting Feature Intervals 5 ini. Shalawat dan salam senantiasa tercurah limpah kepada Rasulullah, Nabi Muhammad shalallahu alaihi wasallam, serta keluarganya, sahabatnya, dan para pengikutnya yang tetap istiqomah hingga akhir zaman. Penulis juga menyampaikan terima kasih kepada seluruh pihak yang telah membantu dalam penelitian ini, yaitu: 1 Kedua orang tua penulis, Ayahanda Supriadi Anra, S.Pd, MM dan Ibunda Murniati S.Pd, serta saudara-saudara penulis, atas doa, kasih sayang, dan dukungan yang luar biasa. 2 Bapak Aziz Kustiyo, S.Si, M.Kom selaku dosen pembimbing yang telah banyak memberikan ide, saran, nasihat, dan dukungan, serta direpotkan dalam penyelesaian penelitian ini. 3 Bapak Dr. Irman Hermadi, S.Kom, MS dan Bapak Toto Haryanto, S.Kom, M.Si selaku dosen penguji. 4 Puspalia Ayudiar Setiawati yang telah berkenan memberikan data penelitian. 5 Revina Bayu Putri, Pebrya Narti, Sevriya Amban Suri, R.Putri Ayu Pramesti, Silvia Rahmi, dan Dean A. Ramadhan, yang selalu memberikan semangat, dukungan dan tempat bertukar pikiran bagi penulis. Semoga ukhuwah kita selalu terajut. 6 Rekan-rekan satu bimbingan, Erni, Ilvi, kak Corry, Septy, mba Sri, kak Asep, dan Bangkit atas diskusi-diskusi dan suka-duka selama pembimbingan. 7 Sahabat Ilkomerz angkatan V atas persahabatan yang hangat. 8 Sahabat di lingkaran cahaya, sahabat DKM Alghifari, sahabat KAMUS IPB, sahabat INF 44, sahabat di kostan B14, terima kasih karena telah hadir dalam kehidupan penulis. Penulis menyadari penelitian ini masih banyak kekurangan. Harapannya, semoga hasil penelitian ini dapat bermanfaat. Bogor, Januari 2013 Sri Rahayu Natasia

9 DAFTAR ISI DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 TINJAUAN PUSTAKA 2 Klasifikasi 2 Imbalanced Data 2 Best Subset Regression 3 Stepwise Regression 3 Voting Feature Intervals 5 (VFI5) 3 Confusion Matrix 5 METODE 7 Data 7 Praproses 7 Pengambilan Sampel 50 Kali 8 Pembuatan Model VFI5 9 Evaluasi Kinerja 9 Lingkungan Pengembangan 10 HASIL DAN PEMBAHASAN 10 Praproses 10 Pengambilan Sampel 50 Kali 11 Pemilihan Fitur berdasarkan Akurasi 11 Pemilihan Fitur secara Bertahap 12 Model 1 12 Model 2 15 Model 3 18

10 Perbandingan dengan Penelitian Sebelumnya 21 SIMPULAN DAN SARAN 22 Simpulan 22 Saran 23 DAFTAR PUSTAKA 23 LAMPIRAN 24 RIWAYAT HIDUP 33

11 DAFTAR TABEL 1 Confusion matrix dengan dua kelas data 6 2 Komposisi data latih dan uji di setiap kelas 11 3 Rata-rata akurasi untuk masing-masing fitur 11 4 Confusion matrix sampel ke-14 dan Confusion matrix sampel ke Nilai voting kesalahan prediksi instance uji ke-56 dan Akurasi Model Confusion matrix sampel ke Confusion matrix sampel ke Nilai voting kesalahan prediksi instance uji ke-6 dan ke-130 pada sampel ke Akurasi Model Confusion matrix sampel ke-12 dan Nilai voting kesalahan prediksi instance uji ke-4 dan 21 pada sampel Confusion matrix sampel ke Voting kesalahan prediksi pada sampel ke-30 untuk instance uji ke-30 dan Perbandingan metrik pengukuran dengan penelitian lain 22 DAFTAR GAMBAR 1 Pseudocode tahap pelatihan algoritme VFI5 (Demiröz 1997) 4 2 Pseudocode tahap klasifikasi algoritme VFI5 (Güvenir et al. 1998) 5 3 Diagram alur penelitian 8 4 Akurasi pengujian Model Perbandingan akurasi Model 1 dan Perbandingan F-measure pada Model 1 dan Perbandingan akurasi Model 1 dan Perbandingan F-measure Model 1 dan 3 19 DAFTAR LAMPIRAN 1 Daftar fitur 24 2 Pemilihan fitur secara bertahap 25 3 Diagram metrik hasil pengukuran Model Voting hasil pelatihan sampel ke-34 pada Model Metrik pengukuran Model Nilai voting hasil pelatihan sampel ke-39 Model Metrik pengukuran Model Nilai vote hasil pelatihan sampel ke-30 Model Diagram perbandingan metrik pengukuran pada Model 1, 2, dan 3 35

12

13 PENDAHULUAN Latar Belakang Penyediaan kartu kredit bagi nasabah merupakan salah satu cara untuk memperoleh keuntungan dalam kegiatan perbankan. Di sisi lain, kartu kredit dapat menimbulkan risiko kerugian jika nasabah sering melakukan tunggakan pembayaran. Oleh karena itu, perlu dilakukan penelusuran riwayat perbankan nasabah untuk mengetahui apakah calon debitur termasuk nasabah yang lancar (good) atau tidak (bad) dalam pembayaran kartu kredit. Riwayat perbankan nasabah ini dapat digunakan untuk membangun model klasifikasi dalam mengelompokkan calon debitur berdasarkan status kelancaran membayar utang. Penelitian mengenai klasifikasi debitur kartu kredit dilakukan oleh Setiawati (2011) menggunakan algoritme jaringan saraf tiruan Backpropagation. Berdasarkan data penelitian Setiawati (2011), terdapat perbedaan yang cukup besar antara debitur good dan bad, yaitu sebesar 4:1 sehingga dapat dikatakan terjadi ketidakseimbangan (imbalanced) antara dua kelas tersebut. Akibatnya, suatu algoritme klasifikasi dapat mencapai akurasi tinggi hanya dengan mengelompokkan kelas debitur bad yang merupakan minoritas ke dalam kelas good sehingga potensi kerugian tidak terdeteksi. Dari hasil penelitian tersebut diperoleh akurasi dari model terbaik sebesar 73.39% serta recall dan precision kelas bad sebesar 56.26% dan 36.90%. Data perbankan untuk mengetahui riwayat kredit nasabah memiliki banyak fitur. Kebanyakan dari fitur ini tidak memberikan informasi yang begitu penting dalam pengklasifikasian debitur sehingga dalam pembuatan model klasifikasi sebaiknya dipilih kembali. Berdasarkan information value fitur yang diperoleh dalam penelitian Setiawati (2011), secara umum keempat belas fitur yang digunakan memiliki tingkat prediksi yang rendah. Oleh karena itu, dalam penelitian ini akan dilakukan pemilihan fitur yang dapat mempengaruhi tingkat akurasi model. Penelitian ini menggunakan algoritme Voting Feature Intervals 5 (VFI5) sebagai algoritme untuk klasifikasi. VFI5 memiliki beberapa kelebihan, di antaranya yaitu waktu pelatihan dan klasifikasi yang singkat serta prediksi yang dihasilkan sangat akurat. Penelitian terkait imbalanced data dengan algoritme VFI5 sebagai metode klasifikasi dilakukan oleh Aritonang (2006). Pada penelitian ini dilakukan pendekatan dari level data untuk mengatasi masalah imbalanced data. Dataset yang digunakan merupakan data penyakit Hypothyroid dan Euthyroid yang masing-masing terdiri atas dua kelas, yaitu positif dan negatif. Perbandingan komposisi data di kedua kelas untuk masing-masing dataset adalah 1:10 untuk Euthyroid dan 1:20 untuk Hypothyroid. Akurasi yang dihasilkan oleh model terbaik pada data Euthyroid adalah 66.00% dengan recall dan precision kelas minoritas sebesar 69.57% dan 65.37%. Sementara untuk model terbaik pada data Hypothyroid diperoleh akurasi 88.73% dengan recall dan precision kelas minoritas masing-masing adalah 79.17% dan 97.77%.

14 2 Tujuan Penelitian Tujuan dari penelitian ini adalah untuk melakukan pemilihan fitur dan menerapkan algoritme Voting Feature Intervals 5 (VFI5) pada klasifikasi debitur kartu kredit serta mengukur tingkat akurasinya. Manfaat Penelitian Manfaat dari penelitian ini adalah mengetahui tingkat akurasi algoritme Voting Feature Intervals 5 (VFI5) dengan pemilihan fitur dalam permasalahan klasifikasi debitur kartu kredit. Serta diharapkan dapat terbangun suatu model untuk memprediksi calon debitur kartu kredit sehingga dapat meminimalkan potensi kerugian. Ruang Lingkup Penelitian Pada penelitian ini dilakukan pembatasan masalah pada: 1 Dataset yang digunakan adalah data penelitian Setiawati (2011), yaitu data debitur Bank X tahun Dataset ini terdiri atas dua kelas yaitu debitur good dan bad. 2 Klasifikasi menggunakan algoritme VFI5. 3 Pembobotan fitur pada algoritme diseragamkan yaitu satu. TINJAUAN PUSTAKA Klasifikasi Klasifikasi adalah proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han dan Kamber 2001). Pada klasifikasi dataset yang digunakan dibagi menjadi data latih dan data uji. Data latih digunakan untuk membangun model, sementara data uji digunakan untuk memvalidasi model yang telah dibangun. Akurasi model ditentukan oleh hasil pengujian terhadap data uji. Imbalanced Data Imbalanced data ditandai dengan distribusi data antar kelas yang tidak seimbang. Terdapat satu kelas yang memiliki lebih banyak sampel daripada kelas lainnya. Pada kasus yang jarang terjadi, aturan klasifikasi untuk memprediksi kelas minoritas cenderung langka, belum ditemukan, atau diabaikan. Akibatnya, sering terjadi kesalahan klasifikasi pada instance uji kelas minoritas. Di beberapa aplikasi, klasifikasi yang tepat dari kelas minor justru memiliki arti yang lebih

15 3 besar, contohnya pada kasus deteksi penipuan kartu kredit, deteksi penyakit langka, dan manajemen resiko (Sun et al. 2009). Pada masalah klasifikasi dengan dua kelas, tingkat imbalanced data dapat dilihat dari rasio distribusi jumlah instance pada kedua kelas. Rasio antara kedua kelas tersebut bisa sangat drastis, yaitu 1:100, 1:1000, bahkan lebih. Beberapa solusi telah dikembangkan untuk mengatasi masalah imbalanced data, seperti pendekatan dari level data dan pendekatan dari level algoritme. Masing-masing pendekatan memiliki kekurangan dan kelebihan. Misalnya pada pendekatan dari level data, keuntungannya ialah dapat diterapkan pada metode pembelajaran apapun. Best Subset Regression Best subset adalah sebuah metode yang digunakan untuk membantu memutuskan variabel prediktor yang akan dimasukkan ke dalam model regresi. Metode ini dilakukan dengan cara memeriksa semua kemungkinan model dari semua kombinasi prediktor yang mungkin. Misalnya, jika terdapat sejumlah p kandidat prediktor, jumlah model dari kombinasi prediktor yang dapat dibentuk adalah 2 p. Best subset menggunakan akurasi prediksi sebagai standar, harapannya adalah subset regression akan menghasilkan persamaan regresi yang lebih sederhana dan lebih akurat daripada persamaan berdasarkan semua variabel (Breiman 1995). Stepwise Regression Stepwise regression membentuk model dengan menambah atau mengurangi prediktor individual secara otomatis, satu langkah pada satu waktu, berdasarkan pada signifikansi statistik prediktor tersebut. Detail proses dapat dikendalikan, termasuk level signifikansi, dan apakah proses hanya melibatkan penambahan/pengurangan prediktor, atau keduanya (Frost 2012). Terdapat dua metode yang dapat digunakan dalam stepwise regression, yaitu: a Forward selection Forward selection dimulai tanpa ada prediktor di dalam model. Selanjutnya ditambahkan prediktor yang paling signifikan di setiap langkah. Penambahan dilakukan hingga tidak ada kandidat prediktor yang memenuhi syarat untuk masuk ke dalam model. b Backward selection Pada backward selection, semua prediktor terdapat di dalam model. Setiap langkah dilakukan penghapusan prediktor yang paling tidak berpengaruh terhadap model. Penghapusan prediktor berhenti ketika tidak ada prediktor yang memenuhi syarat untuk dihapus. Voting Feature Intervals 5 (VFI5) Voting Feature Intervals 5 (VFI5) merupakan algoritme klasifikasi yang dikembangkan oleh Demiröz dan Güvenir (Demiröz 1997). VFI5 adalah algoritme yang non-incremental dan bersifat supervised learning. Kelebihan dari algoritme

16 4 ini yaitu prediksi yang dihasilkan sangat akurat, waktu pelatihan dan klasifikasinya singkat, robust terhadap data pelatihan yang memiliki noise dan tidak diketahui nilai fiturnya, dapat menggunakan bobot fitur, dan menghasilkan model yang dapat dibaca manusia dari pengetahuan klasifikasi (Güvenir et al. 1998). train(trainingset) begin for each feature f for each class c EndPoints[f] = EndPoints[f] find_end_points(trainingset,f,c); Sort(EndPoints[f]); end if f is linear for each end point p in EndPoints[f] form a point interval from end point p form a range interval between p and the next endpoint p else /* f is nominal */ each distinct point in EndPoints[f] forms a point interval for each interval i on feature dimension f for each class c interval_class_count[f,i,c] = 0; count_instances(f, TrainingSet); for each interval i on feature dimension f for each class c interval_class_vote[f,i,c] = interval_class_count[f,i,c] / class_count[c] normalize interval_class_vote[f,i,c]; /* such that c interval_class_vote[f,i,c] = 1 */ Gambar 1 Pseudocode tahap pelatihan algoritme VFI5 (Demiröz 1997) Algoritme VFI5 terdiri atas dua tahap, yaitu tahap pelatihan dan klasifikasi. 1 Pelatihan Tahap awal proses pelatihan adalah mencari nilai end point dari setiap feature f pada setiap kelas c. End point pada feature linear, yaitu feature yang nilainya kontinu adalah nilai minimum dan maksimum dari setiap kelasnya. End point untuk feature nominal adalah semua nilai yang berbeda pada feature tersebut untuk setiap kelas. Nilai end point feature dari setiap kelas c digabungkan dan diurutkan untuk dijadikan selang interval feature tersebut. Ada dua jenis interval, yaitu point interval dan range interval. Point interval dibentuk dari setiap nilai yang berbeda dari end point. Range interval merupakan nilai di antara dua point interval yang berdekatan tetapi tidak termasuk point interval tersebut. Tahap selanjutnya menghitung jumlah instance pelatihan yang jatuh di interval i pada feature f di setiap kelas c yang direpresentasikan sebagai interval_class_count[f,i,c]. Untuk setiap instance pelatihan, dicari interval i tempat nilai feature f dari instance pelatihan e f tersebut jatuh. Jika e f jatuh pada point interval, maka jumlah instance pada interval i untuk feature f akan bertambah satu. Begitupun jika nilai e f jatuh pada range interval, jumlah instance pada interval i dari feature f tersebut akan ditambah satu.

17 5 Berikutnya, setelah jumlah instance setiap interval i pada feature f dari setiap kelas diperoleh, jumlah instance setiap feature dijumlahkan kembali untuk masing-masing kelas. Nilai vote diberikan kepada setiap feature f di kelas c, dengan nilai vote merupakan hasil dari jumlah instance pada interval i dibagi dengan jumlah instance pada kelas c. Algoritme VFI5 melakukan normalisasi nilai vote agar distribusi vote antar kelas tidak terlalu berbeda. Normalisasi ini dilakukan dengan membagi nilai vote interval i pada feature f dengan jumlah semua vote feature f di interval i untuk semua kelas c. Hasil normalisasi feature f pada semua kelas c berjumlah satu. Pseudocode untuk tahap pelatihan disajikan pada Gambar 1. 2 Klasifikasi Proses klasifikasi diawali dengan memberi nilai vote 0 untuk setiap kelas c. Langkah berikutnya adalah mencari interval i dimana nilai e f dari instance uji tersebut jatuh. Jika nilai feature dari instance uji tidak diketahui vote feature tersebut bernilai 0 untuk semua kelas dan tidak diikutsertakan dalam proses voting. Jika nilai feature f instance e diketahui, akan dicari interval tempat nilai tersebut jatuh. Setelah diperoleh intervalnya, nilai vote feature f diisi dengan nilai vote feature yang diperoleh pada saat pelatihan. Nilai vote yang diperoleh masing-masing kelas merupakan hasil penjumlahan setiap vote feature yang dikali dengan bobot feature. Kelas prediksi dari instance e merupakan kelas dengan nilai vote yang paling tinggi. Pseudocode algoritme untuk tahap klasifikasi disajikan pada Gambar 2. classify(e) /* e: example to be classified*/ begin for each class c vote[c] = 0 for each feature f for each class c feature_vote[f,c] = 0 /*vote of feature f for class c*/ if e f values is known i = find_interval(f, e f ) for each class c feature_vote[f,c] = interval_vote[f,i,c] vote [c] = vote[c] + feature_vote[f,c] * weight[f]; return the class c with highest vote[c]; end Gambar 2 Pseudocode tahap klasifikasi algoritme VFI5 (Güvenir et al. 1998) Confusion Matrix Pengukuran keberhasilan suatu algoritme klasifikasi dapat dilakukan dengan membuat confusion matrix dari setiap percobaan. Confusion matrix mengandung informasi tentang kelas data aktual dan kelas data hasil prediksi yang

18 6 direpresentasikan pada baris matriks. Kinerja algoritme klasifikasi biasanya dievaluasi berdasarkan data yang ada pada matriks. Tabel 1 menyajikan confusion matrix untuk data dengan dua kelas (Sun et al. 2009). Tabel 1 Confusion matrix dengan dua kelas data Aktual Data Kelas Positif Kelas Negatif Hasil Prediksi Kelas Positif TP FP Kelas Negatif FN TN Keterangan: - TP adalah jumlah instance kelas positif yang berhasil diprediksi benar sebagai kelas positif. - FN adalah jumlah instance kelas positif yang tidak berhasil diprediksi dengan benar karena masuk ke kelas negatif. - FP adalah jumlah instance kelas negatif yang tidak berhasil diprediksi benar sebagai kelas negatif karena dikelompokkan ke kelas positif. - TN adalah jumlah instance kelas negatif yang berhasil diprediksi benar sebagai kelas negatif. Evaluasi pada non-kelas independen gagal karena hasilnya hanya mencerminkan kinerja pembelajaran dari kelas mayoritas, dan semakin condong distribusi kelas efeknya akan semakin buruk. Oleh karena itu, dalam mengevaluasi imbalanced data fokus tertuju pada kelas individu (Weng dan Poon 2006). Beberapa pengukuran evaluasi untuk imbalanced data adalah precision, recall, F-measure, kurva Receiver Operating Characteristic (ROC), dan lain lain. Metrik yang akan dihitung berdasarkan data confusion matrix adalah: - Akurasi (AC) AC = TP + TN TP + FN + FP + TN - Recall atau true positive rate (TP) menunjukkan persentase kelas data positif yang berhasil diprediksi benar dari keseluruhan instance kelas positif. Recall = TP TP + FN - Precision (P) atau proporsi dari kelas data positif yang berhasil diprediksi dengan benar dari keseluruhan hasil prediksi kelas positif. P = TP TP + FP

19 7 - F-measure yaitu evaluasi metrik umum yang menggabungkan precision dan recall ke dalam satu nilai, biasanya dengan bobot yang sama pada kedua pengukuran. Nilai F-measure yang tinggi memastikan bahwa recall dan precision juga tinggi (Sun et al. 2009). F-measure = 2 x Recall x Precision Recall + Precision - True negatif rate menunjukkan persentase kelas data negatif yang berhasil diprediksi benar dari keseluruhan instance kelas negatif. TN rate = TN TN + FP - Negative predictive value merupakan proporsi kelas data negatif yang berhasil diprediksi benar dari keseluruhan hasil prediksi kelas negatif. NP value = TN TN + FN METODE Ilustrasi tahapan proses penelitian disajikan dalam diagram alur pada Gambar 3. Data Data yang digunakan dalam penelitian ini adalah data sekunder debitur Bank X tahun yang merupakan data penelitian Setiawati (2011) mengenai status kelancaran pembayaran utang kartu kredit. Dataset ini terdiri atas dua kelas, yaitu debitur good dan bad. Kelas good berarti debitur tersebut lancar dalam pembayaran, sedangkan bad berarti mengalami tunggakan lebih dari 90 hari (Setiawati 2011). Jumlah instance keseluruhan adalah 4413 dengan komposisi masing-masing kelas yaitu 3574 debitur good dan 839 debitur bad, yang tergolong imbalanced data. Terdapat 14 fitur pada dataset ini. Fitur-fitur tersebut ialah gender, usia, status pernikahan, pendidikan, tanggungan, status rumah, lama tinggal, pekerjaan, masa kerja, status pekerjaan, tipe perusahaan, pendapatan, banyaknya kartu kredit lain, dan persentase utang kartu kredit lain. Beberapa fitur memiliki missing value, contohnya fitur banyaknya kartu kredit lain dan persentase utang kartu kredit lain. Daftar fitur dan keterangannya disajikan dalam Lampiran 1. Praproses Pada tahap praproses, setiap kelas mengalami pengurangan jumlah instance. Instance yang tidak diketahui salah satu nilai fiturnya tidak digunakan dalam

20 8 pembuatan model. Selain itu, instance yang nilai fiturnya tidak valid juga tidak digunakan. Mulai Data Praproses Pengambilan Sampel 50 Kali Data Uji Data Latih Data Uji Pelatihan VFI5 dengan Semua Fitur Fitur Interval Model 1 Fitur Interval Pemilihan Fitur berdasarkan Akurasi Pemilihan Fitur secara Bertahap Model 2 Model 3 Klasifikasi Evaluasi Kinerja Selesai Gambar 3 Diagram alur penelitian Pengambilan Sampel 50 Kali Data yang telah dipraproses kemudian dipisahkan berdasarkan kelas debitur good dan debitur bad. Pada masing-masing kelas dilakukan pengambilan sampel sebanyak 50 kali. Satu kali pengambilan sampel terdiri atas data latih dan data uji. Persentase pembagian data latih dan data uji adalah 80% data latih dan 20% data uji. Selanjutnya hasil pengambilan sampel tersebut digunakan untuk membuat model.

21 9 Pembuatan Model VFI5 Data latih dan data uji yang diperoleh dari pengambilan sampel sebanyak 50 kali, selanjutnya digunakan untuk membuat tiga model VFI5. Tiga model tersebut yaitu: a Model 1 Model 1 merupakan model VFI5 yang menggunakan semua fitur. Tahapan pembuatan Model 1 yaitu sebagai berikut: 1 Melakukan pelatihan terhadap data latih yang menghasilkan fitur interval dan nilai vote untuk setiap fitur. 2 Proses klasifikasi terhadap data uji berdasarkan semua fitur. 3 Hitung akurasi Model 1. b Model 2 Model 2 adalah model VFI5 dengan pemilihan fitur berdasarkan akurasi. Prosedur pemilihan fitur berdasarkan akurasi mengadopsi metode best subset regression, dengan langkah-langkah seperti di bawah ini: 1 Menggunakan fitur interval dan nilai vote dari Model 1 untuk setiap fitur. 2 Proses klasifikasi dilakukan berdasarkan masing-masing fitur. 3 Hitung akurasi klasifikasi masing-masing fitur. 4 Fitur diambil jika akurasi > 50%. Setelah diperoleh fitur dengan akurasi > 50%, dilakukan klasifikasi terhadap data uji berdasarkan fitur-fitur tersebut. Terakhir, hitung akurasi Model 2. c Model 3 Model 3 yaitu model VFI5 dengan pemilihan fitur secara bertahap mengadopsi teknik stepwise regression, yaitu forward selection. Tahapan pembuatan Model 3 yaitu sebagai berikut: 1 Menggunakan fitur interval dan nilai vote dari Model 1 untuk setiap fitur. 2 Menentukan level signifikansi fitur untuk memasuki model, yaitu akurasi bernilai 50%. Sementara level signifikansi fitur untuk meninggalkan model yaitu lebih kecil dari akurasi pada iterasi sebelumnya. 3 Tentukan fitur yang paling berpengaruh, yaitu fitur dengan akurasi tertinggi. 4 Uji cobakan model dengan setiap kandidat fitur yang tersisa. Fitur yang terpilih pada tahap sebelumnya tetap berada dalam model dan diikutsertakan pada proses pemilihan. 5 Ulangi tahap 3 dan 4. Iterasi berhenti ketika akurasi lebih kecil daripada level signifikansi, yang merupakan akurasi dari iterasi sebelumnya. Setelah diperoleh fitur melalui proses di atas, langkah terakhir adalah evaluasi kinerja Model 3. Evaluasi Kinerja Kinerja dari algoritme VFI5 dalam mengklasifikasikan debitur kartu kredit dapat diketahui dengan mengukur akurasinya. Meskipun akurasi tidak terlalu berpengaruh terhadap imbalanced data, tetapi tetap digunakan untuk mengetahui kinerja model secara keseluruhan. Hasil percobaan yang dilakukan dari setiap

22 10 model digunakan untuk membuat confusion matrix. Selanjutnya dihitung recall, precision, dan F-measure dari kelas positif, yaitu kelas debitur bad. Lingkungan Pengembangan Aplikasi yang dibangun pada penelitian ini menggunakan kode program yang dikembangkan oleh Aritonang (2006). Kode program tersebut kemudian dimodifikasi sesuai data yang digunakan. Selanjutnya diimplementasikan menggunakan spesifikasi perangkat keras dan perangkat lunak sebagai berikut: Perangkat Keras: - Processor Intel Core TM i GHz - RAM kapasitas 2 GB - Harddisk kapasitas 500 GB Perangkat lunak: - Sistem Operasi Windows 7 Ultimate - Matlab Microsoft Excel HASIL DAN PEMBAHASAN Data yang digunakan pada penelitian ini merupakan data debitur kartu kredit mengenai status kelancaran membayar utang, yang tergolong ke dalam kasus imbalanced data. Terdapat dua kelas pada data ini, yaitu kelas debitur good dan bad. Praproses Jumlah instance masing-masing kelas berkurang setelah dilakukan praproses. Instance yang salah satu nilai fiturnya tidak diketahui, misalnya banyaknya kartu kredit lain, tidak digunakan dalam pembuatan model. Selain itu, instance yang nilai fiturnya tidak valid seperti 0 atau 1 pada fitur pendapatan, -1 pada fitur masa kerja dan lama tinggal juga tidak digunakan. Banyaknya instance yang tidak digunakan dalam pembuatan model adalah 526, sehingga total data yang tersisa adalah 3887 instances. Dari hasil pemisahan ini diketahui bahwa instance kelas debitur bad berkurang dari 839 menjadi 636 dan kelas debitur good dari 3574 menjadi 3251 instances.

23 11 Pengambilan Sampel 50 Kali Pengambilan sampel 50 kali dilakukan di setiap kelas sehingga terdapat 50 kombinasi data latih dan data uji dari masing-masing kelas. Setiap satu kali pengambilan diambil data latih dan data uji dengan persentase masing-masing 80% dan 20%. Komposisi data latih dan data uji ditampilkan pada Tabel 2. Tabel 2 Komposisi data latih dan uji di setiap kelas Data Good Bad Latih Uji Pemilihan Fitur berdasarkan Akurasi Fitur interval dan nilai vote yang diperoleh pada Model 1, digunakan dalam proses klasifikasi data uji dari 50 sampel. Klasifikasi dilakukan berdasarkan masing-masing fitur. Rata-rata akurasi dari masing-masing fitur ditampilkan pada Tabel 3. Tabel 3 Rata-rata akurasi untuk masing-masing fitur Fitur Akurasi Pendidikan 61.40% Gender 52.62% Status pernikahan 57.62% Tipe perusahaan 19.67% Status pekerjaan 35.95% Pekerjaan 23.66% Tanggungan 50.35% Pendapatan 16.93% Banyaknya kartu kredit lain 21.70% Persentase utang kartu kredit lain 29.80% Umur 20.76% Masa kerja 17.94% Lama tinggal 22.01% Status rumah 59.63% Berdasarkan akurasi rata-rata setiap fitur pada Tabel 3, diambil fitur dengan akurasi lebih besar dari 50%. Fitur yang terpilih yaitu pendidikan, gender, status pernikahan, tanggungan, dan status rumah. Fitur-fitur ini selanjutnya digunakan pada Model 2.

24 12 Pemilihan Fitur secara Bertahap Pemilihan fitur secara bertahap dimulai dengan menentukan fitur yang paling berpengaruh terhadap akurasi. Berdasarkan akurasi fitur yang diperoleh pada tahap pemilihan fitur menggunakan akurasi > 50%, fitur yang memiliki akurasi tertinggi adalah fitur pendidikan. Oleh karena itu, fitur ini digunakan sebagai fitur awal. Berikutnya fitur pendidikan dikombinasikan dengan 13 fitur lainnya dan diujikan terhadap 50 sampel Model 1. Pada iterasi pertama diperoleh akurasi tertinggi sebesar 63.04% yaitu gabungan fitur pendidikan dengan banyaknya kartu kredit lain. Nilai ini lebih besar dibandingkan dengan akurasi fitur pendidikan saja sehingga kombinasi fitur ini diambil dan diteruskan ke iterasi selanjutnya. Untuk iterasi kedua fitur awal adalah gabungan fitur pendidikan dan banyaknya kartu kredit lain, sementara kandidat fitur adalah 12 fitur sisanya. Proses pemilihan fitur bertahap untuk Model 3 disajikan pada Lampiran 2. Pada iterasi kedua, akurasi rata-rata dari kombinasi fitur pendidikan dan banyaknya kartu kredit lain dengan kandidat fitur lainnya tidak lebih besar daripada iterasi pertama, sehingga proses pemilihan fitur selesai di iterasi pertama. Fitur yang terpilih melalui proses ini hanya dua fitur yaitu pendidikan dan banyaknya kartu kredit lain. Model 1 Model 1 merupakan model VFI5 tanpa pemilihan fitur. Hasil pengujian Model 1 untuk 50 sampel ditampilkan pada Gambar 4. Gambar 4 Akurasi pengujian Model 1 Dari Gambar 4 terlihat bahwa akurasi tertinggi diperoleh pada sampel ke-14 dan ke-24, masing-masing sebesar 68.25% dan terendah pada sampel 8 yaitu 21.11%. Pada metrik pengukuran lainnya, recall mencapai nilai tertinggi pada sampel 48, yaitu 93.70%. Ini artinya hampir keseluruhan instance uji kelas debitur bad dapat diprediksi dengan benar. Meskipun hasil pengukuran recall

25 13 cukup baik, tetapi ketepatan algoritme VFI5 dalam memprediksi kelas debitur bad masih sangat rendah. Hal ini dibuktikan oleh precision yang rendah di setiap sampel percobaan. Metrik precision untuk 50 sampel bernilai kurang dari 25%. Diagram pengukuran metrik recall, TN rate, precision, NP value, dan F-measure untuk Model 1 dapat dilihat pada Lampiran 3. Tabel 4 Confusion matrix sampel ke-14 dan 24 Aktual Data Bad Prediksi Good Bad Good Tabel 4 merupakan confusion matrix untuk sampel dengan akurasi tertinggi pada Model 1. Berdasarkan Tabel 4 diketahui bahwa jumlah instance uji kelas debitur bad yang diprediksi sebagai kelas debitur good lebih besar dibandingkan dengan jumlah instance bad yang diprediksi benar. Sementara pada instance uji debitur good, jumlah instance prediksi benar lebih besar dibandingkan dengan jumlah instance yang salah prediksi, sehingga nilai TN rate kelas good yang dihasilkan cukup tinggi yaitu 74.92%. Sebaliknya, recall dan precision pada kelas debitur bad jauh lebih kecil, masing-masing yaitu 34.38% dan 21.26%. Tabel 5 Confusion matrix sampel ke-34 Aktual Data Bad Prediksi Good Bad Good Berdasarkan confusion matrix di Tabel 5 diketahui bahwa jumlah instance prediksi benar di kedua kelas cukup baik. Recall untuk kelas bad adalah 40.63% sedangkan TN rate untuk kelas good bernilai 70.15%. Sementara precision kelas bad dan NP value kelas good terpaut cukup jauh. Hal ini disebabkan oleh jumlah instance prediksi benar yang dibagi dengan jumlah instance keseluruhan di kelas tersebut mengalami ketidakseimbangan. Dari hasil pengukuran confusion matrix ini dapat dikatakan bahwa sampel ke-34 cukup baik dalam memprediksi debitur yang berpotensi menjadi debitur good dan bad. Kesalahan prediksi instance uji kelas debitur bad menjadi kelas debitur good terjadi karena jumlah vote yang diberikan terhadap kelas debitur good lebih tinggi dibandingkan jumlah vote kelas debitur bad. Misalnya pada instance uji ke- 56 di sampel 14, algoritme VFI5 memprediksi instance tersebut sebagai kelas debitur good, padahal kelas sebenarnya adalah bad. Sebaliknya, instance uji ke- 132 di sampel 34 diprediksi sebagai kelas bad. Hal ini terjadi karena peluang instance tersebut diprediksi sebagai kelas bad lebih tinggi dibandingkan dengan kelas good, sehingga instance uji tersebut diprediksi sebagai kelas bad. Nilai voting kesalahan prediksi untuk instance uji ke-56 dan 132 disajikan pada Tabel 6.

26 14 Tabel 6 Nilai voting kesalahan prediksi instance uji ke-56 dan 132 Data uji ke Kelas prediksi Kelas prediksi Fitur Bad Good Bad Good Pendidikan Gender Status pernikahan Tipe perusahaan Status pekerjaan Pekerjaan Tanggungan Pendapatan Banyaknya kartu kredit lain Persentase utang kartu kredit lain Umur Masa kerja Lama tinggal Status rumah Total Normalisasi Prediksi Good Bad Aktual Bad Good Mengacu pada nilai vote hasil pelatihan untuk sampel ke-34 di Lampiran 4, dapat diketahui bahwa debitur dengan pendidikan SMP/SMA dan S1/S2 cenderung diprediksi sebagai debitur good, sedangkan debitur dengan tingkat pendidikan akademi cenderung bad. Pada fitur gender, peluang wanita menjadi debitur good lebih tinggi dibandingkan dengan laki-laki. Sementara pada fitur status pernikahan, debitur yang berstatus lajang atau bercerai cenderung diprediksi sebagai debitur bad. Industri berat, jasa, dan transportasi merupakan tipe perusahaan yang cenderung dikelompokkan ke kelas bad. Begitupun dengan debitur yang bekerja sebagai wiraswasta yang juga cenderung diklasifikasikan sebagai debitur bad. Pada fitur yang sifatnya kontinu seperti tanggungan, pendapatan, banyaknya kartu kredit lain, persentase utang kartu kredit lain, umur, masa kerja, dan lama tinggal, nilai vote fitur pada selang interval menunjukkan kecenderungan yang sama. Debitur cenderung good ketika nilai fitur berada pada ujung kanan dan kiri selang interval. Sementara ketika berada di bagian tengah selang interval, debitur akan cenderung diprediksi sebagai kelas bad.

27 15 Model 2 Model 2 merupakan model VFI5 dengan pemilihan fitur berdasarkan akurasi. Hasil pengujian Model 2 dengan fitur berakurasi lebih besar dari 50% ditampilkan pada Tabel 7. Tabel 7 Akurasi Model 2 Sampel Akurasi Model 1 Akurasi Model % 71.81% % 71.30% % 70.14% % 23.29% % 19.82% % 12.47% % 71.69% % 71.30% % 70.66% % 71.69% % 71.43% % 72.71% % 70.79% % 71.17% % 71.17% Berdasarkan hasil pengukuran akurasi pada Tabel 7, sampel yang awalnya memiliki akurasi lebih besar atau sama dengan 50% rata-rata mengalami kenaikan akurasi 5%-15%. Sementara sampel yang akurasi awalnya dibawah 40% rata-rata mengalami penurunan 0%-5%. Tetapi secara umum dapat dikatakan bahwa akurasi meningkat setelah dilakukan pemilihan fitur. Perbandingan akurasi Model 1 dan 2 diperlihatkan pada Gambar 5. Gambar 5 Perbandingan akurasi Model 1 dan 2 Akurasi tertinggi Model 2 adalah 72.71% pada sampel 31 dan terendah pada sampel ke-9 yaitu 12.47%. Pada metrik pengukuran lainnya, recall mencapai nilai

28 16 tertinggi pada sampel ke-28 yaitu 89.76%. Artinya pada sampel ini, hampir 90% instance uji kelas bad dapat diprediksi dengan benar. Recall terendah terdapat pada sampel ke-5 yaitu 19.69%. Secara umum pengukuran terhadap recall mengalami penurunan, sedangkan TN rate kelas good mengalami kenaikan. Sementara metrik precision tidak menunjukkan perbedaan yang cukup signifikan. Gambaran recall dan precision ditunjukkan oleh pengukuran F-measure. F- measure pada Model 2 rata-rata mengalami penurunan dibandingkan dengan Model 1. Metrik hasil pengukuran Model 2 dapat dilihat pada Lampiran 5. Perbandingan F-measure Model 1 dan 2 diperlihatkan pada Gambar 6. Gambar 6 Perbandingan F-measure pada Model 1 dan 2 Tabel 8 menyajikan confusion matrix percobaan Model 2 untuk sampel dengan akurasi tertinggi. Berdasarkan confusion matrix tersebut dapat diketahui pengukuran recall dan TN rate masing-masing adalah 39.37% dan 79.23%. Dengan begitu dapat dikatakan bahwa sampel 31 pada Model 2 hanya mampu memprediksi dengan benar instance uji debitur bad kurang dari setengah jumlah instance uji bad keseluruhan. Sementara untuk kelas good, kemampuan algoritme VFI5 memprediksi dengan benar sudah cukup baik. Tabel 8 Confusion matrix sampel ke-31 Aktual Data Bad Prediksi Good Bad Good Berdasarkan confusion matrix pada Tabel 9 diketahui akurasi sampel adalah 67.74%. Meskipun akurasi sampel 39 tergolong rendah, tetapi hasil pengukuran metrik recall dan TN rate -nya cukup baik. Nilai recall dan TN rate masing-masing adalah 46.88% dan 71.85%. Artinya algoritme VFI5 pada sampel ini mampu memprediksi dengan benar hampir separuh instance uji kelas bad dan lebih dari separuh instance uji kelas good. Sementara pengukuran metrik precision dan NP value di kedua kelas masih terpaut jauh. Hal ini disebabkan oleh perbedaan jumlah instance uji yang tidak seimbang di kedua kelas.

29 17 Tabel 9 Confusion matrix sampel ke-39 Aktual Data Bad Prediksi Good Bad Good Meskipun recall dan TN rate di kedua kelas dapat dikatakan cukup baik pada sampel 39, jumlah instance yang salah prediksi tergolong masih tinggi. Kesalahan prediksi ini terjadi karena adanya fitur-fitur yang memberikan nilai vote lebih tinggi meskipun bukan terhadap kelas targetnya. Nilai vote yang diberikan bergantung pada vote yang diperoleh ketika pelatihan. Nilai vote fitur hasil pelatihan untuk sampel ke-39 dapat dilihat pada Lampiran 6. Contohnya instance uji 6 dan 130. Pada instance uji 6 dan 130, tiga dari lima fitur memberikan vote lebih tinggi kepada kelas bukan target. Jumlah vote kelas akhir yang diberikan lebih besar terhadap kelas bukan target sehingga kelas prediksi adalah kelas bukan target. Nilai voting kesalahan prediksi untuk instance uji ke-6 dan 130 ditampilkan pada Tabel 10. Tabel 10 Nilai voting kesalahan prediksi instance uji ke-6 dan ke-130 pada sampel ke-39 Fitur Data uji ke Kelas prediksi Kelas prediksi Bad Good Bad Good Pendidikan Gender Status pernikahan Tanggungan Status rumah Total Normalisasi Prediksi Good Bad Aktual Bad Good Lampiran 6 menunjukan nilai vote fitur yang diperoleh ketika pelatihan untuk sampel ke-39. Berdasarkan hasil vote tersebut, diketahui bahwa debitur dengan pendidikan SMP/SMA dan S1/S2 cenderung dikategorikan ke kelas good. Pada fitur gender, peluang laki-laki dikelompokkan ke kelas debitur good lebih

30 18 kecil dibandingkan dengan debitur bad, sehingga laki-laki cenderung temasuk kelas bad. Debitur yang telah menikah lebih cenderung dikelompokkan sebagai debitur good, sebaliknya lajang dan bercerai dikategorikan menjadi bad. Begitupun dengan jumlah tanggungan, debitur yang tidak memiliki tanggungan atau memiliki tanggungan lebih dari 5 orang lebih berpeluang sebagai debitur good. Fitur status rumah juga menunjukkan kecenderungan yang jelas, yaitu debitur yang memiliki rumah sendiri cenderung dikelompokkan ke kelas good. Dari nilai vote ini terlihat bahwa kecenderungan kelas untuk semua fitur pada Model 2 sama dengan Model 1. Hasil pengujian Model 2 menunjukkan peningkatan akurasi jika dibandingkan dengan Model 1. Hal ini dimungkinkan karena 5 fitur yang digunakan dapat menjadi pemisah yang baik dari kelas good dan bad sehingga mampu mempengaruhi tingkat akurasi. Model 3 Model 3 merupakan model VFI5 dengan pemilihan fitur secara bertahap. Berbeda dengan Model 2, pada model ini hanya menggunakan 2 fitur. Hasil pengukuran akurasi untuk beberapa sampel Model 3 ditampilkan pada Tabel 11. Tabel 11 Akurasi Model 3 Sampel Akurasi Akurasi Model 1 Model % 83.66% % 83.66% % 83.91% % 5.92% % 24.20% % % % 85.59% % 83.66% % 83.91% % 85.59% % 83.66% % 83.91% % 83.66% % 83.66% % 69.37% Pada percobaan Model 3, akurasi mengalami kenaikan cukup baik daripada model-model sebelumnya. Dari Tabel 11 terlihat bahwa umumnya sampel dengan akurasi lebih besar atau sama dengan 50% di Model 1 mengalami kenaikan hingga 34%. Sementara sampel dengan akurasi dibawah 45% lebih fluktuatif. Tetapi secara keseluruhan akurasi Model 3 mengalami kenaikan dibandingkan

31 19 dengan Model 1. Gambar 7 menunjukkan perbandingan akurasi pada Model 1 dan 3. Hasil metrik pengukuran Model 3 dapat dilihat pada Lampiran 7. Gambar 7 Perbandingan akurasi Model 1 dan 3 Akurasi tertinggi diperoleh pada sampel ke-12 dan 22 yaitu sebesar 85.59%. Sementara akurasi terendah berada di sampel ke-7 yaitu sebesar 5.92%. Recall yang cukup baik di Model 1 mengalami penurunan 2%-61% pada model ini. Kenaikan recall hanya terjadi di beberapa sampel dengan kenaikan sebesar 1%-17%. Precision rata-rata mengalami penurunan 0%-24%. Beberapa sampel mengalami kenaikan precision yang cukup signifikan, yaitu hingga 83%. Meskipun recall menurun, metrik precision-nya justru mengalami peningkatan. Ini terjadi karena jumlah instance good yang salah prediksi hanya sedikit bahkan tidak ada, sehingga tidak terlalu mempengaruhi precision. Hasil recall dan precision digunakan untuk mengukur metrik F-measure. Perbandingan F-measure Model 3 dan Model 1 ditampilkan pada Gambar 8. Gambar 8 Perbandingan F-measure Model 1 dan 3 Tabel 12 menunjukkan confusion matrix untuk sampel dengan akurasi tertinggi. Dari confusion matrix tersebut dapat dilihat bahwa jumlah instance uji bad yang berhasil diprediksi dengan benar hanya 15 instances. Hampir keseluruhan instance uji bad mengalami kesalahan prediksi, sehingga recall pada sampel ini hanya 11.81%. Sebaliknya, semua instance uji kelas good berhasil diprediksi benar sehingga TN rate bernilai 100%. Tabel 12 Confusion matrix sampel ke-12 dan 22 Aktual Data Bad Prediksi Good Bad Good 0 650

32 20 Kesalahan prediksi pada sampel 12 terjadi karena adanya beberapa fitur yang memberikan nilai vote lebih besar ke kelas good. Hal ini menyebabkan jumlah vote kelas good lebih tinggi dibandingkan dengan kelas bad sehingga instance uji diprediksi sebagai kelas good. Contoh nilai voting kesalahan prediksi untuk instance uji ke-4 dan 21 pada sampel 12 ditunjukkan pada Tabel 13. Pada Tabel 13 dapat dilihat bahwa untuk instance uji ke-4, kedua fitur mendapatkan nilai vote yang lebih besar di kelas good. Setelah nilai vote masing-masing fitur ini dijumlahkan dan dinormalisasi, diperoleh nilai tertinggi pada kelas good, sehingga instance uji ke-4 diprediksi sebagai kelas good. Begitupun dengan instance uji ke-21, fitur pendidikan memperoleh nilai vote yang lebih besar di kelas good. Dari hasil penjumlahan dan normalisasi total vote akhir masingmasing kelas diketahui bahwa peluang instance uji 21 diprediksi sebagai kelas good lebih besar daripada kelas bad. Tabel 13 Nilai voting kesalahan prediksi instance uji ke-4 dan 21 pada sampel 12 Fitur Data uji ke Kelas prediksi Kelas prediksi Bad Good Bad Good Pendidikan Banyaknya kartu kredit lain Total Normalisasi Prediksi Good Good Aktual Bad Bad Tabel 14 menunjukkan confusion matrix Model 3 untuk sampel dengan recall dan TN rate cukup baik. Dari keseluruhan instance uji kelas bad, hampir 39% berhasil diprediksi dengan benar. Sementara di kelas good juga menunjukkan TN rate yang cukup baik, yaitu sebesar 76.62%. Akurasi dari sampel 30 ini adalah 70.40%. Tabel 14 Confusion matrix sampel ke-30 Aktual Data Prediksi Bad Good Bad Good Kesalahan prediksi pada sampel 30 terjadi di kedua kelas. Jumlah instance yang salah prediksi ini bisa dikatakan cukup tinggi. Tetapi jika dibandingkan

33 21 dengan sampel lainnya pada Model 3, jumlah ini tergolong cukup baik. Kesalahan prediksi instance uji kelas bad terjadi karena adanya fitur yang mendapat nilai vote lebih besar untuk kelas good. Hal ini menyebabkan jumlah vote dan hasil normalisasi kelas good lebih besar dibandingkan dengan kelas bad sehingga instance uji bad diprediksi sebagai good. Begitupun sebaliknya pada instance uji good, peluang instance tersebut masuk ke kelas bad lebih besar dibandingkan dengan kelasnya sendiri sehingga diprediksi sebagai kelas bad. Contoh kesalahan prediksi pada sampel 30 untuk instance uji ke-30 dan 135 dapat dilihat pada Tabel 15. Tabel 15 Voting kesalahan prediksi pada sampel ke-30 untuk instance uji ke-30 dan 135 Fitur Data uji ke Kelas prediksi Kelas prediksi Bad Good Bad Good Pendidikan Banyaknya kartu kredit lain Total Normalisasi Prediksi Good Bad Aktual Bad Good Hasil voting pelatihan untuk sampel ke-30 diperlihatkan pada Lampiran 8. Sama seperti Model 1 dan 2, debitur yang memiliki jenjang pendidikan SMP/SMA dan S1/S2 cenderung dikelompokkan sebagai debitur good. Pada fitur banyaknya kartu kredit lain, debitur yang memiliki 1 kartu kredit lain dikategorikan sebagai debitur bad, sementara debitur yang memiliki 2 atau 3 kartu kredit lain justru termasuk kelas good. Berdasarkan pengujian yang telah dilakukan terhadap semua model, terlihat bahwa Model 3 menghasilkan akurasi yang lebih baik. Meskipun rata-rata akurasi semakin baik dengan pemilihan fitur, metrik pengukuran lainnya menunjukkan penurunan untuk kelas bad, sementara di kelas good menunjukkan peningkatan. Perbandingan metrik pengukuran pada ketiga model dilampirkan dalam Lampiran 9. Perbandingan dengan Penelitian Sebelumnya Akurasi yang diperoleh dari penelitian ini tidak memiliki perbedaan yang cukup besar dengan Setiawati (2011). Sementara jika dibandingkan dengan model terbaik untuk data Hypothyroid pada penelitian Aritonang (2006), terdapat

34 22 perbedaan yang cukup tinggi. Ini dikarenakan Aritonang (2006) menggunakan pendekatan dari level data untuk mengatasi masalah imbalanced data. Metrik pengukuran lainnya untuk ketiga model tidak sebaik yang dihasilkan pada model terbaik di penelitian Setiawati (2011). Begitupun jika dibandingkan dengan penelitian Aritonang (2006), recall, precision, dan F-measure menunjukkan perbedaan nilai yang cukup tinggi. Perbandingan metrik pengukuran pada penelitian Setiawati (2011), Aritonang (2006), dan penelitian ini diperlihatkan pada Tabel 16. Tabel 16 Perbandingan metrik pengukuran dengan penelitian lain Data Model Akurasi Recall Precision F-measure Euthyroid 1) Hypothyroid 2) Debitur VFI5 Model undersampling 66.00% 69.57% 65.37% 67.40% VFI5 Model undersampling 88.73% 79.17% 97.77% 87.49% Backpropagation 3) 73.39% 56.26% 36.90% 44.57% Model 1 4) 65.30% 40.63% 21.14% 27.81% Model 2 5) 67.74% 46.88% 24.69% 32.35% Model 3 6) 70.40% 38.58% 24.38% 29.88% Keterangan: 1), 2) Penelitian Aritonang (2006) 3) Penelitian Setiawati (2011) 4) Model 1: model VFI5 menggunakan semua fitur 5) Model 2: model VFI5 menggunakan fitur berakurasi > 50% 6) Model 3: model VFI5 hasil pemilihan fitur bertahap SIMPULAN DAN SARAN Simpulan Berdasarkan penelitian yang telah dilakukan dapat disimpulkan bahwa: 1 Model VFI5 menggunakan keseluruhan fitur, menghasilkan model terbaik dengan akurasi 65.30%, serta metrik recall, precision, dan F-measure-nya masing-masing adalah 40.63%, 21.14%, dan 27.81%. 2 Model VFI5 menggunakan pemilihan fitur berdasarkan akurasi, diperoleh model terbaik dengan akurasi 67.74%, serta metrik recall, precision, dan F- measure masing-masing yaitu 46.88%, 24.69%, dan 32.25%. 3 Model VFI5 dengan pemilihan fitur bertahap menghasilkan model terbaik dengan pengukuran akurasi, recall, precision, dan F-measure masingmasingnya adalah 70.40%, 38.58%, 24.38%, dan 29.88%. 4 Model terbaik dari keseluruhan model yang dibangun terdapat pada Model VFI5 dengan pemilihan fitur berdasarkan akurasi fitur.

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Klasifikasi merupakan salah satu bidang kajian pada machine learning. Klasifikasi adalah proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep

Lebih terperinci

PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) ABSTRAK

PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) ABSTRAK PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) Atik Pawestri Sulistyo 1, Aziz Kustiyo 1, Agus Buono 2 1 Departemen Ilmu Komputer, Fakultas Matematika dan IPA Institut Pertanian

Lebih terperinci

EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA

EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009 EKSPLORASI

Lebih terperinci

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Biometrik merupakan ilmu pengetahuan yang membangun identitas seseorang berdasarkan sifat-sifat fisik, kimiawi, ataupun kebiasaan seseorang. Sistem biometrik dapat menggunakan

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Penelitian mengenai pengenalan wajah termotivasi oleh banyaknya aplikasi praktis yang diperlukan dalam identifikasi wajah. Pengenalan wajah sebagai salah satu dari teknologi

Lebih terperinci

PEMILIHAN DATA TRAINING UNTUK MENINGKATKAN KINERJA VOTING FEATURE INTERVAL 5 (VFI 5) DAVID AULIA AKBAR ADHIEPUTRA

PEMILIHAN DATA TRAINING UNTUK MENINGKATKAN KINERJA VOTING FEATURE INTERVAL 5 (VFI 5) DAVID AULIA AKBAR ADHIEPUTRA PEMILIHAN DATA TRAINING UNTUK MENINGKATKAN KINERJA VOTING FEATURE INTERVAL 5 (VFI 5) DAVID AULIA AKBAR ADHIEPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

SELEKSI FITUR MENGGUNAKAN FAST CORRELATION BASED FILTER PADA ALGORITMA VOTING FEATURE INTERVALS 5 HIDA NUR FIRQIANI G

SELEKSI FITUR MENGGUNAKAN FAST CORRELATION BASED FILTER PADA ALGORITMA VOTING FEATURE INTERVALS 5 HIDA NUR FIRQIANI G SELEKSI FITUR MENGGUNAKAN FAST CORRELATION BASED FILTER PADA ALGORITMA VOTING FEATURE INTERVALS 5 HIDA NUR FIRQIANI G64103047 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

KLASIFIKASI PASIEN SUSPECT PARVO DAN DISTEMPER PADA DATA REKAM MEDIK RUMAH SAKIT HEWAN IPB MENGGUNAKAN VOTING FEATURE INTERVALS ABSTRAK

KLASIFIKASI PASIEN SUSPECT PARVO DAN DISTEMPER PADA DATA REKAM MEDIK RUMAH SAKIT HEWAN IPB MENGGUNAKAN VOTING FEATURE INTERVALS ABSTRAK 1 KLASIFIKASI PASIEN SUSPECT PARVO DAN DISTEMPER PADA DATA REKAM MEDIK RUMAH SAKIT HEWAN IPB MENGGUNAKAN VOTING FEATURE INTERVALS Muhammad Iqbal 1, Aziz Kustiyo 1, Ekowati Handharyani 2 1 Departemen Ilmu

Lebih terperinci

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Untuk bisa mendukung sistem secara utuh dibutuhkan teori-teori yang mendukung dalam pengembangan aplikasi ini. Teori-teori yang dibutuhkan meliputi pengenalan tanda tangan dan teknologi

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Biometrik adalah ilmu untuk menetapkan identitas seseorang berdasarkan ciri fisik, kimia, ataupun tingkah laku dari orang tersebut. Dewasa ini, biometrik telah menjadi suatu

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Jamur merupakan salah satu jenis tumbuhan yang banyak dijumpai di alam, sehingga sejak dahulu jamur dijadikan sebagai bahan konsumsi utama. Seiring dengan berkembangnya waktu,

Lebih terperinci

DIAGNOSIS GANGGUAN SISTEM URINARI PADA ANJING DAN KUCING MENGGUNAKAN VFI 5. Oleh: DHANY NUGRAHA RAMDHANY G

DIAGNOSIS GANGGUAN SISTEM URINARI PADA ANJING DAN KUCING MENGGUNAKAN VFI 5. Oleh: DHANY NUGRAHA RAMDHANY G DIAGNOSIS GANGGUAN SISTEM URINARI PADA ANJING DAN KUCING MENGGUNAKAN VFI 5 Oleh: DHANY NUGRAHA RAMDHANY G64353 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA 1 PENDAHULUAN Latar Belakang Pesatnya perkembangan teknologi informasi dan komunikasi menempatkan telepon selular menjadi bagian yang tidak terpisahkan dari masyarakat. Keberadaan telepon selular telah

Lebih terperinci

Kelas. Kelas. p q r s t u v w x y Level Transformasi.

Kelas. Kelas. p q r s t u v w x y Level Transformasi. Fitur yang digunakan untuk pelatihan pada algoritme VFI5 diperoleh dari tiap-tiap piksel pada citra tanda tangan. Fitur pada pelatihan yang semula berupa matriks berukuran 3 4 piksel disusun menjadi matriks

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

IDENTIFIKASI KELAYAKAN PESERTA TENDER PADA PETRONAS CARIGALI INDONESIA MENGGUNAKAN ALGORITMA VFI 5 (STUDI KASUS : TENDER PENGADAAN JARINGAN INTERNET)

IDENTIFIKASI KELAYAKAN PESERTA TENDER PADA PETRONAS CARIGALI INDONESIA MENGGUNAKAN ALGORITMA VFI 5 (STUDI KASUS : TENDER PENGADAAN JARINGAN INTERNET) IDENTIFIKASI KELAYAKAN PESERTA TENDER PADA PETRONAS CARIGALI INDONESIA MENGGUNAKAN ALGORITMA VFI 5 (STUDI KASUS : TENDER PENGADAAN JARINGAN INTERNET) YOGI PURNOYUDHO NUGROHO G64103073 DEPARTEMEN ILMU KOMPUTER

Lebih terperinci

PREDIKSI PENYAKIT PARU MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 DENGAN BOBOT FITUR TIDAK SERAGAM DISTY TATA CERIA

PREDIKSI PENYAKIT PARU MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 DENGAN BOBOT FITUR TIDAK SERAGAM DISTY TATA CERIA PREDIKSI PENYAKIT PARU MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 DENGAN BOBOT FITUR TIDAK SERAGAM DISTY TATA CERIA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PREDIKSI INDEKS PRESTASI KUMULATIF MAHASISWA ILMU KOMPUTER IPB MENGGUNAKAN ALGORITMA VFI5 ABDUL NASRAH G

PREDIKSI INDEKS PRESTASI KUMULATIF MAHASISWA ILMU KOMPUTER IPB MENGGUNAKAN ALGORITMA VFI5 ABDUL NASRAH G PREDIKSI INDEKS PRESTASI KUMULATIF MAHASISWA ILMU KOMPUTER IPB MENGGUNAKAN ALGORITMA VFI5 ABDUL NASRAH G64103012 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

SELEKSI FITUR MENGGUNAKAN FAST CORRELATION BASED FILTER PADA ALGORITMA VOTING FEATURE INTERVALS 5 ABSTRAK

SELEKSI FITUR MENGGUNAKAN FAST CORRELATION BASED FILTER PADA ALGORITMA VOTING FEATURE INTERVALS 5 ABSTRAK 1 SELEKSI FITUR MENGGUNAKAN FAST CORRELATION BASED FILTER PADA ALGORITMA VOTING FEATURE INTERVALS 5 Hida Nur Firqiani, Aziz Kustiyo, Endang Purnama Giri 1 Departemen Ilmu Komputer, Fakultas Matematika

Lebih terperinci

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. akurasi =.

dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. akurasi =. dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. Gambar 5 Macam-macam bentuk partisi citra. Ekstraksi Fitur Pada tahap ini semua partisi dari citra dihitung

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Chandra Purnamaningsih Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami No 36 A Surakarta cpurnamaningsih@gmail.com

Lebih terperinci

PREDIKSI KOTA PERAIH ANUGERAH ADIPURA MENGGUNAKAN ALGORITME KLASIFIKASI VFI5 MUHAMAD HAIKAL

PREDIKSI KOTA PERAIH ANUGERAH ADIPURA MENGGUNAKAN ALGORITME KLASIFIKASI VFI5 MUHAMAD HAIKAL PREDIKSI KOTA PERAIH ANUGERAH ADIPURA MENGGUNAKAN ALGORITME KLASIFIKASI VFI5 MUHAMAD HAIKAL DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009 PREDIKSI

Lebih terperinci

BAB IV EKSPERIMEN. 4.1 Tujuan

BAB IV EKSPERIMEN. 4.1 Tujuan BAB IV EKSPERIMEN Pada bab ini dibahas mengenai eksperimen penggunaan SVM dalam pendeteksian intrusi pada jaringan. Pembahasan ini meliputi tujuan yang ingin dicapai melalui eksperimen ini, parameter evaluasi

Lebih terperinci

ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS

ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Perkembangan teknologi sekarang ini semakin pesat. Kebutuhan akan informasi dan komunikasi bertambah. Telah ditemukan berbagai perangkat teknologi yang memudahkan manusia

Lebih terperinci

PEMODELAN JARINGAN SYARAF TIRUAN RECURRENT YANG TEROPTIMASI SECARA HEURISTIK UNTUK PENDUGAAN CURAH HUJAN BERDASARKAN PEUBAH ENSO

PEMODELAN JARINGAN SYARAF TIRUAN RECURRENT YANG TEROPTIMASI SECARA HEURISTIK UNTUK PENDUGAAN CURAH HUJAN BERDASARKAN PEUBAH ENSO PEMODELAN JARINGAN SYARAF TIRUAN RECURRENT YANG TEROPTIMASI SECARA HEURISTIK UNTUK PENDUGAAN CURAH HUJAN BERDASARKAN PEUBAH ENSO AFAN GALIH SALMAN Tesis Sebagai salah satu syarat untuk memperoleh gelar

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

PENENTUAN PERINGKAT DEFAULT

PENENTUAN PERINGKAT DEFAULT PENENTUAN PERINGKAT DEFAULT DEBITUR DALAM VaR (Value at Risk) DENGAN REGRESI BINER LOGISTIK (Studi di PT. Bank Rakyat Indonesia (Persero), Tbk Unit Gajah Mada Cabang Jember) SKRIPSI Oleh : FRIDA MURTINASARI

Lebih terperinci

ii

ii KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES)

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES) PERBANDINGAN ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES) SKRIPSI Oleh : AGUNG WALUYO 24010210141020 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE ITEM BASED COLLABORATIVE FILTERING PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE ITEM BASED COLLABORATIVE FILTERING SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata

Lebih terperinci

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 1 PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 Dina Maurina, Ahmad Zainul Fanani S.Si, M.Kom Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) SKRIPSI Disusun Oleh : DESY RATNANINGRUM 24010211140097 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

PREDIKSI PENYAKIT KENCING MANIS (DIABETES MELLITUS) MENGGUNAKAN ALGORITME KLASIFIKASI VOTING FEATURE INTERVALS 5 EKA HAYANA HASIBUAN

PREDIKSI PENYAKIT KENCING MANIS (DIABETES MELLITUS) MENGGUNAKAN ALGORITME KLASIFIKASI VOTING FEATURE INTERVALS 5 EKA HAYANA HASIBUAN PREDIKSI PENYAKIT KENCING MANIS (DIABETES MELLITUS) MENGGUNAKAN ALGORITME KLASIFIKASI VOTING FEATURE INTERVALS 5 EKA HAYANA HASIBUAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terdahulu Rohmaniah (2017) menganalisis model ambang hujan untuk peringatan dini pergerakan tanah di wilayah Indonesia menggunakan data curah hujan harian berbasis

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

DIAGNOSIS PENYAKIT DEMAM BERDARAH DENGUE MENGGUNAKAN VOTING FEATURE INTERVALS 5 ARISTI IMKA APNIASARI G

DIAGNOSIS PENYAKIT DEMAM BERDARAH DENGUE MENGGUNAKAN VOTING FEATURE INTERVALS 5 ARISTI IMKA APNIASARI G DIAGNOSIS PENYAKIT DEMAM BERDARAH DENGUE MENGGUNAKAN VOTING FEATURE INTERVALS 5 ARISTI IMKA APNIASARI G64103027 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi 4 Perangkat keras berupa Notebook: Processor intel Core i3 2.2 GHz. RAM kapasitas 2. GB. Harddisk Kapasitas 5 GB. Monitor pada resolusi 1366 x 768 piksel. Merek Acer Aspire 475. Perangkat lunak berupa:

Lebih terperinci

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode

Lebih terperinci

Akurasi. Perangkat Lunak: Sistem operasi: Windows Vista Home Premium Aplikasi pemrograman: Matlab 7.0

Akurasi. Perangkat Lunak: Sistem operasi: Windows Vista Home Premium Aplikasi pemrograman: Matlab 7.0 Tabel 1 Dimensi citra di tiap level Level transformasi Dimensi citra 1 46 56 2 23 28 3 12 14 4 6 7 5 3 4 6 2 2 Pada Gambar 5 disajikan visualisasi transformasi wavelet hingga level 3. Deskripsi citra dekomposisi

Lebih terperinci

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

Lebih terperinci

KLASIFIKASI JAMUR KE DALAM KELAS DAPAT DIKONSUMSI ATAU BERACUN MENGGUNAKAN ALGORITMA VFI 5 (STUDI KASUS : FAMILI AGARICUS DAN LEPIOTA)

KLASIFIKASI JAMUR KE DALAM KELAS DAPAT DIKONSUMSI ATAU BERACUN MENGGUNAKAN ALGORITMA VFI 5 (STUDI KASUS : FAMILI AGARICUS DAN LEPIOTA) KLASIFIKASI JAMUR KE DALAM KELAS DAPAT DIKONSUMSI ATAU BERACUN MENGGUNAKAN ALGORITMA VFI 5 (STUDI KASUS : FAMILI AGARICUS DAN LEPIOTA) BAYU MAHARDHIKA PUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

PENGEMBANGAN FUZZY INFERENSI SISTEM UNTUK SELEKSI METODE PENINGKATAN PEROLEHAN MINYAK TINGKAT LANJUT INDAH MUSI INDRIA DEWI G

PENGEMBANGAN FUZZY INFERENSI SISTEM UNTUK SELEKSI METODE PENINGKATAN PEROLEHAN MINYAK TINGKAT LANJUT INDAH MUSI INDRIA DEWI G PENGEMBANGAN FUZZY INFERENSI SISTEM UNTUK SELEKSI METODE PENINGKATAN PEROLEHAN MINYAK TINGKAT LANJUT INDAH MUSI INDRIA DEWI G651034074 SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 SURAT PERNYATAAN

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

Percobaan 1 Percobaan 2

Percobaan 1 Percobaan 2 direpresentasikan dengan histogram. Perlakuan pertama terhadap data-data penelitian ini adalah menghitung histogramnya. Kemudian dari interval antara 0-255 akan dibagi menjadi interval-interval bagian

Lebih terperinci

EKSPLORA INFORMATIKA 127

EKSPLORA INFORMATIKA 127 EKSPLORA INFORMATIKA 127 Implementasi Algoritma C4.5 untuk Analisa Performa Pelayanan Bank Terhadap Nasabah Implementation of C4.5 Algorithm for Bank Service Performance Analysis To Customer Fandi Ramadhan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Instrumen Penelitian Instrumen penelitian ini diperlukan agar penelitian dapat berjalan dengan lancar dan baik. Instrumen tersebut terdiri dari perangkat keras dan perangkat

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

Penggunaan Pohon Keputusan untuk Data Mining

Penggunaan Pohon Keputusan untuk Data Mining Penggunaan Pohon Keputusan untuk Data Mining Indah Kuntum Khairina NIM 13505088 Program Studi Teknik Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jalan Ganesha

Lebih terperinci

LAPORAN SKRIPSI EKSTRAKSI CIRI PENGENALAN GENDER MENGGUNAKAN FITUR GEOMETRIS CITRA WAJAH DENGAN METODE FUZZY C-MEANS (FCM)

LAPORAN SKRIPSI EKSTRAKSI CIRI PENGENALAN GENDER MENGGUNAKAN FITUR GEOMETRIS CITRA WAJAH DENGAN METODE FUZZY C-MEANS (FCM) LAPORAN SKRIPSI EKSTRAKSI CIRI PENGENALAN GENDER MENGGUNAKAN FITUR GEOMETRIS CITRA WAJAH DENGAN METODE FUZZY C-MEANS (FCM) Oleh : NIHAYATUS SA ADAH 2010-51-206 SKRIPSI DIAJUKAN SEBAGAI SALAH SATU SYARAT

Lebih terperinci

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2. 6 tahap ini, pola yang telah ditemukan dipresentasikan ke pengguna dengan teknik visualisasi agar pengguna dapat memahaminya. Deskripsi aturan klasifikasi akan dipresentasikan dalam bentuk aturan logika

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

3. METODE PENELITIAN

3. METODE PENELITIAN 19 3. METODE PENELITIAN 3.1 Diagram Alir Penelitian Kerangka pemikiran pada penelitian ini dapat digambarkan dalam suatu bagan alir seperti pada Gambar 8. Gambar 8 Diagram Alir Penelitian Pengumpulan Data

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

Ahmad Fashel Sholeh Dosen Pembimbing : Prof. Ir. Arif Djunaidy, M.Sc., Ph.D. Wiwik Anggraeni, S.Si., M.Kom.

Ahmad Fashel Sholeh Dosen Pembimbing : Prof. Ir. Arif Djunaidy, M.Sc., Ph.D. Wiwik Anggraeni, S.Si., M.Kom. Ahmad Fashel Sholeh 5209100707 Dosen Pembimbing : Prof. Ir. Arif Djunaidy, M.Sc., Ph.D. Wiwik Anggraeni, S.Si., M.Kom. Stroke merupakan salah satu penyakit yang menyebabkan kematian dan cacat tertinggi.

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN MENENTUKAN OPERATOR TERBAIK MENGGUNAKAN METODE TOPSIS (STUDI KASUS: CBOC REGIONAL 1/ PT. TELEKOMUNIKASI, TBK.

SISTEM PENDUKUNG KEPUTUSAN MENENTUKAN OPERATOR TERBAIK MENGGUNAKAN METODE TOPSIS (STUDI KASUS: CBOC REGIONAL 1/ PT. TELEKOMUNIKASI, TBK. SISTEM PENDUKUNG KEPUTUSAN MENENTUKAN OPERATOR TERBAIK MENGGUNAKAN METODE TOPSIS (STUDI KASUS: CBOC REGIONAL 1/ PT. TELEKOMUNIKASI, TBK.) DRAF SKRIPSI ANDRIAN HAMZANI 071401057 PROGRAM STUDI S1 ILMU KOMPUTER

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

PERBANDINGAN ANALISIS DISKRIMINAN FISHER DAN NAIVE BAYES UNTUK KLASIFIKASI RISIKO KREDIT

PERBANDINGAN ANALISIS DISKRIMINAN FISHER DAN NAIVE BAYES UNTUK KLASIFIKASI RISIKO KREDIT PERBANDINGAN ANALISIS DISKRIMINAN FISHER DAN NAIVE BAYES UNTUK KLASIFIKASI RISIKO KREDIT (Studi Kasus Debitur di Koperasi Jateng Amanah Mandiri Cabang Sukorejo Kendal) SKRIPSI Disusun Oleh: ABDUR ROFIQ

Lebih terperinci

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan

Lebih terperinci

PREDIKSI INDEKS PRESTASI MAHASISWA MENGGUNAKAN ALGORITMA VFI5 (STUDI KASUS MAHASISWA PROGRAM MAYOR MINOR DEPARTEMEN ILMU KOMPUTER IPB ) AKHYAR AZNI

PREDIKSI INDEKS PRESTASI MAHASISWA MENGGUNAKAN ALGORITMA VFI5 (STUDI KASUS MAHASISWA PROGRAM MAYOR MINOR DEPARTEMEN ILMU KOMPUTER IPB ) AKHYAR AZNI PREDIKSI INDEKS PRESTASI MAHASISWA MENGGUNAKAN ALGORITMA VFI5 (STUDI KASUS MAHASISWA PROGRAM MAYOR MINOR DEPARTEMEN ILMU KOMPUTER IPB ) AKHYAR AZNI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

SKRIPSI. Disusun Oleh : ZULFA WAHYU MARDIKA NIM. J2E

SKRIPSI. Disusun Oleh : ZULFA WAHYU MARDIKA NIM. J2E PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART (CLASSIFICATION AND REGRESSION TREES) (STUDI KASUS KREDIT MACET DI PD. BPR-BKK PURWOKERTO UTARA) SKRIPSI Disusun Oleh : ZULFA WAHYU MARDIKA NIM.

Lebih terperinci

PENGENALAN IRIS MATA DENGAN ALGORITME VOTING FEATURE INTERVAL VERSI 5 MENGGUNAKAN EKSTRAKSI CIRI LOG-GABOR WAVELET MUHAMMAD ZAKI

PENGENALAN IRIS MATA DENGAN ALGORITME VOTING FEATURE INTERVAL VERSI 5 MENGGUNAKAN EKSTRAKSI CIRI LOG-GABOR WAVELET MUHAMMAD ZAKI PENGENALAN IRIS MATA DENGAN ALGORITME VOTING FEATURE INTERVAL VERSI 5 MENGGUNAKAN EKSTRAKSI CIRI LOG-GABOR WAVELET MUHAMMAD ZAKI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

DIAGNOSIS GANGGUAN SISTEM URINARI PADA ANJING DAN KUCING MENGGUNAKAN VFI 5. Abstrak

DIAGNOSIS GANGGUAN SISTEM URINARI PADA ANJING DAN KUCING MENGGUNAKAN VFI 5. Abstrak DIAOSIS AUA SISTEM URIARI PADA AJI DA KUCI MEUAKA VFI 5 Dhany ugraha Ramdhany 1, Aziz Kustiyo 2, Ekowati Handharyani 3, dan Agus Buono 4 1, 2, 4 Departemen Ilmu Komputer, FMIPA, IPB, Kampus IPB Darmaga

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

ANALISIS KINERJA DAN IMPLEMENTASI ALGORITMA KOMPRESI ARITHMETIC CODING PADA FILE TEKS DAN CITRA DIGITAL SKRIPSI SARIFAH

ANALISIS KINERJA DAN IMPLEMENTASI ALGORITMA KOMPRESI ARITHMETIC CODING PADA FILE TEKS DAN CITRA DIGITAL SKRIPSI SARIFAH ANALISIS KINERJA DAN IMPLEMENTASI ALGORITMA KOMPRESI ARITHMETIC CODING PADA FILE TEKS DAN CITRA DIGITAL SKRIPSI SARIFAH 061401090 PROGRAM STUDI S1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Tahapan Penelitian Tahapan yang dilakukan dalam penelitian ini disajikan pada Gambar 14, terdiri dari tahap identifikasi masalah, pengumpulan dan praproses data, pemodelan

Lebih terperinci

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine. ABSTRAK Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. Tabel 4.1 Kebutuhan Perangkat Keras. Perangkat Keras Spesifikasi Processor Intel Core i3. Sistem Operasi Windows 7

BAB IV HASIL DAN PEMBAHASAN. Tabel 4.1 Kebutuhan Perangkat Keras. Perangkat Keras Spesifikasi Processor Intel Core i3. Sistem Operasi Windows 7 BAB IV HASIL DAN PEMBAHASAN 4.1 Kebutuhan Sistem Sebelum melakukan penelitian dibutuhkan perangkat lunak yang dapat menunjang penelitian. Perangkat keras dan lunak yang digunakan dapat dilihat pada Tabel

Lebih terperinci

UKURAN DAN BENTUK SERTA PENDUGAAN BOBOT BADAN BERDASARKAN UKURAN TUBUH DOMBA SILANGAN LOKAL GARUT JANTAN DI KABUPATEN TASIKMALAYA

UKURAN DAN BENTUK SERTA PENDUGAAN BOBOT BADAN BERDASARKAN UKURAN TUBUH DOMBA SILANGAN LOKAL GARUT JANTAN DI KABUPATEN TASIKMALAYA UKURAN DAN BENTUK SERTA PENDUGAAN BOBOT BADAN BERDASARKAN UKURAN TUBUH DOMBA SILANGAN LOKAL GARUT JANTAN DI KABUPATEN TASIKMALAYA SKRIPSI MUHAMMAD VAMY HANIBAL PROGRAM STUDI TEKNOLOGI PRODUKSI TERNAK FAKULTAS

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN Dalam penelitian ini diperlukan sebuah desain dan metode penelitian agar dalam pelaksanaaannya dapat menjadi lebih teratur dan terurut. 3.1. Desain Penelitian Bentuk dari desain

Lebih terperinci

DIAGNOSA PENYAKIT TUBERKULOSIS PARU MENGGUNAKAN ALGORITME VFI5 ABDUL ROSYID

DIAGNOSA PENYAKIT TUBERKULOSIS PARU MENGGUNAKAN ALGORITME VFI5 ABDUL ROSYID i DIAGNOSA PENYAKIT TUBERKULOSIS PARU MENGGUNAKAN ALGORITME VFI5 ABDUL ROSYID DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009 ii DIAGNOSA PENYAKIT TUBERKULOSIS

Lebih terperinci

PENGEMBANGAN FUZZY INFERENSI SISTEM UNTUK SELEKSI METODE PENINGKATAN PEROLEHAN MINYAK TINGKAT LANJUT INDAH MUSI INDRIA DEWI G

PENGEMBANGAN FUZZY INFERENSI SISTEM UNTUK SELEKSI METODE PENINGKATAN PEROLEHAN MINYAK TINGKAT LANJUT INDAH MUSI INDRIA DEWI G PENGEMBANGAN FUZZY INFERENSI SISTEM UNTUK SELEKSI METODE PENINGKATAN PEROLEHAN MINYAK TINGKAT LANJUT INDAH MUSI INDRIA DEWI G651034074 SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 SURAT PERNYATAAN

Lebih terperinci

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG TESIS IVAN JAYA 117038072 PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan pada

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan pada BAB III METODOLOGI PENELITIAN 1.1. Desain Penelitian Gambar 3.1 merupakan desain penelitian yang akan digunakan pada proses pengenalan huruf tulisan tangan Katakana menggunakan metode Fuzzy Feature Extraction

Lebih terperinci

UNIVERSITAS INDONESIA PENGUKURAN RISIKO KREDIT MENGGUNAKAN METODE CREDIT RISK + DENGAN MEMPERTIMBANGKAN VARIABEL MAKRO EKONOMI (STUDI KASUS DI BANK X)

UNIVERSITAS INDONESIA PENGUKURAN RISIKO KREDIT MENGGUNAKAN METODE CREDIT RISK + DENGAN MEMPERTIMBANGKAN VARIABEL MAKRO EKONOMI (STUDI KASUS DI BANK X) UNIVERSITAS INDONESIA PENGUKURAN RISIKO KREDIT MENGGUNAKAN METODE CREDIT RISK + DENGAN MEMPERTIMBANGKAN VARIABEL MAKRO EKONOMI (STUDI KASUS DI BANK X) TESIS IRA WIDAYANTI 0806432991 FAKULTAS EKONOMI PROGRAM

Lebih terperinci

FAKTOR-FAKTOR YANG MEMPENGARUHI TINGKAT PENGEMBALIAN PEMBIAYAAN SYARIAH UNTUK UMKM AGRIBISNIS PADA KBMT WIHDATUL UMMAH KOTA BOGOR

FAKTOR-FAKTOR YANG MEMPENGARUHI TINGKAT PENGEMBALIAN PEMBIAYAAN SYARIAH UNTUK UMKM AGRIBISNIS PADA KBMT WIHDATUL UMMAH KOTA BOGOR FAKTOR-FAKTOR YANG MEMPENGARUHI TINGKAT PENGEMBALIAN PEMBIAYAAN SYARIAH UNTUK UMKM AGRIBISNIS PADA KBMT WIHDATUL UMMAH KOTA BOGOR SKRIPSI MASTUTY HANDOYO H 34066079 DEPARTEMEN AGRIBISNIS FAKULTAS EKONOMI

Lebih terperinci

KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO

KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 KINERJA

Lebih terperinci

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri

Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Identifikasi Pembicara Menggunakan Algoritme VFI5 dengan MFCC sebagai Pengekstraksi Ciri Vicky Zilvan, S.Kom. UPT LPSN - LIPI v_q1e@yahoo.com Furqon Hensan Muttaqien, S.Komp. P2 Informatika - LIPI fh.muttaqien@informatika.lipi.go.id

Lebih terperinci

: Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M.

: Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M. Judul : Analisis Diskriminan pada Klasifikasi Desa di Kabupaten Tabanan Menggunakan Metode K-Fold Cross Validation Nama : Ida Ayu Made Supartini Pembimbing : 1. Ir. I Komang Gde Sukarsa, M.Si 2. I Gusti

Lebih terperinci