BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel"

Transkripsi

1 BAB III PEMBAHASAN A. Sumber Data Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel peminjam dengan jaminan sertifikat tanah, tunjuk, dan Buku Pemilik Kendaraan Bermotor (BPKB) serta 25 file excel laporan nominatif pinjaman perbulan dimana setiap file mewakili satu bulan. Data peminjam adalah data mengenai status peminjam, pendapatan keluarga, pengeluaran keluarga, usaha, tempat tinggal, agunan, dan info-info lain yang mencakup 5C yang digunakan sebagai pertimbangan pemberian kredit. Data laporan nominatif pinjaman perbulan adalah data mengenai besar pinjaman, sisa pinjaman, bunga, angsuran, kolektibilitas, dan info-info lain yang berkaitan dengan angsuran perbulan. Rentang waktu dari data peminjam adalah Januari Maret 2016 dan rentang waktu pada data laporan nominatif pinjaman perbulan adalah Januari Maret Daftar atribut pada kedua data dapat dilihat pada lampiran 1. Data yang digunakan adalah data peminjam yang telah melunasi pinjaman dan peminjam yang bermasalah. Pengumpulan data dilakukan secara manual yaitu pada data laporan nominatif pinjaman perbulan dipilih data yang mempunyai nilai bakidebet 0 artinya peminjam telah melunasi pinjaman dan data yang mempunyai nilai kolektibilitas 2-4 artinya peminjam bermasalah dalam mengangsur pinjaman. Hasil pemilihan pada data laporan nominatif pinjaman perbulan tersebut kemudian dihubungkan dengan file peminjam dengan primary key yaitu No.Anggota diperoleh sebanyak dataset. 46

2 Pada data peminjam dan data laporan nominatif pinjaman perbulan tidak semua atribut digunakan. Atribut yang digunakan pada data peminjam adalah sebagai berikut: a. No.Anggota digunakan sebagai primary key, b. pekerjaan adalah pekerjaan peminjam ketika melakukan permohonan pinjaman, c. No KTP adalah Nomer Kartu Tanda Kependudukan peminjam, d. pekerjaan istri/suami adalah pekerjaan suami atau istri peminjam ketika melakukan permohonan pinjaman, e. pendapatan keluarga adalah jumlah pendapatan peminjam ditambah dengan jumlah pendapatan suami atau istri peminjam, f. pengeluaran keluarga adalah jumlah pengeluaran keluarga perbulan untuk memenuhi kebutuhan hidup, g. pinjaman adalah besar pinjaman yang dilakukan, h. kemampuan angsuran adalah kemampuan peminjam untuk mengangsur, i. jangka waktu adalah jumlah waktu untuk mengembalikan pinjaman, j. agunan adalah jaminan yang diberikan oleh peminjam, k. status agunan adalah status kepemilikan jaminan, l. nilai jaminan adalah besar nominal uang yang setara dengan jaminan, m. tujuan adalah tujuan digunakannya dana pinjaman, n. tanggal peminjaman adalah tanggal dimana peminjam melakukan pinjaman. Atribut yang digunakan pada data laporan nominatif pinjaman perbulan adalah sebagai berikut: 47

3 a. No.Anggota digunakan sebagai primary key, b. kolektibilitas adalah status kelancaran peminjam dalam mengangsur pinjaman. Atribut-atribut lain yang tidak digunakan adalah atribut yang telah terwakili oleh atribut yang digunakan, atribut yang tidak ada kaitannya dengan pengklasifikasian, atribut yang nilainya terlalu beragam, dan atribut yang sering tidak mempunyai isian, sehingga atribut tersebut tidak diperlukan pada penelitian ini. Contoh data yang telah dikumpulkan dapat dilihat pada lampiran 2. Setelah data lengkap maka tahap selanjutnya mempersiapkan data tersebut untuk proses data mining yaitu preprocessing yang terdiri dari Data Cleaning, Data Integration, Data Selection, Data Transformation. B. Pembersihan Data (Data Cleaning) dan Integrasi Data (Data Integration) Preprocessing data yang dilakukan setelah data lengkap adalah pembersihan data. Masih adanya data yang tidak memiliki kelengkapan atribut dapat mengakibatkan hasil dari proses mining tidak baik atau memungkinkan adanya noise. Oleh karena itu perlunya preprocessing pembersihan data. Pembersihan data dilakukan terhadap data yang tidak memiliki kelengkapan atribut dengan cara menghapus data tersebut. Dari dataset dilakukan penghapusan pada 97 dataset dengan rincian sebagai berikut: 1. Data yang tidak mempunyai kelengkapan atribut pekerjaan sebanyak Data yang tidak mempunyai kelengkapan atribut No KTP sebanyak 7. 48

4 3. Data yang tidak mempunyai kelengkapan atribut pekerjaan suami/istri sebanyak Data yang tidak mempunyai kelengkapan atribut pengeluaran keluarga sebanayak Data yang tidak mempunyai kelengkapan atribut kemampuan angsuran sebanyak Data yang tidak mempunyai kelengkapan atribut status agunan sebanyak Data yang tidak mempunyai kelengkapan atribut Nilai jaminan sebanyak Data yang tidak mempunyai kelengkapan atribut tujuan sebanyak Data yang tidak mempunyai kelengkapan atribut kolektibilitas sebanyak 1. Setelah proses pembersihan data, jumlah data menjadi 979 dataset yang kemudian dilanjutkan dengan proses integrasi data. Integrasi data pada penelitian ini dilakukan pada awal ketika pemilihan datadata yang diperlukan dan penghubungan data laporan nominatif pinjaman perbulan dengan data peminjam menggunakan primary key yaitu No.Anggota yang kemudian disimpan dalam satu file. Selain itu, integrasi data juga dilakukan dengan penggantian atribut No.KTP dan tanggal peminjaman menjadi atribut umur. Atribut umur tersebut dapat diidentifikasi melalui tahun peminjaman dikurangi dengan tahun lahir peminjam. Tahun lahir peminjam dapat diidentifikasi melalui karakter ke 6 dan 7 dari belakang pada No. KTP. 49

5 C. Seleksi Data (Data Selection) dan Transformasi Data (Data Transformation) Seleksi data yang dilakukan adalah penghapusan atribut No.Anggota dan penghapusan atribut-atribut yang tidak digunakan dalam analisis seperti nama, alamat, nomer telepon, uraian usaha, dan lain-lain. Sehingga atribut-atribut yang digunakan untuk analisis klasifikasi adalah pekerjaan, umur, pekerjaan istri/suami, pendapatan keluarga, pengeluaran keluarga, pinjaman, kemampuan angsuran, jangka waktu, agunan, status agunan, nilai jaminan, tujuan, dan kolektibilitas. Setelah dilakukan tahap pembersihan data, integrasi data, dan seleksi data, selanjutnya dilakukan tahap transformasi data. Transformasi data yang dilakukan pada penelitian ini adalah pengubahan tipe data ke dalam format yang sesuai sehingga siap untuk diproses menggunakan metode decision tree C4.5 dan naïve bayes. Transformasi data dilakukan pada data yang bertipe numerik menjadi interval, diantaranya dilakukan pada beberapa atribut. Hasil transformasi dapat dilihat pada Tabel Tabel 3.1 Transformasi Atribut Umur Umur (tahun) Sebelum Transformasi Sesudah Transformasi U U U U U5 50

6 Tabel 3.2 Transformasi Atribut Pendapatan Keluarga Pendapatan Keluarga (rupiah) Sebelum Transformasi Sesudah Transformasi D D D D D D6 Tabel 3.3 Transformasi Atribut Pengeluaran Keluarga Pengeluaran Keluarga (rupiah) Sebelum Transformasi Sesudah Transformasi K K K K4 Tabel 3.4 Transformasi Atribut Pinjaman Pinjaman (rupiah) Sebelum Transformasi Sesudah Transformasi PJ PJ PJ PJ > PJ5 Tabel 3.5 Transformasi Atribut Kemampuan Angsuran % Kemampuan angsur % Sebelum Transformasi Sesudah Transformasi KA KA KA3 51

7 Tabel 3.6 Transformasi Atribut Jangka Waktu Jangka Waktu (bulan) Sebelum Transformasi Sesudah Transformasi J J J3 Tabel 3.7 Transformasi Atribut Nilai Jaminan Nilai Jaminan (rupiah) Sebelum Transformasi Sesudah Transformasi N N N N N5 Transformasi juga dilakukan pada beberapa atribut yang mempunyai nilai atau isian dengan karakter terlalu panjang, maka untuk mempersingkat data ditransformasi menjadi beberapa inisial. Hasil transformasi dapat dilihat pada Tabel Tabel 3.8 Transformasi Atribut Pekerjaan Pekerjaan Sebelum Transformasi Sesudah Transformasi Wiraswasta PK1 Karyawan Swasta PK2 Petani/pedagang/tukang PK3 Buru PK4 PNS PK5 Tidak Bekerja PK6 52

8 Tabel 3.9 Transformasi Atribut Pekerjaan Suami/Istri Pekerjaan suami/istri Sebelum Transformasi Sesudah Transformasi Wiraswasta PS1 Karyawan Swasta PS2 Petani/pedagang/tukang PS3 Buruh PS4 PNS PS5 Tidak Bekerja PS6 Tabel 3.10 Transformasi Atribut Agunan Agunan Sebelum Transformasi Sesudah Transformasi Sertifikat tanah A1 BPKB A2 Tunjuk A3 Tabel 3.11 Transformasi Atribut Status Agunan Status Agunan Sebelum Transformasi Sesudah Transformasi Milik Sendiri SA1 Bukan Milik Sendiri SA2 Tabel 3.12 Transformasi Atribut Tujuan Tujuan Sebelum Transformasi Sesudah Transformasi Modal T1 Kesejahteraan T2 53

9 Tabel 3.13 Transformasi Atribut Kolektibilitas Kolektibilitas Sebelum Transformasi Sesudah Transformasi 1 Lancar KL1 2 Kurang Lancar KL2 3 Diragukan KL3 4 Macet KL4 Setelah data ditransformasikan dan dikelompokkan sesuai kriteria masingmasing maka dihasilkan data yang siap untuk diolah seperti yang disajikan pada Tabel

10 Pekerjaan Umur Pekerjaan Suami/Istri Pendapatan Keluarga Tabel 3.14 Contoh Data yang Telah Mengalami Preprocessing Pengeluaran Keluarga Pinjaman Kemampuan Angsuran Jangka Waktu Agunan Status Agunan Nilai Jaminan PK1 U1 PS1 D2 K2 PJ2 KA1 J2 A1 SA2 N5 T1 KL3 PK1 U3 PS5 D6 K3 PJ5 KA2 J2 A1 SA1 N5 T1 KL1 PK1 U2 PS1 D4 K3 PJ3 KA2 J2 A2 SA1 N3 T1 KL1 PK2 U4 PS6 D4 K2 PJ2 KA1 J1 A2 SA1 N1 T1 KL3 PK3 U2 PS6 D2 K1 PJ5 KA2 J3 A3 SA1 N4 T2 KL1 PK4 U3 PS4 D2 K1 PJ1 KA3 J2 A3 SA2 N3 T1 KL1 PK6 U2 PS1 D4 K2 PJ4 KA2 J2 A1 SA1 N5 T1 KL1 PK4 U4 PS3 D2 K1 PJ2 KA1 J2 A1 SA1 N2 T2 KL1 PK4 U1 PS4 D2 K1 PJ2 KA2 J1 A3 SA1 N2 T1 KL1 PK4 U2 PS4 D2 K2 PJ3 KA3 J3 A1 SA2 N3 T2 KL4 PK4 U2 PS6 D2 K1 PJ2 KA2 J2 A1 SA2 N2 T1 KL1 PK2 U2 PS1 D3 K2 PJ2 KA2 J2 A3 SA1 N3 T1 KL1 PK3 U3 PS4 D2 K1 PJ1 KA3 J1 A3 SA1 N1 T2 KL3 PK3 U3 PS3 D3 K3 PJ1 KA2 J1 A3 SA1 N1 T1 KL3 PK2 U3 PS1 D4 K2 PJ5 KA3 J3 A1 SA1 N5 T2 KL1 PK4 U3 PS3 D2 K1 PJ3 KA3 J1 A1 SA1 N3 T2 KL4 PK2 U1 PS1 D4 K3 PJ3 KA3 J2 A2 SA1 N2 T1 KL1 PK5 U3 PS3 D2 K2 PJ1 KA2 J2 A3 SA1 N3 T1 KL1 PK5 U3 PS6 D6 K3 PJ5 KA3 J2 A2 SA1 N4 T1 KL3 Tujuan Kelas 55

11 D. Proses Klasifikasi Menggunakan Decision Tree C4.5 Setelah data ditransformasi, maka data siap diproses menggunakan metode decision tree (pohon keputusan). Langkah-langkah pembentukan pohon keputusan menggunakan algoritma C4.5 sebagai berikut: 1. Tahap pertama adalah menentukan simpul akar yang dilakukan dengan menghitung total kasus untuk kelas KL1, KL2, KL3, dan KL4 serta gain ratio pada setiap atribut. Proses ini dilakukan sama pada setiap nilai atribut pekerjaan, umur, pekerjaan suami/istri, pendapaan keluarga, pengeluaran keluarga, pinjaman, kemampuan angsuran, jangka waktu, status agunan, tujuan, nilai jaminan. Hasil dari perhitungan dapat dilihat pada Tabel Berdasarkan Persamaan (2.1) nilai untuk kolom info pada Tabel 3.15 diperoleh dari: info(total) = log 2 ( ) log 2 ( ) log 2 ( ) log 2 ( ) = 1,

12 Tabel 3.15 Proses Pembentukan Simpul Akar KASUS TOTAL KL1 KL2 KL3 KL4 INFO ENTROPY GAIN SPLIT INFO GAIN RATIO PEKERJAAN PK PK PK PK PK PK UMUR U U U U U PEKERJAAN SUAMI/ISTRI PS PS PS PS PS PS

13 KASUS TOTAL KL1 KL2 KL3 KL4 INFO ENTROPY GAIN SPLIT INFO GAIN RATIO PENDAPATAN KELUARGA D D D D D D PENGELUARAN KELUARGA K K K K PINJAMAN PJ PJ PJ PJ PJ KEMAMPUAN ANGSURAN KA KA KA

14 KASUS TOTAL KL1 KL2 KL3 KL4 INFO ENTROPY GAIN SPLIT INFO GAIN RATIO JANGKA WAKTU J J J AGUNAN A A A STATUS AGUNAN SA SA NILAI JAMINAN N N N N N TUJUAN T T

15 Sementara itu, berdasarkan persamaan (2.2), nilai entropy untuk atribut pekerjaan pada Tabel 3.15 diperoleh dari: 227 E(pekerjaan) = ( 326 log 2 ( ) log 2 ( ) log 2 ( ) log 2 ( 15 ) 326 ) ( 61 log 2 ( ) 7 61 log 2 ( 7 61 ) log 2 ( ) 2 61 log 2 ( 2 ) 61 ) ( 311 log 2 ( ) log 2 ( ) log 2 ( ) log 2 ( 31 ) 311 ) ( 202 log 2 ( ) log 2 ( ) log 2 ( ) log 2 ( 13 ) ) 979 ( log 2 ( ) 5 53 log 2 ( 5 42 ) 5 42 log 2 ( 5 42 )) ( log 2 ( ) 1 37 log 2 ( 1 37 )) = 1,33910 Berdasarkan Persamaan (2.3), nilai information gain untuk atribut pekerjaan pada Tabel 3.15 diperoleh dari: Gain(pekerjaan) = Info(total) E(pekerjaan) = 1, ,33910 = 0,03116 Berdasarkan persamaan (2.4), nilai split information untuk atribut pekerjaan pada Tabel 3.15 diperoleh dari: 60

16 Split info(pekerjaan) = log 2 ( ) log 2 ( ) log 2 ( ) log 2 ( ) log 2 ( ) log 2 ( ) = 2,14664 Berdasarkan persamaan (2.5), nilai gain ratio untuk atribut pekerjaan pada Tabel 3.15 diperoleh dari: Gain ratio(pekerjaan) = Gain(pekerjaan) Split info (pekerjaan) = 0, ,14664 = 0,01452 Berdasarkan Tabel 3.15 dapat diketahui bahwa atribut dengan gain ratio tertinggi adalah atribut agunan yaitu sebesar 0,04425, dengan demikian atribut agunan menjadi simpul akar pada pohon keputusan. Ada tiga nilai atribut dari agunan yaitu A1, A2, dan A3. Dari ketiga nilai atribut tersebut belum mengklasifikasikan kasus menjadi satu atau belum menunjukkan sebuah keputusan akhir, sehingga perlu dilakukan perhitungan nilai gain ratio kembali dari setiap atribut dengan penghapusan simpul agunan. Sebagai contoh, akan dicari simpul internal dari percabngan nilai A3 yaitu simpul internal (1,1). Hasil pohon keputusan sementara ditunjukkan pada Gambar

17 Agunan A2 A3 A1 1.2? 1.1? 1.3? Gambar 3.1 Pohon Keputusan Sementara Perhitungan Simpul Akar 2. Menentukan simpul internal (1.1) dengan menghitung total kasus untuk kategori kelas KL1, KL2, KL3, KL4 pada simpul internal (1.1) dan menghitung gain ratio pada setiap atribut. Proses perhitungan tersebut sama untuk semua atribut. Atribut yang sudah menjadi akar dihapus dari daftar atribut. Hasil perhitungan secara lengkap dapat dilihat pada lampiran 3. Berdasarkan perhitungan pada lampiran 3 besar gain ratio pada setiap atribut dapat dilihat pada Tabel Tabel 3.16 Nilai Gain Ratio pada Pembentukan Simpul Internal (1.1) Nama Atribut Gain Ratio Pekerjaan 0,03603 Umur 0,01145 Pekerjaan suami/istri 0,01045 Pendapatan keluarga 0,02015 Pengeluaran keluarga 0,01871 Pinjaman 0,02471 Kemampuan angsuran 0,07708 Jangka waktu 0,03116 Status agunan 0,01793 Nilai jaminan 0,00692 Tujuan 0,

18 Berdasarkan Tabel 3.16 atribut yang mempunyai nilai gain ratio tertinggi adalah kemampuan angsuran yaitu sebesar 0,07708, oleh karena itu atribut kemampuan angsuran dijadikan sebagai simpul internal (1.1). Ada tiga nilai atribut dari kemampuan angsuran, yaitu KA1, KA2, KA3. Dari ketiga nilai tersebut belum menunjukkan keputusan akhir, sehingga dilakukan perhitungan nilai gain ratio kembali dari setiap atribut dengan penghapusan atribut kemampuan angsuran. Sebagai contoh, akan dicari simpul internal dari percabangan nilai KA1 yaitu simpul internal (2.2). Hasil pohon keputusan sementara ditunjukkan pada Gambar 3.2. Agunan A2 A3 A1 1.2? Kemampuan angsuran 1.3? KA2 KA1 KA1 2.1? 2.2? 2.3? Gambar 3.2 Pohon Keputusan Sementara Perhitungan Simpul Internal (1.1) 3. Menentukan simpul internal (2.2) dengan menghitung total kasus untuk kategori kelas KL1, KL2, KL3, KL4 dan gain ratio pada simpul internal (2.2). Proses perhitungan dilakukan sama pada setiap nilai atribut. Atribut kemampuan angsuran yang sudah menjadi simpul internal dihapus. Hasil perhitungan dapat dilihat pada lampiran 4. 63

19 Berdasarkan perhitungan pada lampiran 4 besar gain ratio pada setiap atribut dapat dilihat pada Tabel Tabel 3.17 Nilai Gain Ratio pada Pembentukan Simpul Internal (2.2) Nama Atribut Gain Ratio Pekerjaan 0,03950 Umur 0,07365 Pekerjaan suami/istri 0,05274 Pendapatan keluarga 0,12970 Pengeluaran keluarga 0,10969 Pinjaman 0,04983 Jangka waktu 0,02921 Nilai jaminan 0,07321 Tujuan 0,01334 Berdasarkan Tabel 3.17 atribut yang mempunyai nilai gain ratio tertinggi adalah pendapatan keluarga yaitu sebesar 0,12970, oleh karena itu atribut pendapatan keluarga dijadikan sebagai simpul internal (2.2). Ada enam nilai atribut pada pendapatan keluarga, yaitu D1, D2, D3, D4, D5, D6. Dari keenam nilai tersebut tidak terdapat nilai yang memiliki keputusan akhir, sehingga dilakukan perhitungan nilai gain ratio kembali dari setiap atribut dengan penghapusan atribut pendapatan keluarga. Sebagai contoh, akan dicari simpul internal dari percabngan nilai D3 yaitu simpul internal (3.3). Hasil pohon keputusan sementara yang terbentuk ditunjukkan pada Gambar

20 Agunan A2 A3 A1 1.2? Kemampuan angsuran 1.3? KA2 KA1 KA3 2.1? Pendapatan keluarga 2.3? D1 D2 D3 D4 D5 D6 3.1? 3.2? 3.3? 3.4? 3.5? 3.6? Gambar 3.3 Pohon Keputusan Sementara Perhitungan Simpul Internal (2.2) 4. Menghitung total kasus untuk kategori kelas akhir KL1, KL2, KL3, KL4 pada simpul internal (3.3) dan menghitung nilai gain ratio pada setiap atribut. Proses tersebut dilakukan sama pada setiap nilai atribut. Sementara itu atribut pendapatan keluarga dihapus dari daftar atribut. Hasil perhitungan dapat dilihat pada lampiran 5. Berdasarkan perhitungan pada lampiran 5 besar gain ratio pada setiap atribut dapat dilihat pada Tabel

21 Tabel 3.18 Nilai Gain Ratio pada Pembentukan Simpul Internal (3.3) Nama Atribut Gain Ratio Pekerjaan 0,09200 Umur 0,13840 Pekerjaan suami/istri 0,12065 Pengeluaran keluarga 0,16041 Pinjaman 0,27341 Jangka waktu 0,12215 Nilai jaminan 0,17596 Tujuan 0,05895 Berdasarkan Tabel 3.18 atribut yang mempunyai nilai gain ratio tertinggi adalah pinjaman yaitu sebesar 0,27341, sehingga atribut pinjaman dijadikan sebagai simpul internal (3.3). Pada atribut pinjaman, terdapat satu nilai atribut yang telah memiliki keputusan akhir yaitu nilai PJ3 dengan kategori kelas KL3. Masih terdapat tiga nilai lainnya yang belum memiliki keputusan akhir sehingga perlu dilakukan perhitungan nilai gain ratio kembali dari setiap atribut dengan penghapusan atribut pinjaman. Hasil pohon keputusan sementara yang terbentuk ditunjukkan oleh Gambar

22 Agunan A2 A3 A1 1.2? Kemampuan angsuran 1.3? KA2 KA1 KA3 2.1? Pendapatan keluarga 2.3? D1 D2 D3 D4 D5 D6 3.1? 3.2? Pinjaman 3.4? 3.5? 3.6? PJ1 PJ2 PJ3 PJ5 4.1? 4.2? KL2 4.3? Gambar 3.4 Pohon Keputusan Sementara Perhitungan Simpul Internal (3.3) Proses pembentukan pohon pada Gambar 3.4 bukan akhir dari pembentukan pohon keputusan pada kasus ini. Perhitungan yang terdapat pada keempat langkah di atas merupakan contoh perhitungan pada salah satu simpul internal. Pembentukan pohon keputusan akan dilanjutkan dengan menggunakan bantuan software WEKA karena jumlah dataset yang banyak sehingga apabila dihitung manual akan panjang dan membutuhkan waktu yang lama. Setelah menggunakan 67

23 bantuan software WEKA akan didapatkan pohon keputusan yang lengkap sebagai hasil akhir. Pembentukan pohon keputusan menggunakan WEKA dimulai dengan menyiapkan data yang telah mengalami preprocessing dengan format file comma separated value (csv). Selanjutnya dilakukan classifier dengan trees J48. Algoritma C4.5 di dalam WEKA direpresentasikan oleh trees J48, sehingga dipilih algoritma tersebut. Ilustrasi klasifikasi menggunakan WEKA ditunjukkan oleh Gambar 3.5. Gambar 3.5 Decision tree C4.5 menggunakan WEKA Visualisasi output WEKA menggunakan teknik klasifikasi decision tree C4.5 yang diimplementasikan oleh trees J48 dengan jumlah data 979 ditunjukkan pada Gambar 3.6. Berdasarkan Gambar 3.6 dapat diketahui bahwa model terbentuk dalam waktu 0,27 detik dengan ukuran pohon 53 dan memiliki 41 aturan keputusan. 68

24 === Classifier model (full training set) === J48 pruned tree Agunan = A1: KL1 (339.0/89.0) Agunan = A2: KL1 (279.0/59.0) Agunan = A3 Kemampuan Angsuran = KA1 Pendapatan Keluarga = D2 Nilai Jaminan = N5: KL3 (6.0/1.0) Nilai Jaminan = N3 Pengeluaran Keluarga = K2: KL1 (2.0) Pengeluaran Keluarga = K3: KL3 (0.0) Pengeluaran Keluarga = K1: KL3 (3.0) Pengeluaran Keluarga = K4: KL3 (0.0) Nilai Jaminan = N1 Pengeluaran Keluarga = K2: KL3 (5.0/1.0) Pengeluaran Keluarga = K3: KL3 (0.0) Pengeluaran Keluarga = K1 Pekerjaan = PK1: KL2 (4.0/2.0) Pekerjaan = PK2: KL1 (0.0) Pekerjaan = PK3: KL1 (8.0/3.0) Pekerjaan = PK4: KL2 (5.0/2.0) Pekerjaan = PK6: KL1 (0.0) Pekerjaan = PK5: KL1 (0.0) Pengeluaran Keluarga = K4: KL3 (0.0) Nilai Jaminan = N4: KL1 (3.0) Nilai Jaminan = N2: KL1 (11.0/4.0) Number of Leaves : 41 Size of the tree : 53 Time taken to build model: 0.27 seconds Gambar 3.6 Hasil Output WEKA Berupa Model dan Aturan 979 dataset Gambar 3.7 adalah visualisasi pohon keputusan dari kelas akhir KL1, KL2, KL3, dan KL4 yang dihasilkan menggunakan software WEKA. 69

25 Gambar 3.7 Visualisasi Pohon Keputusan 70

26 Pohon keputusan tersebut diperoleh dari proses klasifikasi menggunakan algoritma C4.5. Berdasarkan pohon keputusan yang dihasilkan maka diperoleh aturan ekstraksi dari pohon keputusan. Ekstraksi pohon keputusan dilihat pada lampiran 12, dan beberapa diantaranya dapat dituliskan sebagai berikut: 1. IF AGUNAN=A1 THEN KELAS=KL1; 2. IF AGUNAN=A2 THEN KELAS=KL1; 3. IF AGUNAN=A3 AND KEMAMPUAN ANGSURAN=KA1 AND PENDAPATAN KELUARGA=D2 AND NILAI JAMINAN=N5 THEN KELAS=KL3; 4. IF AGUNAN=A3 AND KEMAMPUAN ANGSURAN=KA1 AND PENDAPATAN KELUARGA=D2 AND NILAI JAMINAN=N3 AND PENGELUARAN KELUARGA=K2 THEN KELAS=KL1; 5. IF AGUNAN=A3 AND KEMAMPUAN ANGSURAN=KA1 AND PENDAPATAN KELUARGA=D2 AND NILAI JAMINAN=N3 AND PENGELUARAN KELUARGA=K3 THEN KELAS=KL3; Berdasarkan aturan yang terdapat pada ekstraksi pohon keputusan tersebut, maka aturan-aturan tersebut dapat diartikan sebagai berikut: 1. Jika peminjam memberikan agunan A1 maka status peminjam tersebut termasuk dalam kelas KL1. 2. Jika peminjam memberikan agunan A2 maka status peminjam tersebut termasuk dalam kelas KL1. 71

27 3. Jika peminjam memberikan agunan A3, dengan besar kemampuan agsuraan pada kelas KA1, pendapatan keluarga D2, nilai jaminan N5, maka status peminjam tersebut termasuk dalam kelas KL3. 4. Jika peminjam memberikan agunan A3, dengan besar kemampuan agsuraan pada kelas KA1, pendapatan keluarga D2, nilai jaminan N3, pengeluaran keluarga K2, maka status peminjam tersebut termasuk dalam kelas KL1. 5. Jika peminjam memberikan agunan A3, dengan besar kemampuan agsuraan pada kelas KA1, pendapatan keluarga D2, nilai jaminan N3, pengeluaran keluarga K3, maka status peminjam tersebut termasuk dalam kelas KL3. E. Proses Klasifikasi Menggunakan Naïve Bayes Setelah penerapan klasifikasi dengan metode decision tree C4.5 terhadap data kredit pada Koperasi X maka hasil tersebut akan dibandingkan dengan hasil klasifikasi menggunakan naïve bayes. Pada penerapan algoritma naïve bayes, data yang digunakan adalah data yang telah melewati tahap preprocessing yaitu sebanyak 979 dataset. Berikut adalah contoh salah satu perhitungan klasifikasi naïve bayes untuk mencari kelas target pada salah satu peminjam kredit koperasi. Tabel 3.19 Data Prediksi Pekerjaan Umur Pekerjaan Suami/Istri Pendapatan Keluarga Pengeluaran Keluarga Pinjaman PK3 U3 PS3 D3 K2 PJ2 Kemampuan angsuran Jangka Waktu Agunan Status Agunan Nilai Jaminan Tujuan Kelas KA3 J1 A3 SA1 N3 T2 72

28 Data pada Tabel 3.19 menyatakan bahwa pekerjaan pemohon kredit tergolong dalam PK3, umur tergolong dalam U3, pekerjaan suami/istri tergolong dalam PS3, pendapatan keluarga tergolong dalam D3, besar pengeluaran keluarga tergolong dalam K2, pinjaman tergolong dalam PJ2, kemampuan angsuran tergolong dalam KA3, jangka waktu tergolong dalam J1, agunan tergolong dalam A3, status agunan tergolong dalam SA1, nilai jaminan tergolong dalam N3, dan tujuan tergolong dalam T2. Perhitungan klasifikasi naïve bayes dilakukan untuk mengetahui kelas target pada data prediksi tersebut dengan P(C i ) merupakan kelas target. Kemudian akan ditentukan atribut yang digunakan dengan ketentuan: C 1 = (kelas target= KL1 ) C 2 = (kelas target= KL2 ) C 3 = (kelas target= KL3 ) C 4 = (kelas target= KL4 ) x 1 = (pekerjaan= PK3 ) x 2 = (umur= U3 ) x 3 = (pekerjaan suami/istri= PS3 ) x 4 = (pendapatan keluarga= D3 ) x 5 = (pegeluaran keluarga= K2 ) x 6 = (pinjaman= PJ2 ) x 7 = (kemampuan angsuran= KA3 ) x 8 = (jangka waktu= J1 ) x 9 = (agunan= A3 ) x 10 = (status agunan= SA1 ) x 11 = (nilai jaminan= N3 ) 73

29 x 12 = (tujuan= T2 ) Langkah-langkah perhitungan klasifikasi naïve bayes berdasarkan data kredit yang telah mengalami preprocessing sebagai berikut: 1. Langkah pertama adalah menghitung probabilitas kelas target yaitu P(C i ) untuk i = 1, 2, 3, 4. Pada kelas target atau atribut Kelas yang bernilai KL1 sebanyak 668 data, KL2 sebanyak 91 data, KL3 sebanyak 159 data, KL4 sebanyak 61 data. Maka akan dihitung nilai P(C i ) berdasarkan persamaan (2.11), yaitu: P(C 1 ) = P(Kelas = "KL1") = = 0,68233 P(C 2 ) = P(Kelas = "KL2") = = 0,09295 P(C 3 ) = P(Kelas = "KL3") = = 0,16241 P(C 4 ) = P(Kelas = "KL4") = = 0, Menghitung nilai P(x k C i ) untuk k = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 dan i = 1, 2, 3, 4 yaitu: P(x 1 C 1 ) = P(Pekerjaan = "PK3" Kelas = "KL1") = P(x 1 C 2 ) = P(Pekerjaan = "PK3" Kelas = "KL2") = P(x 1 C 3 ) = P(Pekerjaan = "PK3" Kelas = "KL3") = P(x 1 C 4 ) = P(Pekerjaan = "PK3" Kelas = "KL4") = P(x 2 C 1 ) = P(Umur = "U3" Kelas = "KL1") = P(x 2 C 2 ) = P(Umur = "U3" Kelas = "KL2") =

30 P(x 2 C 3 ) = P(Umur = "U3" Kelas = "KL3") = P(x 2 C 4 ) = P(Umur = "U3" Kelas = "KL4") = P(x 3 C 1 ) = P(Pekerjaan Suami/Istri = "PS3" Kelas = "KL1") = P(x 3 C 2 ) = P(Pekerjaan Suami/Istri = "PS3" Kelas = "KL2") = P(x 3 C 3 ) = P(Pekerjaan Suami/Istri = "PS3" Kelas = "KL3") = P(x 3 C 4 ) = P(Pekerjaan Suami/Istri = "PS3" Kelas = "KL4") = P(x 4 C 1 ) = P(Pendapatan Keluarga = "D3" Kelas = "KL1") = P(x 4 C 2 ) = P(Pendapatan Keluarga = "D3" Kelas = "KL2") = P(x 4 C 3 ) = P(Pendapatan Keluarga = "D3" Kelas = "KL3") = P(x 4 C 4 ) = P(Pendapatan Keluarga = "D3" Kelas = "KL4") = P(x 5 C 1 ) = P(Pengeluaran keluarga = "K2" Kelas = "KL1") = P(x 5 C 2 ) = P(Pengeluaran keluarga = "K2" Kelas = "KL2") = P(x 5 C 3 ) = P(Pengeluaran keluarga = "K2" Kelas = "KL3") = P(x 5 C 4 ) = P(Pengeluaran keluarga = "K2" Kelas = "KL4") = P(x 6 C 1 ) = P(Pinjaman = "PJ2" Kelas = "KL1") = P(x 6 C 2 ) = P(Pinjaman = "PJ2" Kelas = "KL2") = P(x 6 C 3 ) = P(Pinjaman = "PJ2" Kelas = "KL3") = P(x 6 C 4 ) = P(Pinjaman = "PJ2" Kelas = "KL4") =

31 P(x 7 C 1 ) = P(Kemampuan angsuran = "KA3" Kelas = "KL1") = P(x 7 C 2 ) = P(Kemampuan angsuran = "KA3" Kelas = "KL2") = P(x 7 C 3 ) = P(Kemampuan angsuran = "KA3" Kelas = "KL3") = P(x 7 C 4 ) = P(Kemampuan angsuran = "KA3" Kelas = "KL4") = P(x 8 C 1 ) = P(Jangka waktu = "J1" Kelas = "KL1") = P(x 8 C 2 ) = P(Jangka waktu = "J1" Kelas = "KL2") = P(x 8 C 3 ) = P(Jangka waktu = "J1" Kelas = "KL3") = P(x 8 C 4 ) = P(Jangka waktu = "J1" Kelas = "KL4") = P(x 9 C 1 ) = P(Agunan = "A3" Kelas = "KL1") = P(x 9 C 2 ) = P(Agunan = "A3" Kelas = "KL2") = P(x 9 C 3 ) = P(Agunan = "A3" Kelas = "KL3") = P(x 9 C 4 ) = P(Agunan = "A3" Kelas = "KL4") = P(x 10 C 1 ) = P(Status agunan = "SA1" Kelas = "KL1") = P(x 10 C 2 ) = P(Status agunan = "SA1" Kelas = "KL2") = P(x 10 C 3 ) = P(Status agunan = "SA1" Kelas = "KL3") = P(x 10 C 4 ) = P(Status agunan = "SA1" Kelas = "KL4") = P(x 11 C 1 ) = P(Nilai jaminan = "N3" Kelas = "KL1") = P(x 11 C 2 ) = P(Nilai jaminan = "N3" Kelas = "KL2") =

32 P(x 11 C 3 ) = P(Nilai jaminan = "N3" Kelas = "KL3") = P(x 11 C 4 ) = P(Nilai jaminan = "N3" Kelas = "KL4") = P(x 12 C 1 ) = P(Tujuan = "T2" Kelas = "KL1") = P(x 12 C 2 ) = P(Tujuan = "T2" Kelas = "KL2") = P(x 12 C 3 ) = P(Tujuan = "T2" Kelas = "KL3") = P(x 12 C 4 ) = P(Tujuan = "T2" Kelas = "KL4") = Langkah selanjutnya adalah menghitung P(X C i ) untuk i = 1, 2 dan dengan menggunakan persamaan (2.12) diperoleh: P(X C 1 ) = P(x k C 1 ) = k= = 1, P(X C 2 ) = P(x k C 2 ) = k= = 9, P(X C 3 ) = P(x k C 3 ) = k= = 1, P(X C 4 ) = P(x k C 4 ) = k= = 1,

33 4. Menghitung nilai P(X C i )P(C i ) yaitu P(X C 1 )P(C 1 ) = 1, ,68233 = 7, P(X C 2 )P(C 2 ) = 9, ,09295 = 8, P(X C 3 )P(C 3 ) = 1, ,16241 = 2, P(X C 4 )P(C 4 ) = 1, , = 1, Dari perhitungan P(X C i )P(C i ) di atas, diperoleh bahwa nilai tertinggi diberikan oleh P(X C 4 )P(C 4 ) sehingga hasil pengklasifikasian pada data di atas dapat dilihat pada Tabel 3.17 berikut. Tabel 3.20 Hasil Klasifikasi Data Pekerjaan Umur Pekerjaan Suami/Istri Pendapatan Keluarga Pengeluaran Keluarga Pinjaman PK3 U3 PS3 D3 K2 PJ2 Kemampuan angsuran Jangka Waktu Agunan Status Agunan Nilai Jaminan Tujuan Kelas KA3 J1 A3 SA1 N3 T2 KL4 Berdasarkan Tabel 3.20, diperoleh informasi bahwa peminjam dengan pekerjaan PK3, umur U3, pekerjaan suami/istri PS3, pendapatan keluarga D3, pengeluaran keluarga K2, pinjaman PJ2, kemampuan angsuran KA3, jangka waktu J1, agunan A3, status agunan SA1, nilai jaminan N3, tujuan T2 maka peminjam tersebut termasuk dalam kelas KL4. Pada proses data mining diperlukan bantuan software WEKA karena jumlah dataset yang cukup banyak sehingga akan sulit jika diolah secara manual dan memerlukan waktu lama. Pengklasifikasian menggunakan WEKA dimulai dengan menyiapkan data yang telah mengalami preprocessing dengan format csv. 78

34 Selanjutnya dilakukan classifier dengan naïve bayes. Ilustrasi klasifikasi naïve bayes menggunakan WEKA ditunjukkan oleh Gambar 3.8. Gambar 3.8 Naïve Bayes menggunakan WEKA Visualisasi output WEKA menggunakan teknik klasifikasi algoritma naïve bayes dengan jumlah data 979 ditunjukkan pada Gambar

35 === Classifier model (full training set) === Naive Bayes Classifier Class Attribute KL3 KL1 KL4 KL2 (0.16) (0.68) (0.06) (0.09) ==================================================== Pekerjaan PK PK PK PK PK PK [total] Umur U U U U U [total] Time taken to build model: 0 seconds Gambar 3.9 Hasil Output WEKA Klasifikasi Menggunakan Naïve Bayes Output program WEKA Gambar 3.9 merupakan model klasifikasi naïve bayes. Berdasarkan output dapat diketahui bahwa pada atribut pekerjaan mempunyai total class KL1 sebanyak 674, class KL2 sebanyak 97, class KL3 sebanyak 165, class KL4 sebanyak 67 sehingga total class seluruhnya ada 1.003, sedangkan jumlah data sebenarnya adalah 979. Hal ini terjadi karena klasifikasi naïve bayes pada program WEKA menghindari frekuensi nol di setiap class sehingga terjadi penambahan 1 angka di setiap class. Pada output di atas juga dapat diketahui bahwa model naïve bayes terbentuk dalam waktu mendekati 0 detik. F. Pengujian Model Pengujian model dilakukan dengan beberapa model tes klasifikasi yaitu menggunakan option use training set, cross validation, dan percentage split. 80

36 Menurut Witten, et al (2011: 153) jumlah fold standar untuk memprediksi tingkat error dari data adalah dengan menggunakan 10-fold cross validation. Sehingga pada penelitian ini digunakan 10-fold cross validation. Menurut Hota, Shrivas & Singhai (2013: 165) terdapat beberapa komposisi data training dan data testing yang sering digunakan, yaitu 1. 60% untuk data training dan 40% untuk data testing, 2. 75% untuk data training dan 25% untuk data testing, 3. 80% untuk data training dan 20% untuk data testing. Pembagian data pada penelitian ini sebesar 80% untuk data training dan 20% untuk data testing. Berdasarkan pengujian menggunakan beberapa model tes tersebut akan diketahui nilai akurasi dari masing-masing model. Hasil yang diperoleh dari tes dengan use training set, 10-fold cross validation, dan percentage split dapat dilihat pada Tabel Tabel 3.21 Hasil Evaluasi Decision Tree C4.5 dan Naïve Bayes Decision Tree C4.5 Use Training 10-Fold Cross Percentage Split Set Validation Correctly Classified 71,91% 68,03% 66,84% Incorrect Classified 28,09% 31,97% 33,16% Waktu komputasi (satuan:detik) 0,25 0,14 0,02 Naïve Bayes Use Training Set 10-Fold Cross Validation Percentage Split Correctly Classified 67,01% 64,66% 65,82% Incorrect Classified 32,99% 35,34% 34,18% Waktu komputasi (satuan:detik) 0,

37 Berdasarkan Tabel 3.21 akurasi yang diberikan dengan model tes use training set, 10-fold cross validation, dan percentage split pada decision tree C4.5 berurutan adalah 71,91%, 68,03%, dan 66,84%, sedangkan pada naïve bayes berurutan adalah 67,01%, 64,66%, dan 65,82%. Dapat diambil informasi bahwa secara keseluruhan klasifikasi decision tree C4.5 memiliki kecenderungan tingkat akurasi yang lebih tinggi. Waktu komputasi yang diberikan dengan model tes use training set, cross validation, dan percentage split pada decision tree C4.5 berturutturut adalah 0,25 detik, 0,14 detik, dan 0,02 detik, sedangkan pada naïve bayes berturut-turut adalah 0,01 detik, mendekati 0 detik, dan mendekati 0 detik. Dapat diambil informasi bahwa klasifikasi naïve bayes mempunyai waktu komputasi yang lebih cepat dibanding decision tree C4.5. Berdasarkan hasil akurasi dengan beberapa model tes, use training set adalah model tes yang mempunyai tingkat akurasi paling tinggi. Model tes tersebut memang mempunyai tingkat akurasi yang bagus namun tidak memberikan estimasi akurasi yang sebenarnya terhadap data yang lain karena seluruh data digunakan untuk data testing maupun data training. 82

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES Analisis Klasifikasi pada Nasabah... (Ahadiyah Nurul Kholifah) 1 ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES CLASSIFICATION ANALYSIS OF CREDIT CUSTOMERS

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

BAB I PENDAHULUAN. kegiatan simpan pinjam layaknya bank, dimana ijin operasionalnya di bawah

BAB I PENDAHULUAN. kegiatan simpan pinjam layaknya bank, dimana ijin operasionalnya di bawah BAB I PENDAHULUAN A. Latar Belakang Koperasi adalah suatu lembaga keuangan bukan bank yang bergerak dalam kegiatan simpan pinjam layaknya bank, dimana ijin operasionalnya di bawah Kementrian Koperasi dan

Lebih terperinci

BAB I PENDAHULUAN. Indonesia. Menurut Undang-Undang No.25 Tahun 1992 koperasi Indonesia adalah

BAB I PENDAHULUAN. Indonesia. Menurut Undang-Undang No.25 Tahun 1992 koperasi Indonesia adalah BAB I PENDAHULUAN A. Latar Belakang Koperasi merupakan salah satu badan usaha yang sudah lama dikenal di Indonesia. Menurut Undang-Undang No.25 Tahun 1992 koperasi Indonesia adalah badan usaha yang beranggotakan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan PENERAPAN DATA MINING DENGAN METODE KLASIFIKASI NAÏVE BAYES UNTUK MEMPREDIKSI KELULUSAN MAHASISWA DALAM MENGIKUTI ENGLISH PROFICIENCY TEST (Studi Kasus : Universitas Potensi Utama) Alfa Saleh Teknik Informatika

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit

Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit Larissa Navia Rani Dosen Sistem Informasi UPI YPTK Padang Jl. Raya Lubuk Begalung Padang - Sumatera Barat larissa_navia_rani@upiyptk.ac.id

Lebih terperinci

BAB II KAJIAN TEORI. Pada bab ini berisi tentang teori-teori dasar mengenai kredit, database,

BAB II KAJIAN TEORI. Pada bab ini berisi tentang teori-teori dasar mengenai kredit, database, BAB II KAJIAN TEORI Pada bab ini berisi tentang teori-teori dasar mengenai kredit, database, penambangan data (data mining), aturan klasifikasi, decision tree C4.5, naïve bayes, metode evaluasi model,

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik. BAB IV HASIL DAN PEMBAHASAN 4.1. Identifikasi Masalah Dalam menentukan status calon dosen dan dosen tetap terdapat masalahmasalah dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya sebagai

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse 1.1.Pengumpulan data BAB IV HASIL DAN PEMBAHASAN Data yang digunakan dalam penelitian ini adalah data warehouse Graduation Universitas Muhammadiyah Yogyakarta pada Fakultas Teknik UMY tahun kelulusan 2013,

Lebih terperinci

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh : ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI Oleh : Frista Yulianora 1401128832 Muchammad Hasbi Latif 1401136065 Rika Jubel Febriana

Lebih terperinci

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA Alfa Saleh Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan Email : alfasoleh1@gmail.com Abstrak

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala

Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Materi Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Dosen Pengasuh Dr. Taufik Fuadi Abidin, M.Tech Dr. Muhammad Subianto, M.Si {tfa,subianto}@informatika.unsyiah.ac.id

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien 1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha

Lebih terperinci

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 Sulidar Fitri Teknik Informatika STMIK AMIKOM Yogyakarta email : inboxfitri@gmail.com Abstraksi Penelitian

Lebih terperinci

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES Nama : Muhammad Rizki NPM : 54410806 Jurusan Pembimbing

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB III ANALISA DAN DESAIN SISTEM

BAB III ANALISA DAN DESAIN SISTEM BAB III ANALISA DAN DESAIN SISTEM Pada bab ini akan dibahas mengenai Perancangan Sistem Pendukung Keputusan Pemberian Bonus Berdasarkan Penilaian Kinerja Karyawan Pada PT. Telkom, Tbk Medan Dengan Metode

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas

Lebih terperinci

Sekip Utara Yogyakarta * 1 2

Sekip Utara Yogyakarta   * 1 2 IJCCS, Vol.9, No.1, January 2015, pp. 1~12 ISSN: 1978-1520 1 Klasifikasi Data NAP (Nota Analisis Pembiayaan) untuk Prediksi Tingkat Keamanan Pemberian Kredit (Studi Kasus : Bank Syariah Mandiri Cabang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kredit merupakan produk utama dari koperasi simpan pinjam dalam upaya meningkatkan profitabilitasnya. Namun akan terjadi masalah apabila manajemen sembarangan dalam

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

UJI AKURASI KLASIFIKASI DAN VALIDASI DATA PADA PENGGUNAAN METODE MEMBERSHIP FUNCTION DAN ALGORITMA C4.5 DALAM PENILAIAN PENERIMA BEASISWA

UJI AKURASI KLASIFIKASI DAN VALIDASI DATA PADA PENGGUNAAN METODE MEMBERSHIP FUNCTION DAN ALGORITMA C4.5 DALAM PENILAIAN PENERIMA BEASISWA Jurnal SIMETRIS, Vol. 9 No. April 8 UJI AKURASI KLASIFIKASI DAN VALIDASI DATA PADA PENGGUNAAN METODE MEMBERSHIP FUNCTION DAN ALGORITMA C4.5 DALAM PENILAIAN PENERIMA BEASISWA Ade Surya Budiman Program Studi

Lebih terperinci

Klasifikasi. Diadaptasi dari slide Jiawei Han

Klasifikasi. Diadaptasi dari slide Jiawei Han Klasifikasi Diadaptasi dari slide Jiawei Han http://www.cs.uiuc.edu/~hanj/bk2/ Pengantar Classification Memprediksi kelas suatu item Membuat model berdasarkan data pelatihan dan digunakan untuk mengklasifikasi

Lebih terperinci

BAB IV PEMBAHASAN. A. Aplikasi Fuzzy Logic untuk Menilai Kolektibilitas Anggota Sebagai. Pertimbangan Pengambilan Keputusan Pemberian Kredit

BAB IV PEMBAHASAN. A. Aplikasi Fuzzy Logic untuk Menilai Kolektibilitas Anggota Sebagai. Pertimbangan Pengambilan Keputusan Pemberian Kredit BAB IV PEMBAHASAN A. Aplikasi Fuzzy Logic untuk Menilai Kolektibilitas Anggota Sebagai Pertimbangan Pengambilan Keputusan Pemberian Kredit Aplikasi fuzzy logic untuk pengambilan keputusan pemberian kredit

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

Klasifikasi. Diadaptasi dari slide Jiawei Han

Klasifikasi. Diadaptasi dari slide Jiawei Han Klasifikasi Diadaptasi dari slide Jiawei Han http://www.cs.uiuc.edu/~hanj/bk2/ yudi@upi.edu / Okt 2012 Pengantar Classification Memprediksi kelas suatu item Membuat model berdasarkan data pelatihan dan

Lebih terperinci

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU Mardiani Jurusan Sistem Informasi, STMIK MDP Palembang Jln. Rajawali No.14 Palembang 30113 Telp. (0711) 376400, Faks.

Lebih terperinci

Seminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012) ISSN: 1907-5022 Yogyakarta, 15-16 Juni 2012 PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU Mardiani

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

BAB I PENDAHULUAN. manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup

BAB I PENDAHULUAN. manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup 1 BAB I PENDAHULUAN 1.1. Latar Belakang Pendidikan merupakan salah satu faktor utama dalam hidup seorang manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup setiap orang. Namun keberadaan

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN. bidang perbankan yang berbadan hukum yang mempunyai Unit Usaha dibidang

BAB III ANALISA DAN PERANCANGAN. bidang perbankan yang berbadan hukum yang mempunyai Unit Usaha dibidang BAB III ANALISA DAN PERANCANGAN III.1. Analisis Masalah PT. Bank Muamalat merupakan sebuah perusahaan yang bergerak di bidang perbankan yang berbadan hukum yang mempunyai Unit Usaha dibidang Jasa Keuangan

Lebih terperinci

Perbandingan Kinerja Algoritma Decision Tree dan Naive Bayes dalam Prediksi Kebangkrutan

Perbandingan Kinerja Algoritma Decision Tree dan Naive Bayes dalam Prediksi Kebangkrutan Perbandingan Kinerja Algoritma Decision Tree dan Naive Bayes dalam Prediksi Kebangkrutan Dian Oktafia Sistem Informasi Universitas Gunadarma Jakarta Universitas Gunadarma Depok, Indonesia doktafia@yahoo.com

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG Andri 1), Yesi Novaria Kunang 2), Sri Murniati 3) 1,2,3) Jurusan Sistem Informasi Universitas

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Situs jejaring sosial merupakan gaya hidup sosial baru yang muncul seiring berkembangnya internet. Gaya hidup baru tersebut memiliki ruang lingkup yang lebih luas

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

BAB III ANALISIS DAN DESAIN SISTEM

BAB III ANALISIS DAN DESAIN SISTEM BAB III ANALISIS DAN DESAIN SISTEM III.1. Analisa Masalah Dalam pengoperasian pekerjaan gondola di ketinggian membutuhkan keahlian khusus dan pengetahuan dibidangnya agar tidak terjadi kendala yang dapat

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG Era komunikasi dengan menggunakan fasilitas internet memberikan banyak kemudahan dalam mendapatkan informasi yang dikehendaki. Dengan demikian semakin banyak orang,

Lebih terperinci

ISBN: SNIPTEK 2016

ISBN: SNIPTEK 2016 ISBN: 978-602-72850-3-3 SNIPTEK 2016 STUDI PERBANDINGAN METODE KLASIFIKASI DAN VALIDASI DATA MENGGUNAKAN MEMBERSHIP FUNCTION DAN ALGORITMA C4.5: STUDI KASUS SELEKSI PENERIMA BEASISWA SMK PGRI PLOSO Tri

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan

Lebih terperinci

Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu

Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu Hai khalayak ramai, pada kesempatan kali ini aku mau ngasik tutorial yang berkaitan dengan data mining. Apa sih itu data mining?? Data mining adalah suatu proses menemukan knowledge atau informasi dari

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya pembangunan gedung sekolah maupun perguruan tinggi menjadi tanda berkembangnya pendidikan. Jumlah pendaftar

Lebih terperinci

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN HASIL DAN PEMBAHASAN Praproses Data Tahap pertama yang dilakukan adalah menyeleksi seluruh data pada kedua dataset dengan memperhatikan keberadaan setiap record data pada keduanya. Jika terdapat record

Lebih terperinci

4.1. Pengambilan Data

4.1. Pengambilan Data BAB IV HASIL PENGUJIAN DAN PEMBAHASAN Hasil pengujian adalah hasil final yang berarti penelitian telah selesai dilakukan, semua yang berkaitan dengan pengujian akan dibahas pada bab ini mulai dari pengolahan

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika

Lebih terperinci

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015 KLASIFIKASI DATA NAP (NOTA ANALISIS PEMBIAYAAN) DENGAN 5C+1S UNTUK PENENTUAN TINGKAT KEAMANAN PEMBIAYAAN MENGGUNKAN ALGORITMA NAÏVE BAYES CLASSIFIER PADA BANK SYARIAH Sumarni Adi1) 1) Teknik Informatika

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

EDY KURNIAWAN DOSEN PEMBIMBING Dr. I Ketut Eddy Purnama, S.T., M.T Dr. Surya Sumpeno, S.T., MS.c

EDY KURNIAWAN DOSEN PEMBIMBING Dr. I Ketut Eddy Purnama, S.T., M.T Dr. Surya Sumpeno, S.T., MS.c EDY KURNIAWAN 2209205007 DOSEN PEMBIMBING Dr. I Ketut Eddy Purnama, S.T., M.T Dr. Surya Sumpeno, S.T., MS.c PROGRAM MAGISTER BIDANG KEAHLIAN JARINGAN CERDAS MULTIMEDIA (DATA MINING) JURUSAN TEKNIK ELEKTRO

Lebih terperinci

3.1 Metode Pengumpulan Data

3.1 Metode Pengumpulan Data BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data Sebuah penelitian memerlukan pengumpulan data dan metode pengumpulan data karena sangat berpengaruh terhadap akurasi dan kualitas data yang digunakan

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

Penggunaan Pohon Keputusan untuk Data Mining

Penggunaan Pohon Keputusan untuk Data Mining Penggunaan Pohon Keputusan untuk Data Mining Indah Kuntum Khairina NIM 13505088 Program Studi Teknik Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jalan Ganesha

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kredit macet merupakan salah satu masalah yang sering dialami oleh perbankan hingga saat ini. Banyaknya calon debitur yang melakukan kredit membuat pihak bank harus

Lebih terperinci

Penerapan Data Mining untuk Menentukan Besar Pinjaman pada Koperasi Simpan Pinjam dengan Algoritma C4.5 (Studi Kasus: Koperasi Wanita XYZ)

Penerapan Data Mining untuk Menentukan Besar Pinjaman pada Koperasi Simpan Pinjam dengan Algoritma C4.5 (Studi Kasus: Koperasi Wanita XYZ) 18 JUISI, Vol. 03, No. 02, Agustus 2017 Penerapan Data Mining untuk Menentukan Besar Pinjaman pada Koperasi Simpan Pinjam dengan Algoritma C4.5 (Studi Kasus: Koperasi Wanita XYZ) Indi Nadya Syahfitri 1

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini sering terjadi data explosion problem yaitu data data yang tersimpan dalam database berjumlah sangat besar namun dari data data tersebut belum banyak dimanfaatkan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Beredarnya iklan penawaran kepemilikan kendaraan sepeda motor yang cukup menarik dengan menawarkan berbagai syarat kemudahan pembayaran membuat bagi sebagian orang

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA Ade Putra Fakultas Vokasi, Program Studi Komputerisasi Akuntansi Universitas Bina Darma

Lebih terperinci

BAB I PENDAHULUAN. Oleh karena itu dalam melakukan Kegiatan usahanya sehari-hari bank harus

BAB I PENDAHULUAN. Oleh karena itu dalam melakukan Kegiatan usahanya sehari-hari bank harus BAB I PENDAHULUAN I.1. Latar Belakang Bank adalah lembaga keuangan yang usaha pokoknya adalah menghimpun dana dan menyalurkan kembali dana tersebut ke masyarakat dalam bentuk kredit serta memberikan jasa-jasa

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : Tabel 2.1 Penelitian sebelumnya Parameter Penulis Objek Metode Hasil

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

Jurnal Teknologi dan Sistem Informasi

Jurnal Teknologi dan Sistem Informasi JURNAL TEKNOLOGI DAN SISTEM INFORMASI - VOL. 04 NO. 01 (2018) 030-036 Terbit online pada laman web jurnal : http://teknosi.fti.unand.ac.id/ Jurnal Teknologi dan Sistem Informasi ISSN (Print) 2460-3465

Lebih terperinci

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK PERBANDINGAN KLASIFIKASI KNN DAN NAIVE BAYESIAN SERTA PERBANDINGAN CLUSTERING SIMPLE K-MEANS YANG MENGGUNAKAN DISTANCE FUNCTION MANHATTAN DISTANCE DAN EUCLIDIAN DISTANCE PADA DATASET Dresses_Attribute_Sales

Lebih terperinci

BAB I PENDAHULUAN. basis data dan mengubahnya menjadi informasi yang berguna. Metode data

BAB I PENDAHULUAN. basis data dan mengubahnya menjadi informasi yang berguna. Metode data BAB I PENDAHULUAN 1.1 Latar Belakang Data-data pinjaman yang tersimpan pada Koperasi XYZ yang selama ini hanya dijadikan arsip koperasi sebenarnya dapat dimanfaatkan menjadi sesuatu yang lebih berguna.

Lebih terperinci

Implementasi Metode Klasifikasi Naïve Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga

Implementasi Metode Klasifikasi Naïve Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga Implementasi Metode Klasifikasi Naïve Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga 207 Alfa Saleh Universitas Potensi Utama E-mail: alfasoleh1@gmail.com Abstrak Peranan listrik sangat

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

PENERAPAN METODE C4.5 DALAM MENENTUKAN STATUS DIET

PENERAPAN METODE C4.5 DALAM MENENTUKAN STATUS DIET Seminar Nasional Teknologi Informasi dan Multimedia 2016 PENERAPAN METODE C4.5 DALAM MENENTUKAN STATUS DIET Edy Victor Haryanto Universitas Potensi Utama Jl. K. L. Yos Sudarso Km 6,5 No 3 A Tanjung Mulia

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM 1.1. Analisa Masalah 3.1.1. Analisa Algoritma Midi (Musical Instrument Digital Interface) merupakan sebuah teknologi yang memungkinkan alat musik elektrik, komputer,

Lebih terperinci

PRAKTIKUM KE-5 KLASIFIKASI I

PRAKTIKUM KE-5 KLASIFIKASI I PRAKTIKUM KE-5 KLASIFIKASI I 1. Tujuan Praktikum 1) Mahasiswa mempunyai pengetahuan dan kemampuan dasar mengenai metode pencarian pengetahuan / pola data dari sejumlah data dengan menggunakan teknik klasifikasi.

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3) Kecerdasan Buatan Materi 6 Iterative Dichotomizer Three (ID3) Pengertian ID3 Singkatan dari Iterative Dichotomiser Three. Atau Induction of Decision Tree. Diperkenalkan pertama kali oleh Ross Quinlan (1979)

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI Disusun Oleh : ATIKA ELSADINING TYAS 24010211120013 JURUSAN STATISTIKA

Lebih terperinci