BAB IV HASIL DAN PEMBAHASAN

dokumen-dokumen yang mirip
BAB III METODE PENELITIAN

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB III METODE PENELITIAN

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

BAB II LANDASAN TEORI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

1. Model Prediksi Ini Menggunakan Tools RapidMiner

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

TINJAUAN PUSTAKA. Definisi Data Mining

BAB 2 TINJAUAN PUSTAKA

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

PERBANDINGAN DECISION TREE

PENERAPAN ALGORTIMA C4.5 UNTUK PENENTUAN KELAYAKAN KREDIT

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

KAJIAN PERANCANGAN RULE KENAIKAN JABATAN PADA PT. ABC

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

BAB III METODOLOGI PENELITIAN. Dataset

BAB II LANDASAN TEORI

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

APPLICATION OF DATA MINING ALGORITHM TO RECIPIENT OF MOTORCYCLE INSTALLMENT

ANALISIS PENENTUAN KARYAWAN TERBAIK MENGGUNAKAN METODE ALGORITMA NAIVE BAYES (STUDI KASUS PT. XYZ)

BAB 2 TINJAUAN PUSTAKA

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

SISTEM PREDIKSI PENYAKIT DIABETES BERBASIS DECISION TREE

Versi Online tersedia di : JURNAL TECH-E (Online)

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

Application Determination Of Credit Feasibility in Sharia Cooperative

BAB 3 METODE PENELITIAN

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

BAB II TINJAUAN PUSTAKA

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

PENERAPAN ALGORITMA C4.5 PADA PROGRAM KLASIFIKASI MAHASISWA DROPOUT. Anik Andriani AMIK BSI Jakarta

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II LANDASAN TEORI

KLASIFIKASI KREDIT MENGGUNAKAN METODE DECISION TREE PADA NASABAH PD BPR BKK GABUS

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

BAB III METODOLOGI PENELITIAN

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING DALAM PENENTUAN PEMBERIAN PINJAMAN KOPERASI

BAB IV HASIL DAN PEMBAHASAN

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT

KAJIAN ALGORITMA NAÏVE BAYES DALAM PEMILIHAN PENERIMAAN BEASISWA TINGKAT SMA

IMPLEMENTASI BUSINESS INTELLIGENCE UNTUK MENENTUKAN MAHASISWA PENERIMA BEASISWA

4.1. Pengambilan Data

Gambar 4.1 Gambar Use Case Diagram

ISSN : e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6880

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

EKSPLORA INFORMATIKA 127

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Oleh: Astrid Darmawan Pembimbing: Selvia Lorena Br. Ginting, M.T Wendi Zarman, M.Si

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

ANALISIS PREDIKSI CHURN MENGGUNAKAN METODE LOGISTIC REGRESSION

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

APLIKASI PREDIKSI PEMINATAN SMAN 8 BANDUNG MENGGUNAKAN METODE KLASIFIKASI DENGAN ALGORITMA ID3

ii

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

Analisis Hubungan antar Faktor dan Komparasi Algoritma Klasifikasi pada Penentuan Penundaan Penerbangan

DAFTAR ISI PHP... 15

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Klasifikasi Berbasis Algoritma C4.5 untuk Deteksi Kenaikan Case Fatality Rate Demam Berdarah

BAB III METODE PENELITIAN

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

CONTOH KASUS DATA MINING

BAB III ANALISIS DAN DESAIN SISTEM

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

SELEKSI MOBIL BERDASARKAN FITUR DENGAN KOMPARASI METODE KLASIFIKASI NEURAL NETWORK, SUPPORT VECTOR MACHINE, DAN ALGORITMA C4.5

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

BAB III METODE PENELITIAN

BAB III METODELOGI PENELITIAN

BAB I PENDAHULUAN Latar Belakang

BAB III ANALISA DAN DESAIN SISTEM

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

OPTIMASI DECISION TREE MENGGUNAKAN PARTICLE SWARM OPTIMIZATION PADA DATA SISWA PUTUS SEKOLAH

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

Penentuan Kelayakan Kredit Dengan Algoritma Naïve Bayes Classifier: Studi Kasus Bank Mayapada Mitra Usaha Cabang PGC

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB II TINJAUAN PUSTAKA

PENERAPAN METODE KLASIFIKASI DATA MINING UNTUK PREDIKSI KELULUSAN TEPAT WAKTU. Asep Saefulloh 1, Moedjiono 2

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Penerapan Metode Neural Network Berbasis Algoritma Genetika Untuk Prediksi Penyakit Kanker Payudara

Transkripsi:

33 BAB IV HASIL DAN PEMBAHASAN 4.1 Pengolahan Data Data yang dipergunakan dalam tugas akhir ini merupakan data karyawan PT Perkbunan Nusantara IX Kebun Blimbing pada tahun 2015. Jumlah data yang digunakan sebanyak 512. Data ini terdapat 19 atribut yang digunakan dalam proses klasifikasi kenaikan golongan.adapun Keterangan dari data tersebut di jelaskan pada tabel di bawah ini : Table 4 1 Keterangan Data No Prod.Januari Prod.Febuari Prod.Maret Prod.April Prod.Mei Prod.Juni Prod.Juli Prod.Agustus Atribut yang berfungsi sebagai ID bulan Januari bulan Febuari bulan Maret bulan April bulan Mei bulan Juni bulan Juli bulan Agustus 33

34 Prod.September bulan September Prod.Oktober bulan Oktober Prod.November bulan November Prod.Desember bulan Desember Jenis Kelamin Atribut ini menginformasikan jenis kelamin Karyawan Golongan Atribut ini menginformasikan Golongan Karyawan Pendidikan Atribut ini menginformasikanpendidikan Karyawan Umur Atribut ini menginformasikan umur karyawan Masa kerja Atribut ini menginformasika masa kerja karyawan Peuang Atribut ini menginformasikanketerangan label untuk mempredikisi apakah layak untuk naik atau tidaknya golongan. Kemudian yaitu pemilihan atribut data yang natinya dipergunakan 34

35 Table 4 2 Memilih Atribut Atribut Detai Pengunaan No ID Nama x No Prod.Januari Variabel Bebas Prod.Febuari Variabel Bebas Prod.Maret Variabel Bebas Prod.April Variabel Bebas Prod.Mei Variabel Bebas Prod.Juni Variabel Bebas Prod.Juli Variabel Bebas Prod.Agustus Variabel Bebas Prod.September Variabel Bebas Prod.Oktober Variabel Bebas Prod.November Variabel Bebas Prod.Desember Variabel Bebas Jenis Kelamin Variabel Bebas Golongan Variabel Bebas Pendidikan Variabel Bebas Umur Variabel Bebas Masa kerja Variabel Bebas Peluang Label Trget Dimana atribut peluang menjadi target. Dan di atribut target terdapat dua kelas yang tujuannya atau target yaitu karyawan belum layak naik golongan,dan karyawan layak naik golongan. Data sampel yang digunakan untuk menentukankenaikan golongan yaitu: 35

36 Gambar 4 1 Data kasus untuk mengklasifikasikan kenaikan golongan Semua data tersebut akan digunakan dalam perhitungan penentuan untuk mengkalasifikasikan kenaikan golongan pada PT Perkebunan Nusantara kebun IX Blimbing mengunakan algoritma C4.5. Yang sebelumnya data-data yang tidak lengkap (incomplete) dan tidak konsisten (inconsisten) serta data-data yang salah dihilangkan terlebih dahulu agar data menjadi valid, complete, dan konsisten, karena data harus bersih dari kesalahan, tidak lengkap dan tidak konsisten maka penulis melakukan proses data cleaning. Untuk memperoleh hasil akurasi dan model yang akan dihasilkan oleh algoritma C4.5 sesuai perhitungan yang sebelumnya maka dmengunakan RapitMiner untuk memproses 512 data tersebut.pada seting parameter algoritma C4.5 untuk menentukan Information gain. 36

37 4.3 Pengujian Model Pada penelitian ini rules atau model yang dihasilkan kemudian diterapkan pada program yang dihasilkan dengan batuan tools RapidMainer. Data yang di uji sebanyak 512 data dengan 19 atribut dimana seluruh atribut bertipe kategorikal, disini penulis mengunakan split validation untuk valedasi.pada proses valedasi terdapat dua kolom, yaitu training dan testing.penulis mengunakan perbandingan 70% untuk data trening dan 30% testing.kolom trening berisi algoritma klasifikasi yang di terapkan, yaitu algoritma C4.5 dan kolom testing berisi apply model serta performence untuk mengetahi akurasi dari algoritma C4.5. Berikut tools RapitMainer untuk menghitung tingat akursai dengan algoritma C4.5 : Gambar 4 2 Split Validition dengan Algoritma C4.5 37

38 Gambar 4 3 Split Validation dengan Algoritma C4.5 Selain itu,dalam model algoritma C4.5 terdapat beberapa parameter yang digunakan,yaitu inforation gain,karena rules yang terbentuk akan berbentuk pohon keputusan atau rule.berikut rules yang terbentuk dari pemodelan algoritma c.45 dan digunakan untuk implementasi pada program. 38

39 4.3 Hasil Pemodelan Pohon Keputusan Dan Rule Gambar 4 4 Pohon kputusan hasil pengolahan dengan RapidMiner Dari pohon keputusan yang dihasilkan diatas,rule yang terbentuk sebagai berikut Table 4 3 Rule yang terbentukdari pemodelan Algoritma C4.5 Berdasarkan pohon keputusan yang dihasilkan diatas rule yang dihasilkan adalah sebagai berikut : Rules Hasil = Karyawan layak naik golongan 1. IF November >165 AND Mei >220 =Karyawan layak naik golongan 2. IF November >165 AND Mei <=220 AND Oktober >210 AND Mei > 65 = Karyawan layak naik golongan 39

40 3. IF November > 165 AND Mei <= 220 AND Oktober > 210 AND Mei < 65 AND Mei <= 65 AND Oktober <= 265 Karyawan layak naik golongan 4. IF November <= 165 AND Mei >260 AND Mei >315 = Karyawan layak naik golongan Rule Hasil = Karyawan belum layak naik golongan 1. IF November >165 AND Mei <=220 AND Oktober <=210 =Karyawan belum layak naik golongan 2. IF November >165 AND Mei <=220 AND Oktober >210 AND Mei <=65 AND Mei <=55 = Karyawan belum layak naik golongan 3. IF November > 165 AND Mei <= 220 = AND Oktober > 210 AND Mei <= 65 AND Mei > 55 AND Oktober > 265 = Karyawan belum layak naik golongan 4. IF November <= 165 AND Mei < =315 = Karyawan belum layak naik golongan 4.4 Evaluasi dan Valedasi Hasil Evaluasi dengan mengunakan hasil klasifikasi. Pengukuran data dilakukan dengan mengunakan confusion matrix untuk mengevasluasi hasil dari hasil algoritma C4.5. Confusion metrix merupakan sebuah tabel yang mempunyai banyak baris data uji yang diprediksi benar atau tidak benar oleh model klasifikasi.tabel tersebut mengukur tingkat akurasi sebuah data. Accuracy dalam klasifikasi adalah persentase ketepatan record data yang diklasifikasikan secara benar setelah dilakukan pengujian pada hasil klasifikasi. 40

41 Table 4 4 nilai acurasy dari data karyawan yang ditampilkan oleh RapidMiner Rumus : Accurasy x 100% = x 100% = 95,51 % True positive (TP) adalah record 294 yang di klaasifikasikan karyawan belum layak naik golongan dan benar karyawan belum layak naik golongan,false Negative (FN) sebanyak 10 record yang di prediksi karyawan belum layak naik golongan namun pada klasifikasi sebenarnya hasilnya karyawan layak naik golongan.jumlah false positive (FP) sebanyak 6 record yang diprediksi karyawan layak naik golongan namun pada klasifikasi sebenarnya kasilnya karyawan belum layak naik golongan.dari confusion matrix diatas,akurasi prediksi yang dihasilkan untuk kenaikan golongn pada PTPN kebun Blimbing sebersar 95,51%. 41

42 Table 4 5 Nilai precision dari data karyawan yang ditampilkan oleh RapidMiner Dari tabel 4.4 hasil evaluasi mengunakan confusion matrix menunjukan nilai precision 88,46%. untuk menghitung manual dapan mengunakan persamaan 8.precision adalah hasil bagi t_pos (total true positif),dengan jumlah t_post (total true positif).dan f_pos,dan f_pos(total fase positif). precision yaitu perbandingan jumlah t_neg terhadap jumlah record yang negative. Untuk menghitung digunakan persamaan dibawah ini : Precision x 100% Precision x 100 % Precision = 0.8846 x 100 % Precision = 88,46 % 42

43 Table 4 6 nilai recall dari data karyawan yang ditampilkan oleh RapidMiner Berdasarkan tabel 4.5 Recall atau sensitivity adalah proporsi kasus positif yang sebenarnya yang diprediksi positif secara benar, Powers.Hasil recall pada cofusion matrix menunjukan nilai recall sebesar 82,14%untuk mengitung manual dapat mengunakan persamaan 8.Nilai recall yaitu hasil bagi t_pos (total true positif) dengan penjumlahan t_pos (total true positif)dan t_neg (total true negatif) total true negatif Recall x 100% Recall x 100% Recall = 0,8214 x 100% Recall = 82,14% 43

44 Gambar 4 5 Hasil ROC dari C4.5 yang ditampilkan oleh RapidMiner Curve ROC (Receiver Operating Characteristic) yaitu cara lain untuk mengevaluasi akurasi dari klasifikasi secara visual. Untuk klasifikasi data mining, nilai Area Under Curve (AUC) dapatdibagi menjadi beberapa kelompok[13]. A. Akurasi 0.90 1.00 = Excellent classification B. Akurasi 0.80 0.90 = Good classification C. Akurasi 0.70 0.80 = Fair classification D. Akurasi 0.60 0.70 = Poor classification E. Akurasi 0.50 0.60 = Failure Hasil yang didapat dari Pengolahan ROC untuk algeritma C4.5 dengan mengunakan data Traninng sebesar 0.887. Dapat diliat pada dengan tingkat diaknosa good classification. 44

45 4.4 Aplikasi Sederhana Setelah melakukan serangkaian proses analisa data menghasilkan sebuah rangkaian aturan dari RpidMainer, maka aturan tersebut dapat diimplementasikan program aplikasi dengan konsep dasar klasifikasi berbasis java.cara kerja aplikasi ini yaitu dngan cara menginputkan data No, Nama karyawan,prod.januari- Desember, jenis kelamin, Golongan, Pendidikan, Umur, Masa kerja.kemudian klik peluang maka akan muncul hasil rediksi apakah karyawan tersebut layak naik golongan atau tidak.berikut tampilan awal program yang dibuat : Gambar 4 6 Tampilan Program sebelum dilakukan inputan Pada tampilan awal program tersebut kita dapat menginputkan data sesuai pada tampilan tersebut sesuai data set yang ada.kemudian hasil klasifikasi akan muncul pada kolom dibawah tombol simpan hasil yang di tampilkan proses klasifikasi berdasarkan aturan yang diimplementasikan.terdapat tobol simpan yang kemudian akan langsung menyimpan hasil klasifikasi pada database dan 45

46 akan muncul di tabel database. Dan terdapat tombol hapus yang digunakan untuk menghapus data yang ada pada databese.berikut merupakan tampilan dari program setelah dilakukan input data : Gambar 4 7 Tampilan program saat menampilkan hasil klasifikasi Pada gambar diatas menampilkan hasil klasifikasi dari hasil input data yang kemudian akan menghasilkan klasifikasi sesuai dengan implementasi dari algoritma C4.5.Sehinga dapat melihat apakah karyawan tersebuk layak naik golongan atau tidak. 46

47 Gambar 4 8 Tampilan program menyimpan kedatabase Pada gambar diatas menampilkan kegunan button simpan kemudian menampilkan hasil klasifikasi selanjutnya hasil tersebut akan masuk pada tabel tersebut. 47

48 Gambar 4 9 Tampilan program saat menghapus data Pada gambar diatas menampilkan button hapus yang berguna untuk menghapus data yang telah tersimpan pada tabel tersebut. Aplikasi ini ditunjukan untuk informasi pihak perusahaan PTP Nusantara kebun blimbing untuk informasi apakah karyawan tersebut layak untuk naik golongan atau tidak.kemudian dari output aplikasi tersebut dapat dimanfaatkan sebagai pengecekan data apakah karyawan tersebut layak untuk naik golongan sehinga memudahkan pemantauan karyawan yang rajin dan yang tidak.tampilan Aplikasi kenaikan golongan karyawan PTP Nusantara Kebun Blimbing 48