Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

dokumen-dokumen yang mirip
ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Manfaat Pohon Keputusan

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Algoritma Data Mining (2) Tugas Klasifikasi

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam

Metodologi Algoritma A Priori. Metodologi dasar algoritma a priori analisis asosiasi terbagi menjadi dua tahap :

Belajar Mudah Algoritma Data Mining : C4.5

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA

KLASIFIKASI DATA PROSPEKTUS LOKASI WARALABA DENGAN ALGORITMA C4.5

MKB3462 KECERDASAN BUATAN. Muhammad Zidny Naf an, M.Kom.

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

Seminar Nasional Teknologi 2007 (SNT 2007) ISSN : Yogyakarta, 24 November 2007

BAB II TINJAUAN PUSTAKA Sejarah Singkat dan Perkembangan Umum Perusahaan [8] Perusahaan Daerah Bank Perkreditan Rakyat Kabupaten Bandung Cabang

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

Pohon Keputusan. 6.1 Inductive Learning

BAB II TINJAUAN PUSTAKA DAN LANDASAR TEORI

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

BAB II LANDASAN TEORI. pengetahuan di dalam basis data. Data Mining adalah proses yang menggunakan teknik statistik,

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI DATA MINING ALGORITMA C4.5 UNTUK MEMPREDIKSI PEMBAYARAN PINJAMAN PADA KOPERASI SIMPAN PINJAM PRIMKOVERI BINA BAKTI PEMALANG

Optimasi dengan Algoritma Simplex. Kusrini Jurusan Sistem Informasi STMIK AMIKOM Yogykakarta Jl. Ringroad Utara Condong Catur Sleman Yogyakarta

Metode C45 Untuk Mengklarifikasi Pelanggan Perusahaan Telekomunikasi Seluler

BAB 2 TINJAUAN PUSTAKA

Algoritma Dasar. 4.1 Naive Bayes

DECISION TREE BERBASIS ALGORITMA UNTUK PENGAMBILAN KEPUTUSAN

PENERAPAN ALGORITMA C4.5 DALAM PENERIMAAN CALON KARYAWAN PT. TELKOM AKSES AREA LAMPUNG BERBASIS WEBSITE

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

KLASIFIKASI CITRA DENGAN POHON KEPUTUSAN

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

KLASIFIKASI CITRA DENGAN POHON KEPUTUSAN

PERBANDINGAN METODE NEAREST NEIGHBOR DAN ALGORITMA C4.5 UNTUK MENGANALISIS KEMUNGKINAN PENGUNDURAN DIRI CALON MAHASISWA DI STMIK AMIKOM YOGYAKARTA

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Burhanudin Junardi Karim Dr. Lintang Yuniar Banowosari, S.Kom., M.Sc

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

Model Penentuan Potensi Status Gizi Bermasalah Menggunakan Decision Tree

ID3 : Induksi Decision Tree

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

PENERAPAN ALGORITMA C4.5 UNTUK PENGELOMPOKAN PENYAKIT HASIL DIAGNOSA PASIEN PENGGUNA JAMKESMAS PADA PUSKESMAS KOTAGEDE II NASKAH PUBLIKASI

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK MEMPREDIKSI KELANCARAN PEMBAYARAN NASABAH. (Studi Kasus: BMT Al Ikhwan) NASKAH PUBLIKASI

Penerapan Data Mining dalam Memprediksi Pembelian cat

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

Kerusakan Barang Jadi

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

SISTEM PENDUKUNG KEPUTUSAN REWARD DAN PUNISHMENT KARYAWAN BERDASARKAN TINGKAT KEPUASAN KONSUMEN MENGGUNAKAN ALGORITMA C4.5 PADA MODEL RUMAH SAKIT

BAB 2 TINJAUAN PUSTAKA. Bab ini berisi teori yang berhubungan dengan saham dan data mining baik

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELAYAKAN KREDIT NASABAH PADA BMT BUMI MIZAN SEJAHTERA YOGYAKARTA MENGGUNAKAN ALGORITMA C4.

BAB 2 LANDASAN TEORI

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

ANALISIS KEPUASAN MAHASISWA TERHADAP PELAYANAN AKADEMIK MENGGUNAKAN METODE ALGORITMA C4.5 (STUDI KASUS: STMIK PRINGSEWU)

Keyword : C 4.5 algorithm, Decision Support System, Selection Employees Candidate

BAB II STUDI PUSTAKA

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK MEMPREDIKSI KELAYAKAN PEMBIAYAAN ANGGOTA PADA BMT IHSAN MULIA YOGYAKARTA NASKAH PUBLIKASI

BAB III METODE CHI-SQUARED AUTOMATIC INTERACTION DETECTION

Data Mining : Klasifikasi Menggunakan Algoritma C4.5

Metode Bayes. Tim Machine Learning

PENGAMBILAN POLA KELULUSAN TEPAT WAKTU PADA MAHASISWA STMIK AMIKOM YOGYAKARTA MENGGUNAKAN DATA MINING ALGORITMA C4.5.

LANDASAN TEORI. Universitas Indonesia

Materi 5 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya

PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK

Pengenalan Pola. Klasifikasi Naïve Bayes

APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI )

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA. Abstrak

SISTEM PENDUKUNG KEPUTUSAN KELAYAKAN PEMBERIAN KREDIT PADA BANK TABUNGAN NEGARA (BTN) MENGGUNAKAN ALGORITMA C4.5 SKRIPSI

RULE MINING UNTUK KLASIFIKASI DATA MENGGUNAKAN SEARCH TREE

Jurnal KomTekInfo Fakultas Ilmu Komputer, Volume 1, No. 2, Desember 2014 ISSN :

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

PENERAPAN METODE C4.5 DALAM MENENTUKAN STATUS DIET

PEMANFAATAN ALGORITMA ID3 UNTUK KLASIFIKASI IPK MAHASISWA PROGRAM STUDI PENDIDIKAN MATEMATIKA UN PGRI KEDIRI

Budi Susanto Versi /08/2012. Teknik Informatika UKDW Yogyakarta

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

SISTEM INFORMASI PERUBAHAN HARGA KOMODITI MENGGUNAKAN ALGORITMA C4.5 DENGAN SMS GATEWAY (Studi Kasus Disperindagsar Kab. Subang)

Sistem Informasi Penjualan Sepeda Motor Bekas Menggunakan Algoritma C4.5

IMPLEMENTASI DATA MINING ALGORITMA C4.5 UNTUK MEMPREDIKSI PERILAKU MAHASISWA DIPLOMA 3 MELANJUTKAN STRATA 1 DI STMIK AMIKOM YOGYAKARTA

IMPLEMENTASI DATA MINING TERHADAP PENYUSUNAN LAYOUT MAKANAN PADA RUMAH MAKAN PADANG MURAH MERIAH

ANALISIS E-LEARNING CENTER OBJECT RECOMMENDER UNTUK PERSONALISASI PEMAHAMAN PRIOR KNOWLEDGE

SATIN Sains dan Teknologi Informasi

IMPLEMENTASI ALGORITMA C4.5 PADA VARIABEL-VARIABEL YANG MEMPENGARUHI STATUS GIZI BALITA DESA KUALA DUA KABUPATEN KUBU RAYA

Vol.17 No.2. Agustus 2015 Jurnal Momentum ISSN : X CASED BASED REASONING UNTUK PEMILIHAN KEGIATAN ORGANISASI MAHASISWA

Metode klasifikasi Naïve Bayes. Team teaching

BAB III ANALISA DAN DESAIN SISTEM

BAB IV HASIL DAN UJI COBA

Diktat Kuliah Data Mining - Institut Informatika Indonesia Semester Genap 2006/ Maret 2007 Sub Materi: ID3: Induksi Decision Tree

Transkripsi:

Algoritma C4.5 1 Kusrini, 2 Emha Taufiq Luthfi 1 Jurusan Sistem Informasi, 2 Jurusan Teknik Informatika 1, 2 STMIK AMIKOM Yogykakarta 1,2 Jl. Ringroad Utara Condong Catur Sleman Yogyakarta Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1. Tabel 1. Keputusan Bermain Tenis NO OUTLOOK TEMPERATURE HUMIDITY WINDY PLAY 1 Sunny Hot High FALSE No 2 Sunny Hot High TRUE No 3 Cloudy Hot High FALSE Yes 4 Rainy Mild High FALSE Yes 5 Rainy Cool Normal FALSE Yes 6 Rainy Cool Normal TRUE Yes 7 Cloudy Cool Normal TRUE Yes 8 Sunny Mild High FALSE No 9 Sunny Cool Normal FALSE Yes 10 Rainy Mild Normal FALSE Yes 11 Sunny Mild Normal TRUE Yes 12 Cloudy Mild High TRUE Yes 13 Cloudy Hot Normal FALSE Yes 14 Rainy Mild High TRUE No Dalam kasus yang tertera pada Tabel 1, akan dibuat pohon keputusan untuk menentukan main tenis atau tidak dengan melihat keadaan cuaca, temperatur, kelembaban dan keadaan angin. Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai a. Pilih atribut sebagai akar b. Buat cabang untuk masing-masing nilai c. Bagi kasus dalam cabang d. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama. Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atributatribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera dalam Rumus 1 (Craw, S., ---). n Si Gain( S, A) = Entropy( S) * Entropy( Si) (1) S 1 Dengan : S : Himpunan kasus A : Atribut n : Jumlah partisi atribut A Si : Jumlah kasus pada partisi ke i

S : Jumlah kasus dalam S Sedangkan penhitungan nilai entropy dapat dilihat pada rumus 2 berikut(craw, S., ---): n Entropy( S) = pi * log 2 pi... (2) 1 dengan : S : Himpunan Kasus A : Fitur n : Jumlah partisi S : Proporsi dari S i terhadap S p i Berikut ini adalah penjelasan lebih rinci mengenai masing-masing langkah dalam pembentukan pohon keputusan dengan menggunakan algoritma C4.5 untuk menyelesaikan permasalahan pada Tabel 1. a. Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus berdasarkan atribut OUTLOOK, TEMPERATURE, HUMIDITY dan WINDY. Setelah itu lakukan penghitungan Gain untuk masing-masing atribut. Hasil perhitungan ditunjukkan oleh Tabel 2. Tabel 2. Perhitungan 1 Kasus Tidak Ya (S) (S 1 ) (S 2 ) Entropy Gain 1 TOTAL 14 4 10 0.863120569 OUTLOOK 0.258521037 CLOUDY 4 0 4 RAINY 5 1 4 0.721928095 SUNNY 5 3 2 0.970950594 TEMPERATURE 0.183850925 COOL 4 0 4 0 HOT 4 2 2 1 MILD 6 2 4 0.918295834 HUMIDITY 0.370506501 HIGH 7 4 3 0.985228136 NORMAL 7 0 7 0 WINDY 0.005977711 FALSE 8 2 6 0.811278124 TRUE 6 4 2 0.918295834 Baris TOTAL kolom Entropy pada Tabel 2 dihitung dengan rumus 2, sebagai 4 4 10 10 Entropy ( Total) = ( * log 2 ( )) + ( * log 2 ( )) 14 14 14 14 Entropy ( Total) = 0.863120569 Sementara itu nilai Gain pada baris OUTLOOK dihitung dengan menggunakan rumus 1, sebagai

n Outlooki Gain( Total, Outlook) = Entropy( Total) * Entropy( Outlooki ) 1 Total 4 5 5 Gain( Total, Outlook) = 0.863120569 (( *0) + ( *0.723) + ( *0.97)) 14 14 14 Gain ( Total, Outlook ) = 0.23 Dari hasil pada Tabel 2 dapat diketahui bahwa atribut dengan Gain tertinggi adalah HUMIDITY yaitu sebesar 0.37. Dengan demikian HUMIDITY dapat menjadi node akar. Ada 2 nilai atribut dari HUMIDITY yaitu HIGH dan NORMAL. Dari kedua nilai atribut tersebut, nilai atribut NORMAL sudah mengklasifikasikan kasus menjadi 1 yaitu keputusan-nya Yes, sehingga tidak perlu dilakukan perhitungan lebih lanjut, tetapi untuk nilai atribut HIGH masih perlu dilakukan perhitungan lagi. Dari hasil tersebut dapat digambarkan pohon keputusan sementara-nya tampak seperti Gambar 1 Gambar 1 Pohon Keputusan Hasil Perhitungan 1 b. Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus berdasarkan atribut OUTLOOK, TEMPERATURE dan WINDY yang dapat menjadi node akar dari nilai atribut HIGH. Setelah itu lakukan penghitungan Gain untuk masing-masing atribut. Hasil perhitungan ditunjukkan oleh Tabel 3. 1.1 Tabel 3. Perhitungan 1.1 Kasus Tidak (S) (S1) Ya (S2) Entropy Gain HUMIDITY- HIGH 7 4 3 0.985228136 OUTLOOK 0.69951385 CLOUDY 2 0 2 0 RAINY 2 1 1 1 SUNNY 3 3 0 0 TEMPERATURE 0.020244207 COOL 0 0 0 0 HOT 3 2 1 0.918295834 MILD 4 2 2 1 WINDY 0.020244207 FALSE 4 2 2 1 TRUE 3 2 1 0.918295834

Dari hasil pada Tabel 3 dapat diketahui bahwa atribut dengan Gain tertinggi adalah OUTLOOK yaitu sebesar 0.67. Dengan demikian OUTLOOK dapat menjadi node cabang dari nilai atribut HIGH. Ada 3 nilai atribut dari OUTLOOK yaitu CLOUDY, RAINY dan SUNNY. Dari ketiga nilai atribut tersebut, nilai atribut CLOUDY sudah mengklasifikasikan kasus menjadi 1 yaitu keputusan-nya Yes dan nilai atribut SUNNY sudah mengklasifikasikan kasus menjadi satu dengan keputusan No, sehingga tidak perlu dilakukan perhitungan lebih lanjut, tetapi untuk nilai atribut RAINY masih perlu dilakukan perhitungan lagi. Pohon keputusan yang terbentuk sampai tahap ini ditunjukkan pada Gambar 2 Gambar 2. Pohon Keputusan Hasil Perhitungan 1.1 c. Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus berdasarkan atribut TEMPERATURE dan WINDY yang dapat menjadi node cabang dari nilai atribut RAINY. Setelah itu lakukan penghitungan Gain untuk masing-masing atribut. Hasil perhitungan ditunjukkan oleh Tabel 4. Dari hasil pada Tabel 4 dapat diketahui bahwa atribut dengan Gain tertinggi adalah WINDY yaitu sebesar 1. Dengan demikian WINDY dapat menjadi node cabang dari nilai atribut RAINY. Ada 2 nilai atribut dari WINDY yaitu FALSE dan TRUE. Dari kedua nilai atribut tersebut, nilai atribut FALSE sudah mengklasifikasikan kasus menjadi 1 yaitu keputusan-nya Yes dan nilai atribut TRUE sudah mengklasifikasikan kasus menjadi satu dengan keputusan No, sehingga tidak perlu dilakukan perhitungan lebih lanjut untuk nilai atribut ini.

Tabel 4. Perhitungan 1.1.2 1.1.2 Kasus (S) Tidak (S1) Ya (S2) Entropy Gain HUMIDITY- HIGH dan OUTLOOK - RAINY 2 1 1 1 TEMPERATURE 0 COOL 0 0 0 0 HOT 0 0 0 0 MILD 2 1 1 1 WINDY 1 FALSE 1 0 1 0 TRUE 1 1 0 0 Gambar 3. Pohon Keputusan Hasil Perhitungan 1.1.2 Pohon keputusan yang terbentuk sampai tahap ini ditunjukkan pada Gambar 3. Dengan memperhatikan pohon keputusan pada Gambar 3, diketahui bahwa semua kasus sudah masuk dalam kelas. Dengan demikian, pohon keputusan pada Gambar 3 merupakan pohon keputusan terakhir yang terbentuk. Implementasi dari algoritma C4.5 dijelaskan secara detail di buku Algoritma Data Mining. Daftar Pustaka Craw, S., 2005, Case Based Reasoning : Lecture 3: CBR Case-Base Indexing, www.comp.rgu.ac.uk/staff/smc/teaching/cm3016/lecture-3-cbr-indexing.ppt, Tanggal akses 14 Desember 2009. Kusrini dan Luthfi, E. T., 2009, Algoritma Data Mining, Andi Offset, Yogyakarta