Algoritma Data Mining (2) Tugas Klasifikasi

dokumen-dokumen yang mirip
ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

Manfaat Pohon Keputusan

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Belajar Mudah Algoritma Data Mining : C4.5

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA Sejarah Singkat dan Perkembangan Umum Perusahaan [8] Perusahaan Daerah Bank Perkreditan Rakyat Kabupaten Bandung Cabang

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA DAN LANDASAR TEORI

MKB3462 KECERDASAN BUATAN. Muhammad Zidny Naf an, M.Kom.

PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

Pohon Keputusan. 6.1 Inductive Learning

BAB II TINJAUAN PUSTAKA

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Metode C45 Untuk Mengklarifikasi Pelanggan Perusahaan Telekomunikasi Seluler

DECISION TREE BERBASIS ALGORITMA UNTUK PENGAMBILAN KEPUTUSAN

KLASIFIKASI DATA PROSPEKTUS LOKASI WARALABA DENGAN ALGORITMA C4.5

BAB 2 LANDASAN TEORI

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

IMPLEMENTASI DATA MINING ALGORITMA C4.5 UNTUK MEMPREDIKSI PEMBAYARAN PINJAMAN PADA KOPERASI SIMPAN PINJAM PRIMKOVERI BINA BAKTI PEMALANG

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

Algoritma Dasar. 4.1 Naive Bayes

DAFTAR ISI... LEMBAR PENGESAHAN PEMBIMBING... LEMBAR PENGESAHAN PENGUJI... HALAMAN PERSEMBAHAN... HALAMAN MOTTO... KATA PENGANTAR...

TUGAS DATA MINING. Nama Kelompok : I Putu Ari Ratna Pratama ( ) Putu Mega Suryawan ( ) Ida Bagus Surya Winantara ( )

DAFTAR ISI PHP... 15

BAB II TINJAUAN PUSTAKA

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

SISTEM PENDUKUNG KEPUTUSAN KELAYAKAN PEMBERIAN KREDIT PADA BANK TABUNGAN NEGARA (BTN) MENGGUNAKAN ALGORITMA C4.5 SKRIPSI

BAB III ANALISA DAN DESAIN SISTEM

Penerapan Data Mining dalam Memprediksi Pembelian cat

PENERAPAN ALGORITMA C4.5 DALAM PENERIMAAN CALON KARYAWAN PT. TELKOM AKSES AREA LAMPUNG BERBASIS WEBSITE

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

BAB III METODE PENELITIAN

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELAYAKAN KREDIT NASABAH PADA BMT BUMI MIZAN SEJAHTERA YOGYAKARTA MENGGUNAKAN ALGORITMA C4.

BAB II LANDASAN TEORI. pengetahuan di dalam basis data. Data Mining adalah proses yang menggunakan teknik statistik,

BAB 2 TINJAUAN PUSTAKA. Bab ini berisi teori yang berhubungan dengan saham dan data mining baik

ID3 : Induksi Decision Tree

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

BAB I PENDAHULUAN 1.1 Latar Belakang

APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI )

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK MEMPREDIKSI KELANCARAN PEMBAYARAN NASABAH. (Studi Kasus: BMT Al Ikhwan) NASKAH PUBLIKASI

SISTEM REKOMENDASI PEMILIHAN TIKET PESAWAT ONLINE MENGGUNAKAN METODE DECISION TREE DI PT. ANTA UTAMA KEDIRI

BAB II TINJAUAN PUSTAKA

ANALISIS E-LEARNING CENTER OBJECT RECOMMENDER UNTUK PERSONALISASI PEMAHAMAN PRIOR KNOWLEDGE

Materi 5 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya

SISTEM PENDUKUNG KEPUTUSAN REWARD DAN PUNISHMENT KARYAWAN BERDASARKAN TINGKAT KEPUASAN KONSUMEN MENGGUNAKAN ALGORITMA C4.5 PADA MODEL RUMAH SAKIT

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Burhanudin Junardi Karim Dr. Lintang Yuniar Banowosari, S.Kom., M.Sc

Data Mining : Klasifikasi Menggunakan Algoritma C4.5

IMPLEMENTASI ALGORITMA C4.5 PADA VARIABEL-VARIABEL YANG MEMPENGARUHI STATUS GIZI BALITA DESA KUALA DUA KABUPATEN KUBU RAYA

KNOWLEDGE DISCOVERY PADA RISKED CUSTOMER S BANK MENGGUNAKAN DECISION TREE

ISSN: Candraningsih 1, Bowo Nurhadiyono 2

BAB 2 TINJAUAN PUSTAKA

ALGORITMA C4.5 UNTUK KLASIFIKASI CALON PESERTA LOMBA CERDAS CERMAT SISWA SMP N 1 WINONG TINGKAT KABUPATEN

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

BAB I PENDAHULUAN 1.1 Latar Belakang

Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

PENERAPAN ALGORITMA C4.5 UNTUK PENGELOMPOKAN PENYAKIT HASIL DIAGNOSA PASIEN PENGGUNA JAMKESMAS PADA PUSKESMAS KOTAGEDE II NASKAH PUBLIKASI

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

RULE MINING UNTUK KLASIFIKASI DATA MENGGUNAKAN SEARCH TREE

IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS

BAB II TINJAUAN PUSTAKA

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

BAB 2 LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA

TINJAUAN PUSTAKA. Definisi Data Mining

IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE

BAB II TINJAUAN PUSTAKA

Seminar Nasional Teknologi 2007 (SNT 2007) ISSN : Yogyakarta, 24 November 2007

BAB 2 LANDASAN TEORI

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

TUGAS KONSEP DASAR DATA MINING

BAB IV HASIL DAN UJI COBA

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

Transkripsi:

Algoritma Data Mining (2) Tugas Klasifikasi Anief Fauzan Rozi, S. Kom., M. Eng. 1

Kompentensi Mahasiswa mengetahui algoritma data mining pada tugas klasifikasi 2

Pokok Bahasan Algoritma C4.5 3

Supervised Learning à Klasifikasi Nasabah Tabungan Aset Pendapatan Risiko Kredit A Sedang Tinggi 75 Baik B Rendah Rendah 50 Buruk C Tinggi Sedang 25 Buruk D Sedang Sedang 50 Baik E Rendah Sedang 100 Baik F Tinggi TInggi 25 Baik G Rendah Rendah 25 Buruk H Sedang Sedang 75 Baik I Tinggi Rendah 50? Klasifikasi digunakan untuk mengetahui variabel target jika diketahui hubungan tersembunyi antara variabel input. Tabel di samping contoh dari masalah yang dapat diselesaikan dengan tugas data mining klasifikasi. Variabel target dari masalah ini adalah resiko kredit. Sedangkan variabel inputnya adalah tabungan, aset, dan pendapatan. 4

Algoritma C4.5 (1) Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Dapat diekspresikan dalam bentuk bahasa basis data seperti SQL untuk mencari record pada kategori tertentu. Berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Proses pada pohon keputusan adalah mengubah bentuk data (tabel) menjadi model pohon, mengubah model pohon menjadi rule, dan menyederhanakan rule (Basuki & Syarif, 2003) 5

Algoritma C.45 (2) Langkah- langkah secara umum: 1. Pilih atribut sebagai akar (root) 2. Buat cabang untuk tiap- tiap nilai 3. Bagi kasus dalam cabang 4. Ulangi proses untuk setiap cabang (langkah 1, 2, dan 3) sampai semua kasus pada cabang memiliki kelas yang sama. 6

Contoh Kasus (1) Diberikan beberapa data tentang keputusan bermain tenis. Buatlah pohon keputusan dengan algoritma c4.5 agar kelak kita dapat memutuskan bermain atau tidak jika diketahui informasi lainnya. 7

Contoh Kasus (2) 8

Penyelesaian 1. Tentukan mana variabel tujuan, mana variabel input. 2. Lakukan tahap- tahap algoritma C4.5 pada variabel input untuk menentukan variabel tujuan. 9

Penentuan Variabel Tujuan dan Variabel Input Berdasar tabel dan pertanyaan, maka dapat dituliskan bahwa: Variabel tujuan adalah kolom play Variabel input adalah kolom outlook, temperature, humidity, windy 10

Langkah 1: Pilih atribut sebagai akar (1) Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari variabel input. Rumusnya: Keterangan: S = himpunan kasus A = atribut n = jumlah partisi atribut A S i = jumlah kasus pada partisi ke- 1 S = jumlah kasus dalam S 11

Langkah 1: Pilih atribut sebagai akar (2) Sedangkan untuk mencari nilai entrophy, digunakan rumus berikut ini: Keterangan: S = himpunan kasus n = jumlah partisi S pi = proporsi dari S i terhadap S 12

Langkah 1: Pilih atribut sebagai akar (3) Hasil perhitungan gain pada masing- masing atribut adalah seperti tertera pada tabel perhitungan node 1 berikut ini: Tips mengitung nilai entrophy: Jika salah satu nilai dari kolom ya dan tidak ada yang nilainya 0, maka dipastikan nilai entrophy juga 0 Jika nilai kolom ya dan tidak bernilai sama, maka entrophy bernilai 1 13

Langkah 1: Pilih atribut sebagai akar (4) Pada tabel tersebut dapat dilihat bahwa nilai gain tertinggi adalah pada artibut humidity, yaitu 0,3705065. Maka atribut humidity ini adalah akar dari pohon keputusan. 14

Langkah 2: buat cabang untuk masing- masing nilai Keterangan: Pengisian cabang berdasar pada nilai yang ada di kolom humidity, yaitu high dan normal (lihat soal). 15

Langkah 3: Bagi kasus dalam cabang Keterangan: Humidity memiliki dua nilai, high dan normal. Pada perhitungan node 1, untuk nilai normal menghasilkan 7 keputusan yes dan 0 keputusan no. Artinya untuk semua nilai humidity normal keputusannya adalah yes, maka anak cabang dari normal adalah yes. Sedangkan untuk high, terdapat 3 keputusan yes dan 4 keputusan no. Artinya untuk nilai high belum jelas keputusannya, maka anak cabang dari high perlu dicari kembali (perhitungan node 2) 16

Langkah 4: ulangi langkah 1, 2, dan 3 sampai tidak ada percabangan lagi (1). Penentuan anak cabang untuk humidity high 17

Langkah 4: ulangi langkah 1, 2, dan 3 sampai tidak ada percabangan lagi (2) Pada tabel tersebut dapat dilihat bahwa nilai gain tertinggi adalah pada artibut outlook, yaitu 0,69951385. Maka atribut outlook ini adalah anak cabang dari humidity high. 18

Langkah 4: ulangi langkah 1, 2, dan 3 sampai tidak ada percabangan lagi (3) Keterangan: Outlook memiliki tiga nilai yaitu: sunny, cloudy, dan rainny. Pada perhitungan node 2, dapat dilihat untuk semua nilai outlook sunny keputusannya adalah no. Untuk semua nilai cloudy keputusannya adalah yes. Sedangkan untuk rainny belum jelas keputusannya, maka anak cabang dari rainny perlu dicari kembali (perhitungan node 3) 19

Langkah 4: ulangi langkah 1, 2, dan 3 sampai tidak ada percabangan lagi (4). Penentuan node untuk outlook rainny 20

Langkah 4: ulangi langkah 1, 2, dan 3 sampai tidak ada percabangan lagi (5) Pada tabel tersebut dapat dilihat bahwa nilai gain tertinggi adalah pada artibut windy, yaitu 1. Maka atribut windy ini adalah anak cabang dari outlook rainny. 21

Langkah 4: ulangi langkah 1, 2, dan 3 sampai tidak ada percabangan lagi (6) Keterangan: Windy memiliki dua nilai yaitu: true dan false. Pada perhitungan node 3, dapat dilihat untuk semua nilai windy true keputusannya adalah no. Untuk semua nilai false keputusannya adalah yes. Karena pada kondisi ini semua anak cabang telah jelas, maka perhitungan berhenti. 22

Hasil Akhir Klasifikasi (1) 23

Hasil Akhir Klasifikasi (2) Dari pohon keputusan tersebut dapat dibuat suatu rumusan: Humidity: Normal à main tenis Humidity: High, Outlook: Cloudy à main tenis Humidity: High, Outlook: Sunny à tidak main tenis Humidity: High, Outlook: Rainny, Windy: false à main tenis Humidity: High, Outlook: Rainny, Windy: trueà tidak main tenis 24

Implementasi Data mining tugas klasifikasi (algoritma c4.5) dengan php- mysql 25

Pertanyaan??? 26

Kuis (1) Diberikan data sebagai berikut: 27

Kuis (2) Buatlah pohon keputusan yang dapat mengklasifikasikan rekomendasi lensa berdasar atribut yang lain! 28