Classification. Decision Tree. Decision Tree. Konsep Decision Tree. Penggunaan Decision Tree. When To Consider Decision Tree?

dokumen-dokumen yang mirip
Sesi 09 Dosen Pembina : Danang Junaedi IF-UTAMA 1 IF-UTAMA 2

Decision Tree. Achmad Basuki, Iwan Syarif Politeknik Elektronika Negeri Surabaya PENS-ITS 2003

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

ID3 : Induksi Decision Tree

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

Modul IV KLASIFIKASI

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Belajar Mudah Algoritma Data Mining : C4.5

DIAGNOSA KETERLAMBATAN PERKEMBANGAN PADA ANAK BALITA DENGAN ACUAN DENVER II DAN PENGAMBIL KEPUTUSAN DENGAN METODE DECISION TREE BERBASIS JSP

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

BAB II TINJAUAN PUSTAKA

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

MODUL 12 Model Prediktif

Algoritma Iterative Dichotomizer 3 ( ID3 ) Pengambilan Keputusan

Algoritma Iterative Dichotomizer 3 (ID3) Pengambilan Keputusan

Diktat Kuliah Data Mining - Institut Informatika Indonesia Semester Genap 2006/ Maret 2007 Sub Materi: ID3: Induksi Decision Tree

BAB 2 TINJAUAN PUSTAKA

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penerimaan Mahasiswa Baru

APLIKASI DATA MINING DENGAN METODE CLASSIFICATION BERBASIS ALGORITMA C4.5

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

TUGAS DATA MINING. Nama Kelompok : I Putu Ari Ratna Pratama ( ) Putu Mega Suryawan ( ) Ida Bagus Surya Winantara ( )

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

PRAKTIKUM KE-5 KLASIFIKASI I

IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE

Sebelumnya... Sistem Pakar berbasis Logika Fuzzy

BAB 2 LANDASAN TEORI

Pohon Keputusan. 6.1 Inductive Learning

IMPLEMENTASI ALGORITMA C4.5 UNTUK MENENTUKAN PENERIMA BEASISWA DI STT HARAPAN MEDAN

BAB II TINJAUAN PUSTAKA

Research of Science and Informatic

Penggunaan Decision Tree Dengan ID3 Algorithm Untuk Mengenali Dokumen Beraksara Jawa

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

Metode Bayes. Tim Machine Learning

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Manfaat Pohon Keputusan

PENDAHULUAN TINJAUAN PUSTAKA

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

PENERAPAN DATA MINING UNTUK KLASIFIKASI PREDIKSI PENYAKIT ISPA (Infeksi Saluran Pernapasan Akut) DENGAN ALGORITMA DECISION TREE (ID3)

Rayendra AMIK Kosgoro Solok

MENGIDENTIFIKASI DATA REKAM MEDIS. (Studi Kasus Penyakit Diabetes Mellitus di Balai Kesehatan Kementerian. Perindustrian, Jakarta) SKRIPSI

IKI30320 Kuliah 19 3 Des Ruli Manurung. Learning. Agents. Inductive Learning. Decision Tree. Mengukur Kinerja Belajar.

Penerapan Data Mining dalam Memprediksi Pembelian cat

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

BAB II LANDASAN TEORI

DECISION TREE BERBASIS ALGORITMA UNTUK PENGAMBILAN KEPUTUSAN

MKB3462 KECERDASAN BUATAN. Muhammad Zidny Naf an, M.Kom.

ANALISA TEKNIK PENENTUAN ATRIBUT DALAM MEMBUAT POHON KEPUTUSAN PADA PENAMBANGAN DATA

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

IDENTIFIKASI LAMA STUDI BERDASARKAN KARAKTERISTIK MAHASISWA MENGGUNAKAN ALGORITMA C4.5

Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit

ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

DECISION TREE MENGGUNAKAN ALGORITMA ID3 UNTUK MELAKUKAN DETEKSI PENYAKIT KANKER PAYUDARA

Minimum Spanning Trees algorithm

Outline. Struktur Data & Algoritme (Data Structures & Algorithms) Pengantar. Definisi. 2-3 Trees

SISTEM REKOMENDASI PENENTUAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA DECISION TREE

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Terbit online pada laman web jurnal : JURNAL RESTI. ( R e k a y a s a S i s t e m d a n T e k n o l o g i I n f o r m a s i )

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN (SPK) UNTUK MENENTUKAN KELAIKLAUTAN KAPAL ABSTRAK

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

Decision Tree Penentuan Masa Studi Mahasiswa Prodi Teknik Informatika (Studi Kasus: Fakultas Teknik dan Komputer Universitas Harapan Medan)

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

BAB III METODE PENELITIAN

Sistem Informasi Penjualan Sepeda Motor Bekas Menggunakan Algoritma C4.5

APLIKASI KLASIFIKASI KOLEKTIBILITAS KREDIT PEMILIKAN RUMAH (KPR) MENGGUNAKAN DECISION TREE C5.0 SKRIPSI MASLIMONA HARIMITA RITONGA

Gain Ratios Model Implementasi Decision Tree Analisis Kepuasan Konsumen terhadap Restoran Siap Saji

Seminar Nasional Teknologi 2007 (SNT 2007) ISSN : Yogyakarta, 24 November 2007

BAB II TINJAUAN PUSTAKA

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

PENERAPAN DATA MINING UNTUK MENGANALISA KEMUNGKINAN PENGUNDURAN DIRI CALON MAHASISWA BARU

DAFTAR ISI ABSTRAK... KATA PENGANTAR... DAFTAR ISI... DAFTAR GAMBAR... DAFTAR TABEL... DAFTAR LAMPIRAN Latar Belakang... 1

Virtual Memory Ch. 9. Virtual Memory. SISTIM OPERASI (Operating System) IKI Johny Moningka

Manajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM :

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 TINJAUAN PUSTAKA

PENERAPAN ALGORITMA DECISION TREE PADA PENENTUAN KEBERHASILAN AKADEMIK MAHASISWA

IMPLEMENTASI TEKNIK DATA MINING CLASSIFICATION DENGAN METODE DECISSION TREE UNTUK MENENTUKAN TINGKAT KELULUSAN MAHASISWA

BAB 2 LANDASAN TEORI

Statistik Farmasi Probabilitas

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

TUGAS KONSEP DASAR DATA MINING

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

IMPLEMENTASI DATA MINING UNTUK MENGETAHUI PERILAKU SESEORANG DALAM MEMBELI ALAT PANAHAN

ANALISA DAN PERANCANGAN PENENTUAN GURU BERPRESTASI MENGGUNAKAN METODE DECISION TREE (Studi kasus SMA XYZ)

Transkripsi:

Classification Decision Tree esi 09 Dosen Pembina : Danang Junaedi IF-UTAMA 1 IF-UTAMA Konsep Decision Tree Decision Tree Mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (rule) IF-UTAMA 3 IF-UTAMA 4 When To Consider Decision Tree? Penggunaan Decision Tree Diagnosa penyakit tertentu, seperti hipertensi, kanker, stroke dan lain-lain Pemilihan produk seperti rumah, kendaraan, komputer dan lain-lain Pemilihan pegawai teladan sesuai dengan kriteria tertentu Deteksi gangguan pada komputer atau jaringan komputer seperti Deteksi Entrusi, deteksi virus (trojan dan varians) dll IF-UTAMA 5 IF-UTAMA 6 1

Gambaran Pemakaian Decision Tree ample IF-UTAMA 7 IF-UTAMA 8 Information Theory Information Theory (contd) IF-UTAMA 9 IF-UTAMA 10 Information Theory (contd) Konsep Data dalam Decision Tree Data dinyatakan dalam bentuk tabel dengan atribut dan record. Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan tree. Misalkan untuk menentukan main tenis, kriteria yang diperhatikan adalah cuaca, angin dan temperatur. alah satu atribut merupakan atribut yang menyatakan data solusi per-item data yang disebut dengan target atribut. Atribut memiliki nilai-nilai yang dinamakan dengan instance. Misalkan atribut cuaca mempunyai instance berupa cerah, berawan dan hujan. IF-UTAMA 11 IF-UTAMA 1

Proses Dalam Decision Tree Mengubah Data Tree 1. Mengubah bentuk data (tabel) menjadi model tree. ID3 Algorithm C.45 Algorithm etc. Mengubah model tree menjadi rule Disjunction (v OR) Conjunction (^ AND) 3. Menyederhanakan Rule (Pruning) IF-UTAMA 13 IF-UTAMA 14 Tree Rule Tree Rule (contd) IF-UTAMA 15 IF-UTAMA 16 How Decision Tree Induction For Classification IF-UTAMA 17 IF-UTAMA 18 3

ID3 Algorithm ID3 Algorithm (contd) IF-UTAMA 19 IF-UTAMA 0 ID3 Algorithm Given a set of examples,, categorised in categories ci, then: 1. Choose the root node to be the attribute, A, which scores the highest for information gain relative to.. For each value v that A can possibly take, draw a branch from the node. 3. For each branch from A corresponding to value v, calculate v. Then: If v is empty, choose the category cdefault which contains the most examples from, and put this as the leaf node category which ends that branch. If v contains only examples from a category c, then put c as the leaf node category which ends that branch. Otherwise, remove A from the set of attributes which can be put into nodes. Then put a new node in the decision tree, where the new attribute being tested in the node is the one which scores highest for information gain relative to v (note: not relative to ). This new node starts the cycle again (from ), with replaced by v in the calculations and the tree gets built iteratively like this. The algorithm terminates either when all the attributes have been exhausted, or the decision tree perfectly classifies the examples. IF-UTAMA 1 ID3 Algorithm Ilustration Diagram IF-UTAMA Pembentukan Tree pesifikasikan masalah menentukan Atribut dan Target Atribut berdasarkan data yang ada Hitung nilai Entropy dari setiap kriteria dengan data sample yang ditentukan. Hitung Information Gain dari setiap kriteria Node terpilih adalah kriteria dengan Information Gain yang paling tinggi. Ulangi sampai diperoleh node terakhir yang berisi target atribut Entropy Entropy() adalah jumlah bit yang diperkirakan dibutuhkan untuk dapat mengekstrak suatu kelas (+ atau -) dari sejumlah data acak pada ruang sample. Entropy bisa dikatakan sebagai kebutuhan bit untuk menyatakan suatu kelas. emakin kecil nilai Entropy maka semakin baik untuk digunakan dalam mengekstraksi suatu kelas. Panjang kode untuk menyatakan informasi secara optimal adalah p bits untuk messages yang mempunyai probabilitas p. IF-UTAMA 3 IF-UTAMA 4 4

Entropy (contd) Entropy (contd) IF-UTAMA 5 IF-UTAMA 6 Information Gain Example Training Data et IF-UTAMA 7 IF-UTAMA 8 IF-UTAMA 9 IF-UTAMA 30 5

IF-UTAMA 31 IF-UTAMA 3 IF-UTAMA 33 IF-UTAMA 34 IF-UTAMA 35 IF-UTAMA 36 6

Extracting Classification Rule Form Tree Data Mentah ample Atribut Target Atribut Decision Tree?? IF-UTAMA 37 IF-UTAMA 38 Entropy Awal Jumlah instance = 8 Jumlah instance positif = 3 Jumlah instance negatif = 5 ( Hipertensi) = Entropy 3 3 5 5 = 8 8 8 8 = = = 0,531+ 0,44 = 0,955 ( 0.375 0.375) ( 0.65 0.65) ( 0.375-1.415) ( 0.65-0.678) IF-UTAMA 39 Entropy Usia Jumlah instance = 8 Instance Usia Muda Instance positif = 1 Instance negatif = 3 Tua Instance positif = Instance negatif = Entropy Usia Entropy( Muda) = tan ce _ Entropy( Tua) = Entropy(muda) = 0.906 Entropy(tua) = 1 negatif IF-UTAMA 40 Gain Gain Usia v (, Usia) Entropy( ) Entropy( ) = Entropy 4 = 8 = 0.955 0.453 0.5 Muda Tua ( ) Entropy( ) Entropy( ) ( 0.955) ( 0.906) () 1 = 0.00 = 4 8 v Muda, Tua Muda Tua IF-UTAMA 41 v Entropy Berat Jumlah instance = 8 Intance Berat Overweight Instance positif = 3 Instance negatif = 1 Average Instance positif = 0 Instance negatif = Underweight Instance positif = 0 Instance negatif = Entropy( Overweight) = Entropy( Average) = Entropy( Underweight) = Entropy(Overweight)=0.906 Entropy(Average)=0.5 IF-UTAMA 4 Entropy(Underweight)=0.5 7

Gain Usia v Gain(, Berat) = Entropy( ) Entropy( v ) v Overwight, Average, Underweight Overweight Average Underweight = Entropy( ) Entropy( Overweight ) Entropy( average ) Entropy( ) Underweight 4 = ( 0.955) ( 0.906) ( 0.5) ( 0.5) 8 8 8 = 0.955 0.453 0.15 0.15 = 0,5 Entropy Jenis Kelamin Jumlah instance = 8 Intance Jenis Kelamin Pria Instance positif = Instance negatif = 4 Wanita Instance positif = 1 Instance negatif = 1 Entropy( Pr ia) = Entropy( Wanita) = Entropy(Pria)=1 Entropy(Wanita)=0.75 IF-UTAMA 43 IF-UTAMA 44 Gain Usia Gain v (, JenisKela min) Entropy( ) Entropy( ) = Entropy 6 = 8 8 = 0.955 0.75 0.188 Pr ia Wanita ( ) Entropy( ) Entropy( ) ( 0.955) () 1 ( 0.75) = 0,017 = Pr ia v Pr ia, Wanita Wanita IF-UTAMA 45 v Atribut yang dipilih adalah atribut berat karena nilai Information Gainnya paling tinggi Overweight Berat Average Underweight Jumlah Instance untuk Overweight = 4 Jumlah Instance untuk Average = Jumlah Instance untuk Underweight = Hitung Gain paling tinggi untuk dijadikan cabang berikutnya IF-UTAMA 46 Node untuk cabang Overweight Jumlah instance = 4 Instance (Berat = Overwight ) & Usia = Muda Instance positif = 1 Instance negatif = 0 Tua Instance positif = Instance negatif = 1 Instance (Berat = Overwight ) & Jenis Kelamin = Pria Instance positif = Instance negatif = 1 Wanita Instance positif = 1 Instance negatif = 0 IF-UTAMA 47 Decision Tree yang dihasilkan Clasification Rule???? IF-UTAMA 48 8

trength of Decision Tree Weakness of Decision Tree IF-UTAMA 49 IF-UTAMA 50 tudi Kasus tudi Kasus IF-UTAMA 51 IF-UTAMA 5 Referensi 1. Dr. Mourad YKHLEF.009. Decision Tree Induction ystem.king aud University. Achmad Basuki, Iwan yarif. 003. Decision Tree. Politeknik Elektronika Negeri urabaya (PEN) IT 3. imon Colton.004. Decision Tree Learning.- 4. Tom M. Mitchell. 1997. Machine Learning. Mc-Graw Hill IF-UTAMA 53 9