Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009

dokumen-dokumen yang mirip
Teknik Pengklasifikasi : Bayesian, JST (ANN) Bertalya Universitas Gunadarma 2009

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

Manfaat Pohon Keputusan

Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Model. Pengklasifikasian: Definisi. Catatan Kuliah untuk Bab 4

BAB I PENDAHULUAN 1.1 Latar Belakang

ID3 : Induksi Decision Tree

Pengenalan Pola. Klasifikasi Naïve Bayes

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Metode C45 Untuk Mengklarifikasi Pelanggan Perusahaan Telekomunikasi Seluler

Metode klasifikasi Naïve Bayes. Team teaching

RULE MINING UNTUK KLASIFIKASI DATA MENGGUNAKAN SEARCH TREE

ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING

BAB II LANDASAN TEORI

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

BAB II TINJAUAN PUSTAKA

Data Mining II Estimasi

MODUL 12 Model Prediktif

Belajar Mudah Algoritma Data Mining : C4.5

Classification (1) Classification (3) Classification (2) Contoh Classification. Classification (4)

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

BAB II TINJAUAN PUSTAKA

PRAKTIKUM KE-5 KLASIFIKASI I

BAB II LANDASAN TEORI

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

Modul IV KLASIFIKASI

Pohon Keputusan. 6.1 Inductive Learning

BAB I PENDAHULUAN 1.1 Latar Belakang

TINJAUAN PUSTAKA. Definisi Data Mining

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

Diktat Kuliah Data Mining - Institut Informatika Indonesia Semester Genap 2006/ Maret 2007 Sub Materi: ID3: Induksi Decision Tree

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE


Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAR TEORI

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

Metode Bayes. Tim Machine Learning

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

PPDAFTAR GAMBAR Gambar Halaman Yuni Melawati, 2013

BAB 1 PENDAHULUAN 1-1

BAB I PENDAHULUAN Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

Algoritma Dasar. 4.1 Naive Bayes

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

Klasifikasi. Diadaptasi dari slide Jiawei Han

Algoritma Data Mining (2) Tugas Klasifikasi

BAB I PENDAHULUAN 1.1. Latar Belakang

Klasifikasi. Diadaptasi dari slide Jiawei Han

BAB I PENDAHULUAN. sistem peredaran darah orang lain. Sebelum ditransfusikan, periksa kembali sifat

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

SISTEM PENDUKUNG PENGAMBILAN KEPUTUSAN MENGGUNAKAN METODE NAIVE BAYES (STUDI KASUS KREDIT SEPEDA MOTOR)

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB II TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Komparasi Algoritma Klasifikasi untuk dataset iris dengan rapid miner

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

Sebelumnya... Sistem Pakar berbasis Logika Fuzzy

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Penggunaan Pohon Keputusan untuk Data Mining

BAB II TINJAUAN PUSTAKA

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

Perbandingan Performansi Algoritma Decision Tree CART dan CHAID

IMPLEMENTASI TEKNIK DATA MINING CLASSIFICATION DENGAN METODE DECISSION TREE UNTUK MENENTUKAN TINGKAT KELULUSAN MAHASISWA

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE

BAB II STUDI PUSTAKA

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU


BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

TUGAS KONSEP DASAR DATA MINING

BAB I PENDAHULUAN 1.1 Latar Belakang

MKB3462 KECERDASAN BUATAN. Muhammad Zidny Naf an, M.Kom.

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

Gambar 1.1 Logo Rumah123.com Sumber: rumah123.com

Pemanfaatan Educational Data Mining (EDM)...

Klasifikasi & Prediksi

Transkripsi:

Konsep Data Mining Klasifikasi : Pohon Keputusan Bertalya Universitas Gunadarma 2009

Definisi Klasifikasi Proses untuk menyatakan suatu objek ke salah satu kategori yg sudah didefinisikan sebelumnya. Proses pembelajaran fungsi target (model klasifikasi) yg memetakan setiap sekumpulan atribut x (input) ke salah satu klas y yang didefinisikan sebelumnya. Input : sekumpulan record (training set) Setiap record terdiri atas sekumpulan atribut, salah satu atribut adalah klas. Mencari model utk atribut klas sebagai fungsi dari nilai2 utk atribut yg lain. Klasifikasi 2

Definisi Klasifikasi (lanj.) Tujuannya adalah record2 yg sebelumnya tidak terlihat dinyatakan kelasnya seakurat mungkin. Model klasifikasi digunakan untuk pemodelan deskriptif sebagai perangkat penggambaran utk membedakan objek2 dari klas berbeda. Pemodelan prediktif digunakan utk memprediksi label klas utk record yg tidak diketahui atau tidak dikenal. Klasifikasi 3

10 10 Contoh Klasifikasi categorical categorical Tid Atr-1 Atr-2 Atr-3 continuous Class class Atr-1 Atr-2 Atr-3 Class 1 Yes Single 125K No 2 No Married 100K No 3 No Single 70K No 4 Yes Married 120K No 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No No Single 75K? Yes Married 50K? No Married 150K? Yes Divorced 90K? No Single 40K? No Married 80K? Test Set 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes Training Set Learn Classifier Model Klasifikasi 4

Classifier (Teknik Klasifikasi) Merupakan pendekatan sistematis utk membangun model klasifikasi dari sekumpulan data input. Contoh Decision tree (pohon keputusan) Rule-based (berbasis aturan) Neural network (jaringan syaraf) Support Vector Machine (SVM) Naïve Bayes Klasifikasi 5

Contoh Aplikasi 1 Pendeteksi Kecurangan Tujuan : memprediksi kecurangan pada transaksi kartu kredit Pendekatan : Gunakan transaksi kartu kredit & informasi mengenai pemegang rekening sebagai atribut2. Kapan si pelanggan membeli, apa yg dibeli, seberapa sering pelanggan tsb membayar pada waktunya, dll Tandai transaksi yg lama sebagai transaksi yg benar atau curang. Hal ini akan membentuk atribut klas. Pelajari suatu model utk klas transaksi Gunakan model ini utk mendeteksi kecurangan dgn mengamati transaksi kartu kredit pada suatu rekening. Klasifikasi 6

Contoh Aplikasi 2 Pemasaran secara langsung Tujuan : mengurangi biaya pengiriman dengan menargetkan sekumpulan pelanggan yg kemungkinan membeli produk telpon selular baru Pendekatan : Gunakan data utk produk yg sama yg diperkenalkan sebelumnya. Kita mengetahui pelanggan yg memutuskan membeli atau tidak. Hasil keputusan {beli, tidak beli} membentuk atribut klas. Kumpulkan informasi mengenai pelanggan yg berhubungan dengan demografik, gaya hidup & interaksi dengan perusahaan. Tipe bisnis, dimanan mereka tinggal, berapa banyak yg mereka belanjakan, dll Gunakan informasi ini sebagai atribut input utk mempelajari model klasifikasi. Klasifikasi 7

Pengukuran Kinerja Klasifikasi Akurasi = jumlah prediksi yang benar total jumlah prediksi Rata2 kesalahan = jumlah prediksi yang salah total jumlah prediksi Klasifikasi 8

Pohon Keputusan (Decision Tree) Struktur hirarkis seperti pohon yg terdiri atas node & edge Root node, node yg tidak mempunyai edge yg masuk & 0 atau banyak edge yg keluar Internal node, node yg mempunyai satu edge yg masuk & dua atau lebih edge yg keluar Leaf atau terminal node, node yg mempunyai satu edge yg masuk & tidak ada edge keluar Leaf atau terminal node dinyatakan sebagai label klas. Non-terminal node terdiri atas atribut kondisi tes utk membedakan record dgn karakteristik berbeda. Klasifikasi 9

Contoh Pohon Keputusan : Klasifikasi Vertebrata Suhu tubuh panas dingin melahirkan Bukan Suhu mamalia tubuh Ya Tidak Mamalia Bukan mamalia Klasifikasi 10

Classification and Regression Trees (CART) Klasifikasi 11

Contoh Grandparents A lot A little Klasifikasi 12

DECISION TREE FOR THE CONCEPT Play Tennis Day OutlookT emp HumidityWind PlayT enni D1 Sunny Hot High Weak No D2 Sunny Hot High Strong No D3 Overcas Hot High Weak Yes D4 Rain Mild High W eak Yes D5 Rain Cool Normal Weak Yes D6 Rain Cool Normal Strong No D7 Overcas Cool Normal Strong Yes D8 Sunny Mild High W eak No D9 Sunny Cool Normal Weak Yes D10 Rain Mild Normal W eak Yes D11 Sunny Mild Normal Strong Yes D12 Overcas Mild High Strong Yes D13 Overcas Hot Normal Weak Yes D14 Rain Mild High Strong No Mitchell, 1997 Klasifikasi 13 [Mitchell,1997]

DECISION TREE FOR THE CONCEPT Play Tennis Day OutlookTempHumidityWind PlayTenni D1 Sunny Hot High Weak No D2 Sunny Hot High Strong No D3 Overcas Hot High Weak Yes D4 Rain Mild High Weak Yes D5 Rain Cool Normal Weak Yes D6 Rain Cool Normal Strong No D7 Overcas Cool Normal Strong Yes D8 Sunny Mild High Weak No D9 Sunny Cool Normal Weak Yes D10 Rain Mild Normal Weak Yes D11 Sunny Mild Normal Strong Yes D12 Overcas Mild High Strong Yes D13 Overcas Hot Normal Weak Yes D14 Rain Mild High Strong No Mitchell, 1997 Klasifikasi 14 [Mitchell,1997]