Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala

dokumen-dokumen yang mirip
Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Bayesian Classifier. Bahan Kuliah Data Mining. Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Program Studi Teknik Informatika FMIPA Universitas Syiah Kuala

Classification (1) Classification (3) Classification (2) Contoh Classification. Classification (4)

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODE PENELITIAN

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK

Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

BAB II LANDASAN TEORI

DIAGNOSA KETERLAMBATAN PERKEMBANGAN PADA ANAK BALITA DENGAN ACUAN DENVER II DAN PENGAMBIL KEPUTUSAN DENGAN METODE DECISION TREE BERBASIS JSP

BAB III METODOLOGI PENELITIAN. Dataset

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG

Perangkat Lunak - Weka*

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

DAFTAR ISI PHP... 15

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

REKOMENDASI TOPIK TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA DI UNIVERSITAS MUHAMMADIYAH JEMBER MENGGUNAKAN METODE NAÏVE BAYESIAN CLASSIFIER

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

KLASIFIKASI PADA TEXT MINING

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

4.1. Pengambilan Data

BAB IV HASIL DAN PEMBAHASAN

Pendahuluan* Data vs Informasi

Tabel 2 Jumlah data prosedur uji. Crop Variable. Jumlah data LAI 104 SPAD 105 yield 64 LAI 104 SPAD 105 yield 64 LAI 62 SPAD 63 yield 34.

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Scientific Journal of Informatics Vol. 2, No. 1, Mei 2015

Research of Science and Informatic

TINJAUAN PUSTAKA. Definisi Data Mining

Penggunaan Pohon Keputusan untuk Data Mining

BAB III METODE PENELITIAN

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU

Klasifikasi. Diadaptasi dari slide Jiawei Han

BAB II LANDASAN TEORI

Penerapan Data Mining dalam Memprediksi Pembelian cat

LEARNING ARTIFICIAL INTELLIGENT

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa


Klasifikasi. Diadaptasi dari slide Jiawei Han

Modul IV KLASIFIKASI

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Model. Pengklasifikasian: Definisi. Catatan Kuliah untuk Bab 4

Materi III Praktikum Data Mining Program Studi Matematika FMIPA Universitas Syiah Kuala

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

KLASIFIKASI PADA TEXT MINING

Sistem Pakar Diagnosa Penyakit Diabetes Melitus Menggunakan Algoritma Iterative Dichotomiser Three (ID3) Berbasis Android.

BAB II KAJIAN TEORI. Pada bab ini berisi tentang teori-teori dasar mengenai kredit, database,

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

TEKNIK KLASIFIKASI POHON KEPUTUSAN UNTUK MEMPREDIKSI KEBANGKRUTAN BANK BERDASARKAN RASIO KEUANGAN BANK

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI NASABAH KREDIT BANK"X" MENGGUNAKAN CLASSIFICATION RULE

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

BAB I PENDAHULUAN Latar Belakang

EDY KURNIAWAN DOSEN PEMBIMBING Dr. I Ketut Eddy Purnama, S.T., M.T Dr. Surya Sumpeno, S.T., MS.c

BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB 2 LANDASAN TEORI

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

Pohon Keputusan. 6.1 Inductive Learning

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

BAB III ANALISA DAN DESAIN SISTEM

PENCARIAM JURUSAN SUBANG DENGAN ALGORITMA C 4.5 DAN DATA MINING STMIK SUBANG Timbo Faritcan Parlaungan Siallagan

S1 Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Maranatha

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

Versi Online tersedia di : JURNAL TECH-E (Online)

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

PRAKTIKUM KE-5 KLASIFIKASI I

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG


Bab I Pendahuluan. 1.1 Latar Belakang

BAB II LANDASAN TEORI

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

PERBANDINGAN ALGORITMA ID3 DAN C5.0 DALAM INDENTIFIKASI PENJURUSAN SISWA SMA

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

Transkripsi:

Materi Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Dosen Pengasuh Dr. Taufik Fuadi Abidin, M.Tech Dr. Muhammad Subianto, M.Si {tfa,subianto}@informatika.unsyiah.ac.id PENDAHULUAN Ada dua proses penting yang dilakukan saat melakukan klasifikasi. Proses yang pertama adalah learning (training) yaitu proses pembelajaran menggunakan training set. Untuk kasus Naïve Bayesian Classifier, perhitungan probabilitas dari data berdasarkan data pembelajaran dilakukan. Proses yang kedua adalah proses testing yaitu menguji model menggunakan data testing. Gambar berikut memperlihatkan alur dari kedua proses tersebut. Gambar 1. Tahapan Proses Klasifikasi Materi praktikum ini berkaitan dengan metode Decision Tree. Ada dua tahapan yang harus dilakukan bila klasifikasi dilakukan menggunakan metode ini. Pertama adalah membangun pohon keputusan (decision tree) dan kedua, membangun aturan (rule) dari pohon keputusan yang dibangun. Tree dibangun secara top-down recursive divide-and-conquer dan data dipartisi secara rekursif berdasarkan atribut yang dipilih secdara heuristics menggunakan pengukuran statistik information gain. Partisi data berhenti jika tidak ada lagi data sampel yang tersisa, tidak ada lagi atribut yang dapat dipartisi atau semua data masuk ke dalam kelas label yang sama. Perhitungan information gain untuk menentukan atribut split dilakukan sebagai berikut: Pilih atribut dengan nilai information gain tertinggi Jika S mengandung s i sample dari class C i untuk dimana i = {1,, m} Perhitungan besar informasi yang dibutuhkan untuk melakukan proses klasifikasi adalah: m si I(s,s2,...,sm )= log S 1 2 i= 1 s i S 1

Entropy dari atribut A dengan nilai {a 1, a 2,,a v } E(A) = v j= 1 s 1j +... + s S mj I(s 1j,...,s mj ) Information gain dihitung sebagai berikut: Gain(A) = I(s1,s 2,...,s m ) E(A) TUJUAN Tujuan dari praktikum ini adalah a) meningkatkan pemahaman mahasiswa terhadap metode Decision Tree (yang dalam perangkat lunak disebut dengan metode J48), b) memahami cara melakukan klasifikasi dengan metode Decision Tree (membangun tree) menggunakan perangkat lunak Weka dan c) Memahami hasil klasifikasi. Gambar 2. Tampilan GUI Weka KEGIATAN PRAKTIKUM 1. Pahami data contact-lense.arff yang disimpan dalam direktori data dimana aplikasi Weka di install. Data contact-lense.arff memiliki 4 atribut nominal (categorical) dan 1 klas label yang menerangkan apakah seseorang menggunakan hard contact lenses, soft contact lenses, atau tidak perlu menggunakan contact lenses. Buka file arff tersebut dengan menggunakan text editor (gedit, textpad atau vim) dan pelajari bagaimana data dalam format arff disusun. Perhatikan penjelasan di bagian atas file tersebut dan perhatikan pula bagian deklarasi seperti potongan pernyataan berikut: @relation contact-lenses @attribute age {young, pre-presbyopic, presbyopic} @attribute spectacle-prescrip {myope, hypermetrope} @attribute astigmatism {no, yes} @attribute tear-prod-rate {reduced, normal} @attribute contact-lenses {soft, hard, none} 2

@data % % 24 instances % young,myope,no,reduced,none young,myope,no,normal,soft young,myope,yes,reduced,none : : 2. Setelah anda memahami bagaimana data dalam format arff dari data contact-lense disusun, lakukan proses klasifikasi menggunakan metode J48. Sebagai acuan, berikut snapshot dari Weka setelah file contact-lense.arff dibuka. Gambar 3. Tampilan setelah dataset dibuka dalam Weka Lakukan observasi dan lanjutkan proses klasifikasi (classify) menggunakan metode Decision Tree (dalam software Weka disebut sebagai metode J48). Snapshot berikut memperlihatkan tampilan Weka setelah metode J48 dipilih. 3

Gambar 4. Tampilan setelah metode J48 dipilih Lakukan proses testing menggunakan training set itu sendiri dengan memilih Cross-validation sebagai Test Options. Set parameter folds = 10, hal ini berarti sistem akan mengacak data training set dan mengambil sebagian dari datanya untuk dijadikan testing set. Proses ini dilakukan sebanyak 10 kali dan hasil akhir merupakan akurasi rata-rata dari kesepuluh percobaan tersebut. Diskusikan hasil yang diperoleh dengan teman dan asisten. Lakukan tuning (perubahan) pada parameter di atas dan perhatikan hasilnya. Gambar 5. Hasil klasifikasi menggunakan Decision Tree (J48 di Weka) 4

Klik tombol mouse-kanan pada bagian seperti yang ditunjukkan oleh gambar berikut dan pilih Visualize Tree, maka pohon yang terbentuk akan ditampilkan. Right-click Gambar 6. Right-click dan pilih visualize tree Pohon keputusan ditampilkan sebagai berikut (pahami arti dari pohon tersebut). Gambar 7. Tree yang dibangun oleh metode Decision Tree (J48) 5

Ulangi observasi menggunakan Cross-validation dengan parameter folds = 5. Apakah terjadi perubahan yang signifikan terhadap akurasi? Ulangi juga proses klasifikasi menggunakan data weather.arff. Perhatikan nilai precision, recall, dan F-measurenya. - - - Happy Mining - - - 6