Perangkat Lunak - Weka*

dokumen-dokumen yang mirip
BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

Model Linear untuk Regresi

Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala

SVM untuk Regresi Ordinal

Neural Networks. Machine Learning

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

Pendahuluan : Evaluasi*

Model Linear untuk Klasifikasi

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

PENERAPAN METODE DECISION TREE(DATA MINING) UNTUK MEMPREDIKSI TINGKAT KELULUSAN SISWA SMPN1 KINTAMANI

Metode Kernel. Machine Learning

BUKU RANCANGAN PEMBELAJARAN

BAB II LANDASAN TEORI

Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu

SATUAN ACARA PERKULIAHAN UNIVERSITAS GUNADARMA

PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R)

BAB 1 PENDAHULUAN. Sudah tidak diragukan lagi bahwa penerapan teknologi komputer dan teknologi informasi

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

SVM untuk Regresi. Machine Learning

Perbandingan Kinerja Algoritma Decision Tree dan Naive Bayes dalam Prediksi Kebangkrutan

BAB 2 TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG

BAB 3 METODE PENELITIAN

Sebuah lingkungan untuk machine learning, data mining, text mining dan predictive analytics. Machine learning

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV HASIL DAN PEMBAHASAN

KOMPORASI METODE KLASIFIKASI DATA MINING UNTUK PREDIKSI PENYAKIT JANTUNG

Laporan Implementasi Naïve Bayes dan Feed Forward Neural Network untuk Klasifikasi

BAB I PENDAHULUAN 1.1 Latar Belakang

Pendahuluan* Data vs Informasi

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU

Studi Kasus Klasifikasi Hutan

TEKNIK DATA MINING UNTUK MENDAPATKAN INFORMASI DARI KELUARAN PERANGKAT JARINGAN


BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

Bab I Pendahuluan. 1.1 Latar Belakang

ABSTRAK. Kata kunci: Sistem Pakar, Pembelajaran Mesin, Weka, Support Vector Machine, Regresi Logistik, Demam Berdarah, Malaria, Typhus

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

MACHINE LEARNING MULTI KLASIFIKASI CITRA DIGITAL

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

BAB I PENDAHULUAN. 1.1 Latar Belakang

TINJAUAN PUSTAKA. Definisi Data Mining

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

Data Mining II Estimasi

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

BAB I PENDAHULUAN. masalah kecerdasan, desain, pemilihan, implementasi, dan monitoring (Tripathi,

APLIKASI ALGORITMA CLASSIFY-BY-SEQUENCE UNTUK PENILAIAN KREDIT PADA BANK Y. Mohammad Iqbal 1. Abstrak

BAB I PENDAHULUAN 1.1 Latar Belakang

ii Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis

IMPLEMENTASI TEKNIK DATA MINING DENGAN MENGGUNAKAN METODE DECISION TREE UNTUK PREDIKSI PENENTUAN RESIKO KREDIT

BAB I PENDAHULUAN. Universitas Sumatera Utara

BAB III METODE PENELITIAN

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB II LANDASAN TEORI

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BENCHMARKING ALGORITMA PEMILIHAN ATRIBUT PADA KLASIFIKASI DATA MINING

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN Latar Belakang

Penerapan Data Mining dalam Memprediksi Pembelian cat

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS MENGGUNAKAN METODE NAIVE BAYES.

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

ABSTRAK. Kata kunci: Spam, Android, Pesan, Java, Webservice. Universitas Kristen Maranatha

Analisis Pola Pemilihan Konsentrasi Ilmu Jurusan Sistem Informasi Di STMIK TIME

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Sistem Komputer. Komponen Sistem Komputer. Pengertian Sistem Operasi (SO) DEFENISI SISTEM OPERASI 21/03/2014

SISTEM INFORMASI GEOGRAFIS UNTUK PEMETAAN DAN ANALISADAERAH PERTANIAN DI KABUPATEN PONOROGO

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB III ANALISA DAN PERANCANGAN SISTEM

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

BAB 2 LANDASAN TEORI

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

BAB II TINJAUAN PUSTAKA

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

BAB 3 CARA PENGOLAHAN DATA. Cara pengolahan data secara garis besar terbagi menjadi 2 tahap yaitu tahap

IMPLEMENTASI ANTAR MUKA APLIKASI DATA MINING ALGORITHM COLLECTION DAN MODUL PREPROCESSING DATA SKRIPSI YOGI KURNIA

Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit

PENGKLASIFIKASIAN TINGKAT DANGEROUS DRIVING BEHAVIOR MENGGUNAKAN DATA ELEKTROENSEFALOGRAFI (EEG) DENGAN PENDEKATAN MACHINE LEARNING

Penerapan Algoritma C4.5 untuk Klasifikasi Tingkat Keganasan Kanker Payudara

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG

BAB I PENDAHULUAN 1.1 Latar Belakang

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

SISTEM INFORMASI GEOGRAFIS UNTUK PEMETAAN DAN ANALISADAERAH PERTANIAN DI KABUPATEN PONOROGO

ANALISA PERBANDINGAN ALGORITMA SVM, NAIVE BAYES, DAN DECISION TREE DALAM MENGKLASIFIKASIKAN SERANGAN (ATTACKS) PADA SISTEM PENDETEKSI INTRUSI

PREDIKSI UMUR BUG DALAM POYEK PENGEMBANGAN PERANGKAT LUNAK

SVM untuk Ranking. Model Linear

Transkripsi:

MMA10991 Topik Khusus - Machine Learning Perangkat Lunak - Weka* Dr. rer. nat. Hendri Murfi * Beberapa bagian dari slide ini adalah terjemahan dari slide Data Mining oleh I. H. Witten, E. Frank dan M. A. Hall Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. hendri@ui.ac.id Weka Weka adalah perangkat lunak machine learning yang ditulis dalam bahasa Java Didistribusikan berdasarkan the GNU Public License Fitus utama: Memiliki fasilitas yang komprehensif untuk analisa data, yaitu perangkat pre-processing data, algoritma pembelajaran, serta metode-metode evaluasi Memiliki interface grafis (GUI), termasuk untuk visualisasi data Memiliki lingkungan untuk membandingkan algoritmaalgoritma pembelajaran 2

@relation heart-disease-simplified Format Data Flat File dalam Format ARFF @attribute age numeric @attribute sex { female, male} @attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric @attribute exercise_induced_angina { no, yes} @attribute class { present, not_present} @data 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present... 3 @relation heart-disease-simplified Format Data Flat File dalam Format ARFF @attribute age numeric @attribute sex { female, male} @attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric @attribute exercise_induced_angina { no, yes} @attribute class { present, not_present} @data 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present... 4

Menu Utama, Experimenter, KnowledgeFlow, Simple CLI 5 GUI, Experimenter, KnowledgeFlow, Simple CLI 6

Menu Preprocess Data dapat diimpor dari file dengan beberapa format, yaitu: ARFF, CSV, C4.5, Binary. Data juga dapat dibaca dari alamat URL atau dari suatu database Perangkat pre-processing pada Weka disebut filters. Weka memiliki filter yang dapat digunakan untuk: Diskritisasi, Normalisasi, Resampel, pemilihan atribut/fitur, Dll Distribusi data dapat dilihat dengan cara melakukan visualisasi 7 Menu Preprocess 8

Menu Preprocess: Membuka Data 9 Menu Preprocess: Informasi Atribut/Fitur 10

Menu Preprocess: Informasi Atribut/Fitur 11 Menu Preprocess: Visualisasi Semua Atribut/Fitur 12

Menu Preprocess: Visualisasi Semua Atribut/Fitur 13 Menu Preprocess: Filter 14

Menu Preprocess: Filter 15 Menu Preprocess: Filter 16

Menu Preprocess: Filter 17 Menu Preprocess: Filter 18

Menu Preprocess: Filter 19 Menu Preprocess: Filter 20

Menu Preprocess: Filter 21 Menu Preprocess: Filter 22

Menu Preprocess: Filter 23 Menu Preprocess: Filter 24

Menu Preprocess: Filter 25 Menu Preprocess: Filter 26

Menu Classify Classifiers pada Weka adalah model-model untuk memprediksi nilai-nilai nominal (klasifikasi) atau numerik (regresi) Machine learning yang diimplementasikan adalah: Decision tree, instance-based classifiers, support vector machines, multi-layer perceptrons, Bayes' nets, rule,... Meta -classifiers yang diimplemntasikan adalah: Filtered classifier, CVParameterselection, Gridsearch, Boosting,... 27 Menu Classify 28

Menu Classify: Pemilihan Classifier 29 Menu Classify: Pemilihan Classifier 30

Menu Classify: Pemilihan Classifier 31 Menu Classify: Pemilihan Model 32

Menu Classify: Pemilihan Model dan Kernel 33 Menu Classify: Pemilihan Skema Testing 34

Menu Classify: Pemilihan Skema Testing 35 Menu Classify: Run/Start 36

Menu Classify: Hasil 37 Menu Classify: Hasil 38

Menu Classify: Visualisasi Hasil/Error 39 Menu Classify: Visualisasi Hasil/Error 40

Menu Select attributes Menu yang dapat digunakan untuk melakukan investigasi atribut/fitur mana yang paling berdaya guna Metode pemilihan atribut/fitur terdiri dari dua bagian: Metode evaluasi: PrincipalComponents, LatentSemanticAnalysis, SVMAtributEval,... Metode pecarian: BestFirst, RandomSearch, GeneticSearch, RankSearch,... 41 Menu Classify: Menyimpan atau Memanggil Kembali Model 42

Menu Select attributes Menu yang dapat digunakan untuk melakukan investigasi atribut/fitur mana yang paling berdaya guna Metode pemilihan atribut/fitur terdiri dari dua bagian: Metode evaluasi: PrincipalComponents, LatentSemanticAnalysis, SVMAtributEval,... Metode pecarian: BestFirst, RandomSearch, GeneticSearch, RankSearch,... 43 Menu Select attributes: Pemilihan Metode Evaluasi dan Pencarian 44

Menu Select attributes: Run/Start 45 Menu Select attributes: Hasil 46

Menu Visualize Visualisasi dangan berguna pada machine learning pada tataran praktis, misal: membantu menentukan tingkat kesulitan dari masalah yang akan di olah Weka dapat melakukan visualisasi dalam bentuk satu atribut/fitur (1-d) atau pasangan atribut/fitur (2-d) Fasilitas lain: Nilai-nilai kelas yang berbeda warna Fungsi zoom-in 47 Menu Visualize: Single Atribut/Fitur 48

Menu Visualize: Pasangan Atribut/Fitur 49 Menu Visualize: Pasangan Atribut/Fitur 50

Menu Visualize: Pasangan Atribut/Fitur 51 Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 52

Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 53 Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 54

Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 55 Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 56

Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 57