MMA10991 Topik Khusus - Machine Learning Perangkat Lunak - Weka* Dr. rer. nat. Hendri Murfi * Beberapa bagian dari slide ini adalah terjemahan dari slide Data Mining oleh I. H. Witten, E. Frank dan M. A. Hall Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. hendri@ui.ac.id Weka Weka adalah perangkat lunak machine learning yang ditulis dalam bahasa Java Didistribusikan berdasarkan the GNU Public License Fitus utama: Memiliki fasilitas yang komprehensif untuk analisa data, yaitu perangkat pre-processing data, algoritma pembelajaran, serta metode-metode evaluasi Memiliki interface grafis (GUI), termasuk untuk visualisasi data Memiliki lingkungan untuk membandingkan algoritmaalgoritma pembelajaran 2
@relation heart-disease-simplified Format Data Flat File dalam Format ARFF @attribute age numeric @attribute sex { female, male} @attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric @attribute exercise_induced_angina { no, yes} @attribute class { present, not_present} @data 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present... 3 @relation heart-disease-simplified Format Data Flat File dalam Format ARFF @attribute age numeric @attribute sex { female, male} @attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina} @attribute cholesterol numeric @attribute exercise_induced_angina { no, yes} @attribute class { present, not_present} @data 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present... 4
Menu Utama, Experimenter, KnowledgeFlow, Simple CLI 5 GUI, Experimenter, KnowledgeFlow, Simple CLI 6
Menu Preprocess Data dapat diimpor dari file dengan beberapa format, yaitu: ARFF, CSV, C4.5, Binary. Data juga dapat dibaca dari alamat URL atau dari suatu database Perangkat pre-processing pada Weka disebut filters. Weka memiliki filter yang dapat digunakan untuk: Diskritisasi, Normalisasi, Resampel, pemilihan atribut/fitur, Dll Distribusi data dapat dilihat dengan cara melakukan visualisasi 7 Menu Preprocess 8
Menu Preprocess: Membuka Data 9 Menu Preprocess: Informasi Atribut/Fitur 10
Menu Preprocess: Informasi Atribut/Fitur 11 Menu Preprocess: Visualisasi Semua Atribut/Fitur 12
Menu Preprocess: Visualisasi Semua Atribut/Fitur 13 Menu Preprocess: Filter 14
Menu Preprocess: Filter 15 Menu Preprocess: Filter 16
Menu Preprocess: Filter 17 Menu Preprocess: Filter 18
Menu Preprocess: Filter 19 Menu Preprocess: Filter 20
Menu Preprocess: Filter 21 Menu Preprocess: Filter 22
Menu Preprocess: Filter 23 Menu Preprocess: Filter 24
Menu Preprocess: Filter 25 Menu Preprocess: Filter 26
Menu Classify Classifiers pada Weka adalah model-model untuk memprediksi nilai-nilai nominal (klasifikasi) atau numerik (regresi) Machine learning yang diimplementasikan adalah: Decision tree, instance-based classifiers, support vector machines, multi-layer perceptrons, Bayes' nets, rule,... Meta -classifiers yang diimplemntasikan adalah: Filtered classifier, CVParameterselection, Gridsearch, Boosting,... 27 Menu Classify 28
Menu Classify: Pemilihan Classifier 29 Menu Classify: Pemilihan Classifier 30
Menu Classify: Pemilihan Classifier 31 Menu Classify: Pemilihan Model 32
Menu Classify: Pemilihan Model dan Kernel 33 Menu Classify: Pemilihan Skema Testing 34
Menu Classify: Pemilihan Skema Testing 35 Menu Classify: Run/Start 36
Menu Classify: Hasil 37 Menu Classify: Hasil 38
Menu Classify: Visualisasi Hasil/Error 39 Menu Classify: Visualisasi Hasil/Error 40
Menu Select attributes Menu yang dapat digunakan untuk melakukan investigasi atribut/fitur mana yang paling berdaya guna Metode pemilihan atribut/fitur terdiri dari dua bagian: Metode evaluasi: PrincipalComponents, LatentSemanticAnalysis, SVMAtributEval,... Metode pecarian: BestFirst, RandomSearch, GeneticSearch, RankSearch,... 41 Menu Classify: Menyimpan atau Memanggil Kembali Model 42
Menu Select attributes Menu yang dapat digunakan untuk melakukan investigasi atribut/fitur mana yang paling berdaya guna Metode pemilihan atribut/fitur terdiri dari dua bagian: Metode evaluasi: PrincipalComponents, LatentSemanticAnalysis, SVMAtributEval,... Metode pecarian: BestFirst, RandomSearch, GeneticSearch, RankSearch,... 43 Menu Select attributes: Pemilihan Metode Evaluasi dan Pencarian 44
Menu Select attributes: Run/Start 45 Menu Select attributes: Hasil 46
Menu Visualize Visualisasi dangan berguna pada machine learning pada tataran praktis, misal: membantu menentukan tingkat kesulitan dari masalah yang akan di olah Weka dapat melakukan visualisasi dalam bentuk satu atribut/fitur (1-d) atau pasangan atribut/fitur (2-d) Fasilitas lain: Nilai-nilai kelas yang berbeda warna Fungsi zoom-in 47 Menu Visualize: Single Atribut/Fitur 48
Menu Visualize: Pasangan Atribut/Fitur 49 Menu Visualize: Pasangan Atribut/Fitur 50
Menu Visualize: Pasangan Atribut/Fitur 51 Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 52
Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 53 Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 54
Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 55 Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 56
Menu Visualize: Pasangan Atribut/Fitur - Zoom-in 57