Metode Bayes. Tim Machine Learning

dokumen-dokumen yang mirip
Metode Bayes. Achmad Basuki PENS ITS 2006

PROBABILITAS DAN TEOREMA BAYES

BAB II TEORI PENUNJANG

Metode klasifikasi Naïve Bayes. Team teaching

Pengenalan Pola. Klasifikasi Naïve Bayes

ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

Pohon Keputusan. 6.1 Inductive Learning

Mesin Pembelajaran. Achmad Basuki PENS ITS 2006

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Algoritma Dasar. 4.1 Naive Bayes

ID3 : Induksi Decision Tree

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

Classification (1) Classification (3) Classification (2) Contoh Classification. Classification (4)

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009

UNIVERSITAS INDONESIA ANALISIS OPINI KONSUMEN BERBASIS FITUR DALAM BAHASA INDONESIA : STUDI KASUS PADA PRODUK GADGET E-COMMERCE KARYA AKHIR

Diktat Kuliah Data Mining - Institut Informatika Indonesia Semester Genap 2006/ Maret 2007 Sub Materi: ID3: Induksi Decision Tree

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Manfaat Pohon Keputusan

Classification. Decision Tree. Decision Tree. Konsep Decision Tree. Penggunaan Decision Tree. When To Consider Decision Tree?

Algoritma Data Mining (2) Tugas Klasifikasi

Bayesian Classifier. Bahan Kuliah Data Mining. Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Program Studi Teknik Informatika FMIPA Universitas Syiah Kuala

RULE MINING UNTUK KLASIFIKASI DATA MENGGUNAKAN SEARCH TREE

BAB II STUDI PUSTAKA

Teknik Pengklasifikasi : Bayesian, JST (ANN) Bertalya Universitas Gunadarma 2009

( ) ( ) (3) II-1 ( ) ( )

MKB3462 KECERDASAN BUATAN. Muhammad Zidny Naf an, M.Kom.

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

BAB II LANDASAN TEORI

SAINTEKBU: Jurnal Sains dan Teknologi Volume 9 No.2 Mei 2017 EVALUASI INTERNAL PROGRAM STUDI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC)

Klasifikasi. Diadaptasi dari slide Jiawei Han

Sebelumnya... Sistem Pakar berbasis Logika Fuzzy

KLASIFIKASI CALON PENDONOR DARAH MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (Studi Kasus : Calon Pendonor Darah di Kota Semarang)

PENERAPAN DATA MINING UNTUK MENGETAHUI EFEKTIFITAS PEMASANGAN IKLAN DI KOTA SOLO MENGGUNAKAN ALGORITMA NAÏVE BAYES. Makalah

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Indonesian Section 28 - Online activitites

Klasifikasi. Diadaptasi dari slide Jiawei Han

Bagian II. Algoritma Pembelajaran Mesin

BAB I PENDAHULUAN. 1.1 Latar Belakang

DIAGNOSA PENYAKIT SEPTICAEMIA EPIZOOTICA PADA SAPI TERNAK DENGAN TEOREMA BAYES

TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN R

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

NAIVE BAYES. Artinya Peluang kejadian X bersyarat Y ditentukan dari peluang Y terhadap X, peluang X, dan peluang Y. Posterior Evidence

BAB III METODE PENELITIAN

Algoritma Data Mining

ALGORITMA NAÏVE BAYES UNTUK MELIHAT FAKTOR-FAKTOR YANG MEMPENGARUHI KULIT TERBAKAR

BAB III LANDASAN TEORI. Deteksi emosi termasuk salah satu persoalan utama dalam affective computing

Budi Susanto Versi /08/2012. Teknik Informatika UKDW Yogyakarta

LAB MANAJEMEN DASAR MODUL STATISTIKA 1

KLASIFIKASI CALON PENDONOR DARAH MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

SISTEM PENDUKUNG PENGAMBILAN KEPUTUSAN MENGGUNAKAN METODE NAIVE BAYES (STUDI KASUS KREDIT SEPEDA MOTOR)

Pengenalan Pola. Klasifikasi Teori Keputusan Bayes

Statistik Bisnis 1. Week 9 Discrete Probability

Kata kunci: Klasifikasi, warna kulit, naïve bayes

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING

IMPLEMENTASI METODE NAÏVE BAYESPADA SPK UNTUK MEMPREDIKSI POLA KELULUSAN MAHASISWA PERGURUAN TINGGI SWASTA

DAFTAR ISI. BAB I PENDAHULUAN 1.1 Latar Belakang Tujuan Penelitian Manfaat Penelitian... 4

BAB II Dasar Teori II.1 Data Mining II.1.1 Pengantar Data Mining

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI

Sistem Pendukung Keputusan Untuk Mengevaluasi Internal Program Studi

Laporan Implementasi Naïve Bayes dan Feed Forward Neural Network untuk Klasifikasi

BAB III METODOLOGI PENELITIAN. Dataset

PERBANDINGAN 3 METODE DATA MINING DALAM PENCARIAN PENGETAHUAN KUALITAS PELAYANAN KESEHATAN BAGI PASIEN BPJS

Statistik Bisnis 1. Week 9 Discrete Probability Binomial and Poisson Distribution

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Dependent VS independent variable

KLASIFIKASI DATA PROSPEKTUS LOKASI WARALABA DENGAN ALGORITMA C4.5

HUBUNGAN ANTAR PEUBAH

Teknik Informatika UKDW Yogyakarta

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

M. Zidny Naf an Gasal 2016/2017

BAB 2 LANDASAN TEORI

MITIGASI RISIKO KREDIT : STUDI MODEL-MODEL SISTEM PENDUKUNG KEPUTUSAN PERMOHONAN KREDIT PADA KOPERASI SIMPAN PINJAM

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

ABSTRAK. Kata kunci: Spam, Android, Pesan, Java, Webservice. Universitas Kristen Maranatha

PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT

INFORMASI DATA REKAM MEDIS PASIEN DI RS BEDAH MITRA KABUPATEN LAMONGAN DENGAN METODE NAIVE BAYES DAN CLUSTERING DALAM PENENTUAN PENYAKIT HYPERTENSI

CONTOH KASUS DATA MINING

Statistik Bisnis 1. Week 8 Basic Probability

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

Decision Tree. Achmad Basuki, Iwan Syarif Politeknik Elektronika Negeri Surabaya PENS-ITS 2003

Pengujian Hipotesis - Sipil Geoteknik 2013 PENGUJIAN HIPOTESIS. Dr. Vita Ratnasari, M.Si 02/10/2013

Aplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition

BAB II TINJAUAN PUSTAKA

APLIKASI HOPFIELD NEURAL NETWORK UNTUK PRAKIRAAN CUACA

IDENTIFIKASI KERUSAKAN PANKREAS MELALUI IRIDOLOGY MENGGUNAKAN METODE BAYES UNTUK PENGENALAN DIABETES MELLITUS

Bab II Dasar Teori. 2.1 Estimasi Akurasi Classifier Metode Holdout

PENERAPAN DATA MINING UNTUK MENENTUKAN POTENSI HUJAN HARIAN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES

APLIKASI SURVEY POLITIK UNIVERSITAS BRAWIJAYA MALANG (ASUPOL) : STUDI KASUS PEMILIHAN BEM PTIIK 2012 (PEMILWA 2012)

Klasifikasi. Data Mining

Implementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier

BAB 3 PERANCANGAN. Tabel 3.1 Daftar Kategori dan Jumlah Dokumen Teks. Dokumen Bulutangkis 155 Basket 59 Otomotif 160 Sepakbola 767 Tenis 159

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam

PENCARIAN KEYWORD PAPER MENGGUNAKAN ALGORITMA BAYESIAN

Transkripsi:

Metode Bayes Tim Machine Learning

Mengapa Metode Bayes Metode Find-S tidak dapat digunakan untuk data yang tidak konsisten dan data yang bias, sehingga untuk bentuk data semacam ini salah satu metode sederhana yang dapat digunakan adalah metode bayes. Metode Bayes ini merupakan metode yang baik di dalam mesin pembelajaran berdasarkan data training, dengan menggunakan probabilitas bersyarat sebagai dasarnya.

Probabilitas Bersyarat S X XY Y P( X Y) P( X Y) P( Y) Probabilitas X di dalam Y adalah probabilitas interseksi X dan Y dari probabilitas Y, atau dengan bahasa lain P(X Y) adalah prosentase banyaknya X di dalam Y

Probabilitas Bersyarat Dalam Data # Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 Cerah Normal Pelan Ya 3 Hujan Tinggi Pelan Tidak 4 Cerah Normal Kencang Ya 5 Hujan Tinggi Kencang Tidak 6 Cerah Normal Pelan Ya Banyaknya data berolah-raga=ya adalah 4 dari 6 data maka dituliskan P(Olahraga=Ya) = 4/6 Banyaknya data cuaca=cerah dan berolah-raga=ya adalah 4 dari 6 data maka dituliskan P(cuaca=cerah dan Olahraga=Ya) = 4/6 4/ 6 P( cuaca cerah olahraga ya) 1 4/ 6

Probabilitas Bersyarat Dalam Data # Cuaca Temperatur Berolahraga 1 cerah normal ya 2 cerah tinggi ya 3 hujan tinggi tidak 4 cerah tinggi tidak 5 hujan normal tidak 6 cerah normal ya Banyaknya data berolah-raga=ya adalah 3 dari 6 data maka dituliskan P(Olahraga=Ya) = 3/6 Banyaknya data cuaca=cerah, temperatur=normal dan berolahraga=ya adalah 4 dari 6 data maka dituliskan P(cuaca=cerah, temperatur=normal, Olahraga=Ya) = 2/6 2/ 6 P( cuaca cerah, temperatur normal olahraga ya) 3/ 6 2 3

Metode Bayes X 1 Y X 2. X n P( X k Y ) i P( Y X P( Y k X ) i ) Keadaan Posteriror (Probabilitas Xk di dalam Y) dapat dihitung dari keadaan prior (Probabilitas Y di dalam Xk dibagi dengan jumlah dari semua probabilitas Y di dalam semua Xi)

HMAP HMAP (Hypothesis Maximum Appropri Probability) menyatakan hipotesa yang diambil berdasarkan nilai probabilitas berdasarkan kondisi prior yang diketahui. P( S X ) = argmax xx P( Y X ) P(X) P(X ) = argmax P( Y X ) P(X) xx HMAP adalah model penyederhanaan dari metode bayes yang disebut dengan Naive Bayes. HMAP inilah yang digunakan di dalam macine learning sebagai metode untuk mendapatkan hipotesis untuk suatu keputusan.

Contoh HMAP Diketahui hasil survey yang dilakukan sebuah lembaga kesehatan menyatakan bahwa 9 0% penduduk di dunia menderita sakit paru-paru. Dari 90% penduduk yang sakit paru-paru ini 60% adalah perokok, dan dari penduduk yang tidak menderita sakit paru-paru 20% perokok. Fakta ini bisa didefinisikan dengan: X=sakit paru-paru dan Y=perokok. Maka : P(X) = 0.9 P(~X) = 0.1 P(Y X) = 0.6 P(~Y X) = 0.4 P(Y ~X) = 0.2 P(~Y ~X) = 0.8 Dengan metode bayes dapat dihitung: P({Y} X) = P(Y X).P(X) = (0.6). (0.9) = 0.54 P({Y} ~X) = P(Y ~X) P(~X) = (0.2).(0.1) = 0.02 Bila diketahui seseorang merokok, maka dia menderita sakit paru-paru karana P({Y} X) lebih besar dari P({Y} ~X). HMAP diartikan mencari probabilitas terbesar dari semua instance pada attribut target atau semua kemungkinan keputusan. Pada persoalan keputusan adalah sakit paru-paru atau tidak.

HMAP Dari Data Training # Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 Cerah Normal Pelan Ya 3 Hujan Tinggi Pelan Tidak 4 Cerah Normal Kencang Ya 5 Hujan Tinggi Kencang Tidak 6 Cerah Normal Pelan Ya Asumsi: Y = berolahraga, X 1 = cuaca, X 2 = temperatur, X 3 = kecepatan angin. Fakta menunjukkan: P(Y=ya) = 4/6 P(Y=tidak) = 2/6

HMAP Dari Data Training # Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 Cerah Normal Pelan Ya 3 Hujan Tinggi Pelan Tidak 4 Cerah Normal Kencang Ya 5 Hujan Tinggi Kencang Tidak 6 Cerah Normal Pelan Ya Apakah bila cuaca cerah dan kecepatan angin kencang, orang akan berolahraga? Fakta: P(X1=cerah Y=ya) = 1, P(X1=cerah Y=tidak) = 0 P(X3=kencang Y=ya) = 1/4, P(X3=kencang Y=tidak) = 1/2 HMAP dari keadaan ini dapat dihitung dengan: P( X1=cerah,X3=kencang Y=ya ) = { P(X1=cerah Y=ya).P(X3=kencang Y=ya) }. P(Y=ya) = { (1). (1/4) }. (4/6) = 1/6 P( X1=cerah,X3=kencang Y=tidak ) = { P(X1=cerah Y=tidak).P(X3=kencang Y=tidak) }. P(Y=tidak) = { (0). (1/2) }. (2/6) = 0 KEPUTUSAN ADALAH BEROLAHRAGA = YA

Naïve Bayes Algorithm Naïve Bayes Algorithm (for discrete input attributes) has two phases 1. Learning Phase: Given a training set S, For eachtargetvalue of ci (ci c1,,cl ) Pˆ( C c ) estimatep( C c ) with examplesin S; i For everyattribute value x jk of eachattribute X Pˆ( Xj xjk C ci ) estimatep( Xj xjk C ci ) with examplesin S; Xj, Nj L Output: conditional probability tables; for elements X ( a 1,, a n ) 2. Test Phase: Given an unknown instance, Look up tables to assign the label c* to X if ˆ( ˆ( i ˆ( j ( j 1,, n; k 1,,N * * * * [ P a1 c ) P an c )] Pˆ( c ) [ P a1 c) P an c)] Pˆ( c), c c, c c1, ˆ( Classification is easy, just multiply probabilities Learning is easy, just create probability tables. j, c ) L

Tennis Example Example: Play Tennis

The learning phase for tennis example P(Play=Yes) = 9/14 Outlook Play=Yes Play=No Sunny 2/9 3/5 Overcast 4/9 0/5 Rain 3/9 2/5 Humidity Play=Ye s Play=N o High 3/9 4/5 Normal 6/9 1/5 P(Play=No) = 5/14 We have four variables, we calculate for each we calculate the conditional probability table Temperatur e Play=Yes Play=No Hot 2/9 2/5 Mild 4/9 2/5 Cool 3/9 1/5 Wind Play=Yes Play=No Strong 3/9 3/5 Weak 6/9 2/5

The test phase for the tennis example Test Phase Given a new instance of variable values, x =(Outlook=Sunny, Temperature=Cool, Humidity=High, Wind=Strong) Given calculated Look up tables P(Outlook=Sunny Play=Yes) = 2/9 P(Temperature=Cool Play=Yes) = 3/9 P(Huminity=High Play=Yes) = 3/9 P(Wind=Strong Play=Yes) = 3/9 P(Play=Yes) = 9/14 P(Outlook=Sunny Play=No) = 3/5 P(Temperature=Cool Play==No) = 1/5 P(Huminity=High Play=No) = 4/5 P(Wind=Strong Play=No) = 3/5 P(Play=No) = 5/14 Use the MAP rule to calculate Yes or No P(Yes x ): [P(Sunny Yes)P(Cool Yes)P(High Yes)P(Strong Yes)]P(Play=Yes) = 0.0053 P(No x ): [P(Sunny No) P(Cool No)P(High No)P(Strong No)]P(Play=No) = 0.0206 Given the fact P(Yes x ) < P(No x ), we label x to be No.

An Example of the Naïve Bayes Classifier The weather data, with counts and probabilities outlook temperature humidity windy play yes no yes no yes no yes no yes no sunny 2 3 hot 2 2 high 3 4 false 6 2 9 5 overcast 4 0 mild 4 2 normal 6 1 true 3 3 rainy 3 2 cool 3 1 sunny 2/9 3/5 hot 2/9 2/5 high 3/9 4/5 false 6/9 2/5 9/14 5/14 overcast 4/9 0/5 mild 4/9 2/5 normal 6/9 1/5 true 3/9 3/5 rainy 3/9 2/5 cool 3/9 1/5 A new day outlook temperature humidity windy play sunny cool high true?

Likelihood of yes 2 3 3 3 9 9 9 9 9 14 Likelihood of no 3 5 1 5 4 5 3 5 5 14 0.0053 Therefore, the prediction is No 0.0206

The Naive Bayes Classifier for Data Sets with Numerical Attribute Values One common practice to handle numerical attribute values is to assume normal distributions for numerical attributes.

The numeric weather data with summary statistics outlook temperature humidity windy play yes no yes no yes no yes no yes no sunny 2 3 83 85 86 85 false 6 2 9 5 overcast 4 0 70 80 96 90 true 3 3 rainy 3 2 68 65 80 70 64 72 65 95 69 71 70 91 75 80 75 70 72 90 81 75 sunny 2/9 3/5 mean 73 74.6 mean 79.1 86.2 false 6/9 2/5 9/14 5/14 overcast 4/9 0/5 std dev rainy 3/9 2/5 6.2 7.9 std dev 10.2 9.7 true 3/9 3/5

Let x 1, x 2,, x n be the values of a numerical attribute in the training data set. 2 2 2 1 ) ( 1 1 1 1 2 1 w e w f x n x n n i i n i i

For examples, f temperature 66 Yes Likelihood of Yes = 2 9 1 2 6.2 0.03400.0221 e 6673 2 2 6.2 2 0. 0340 3 9 9 14 0.000036 Likelihood of No = 3 5 0.0291 0.038 3 5 5 14 0.000136

Kelemahan Metode Bayes Metode Bayes hanya bisa digunakan untuk persoalan klasifikasi dengan supervised learning. Metode Bayes memerlukan pengetahuan awal untuk dapat mengambil suatu keputusan. Tingkat keberhasilan metode ini sangat tergantung pada pengetahuan awal yang diberikan.

Beberapa Aplikasi Metode Bayes Menentukan diagnosa suatu penyakit berdasarkan data-data gejala (sebagai contoh hipertensi atau sakit jantung). Mengenali buah berdasarkan fitur-fitur buah seperti warna, bentuk, rasa dan lain-lain Mengenali warna berdasarkan fitur indeks warna RGB Mendeteksi warna kulit (skin detection) berdarkan fitur warna chrominant Menentukan keputusan aksi (olahraga, art, psikologi) berdasarkan keadaan. Menentukan jenis pakaian yang cocok untuk keadaan-keadaan tertentu (seperti cuaca, musim, temperatur, acara, waktu, tempat dan lain-lain) Menentukan ekspresi (sedih, gembira, dll) dari kalimat yang diucapkan