Pendahuluan : Evaluasi*

dokumen-dokumen yang mirip
Neural Networks. Machine Learning

Model Linear untuk Regresi

Model Linear untuk Klasifikasi

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

Metode Kernel. Machine Learning

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN. Dataset

SVM untuk Regresi Ordinal

BAB II LANDASAN TEORI

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

TINJAUAN PUSTAKA. Definisi Data Mining

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Perangkat Lunak - Weka*

Penerapan Klasifikasi Decision Tree dan Model Log Linear dalam Penanganan Kecelakaan Kerja

SVM untuk Regresi. Machine Learning

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

BAB 4 IMPLEMENTASI DAN PENGUJIAN

BAB II TINJAUAN PUSTAKA

BAB IX ANALISIS REGRESI

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

TES DIAGNOSTIK (DIAGNOSTIC TEST)

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

BAB 3 METODE PENELITIAN

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

UJI RATA-RATA SATU SAMPEL MENGGUNAKAN R UNTUK MENGETAHUI PENGARUH MODEL BELAJAR TERHADAP HASIL BELAJAR MATA KULIAH ANALISIS VEKTOR

Uji Hipotesa. Arna Fariza. Materi

Apa itu suatu Hypothesis?

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB IV ANALISIS HASIL DAN PEMBAHASAN

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

BAB 4 HASIL DAN PEMBAHASAN

Radial Basis Function Networks

BAB IV EKSPERIMEN. 4.1 Tujuan

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

BAB. III. ANALISA PERMASALAHAN

Bab IV. Pembahasan dan Hasil Penelitian

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah

BAB IV HASIL ANALISIS DAN PEMBAHASAN. Tabel 4. Berdasarkan tabel diatas dapat diketahui bahwa variabel harga saham (Y)

PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI)

PENDAHULUAN TINJAUAN PUSTAKA

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

BUKU RANCANGAN PEMBELAJARAN

Keoptimalan Naïve Bayes Dalam Klasifikasi

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Pertemuan 8 STATISTIKA INDUSTRI 2 08/11/2013. Introduction to Linier Regression. Introduction to Linier Regression. Introduction to Linier Regression

MA5283 STATISTIKA Bab 3 Inferensi Untuk Mean

PREDIKSI PELAPORAN PENCURIAN KENDARAAN BERMOTOR BERBASIS LINIER REGRESI BERGANDA DI KOTA SEMARANG

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

BAB 2 LANDASAN TEORI

BAB I 1 PENDAHULUAN. atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi

BAB IV HASIL DAN PEMBAHASAN. Pada bab ini, akan dipaparkan mengenai hasil penelitian mengenai cara

Sumber : Hasil olah data,2009

Statistika Industri II TIP - FTP UB

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

Kumpulan pasangan nilai-nilai dari variabel acak X dengan probabilitas nilai-nilai variabel random X, yaitu P(X=x) disebut distribusi probabilitas X

Tidur Malam. 2. Nyatakan hipotesis nol dan hipotesis alternatif untuk menginvestigasi pertanyaan ini. Hipotesis Nol :

PERENCANAAN PRODUKSI

LAMPIRAN A. Angket Penelitian

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB 2 LANDASAN TEORI

APLIKASI PREDIKSI PEMINATAN SMAN 8 BANDUNG MENGGUNAKAN METODE KLASIFIKASI DENGAN ALGORITMA ID3

BAB IV ANALISIS HASIL DAN PEMBAHASAN. penelitian ini meliputi jumlah sampel (N), nilai minimum, nilai maksimum,

BAB IV ANALISA DAN PEMBAHASAN

BAB III METODELOGI PENELITIAN

Studi Kasus Sistem Rekomendasi

BAB III METODE PENELITIAN

DUKUNGAN SOSIAL. Item-Total Statistics

PERTEMUAN 2-3 SIFAT DASAR ANALISIS REGRESI

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

BAB 2 TINJAUAN PUSTAKA

BAB IV ANALISIS HASIL

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Studi Kasus Klasifikasi Hutan

28/09/2012 SAMPLE SPACE, SAMPLE POINTS, EVENTS. ω Ω

BAB IV HASIL DAN PEMBAHASAN

BAB 2 TINJAUAN PUSTAKA

DISTRIBUSI TEORITIS. P(M) = p = probabilitas untuk mendapat bola merah (sukses) 30

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

APLIKASI PREDIKSI KELULUSAN MAHASISWA DENGAN METODE LINEAR DISCRIMINANT ANALYSIS

KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR

III. METODOLOGI PENELITIAN. dan verifikatif. Metode deskriptif adalah studi untuk menentukan fakta dengan

BAB 3 METODOLOGI. seseorang. Hal inilah yang mendorong adanya perkembangan teknologi

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. Dana Pihak Ketiga (DPK) dan Non Performing Financing (NPF) dapat dilihat

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. Textile dan Otomotif yang terdaftar di BEI periode tahun

BAB I PENDAHULUAN 1.1. Latar Belakang

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

SVM untuk Ranking. Model Linear

Transkripsi:

MMA10991 Topik Khusus - Machine Learning Pendahuluan : Evaluasi* Dr. rer. nat. Hendri Murfi * Beberapa bagian dari slide ini adalah terjemahan dari slide Data Mining oleh I. H. Witten, E. Frank dan M. A. Hall Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. hendri@ui.ac.id Evaluasi Seberapa prediktif model yang sudah terbentuk? Dengan kata lain berapa kapabilitas generalisasi dari model yang terbentuk? Akurasi pada data training bukan merupakan indikator kinerja model untuk data di masa yang akan datang Jika kita memiliki cukup banyak data, solusi sederhana yang dapat digunakan adalah bagi data menjadi data training dan data testing. Selanjutnya evaluasi akurasi pada data testing. Akan tetapi, data biasanya terbatas, sehingga diperlukan teknikteknik yang lebih tepat 2

Evaluasi Asumsi: baik data training dan data testing adalah sampelsample yang representatif untuk masalah yang dihadapi Data testing adalah data independen yang tidak terlibat dalam pembentukan model Data training dan data testing boleh jadi memiliki karakteristik yang berbeda Contoh: untuk mengestimasi kinerja suatu model dari kota A pada data kota lain yang berbeda, maka uji model tersebut pada data dari kota B 3 Evaluasi Setelah proses evaluasi selesai, semua data (training + testing) digunakan untuk membangun model akhir Secara umum, semakin besar data training maka akan semakin baik kinerja model Sementara itu, semakin besar data testing maka akan semakin akurat estimasi kinerja Machine Learning diharapkan handal untuk data training yang kecil 4

Isu-Isu Pada Evaluasi Prosedur estimasi kinerja: holdout, cross-validation, bootstrap Ukuran estimasi kinerja: Klasifikasi: success rate, cost-sensitive,... Regresi: MSE, RMSE, MAE, RSE, RAE,... Regresi Ordinal, Ranking, Estimasi Densitas,... Kehandalan estimasi kinerja: confidence interval Perbandingan skema pembelajaran: t-test 5 Prosedur Estimasi Kinerja Metode Holdout Metode holdout membagi sejumlah data untuk testing dan menggunakan sisinya untuk training Umumnya: sepertiga untuk testing, sisanya untuk training Masalah: sample-sample tsb boleh jadi tidak representatif Contoh: suatu kelas bisa jadi tidak ada pada data testing Solusi: menggunakan metode stratification Menjamin bahwa masing-masing kelas direpresentasikan dengan proporsi hampir sama pada kedua bagian data 6

Prosedur Estimasi Kinerja Metode Repeated Holdout Metode holdout dapat dibuat lebih handal dengan mengulang proses untuk subsampel yang berbeda Pada setiap iterasi, suatu proporsi tertentu dipilih secara acak untuk training Kinerja pada setiap iterasi dirata-rata untuk mendapatkan estimasi kinerja total Metode ini disebut repeated holdout Masih tidak optimal: kemungkinan terjadi tumpang tindih pada data testing pada masing-masing iterasi 7 Prosedur Estimasi Kinerja K-Fold Cross-Validation Metode cross-validation akan menghindari tumpang tindih pada data testing Tahap 1: bagi data menjadi k bagian dengan ukuran yang sama Tahap 2: gunakan masing-masing bagian untuk testing, sisanya sebagai training Metode seperti ini dikenal sebagai k-fold cross validation Biasanya digunakan metode stratification sebelum proses crossvalidation dilaksanakan Estimasi tingkat kesuksesan dirata-rata untuk mendapatkan estimasi total 8

Prosedur Estimasi Kinerja 10-Fold Cross-Validation Metode standar untuk evaluasi adalah 10-fold cross-validation Kenapa 10? Banyak hasil eksperiment menunjukan bahwa ini adalah pilihan terbaik untuk mendapatkan estimasi yang akurat Ada juga beberapa bukti teoritis untuk ini Proses stratification akan mereduksi variansi estimasi 5-fold atau 20-fold sering juga memberikan hasil yang hampir sama 9 Prosedur Estimasi Kinerja Leave-One-Out Cross-Validation Leave-One -Out adalah bentuk khusus dari cross-validation, yaitu jumlah fold sama dengan jumlah data training Tidak ada proses acak dalam menentukan subsampel Membutuhkan biaya komputasi yang sangat mahal Diutamakan untuk data yang sangat kecil 10

Ukuran Estimasi Kinerja Klasifikasi Success Rate Satuan ukuran estimasi kinerja yang umum digunakan untuk masalah klasifikasi adalah tingkat kesuksesan (success rate) Sukses: kelas suatu data diprediksi dengan benar Gagal/Error: kelas suatu data dipredikasi dengan tidak benar Success rate: proporsi kesuksesan terhadap semua data 11 Ukuran Estimasi Kinerja Klasifikasi Confusion Matrix Confusion matrix: Actual class Yes No Predicted class Yes No True positive False negative False positive True negative True positive rate: TP/(TP+FN) False positive rate: FP/(FP+TN) Success rate: (TP+TN)/(TP+TN+FP+FN) Error rate: 1 Success rate 12

Ukuran Estimasi Kinerja Klasifikasi Kappa Statistic Misal confusion matrix untuk actual predictor (kiri) vs. random predictor (kanan) adalah: Jumlah sukses: jumlah entri pada diagonal (D) Kappa statistic: Ukuran peningkatan kinerja relatif terhadap D random predictor observed D random D perfect D random 13 Ukuran Estimasi Kinerja Klasifikasi ROC Curve Receiver Operating Characteristic (ROC) Curve adalah suatu kurva yang mengambarkan estimasi kinerja klasifikasi untuk proporsi false positives vs true positives yang bervariasi Jagged curve : one set of test data Smooth curve : use cross-validation 14

Ukuran Estimasi Kinerja Klasifikasi ROC Curve For a small, focused sample, use method A For a larger one, use method B In between, choose between A and B with appropriate probabilities 15 Ukuran Estimasi Kinerja Klasifikasi Klasifikasi dengan Costs Dalam prakteknya, berbagai jenis kesalahan klasifikasi sering dikenakan biaya (cost) yang berbeda Contoh: Promotional mailing Terrorist profiling Loan decisions Fault diagnosis 16

Ukuran Estimasi Kinerja Klasifikasi Cost Matrix Contoh dua cost matrices: Success rate diganti dengan rata-rata biaya setiap prediksi Cost diberikan oleh entri yang sesuai pada cost matrix 17 Ukuran Estimasi Kinerja Klasifikasi Lift Charts Pada prakteknya, cost jarang diketahui Keputusan biasanya diambil dengan membandingkan skenario yang mungkin Contoh: surat promosi ke 1000000 rumah Kirim ke semua (100%) 1000 yang merespon (0.1%) Kirim ke 100000 (10%) 400 yang merespon (0.4%) Kirim ke 400000 (40%) 800 yang merespon (0.2%) Lift factor adalah faktor peningkatan respon, misal 4 pada kasus- 2, dan 2 pada kasus-3. Lift chart memungkinkan perbadingan secara visual. 18

Ukuran Estimasi Kinerja Klasifikasi Lift Charts 40% of responses for 10% of cost 80% of responses for 40% of cost 19 Ukuran Estimasi Kinerja Regresi Mean-Squared Error Satuan ukuran estimasi kinerja yang populer digunakan untuk masalah regresi adalah mean-squared error Nilai-nilai target sebenarnya: a 1, a 2,..., a n Nilai-nilai target hasil prediksi: p 1, p 2,..., p n Mean-Squared Error: p 1 a 1 2... p n a n 2 n 20

Ukuran Estimasi Kinerja Regresi Satuan Ukuran Kinerja Lain Root mean-squared error: p a 2 1 1... p n a n 2 n Mean absolute arror kurang sensitif terhadap outlier dibandingkan mean-squared error: p 1 a 1... p n a n n 21 Ukuran Estimasi Kinerja Regresi Satuan Ukuran Kinerja Lain Kadang-kadang relative error lebih cocok untuk suatu keadaan, misal: 10% untuk error dari 50 ketika memprediksi 500. Relative squared error: p 1 a 1 2... p n a n 2 a a 1 2... a a n 2 Relative absolute error: p 1 a 1... p n a n a a 1... a a n 22

Ukuran Estimasi Kinerja Regresi Satuan Ukuran Kinerja Lain Statistical correlation antara nilai sebenarnya dan nilai prediksi: S PA S P S A S PA = i p i p a i a n 1 S P = i p i p 2 n 1 S A = i a i a 2 n 1 Memiliki skala: -1 sd +1. Kinerja yang baik memiliki nilai yang besar. 23 Ukuran Estimasi Kinerja Regresi Satuan Ukuran Kinerja Terbaik? Terbaik adalah dengan melihat semua satuan ukuran kinerja tsb Contoh: A B C D Root mean-squared error 67.8 91.7 63.3 57.4 Mean absolute error 41.3 38.5 33.4 29.2 Root rel squared error 42.2% 57.2% 39.4% 35.8% Relative absolute error 43.1% 40.1% 34.8% 30.4% Correlation coefficient 0.88 0.88 0.89 0.91 D terbaik, C terbaik kedua, A & B dapat diperdebatkan 24

Kehandalan Estimasi Kinerja Asumsikan estimasi kesuksesan adalah 75%. Seberapa dekat hasil estimasi ini terhadap tingkat kesuksesan sebenarnya? Tergantung dari jumlah data testing Kasus ini sangat mirip dengan pelemparan koin head sebagai sukses, tail sebagai gagal Dalam statistik, kesuksesan dari kejadian-kejadian bebas seperti ini dikenal dengan nama proses Bernoulli Teori statistik yang memberikan interval kepercayaan untuk hasil sebenarnya 25 Kehandalan Estimasi Kinerja Proses Bernoulli Proses Bernoulli: tingkat kesuksesan p terletak pada suatu interval tertentu dengan tingkat kepercayaan tertentu Contoh 1: S = 750 sukses dalam N = 1000 percobaan Estimasi tingkat kesuksesan: 75% Seberapa dekat hasil ini pada tingkat kesuksesan sebenarnya p? Jawab: dengan tingkat kepercayaan 80%, p terletak pada interval [73.2, 76.7] Contoh 2: S = 75 sukses dalam N = 100 percobaan Estimasi tingkat kesuksesan: 75% Seberapa dekat hasil ini pada tingkat kesuksesan sebenarnya p? Jawab: dengan tingkat kepercayaan 80%, p terletak pada interval [69.1, 80.1] 26

Kehandalan Estimasi Kinerja Proses Bernoulli: Interval Kepercayaan Probabiliti bahwa suatu variabel random X, dengan mean nol, terletak pada interval kepercayaan dengan lebar 2z adalah: Pr[-z X z] = c Untuk distribusi yang simetri: Pr[-z X z] = 1 2 Pr[x z] 27 Kehandalan Estimasi Kinerja Proses Bernoulli: Interval Kepercayaan Interval kepercayaan untuk distribusi normal dengan mean 0 dan variansi 1 adalah: Sehingga: Pr[-1.65 X 1.65] = 90% Pr[X z] z 0.1% 3.09 0.5% 2.58 1% 2.33 5% 1.65 10% 1.28 20% 0.84 40% 0.25 Untuk penggunaannya, kita harus mereduksi variable random supaya memiliki mean 0 dan variansi 1 28

Kehandalan Estimasi Kinerja Proses Bernoulli: Fakta Misal mean dan variansi untuk satu percobaan Bernoulli dengan success rate p adalah p dan p(1-p). Jika dilakukan N percobaan, maka ekspektasi success rate f = S/N adalah suatu variabel random dengan mean yang sama p, dan variansi direduksi oleh N menjadi p(1-p)/n 29 Kehandalan Estimasi Kinerja Proses Bernoulli: Tranformasi ke Distribusi N(0,1) Untuk mentransformasikan variabel random f memiliki distribusi N(0,1), maka f dikurangi mean dan dibagi dengan standar deviasi, yaitu: f p p 1 p /N Sehingga: f p Pr [ z p 1 p /N z]=c Diperoleh nilai p: p= f z2 2N z f N f 2 N z 2 4N 2 / 1 z 2 N 30

Kehandalan Estimasi Kinerja Proses Bernoulli Contoh 1: f = 75%, N=1000, c = 80% (sehingga z = 1.28), maka: dengan tingkat kepercayaan 80%, p terletak pada interval [73.2, 76.7] Contoh 2: f = 75%, N=100, c = 80% (sehingga z = 1.28), maka: dengan tingkat kepercayaan 80%, p terletak pada interval [69.1, 80.1] Catatan: asumsi distribusi normal hanya valid untuk data yang besar (N > 100). Perhatikan contoh berikut: Contoh 3: f = 75%, N=10, c = 80% (sehingga z = 1.28), maka: dengan tingkat kepercayaan 80%, p terletak pada interval [54.9, 88.1] 31