Model Linear untuk Regresi

dokumen-dokumen yang mirip
Model Linear untuk Klasifikasi

Neural Networks. Machine Learning

Metode Kernel. Machine Learning

SVM untuk Regresi. Machine Learning

Radial Basis Function Networks

SVM untuk Regresi Ordinal

Support Vector Machine

Perangkat Lunak - Weka*

SVM untuk Ranking. Model Linear

Pendahuluan* Data vs Informasi

Pendahuluan : Evaluasi*

Studi Kasus Sistem Rekomendasi

Jaringan syaraf dengan lapisan tunggal

Matrix Factorization. Machine Learning

BAB III PEMBAHASAN. FRBFNN, Arsitektur FRBFNN, aplikasi FRBFNN untuk meramalkan kebutuhan

BAB III PEMBAHASAN. arsitektur, prosedur, dan hasil model Radial Basis Function Neural Network untuk

g(x, y) = F 1 { f (u, v) F (u, v) k} dimana F 1 (F (u, v)) diselesaikan dengan: f (x, y) = 1 MN M + vy )} M 1 N 1

BUKU RANCANGAN PEMBELAJARAN

BAB I PENDAHULUAN 1.1 Latar Belakang Musim hujan merupakan musim yang mutlak ada di sebagian belahan benua dunia. Dan curah hujan pasti memiliki

BAB I PENDAHULUAN Latar Belakang Masalah

BAB 2 LANDASAN TEORI

KLASIFIKASI CITRA PARU MENGGUNAKAN MODEL SELF-ORGANIZING MAPS RADIAL BASIS FUNCTION NEURAL NETWORKS (SOM-RBFNN) SKRIPSI

BAB I PENDAHULUAN 1.1. Latar Belakang

PENDAHULUAN. Latar Belakang. Tujuan Penelitian

BAB IV PEMBAHASAN. A. Hasil Model Radial Basis Function Neural Network (RBFNN) Langkah-langkah untuk menentukan model terbaik Radial Basis Function

Gambar 5.8 Crossplot korelasi regresi multiatribut CC = Gambar 5.9 Crossplot korelasi multiatribut-pnn CC = 0.87

MODEL FUZZY RADIAL BASIS FUNCTION NEURAL NETWORK UNTUK PERAMALAN KEBUTUHAN LISTRIK DI PROVINSI DAERAH ISTIMEWA YOGYAKARTA

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

BAB I PENDAHULUAN 1.1 Latar Belakang

2. Adanya resiko pemumpukan barang pada gudang.

Studi Kasus Klasifikasi Hutan

PENGENALAN POLA TANDA TANGAN MENGGUNAKAN METODE MOMEN INVARIAN DAN RADIAL BASIS FUNCTION (RBF)

BAB III PEMBAHASAN. 1. Arsitektur Fuzzy Radial Basis Function Neural Network (FRBFNN) Fuzzy Radial Basis Function Neural Network (FRBFNN) merupakan

BAB III LANDASAN TEORI. Definisi Peramalan adalah memperkiraan atau memproyeksikan sesuatu

Prediksi Nilai Indeks Harga Konsumen (IHK) Kota Jambi Menggunakan Radial Basis Function Neural Network (RBFNN) dengan Metode Fuzzy C-Means Clustering

BAB I PENDAHULUAN. Dalam bab ini akan dibahas mengenai hal-hal yang melatarbelakangi

BAB 3 PERANCANGAN SISTEM. Bab ini menguraikan analisa penelitian terhadap metode Backpropagation yang

1. Pendahuluan. 1.1 Latar Belakang

Pertemuan 6: Metode Least Square. Achmad Basuki Politeknik Elektronika Negeri Surabaya 2014

Penerapan Jaringan Saraf Tiruan Metode Backpropagation Menggunakan VB 6

BAB III REGRESI SPLINE = + dimana merupakan fungsi pemulus yang tidak spesifik, dengan adalah

Andry Pujiriyanto

Aplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition

BAB III LANDASAN TEORI

BAB III ANALISA DAN PERANCANGAN SISTEM

Pengantar Metode Klasifikasi

RENCANA PEMBELAJARAN SEMESTER

UJI KINERJA LEARNING TO RANK DENGAN METODE SUPPORT VECTOR REGRESSION

Analisis Korelasi dan Regresi. Dr. Kusman Sadik, M.Si Dept. Statistika IPB

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

PERAMALAN BEBAN JANGKA PENDEK PADA HARI LIBUR DI BALI MENGGUNAKAN METODE GENERALIZED REGRESSION NEURAL NETWORK (GRNN)

STK511 Analisis Statistika. Pertemuan 10 Analisis Korelasi & Regresi (1)

BAB IV PEMBAHASAN. Bab IV berisi pembahasan yang meliputi proses penelitian yakni hasil

4 Notepad dan Microsoft Excel sebagai editor data.

NEURAL NETWORK BAB II

BAB I PENDAHULUAN. Analisis regresi merupakan suatu metode yang digunakan untuk

BAB I PENDAHULUAN. 1.1 Latar Belakang

PERANCANGAN PROGRAM PENGENALAN BENTUK MOBIL DENGAN METODE BACKPROPAGATION DAN ARTIFICIAL NEURAL NETWORK SKRIPSI

BAB II DASAR TEORI. Gambar 2.1 : Perbedaan Antara Proses Stationer dan Proses Non-Stationer

II. TINJAUAN PUSTAKA. Dalam proses penelitian untuk mengkaji karakteristik penduga GMM pada data

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1. Latar Belakang

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

PEMODELAN HARGA CABAI DI KOTA SEMARANG TERHADAP HARGA INFLASI MENGGUNAKAN REGRESI SEMIPARAMETRIK POLINOMIAL LOKAL

METODE PARTIAL LEAST SQUARES UNTUK MENGATASI MULTIKOLINEARITAS PADA MODEL REGRESI LINEAR BERGANDA

PRISMA FISIKA, Vol. III, No. 3 (2015), Hal ISSN :

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI. : Ukuran sampel telah memenuhi syarat. : Ukuran sampel belum memenuhi syarat

LANDASAN TEORI. Universitas Indonesia. Klasifikasi topik menggunakan..., Dyta Anggraeni

BAB I PENDAHULUAN. 1.1 Latar Belakang

Pertemuan 9 : Interpolasi 1 (P9) Interpolasi. Metode Newton Metode Spline

2.1. Dasar Teori Bandwidth Regression

TINJAUAN PUSTAKA Spesifikasi Model Berbagai model dalam pemodelan persamaan struktural telah dikembangkan oleh banyak peneliti diantaranya Bollen

Presentasi Tugas Akhir

Analisis Regresi Spline Kuadratik

ANALISIS KUANTITATIF PERMINTAAN

II. TINJAUAN PUSTAKA

BAB III PEMBAHASAN. Radial Basis Function Neural Network (FRBFNN), prosedur pembentukan model

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB II DASAR TEORI. 2.1 Meter Air. Gambar 2.1 Meter Air. Meter air merupakan alat untuk mengukur banyaknya aliran air secara terus

BAB III MODEL STATE-SPACE. dalam teori kontrol modern. Model state space dapat mengatasi keterbatasan dari

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 3 METODE PENELITIAN

BAB I PENDAHULUAN 1.1. Latar Belakang

5. Struktur Penulisan Tesis

PERAMALAN DENGAN MENGGUNAKAN ARTIFICIAL NEURAL NETWORK DAN SUPPORT VECTOR REGRESSION

METODOLOGI PENELITIAN

BAB III METODELOGI PENELITIAN. Alat yang digunakan dalam penelitian ini adalah: a. Prosesor : Intel Core i5-6198du (4 CPUs), ~2.

Analisis Regresi Nonlinear (I)

BAB III METODE PENELITIAN. menjawab segala permasalahan yang ada dalam penelitian ini.

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

PEMBELAJARAN BERTINGKAT PADA ARSITEKTUR JARINGAN SARAF FUNGSI RADIAL BASIS

PEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK

BAB I PENDAHULUAN. Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan

BAB IV PENGUMPULAN DATA

Transkripsi:

MMA10991 Topik Khusus - Machine Learning Model Linear untuk Regresi Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. hendri@ui.ac.id Machine Learning Tahapan Umum Proses Input Model/Metode Output x 1 x 2 : x D y(x,w) t Diberikan data pelatihan (training data), yaitu x i dan/atau t i, i = 1 sd N Preprocessing: pemilihan/ekstraksi fitur dari data, misal x i = (x 1, x 2,.., x D ) T Learning: penentuan parameter metode, misal w, berdasarkan data pelatihan Testing: pengujian metode dengan data baru. Data penguji (testing data) tersebut harus dilakukan preprocessing yang sama dengan data pembelajaran sebelum dieksekusi oleh metode 2

Learning Diberikan data pelatihan x i, i = 1 sd N, dan/atau t i, i = 1 as N Supervised Learning. Data pelatihan disertai target, yaitu {x i, t i }, i = 1 sd N. Tujuan pembelajaran adalah membangun model yang dapat menghasilkan output yang benar untuk suatu data input, misal untuk regresi, klasifikasian, regresi ordinal, ranking, dll Unsupervised Learning. Data pelatihan tidak disertai target, yaitu x i, i = 1 sd N. Tujuan pembelajaran adalah membagun model yang dapat menemukan komponen/variabel/fitur tersembunyi pada data pelatihan, yang dapat digunakan untuk: pengelompokan (clustering), reduksi dimensi (dimension reduction), rekomendasi, dll 3 Supervised Learning Regresi Nilai output t i bernilai kontinu (riil) Bertujuan memprediksi output dengan akurat untuk data baru Klasifikasi Nilai output t i bernilai diskrit (kelas) Bertujuan mengklasifikasi data baru dengan akurat 4

Regresi Model Linear Model linear adalah kombinasi linear dari fungsi nonlinear dari variabel input (fungsi basis): dimana x = (x 1, x 2,..., x D ) T adalah variabel input, dan w = (w 0, w 1,..., w M-1 ) T adalah parameter, φ(x) = (φ 0 (x), φ 1 (x),..., φ Μ 1 (x)) T adalah vektor fungsi basis φ j (x), M adalah jumlah total parameter dari model Biasanya, φ 0 (x) = 1, sehingga w 0 berfungsi sebagai bias Ada banyak pilihan yang mungkin untuk fungsi basis φ(x), misal fungsi linear, fungsi polinomial, fungsi gaussian, fungsi sigmoidal, dll 5 Regresi Linear Sederhana Fungsi Basis Polinomial Regresi linear sederhana (simple linear regression) adalah masalah regresi dengan variabel input x berdimensi satu. Misal kita menggunakan polinomial φ j (x) = x j sebagai fungsi basis, dan M = M-1, maka bentuk umum dari regresi linear sederhana tersebut adalah: 6

Regresi Linear Sederhana Polynomial Curve Fitting Diberikan data pelatihan {x i, t i }, i = 1 sd N Masalah: bagaimana mendapatkan kurva polinomial yang cocok untuk data pelatihan tersebut Solusi: mencari kurva polinomial yang memiliki kesalahan (error) terkecil pada data pelatihan tersebut Persoalan ini sering juga disebut sebagai polynomial curve fitting 7 Regresi Linear Sederhana Fungsi Error Salah satu fungsi error yang sering digunakan adalah fungsi sum-of-squares error sbb: Salah satu metode yang digunakan untuk mencari nilai w yang meminimumkan fungsi error adalah metode kuadrat terkecil (least squares) 8

Regresi Linear Sederhana Metode Kuadrat Terkecil Setelah penurunan E(w) terhadap w, maka persoalan penentuan nilai parameter w menjadi persoalan penentuan solusi sistem persamaan linear: dimana Aw = t 9 Regresi Linear Sederhana Contoh Kasus Seorang ahli biologi telah melakukan eksperimen sebanyak 7 kali untuk melihat pertumbuhan bakteri berdasarkan kadar Nitrogen, dan diperoleh kondisi sbb: Kadar Nitrogen (gram) 3 4 6 7 8 9 Pertumbuhan Bakteri 1 3 4 6 8 8 Tentukan regresi linear polinomial berorde 1 berdasarkan data tsb. Selanjutnya, prediksi pertumbuhan bakteri jika diberikan Nitrogen sebanyak 5 gram. Solusi: Dari persoalan diatas diketahui x = kadar nitrogen, t = pertumbuhan bakteri, N=6 dan M=1, sehingga: A= [ 6 37 37 255], t= [ 217] 30 [, dan w= w 0 w 1] adalah solusi SPL Aw=t, yaitu w= [ 2.35 1.19 ] dan model linear yang dihasilkan adalah y(x) = -2.35 + 1.19x. Sementara prediksi pertumbuhan bakteri untuk 5 gram Nitrogen adalah y(5) = -2.35 + 1.19*5 = 3.6 10

Format data*: @RELATION bakteri @ATTRIBUTE kadar NUMERIC @ATTRIBUTE pertumbuhan NUMERIC @DATA 3,1 4,3 6,4 7,6 8,8 9,8 Regresi Linear Sederhana Contoh Kasus: Menggunakan Weka *Disimpan dalam file dengan ekstensi arff (misal: bakteri.arff) 11 Regresi Linear Sederhana Contoh Kasus: Menggunakan Weka Model hasil: y(x) = -2.35 + 1.19x 12

Pemilihan Model Karakteristik model regresi linear polinomial ditentukan oleh nilai M (orde polinomial atau jumlah parameter). Pemilihan nilai M yang optimal dikenal juga dengan istilah pemilihan model (model selection) 13 Pemilihan Model Under-fitting dan Over-fitting 14

Pemilihan Model Under-fitting dan Over-fitting Root-Mean-Square (RMS) Error: 15 Parameter vs Data Jumlah data pembelajaran seharusnya tidak lebih sedikit dari jumlah parameter 16

Regularisasi Pada aplikasi praktis, kita sering menemukan kondisi dimana untuk persoalan yang kompleks ketersediaan data pembelajaran terbatas. Salah satu teknik yang digunakan untuk mengkontrol fenomena over-fitting adalah regularisasi (regularization), yaitu dengan cara menambah finalti ke fungsi error. 17 Regularisasi Penghalusan Kurva 18

Regularisasi Pengecilan Nilai Bobot 19 Regularisasi Mengatasi over-fitting 20

Regresi Linear Umum Fungsi sum square error adalah nilai bobot w yang meminimum fungsi error adalah dimana 21 Regresi Linear Umum Regularisasi Fungsi regularized sum square error adalah nilai bobot w yang meminimum fungsi erroe adalah dimana 22

Referensi Bishop, C. H., Pattern Recognition and Machine Learning, Springer, 2006 (Bab 1.1, Bab 1.3, Bab 1.4, Bab 3.1)