Model Linear untuk Klasifikasi

dokumen-dokumen yang mirip
Neural Networks. Machine Learning

Model Linear untuk Regresi

Metode Kernel. Machine Learning

SVM untuk Regresi. Machine Learning

SVM untuk Regresi Ordinal

Support Vector Machine

Radial Basis Function Networks

SVM untuk Ranking. Model Linear

Jaringan syaraf dengan lapisan tunggal

Matrix Factorization. Machine Learning

Pendahuluan* Data vs Informasi

Pada dasarnya lebih sulit drpd classifier berdasar teori bayes, terutama untuk data dimensi tinggi.

Pendahuluan : Evaluasi*

BAB III PEMBAHASAN. FRBFNN, Arsitektur FRBFNN, aplikasi FRBFNN untuk meramalkan kebutuhan

Architecture Net, Simple Neural Net

g(x, y) = F 1 { f (u, v) F (u, v) k} dimana F 1 (F (u, v)) diselesaikan dengan: f (x, y) = 1 MN M + vy )} M 1 N 1

1. Pendahuluan. 1.1 Latar Belakang

BAB 2 KONSEP DASAR PENGENAL OBJEK

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

Architecture Net, Simple Neural Net

BAB III LANDASAN TEORI. Definisi Peramalan adalah memperkiraan atau memproyeksikan sesuatu

Studi Kasus Sistem Rekomendasi

BUKU RANCANGAN PEMBELAJARAN

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. (b) Variabel independen yang biasanya dinyatakan dengan simbol

SISTEM PENGENALAN KARAKTER DENGAN JARINGAN SYARAF TIRUAN ALGORITMA PERCEPTRON

Farah Zakiyah Rahmanti

BAB 3 METODOLOGI PENELITIAN

Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan

BAB II DASAR TEORI. 2.1 Meter Air. Gambar 2.1 Meter Air. Meter air merupakan alat untuk mengukur banyaknya aliran air secara terus

Studi Kasus Klasifikasi Hutan

BAB III METODE PENELITIAN. menjawab segala permasalahan yang ada dalam penelitian ini.

Fuzzy Clustering. Logika Fuzzy

BAB 2 LANDASAN TEORI

Penerapan Jaringan Saraf Tiruan Metode Backpropagation Menggunakan VB 6

BAB 2 LANDASAN TEORI. fuzzy logic dengan aplikasi neuro computing. Masing-masing memiliki cara dan proses

Prediksi Nilai Indeks Harga Konsumen (IHK) Kota Jambi Menggunakan Radial Basis Function Neural Network (RBFNN) dengan Metode Fuzzy C-Means Clustering

PERANCANGAN PROGRAM PENGENALAN BENTUK MOBIL DENGAN METODE BACKPROPAGATION DAN ARTIFICIAL NEURAL NETWORK SKRIPSI

Perangkat Lunak - Weka*

Data Mining Terapan dengan Matlab

BAB 3 PENGENALAN WAJAH

Presentasi Tugas Akhir

BAB III LANDASAN TEORI

STUDI KOMPARASI METODE KLASIFIKASI DUA KELAS

PENDUGAAN PARAMETER REGRESI LOGISTIK DENGAN JARINGAN SYARAF TIRUAN. Anik Djuraidah Jurusan Statistika FMIPA Institut Teknologi Sepuluh Nopember

Kesehatan balita bisa diketahui salah satunya melalui penilaian status gizinya. Penelitian ini bertujuan untuk mempermudah

3. METODE PENELITIAN

PEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK

BAB 2 LANDASAN TEORI. Pengenalan suara (voice recognition) dibagi menjadi dua jenis, yaitu

METODOLOGI PENELITIAN

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM APLIKASI

IMPLEMENTASI ALGORITMA PERCEPTRON UNTUK PENGENALAN POLA MASUKAN BINER MAUPUN BIPOLAR MENGGUNAKAN BORLAND DELPHI

KLASIFIKASI CITRA PARU MENGGUNAKAN MODEL SELF-ORGANIZING MAPS RADIAL BASIS FUNCTION NEURAL NETWORKS (SOM-RBFNN) SKRIPSI

Jaringan Syaraf Tiruan. Disusun oleh: Liana Kusuma Ningrum

BAB I PENDAHULUAN 1.1. Latar Belakang

lalu menghitung sinyal keluarannya menggunakan fungsi aktivasi,

Bab V KESIMPULAN DAN MASALAH TERBUKA

BAB 2 LANDASAN TEORI

BAB 3 PERANCANGAN SISTEM. Bab ini menguraikan analisa penelitian terhadap metode Backpropagation yang

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG

PEMANFAATAN NEURAL NETWORK PERCEPTRON PADA PENGENALAN POLA KARAKTER

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB VIII JARINGAN SYARAF TIRUAN

BAB III PEMBAHASAN. 1. Arsitektur Fuzzy Radial Basis Function Neural Network (FRBFNN) Fuzzy Radial Basis Function Neural Network (FRBFNN) merupakan

BAB III PEMBAHASAN. arsitektur, prosedur, dan hasil model Radial Basis Function Neural Network untuk

Aplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition

Pengembangan Aplikasi Prediksi Pertumbuhan Ekonomi Indonesia dengan Jaringan Syaraf Tiruan Backpropagation

BAB II TINJAUAN PUSTAKA

BAB III METODOLOGI PENELITIAN

BAB IV PEMBAHASAN. A. Hasil Model Radial Basis Function Neural Network (RBFNN) Langkah-langkah untuk menentukan model terbaik Radial Basis Function

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

Pendahuluan : Aplikasi*

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. Sejak komputer diciptakan pertama kali, komputer memiliki peranan yang

KLASIFIKASI ARITMIA EKG MENGGUNAKAN JARINGAN SYARAF TIRUAN DENGAN FUNGSI AKTIVASI ADAPTIF

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE

BAB 2 LANDASAN TEORI. variabel untuk mengestimasi nilainya di masa yang akan datang. Peramalan Merupakan

LANDASAN TEORI. Universitas Indonesia. Klasifikasi topik menggunakan..., Dyta Anggraeni

BAB II LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA. menggunakan teknik statistik, matematika, kecerdasan buatan, tiruan dan machinelearning

NEURAL NETWORK BAB II

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

PREDIKSI KELULUSAN MAHASISWA MENGGUNAKAN METODE NEURAL NETWORK DAN PARTICLE SWARM OPTIMIZATION

PENGENALAN POLA TANDA TANGAN MENGGUNAKAN METODE MOMENT INVARIANT DAN JARINGAN SYARAF RADIAL BASIS FUNCTION (RBF)

ANALISA JARINGAN SARAF TIRUAN DENGAN METODE BACKPROPAGATION UNTUK MENGETAHUI LOYALITAS KARYAWAN

SATIN Sains dan Teknologi Informasi

BAB III PEMBAHASAN. Radial Basis Function Neural Network (FRBFNN), prosedur pembentukan model

PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION DENGAN ALGORITMA GRID SEARCH

BAB I PENDAHULUAN 1.1 Latar Belakang Musim hujan merupakan musim yang mutlak ada di sebagian belahan benua dunia. Dan curah hujan pasti memiliki

Jaringan Syaraf Tiruan

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB 1 PENDAHULUAN Latar Belakang

KAJIAN KEMAMPUAN GENERALISASI SUPPORT VECTOR MACHINE DALAM PENGENALAN JENIS SPLICE SITES PADA BARISAN DNA

PRESENTASI TUGAS AKHIR IMPLEMENTASI PENGGABUNGAN ALGORITMA SUPPORT VECTOR MACHINE DAN SIMULATED ANNEALING PADA PERMASALAHAN KLASIFIKASI POLA

BAB III MODEL STATE-SPACE. dalam teori kontrol modern. Model state space dapat mengatasi keterbatasan dari

SISTEM PENDETEKSI WAJAH MANUSIA PADA CITRA DIGITAL

ii Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis

I PENDAHULUAN II LANDASAN TEORI

Transkripsi:

MMA10991 Topik Khusus - Machine Learning Model Linear untuk Klasifikasi Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439, Email. hendri@ui.ac.id Machine Learning Input Model/Metode Output x 1 x 2 : x D y(x,w) t Diberikan data pelatihan (training data), yaitu x i dan/atau t i, i = 1 sd N Preprocessing: pemilihan/ekstraksi fitur dari data, misal x i = (x 1,.., x D ) T Learning: penentuan parameter metode, misal w, berdasarkan data pelatihan Testing: pengujian metode dengan data baru. Data penguji (testing data) tersebut harus dilakukan preprocessing yang sama dengan data pembelajaran sebelum dieksekusi oleh metode 2

Learning Diberikan data pelatihan x i, i = 1 sd N, dan/atau t i, i = 1 as N Supervised Learning. Data pelatihan disertai target, yaitu {x i, t i }, i = 1 sd N. Tujuan pembelajaran adalah membangun model yang dapat menghasilkan output yang benar untuk suatu data input, misal untuk regresi, klasifikasian, regresi ordinal, ranking, dll Unsupervised Learning. Data pelatihan tidak disertai target, yaitu x i, i = 1 sd N. Tujuan pembelajaran adalah membagun model yang dapat menemukan komponen/variabel/fitur tersembunyi pada data pelatihan, yang dapat digunakan untuk: pengelompokan (clustering), reduksi dimensi (dimension reduction), rekomendasi, dll 3 Supervised Learning Regresi Nilai output t i bernilai kontinu (riil) Bertujuan memprediksi output dari data baru dengan akurat Klasifikasi Nilai output t i bernilai diskrit (kelas) Bertujuan mengklasifikasi data baru dengan akurat 4

Klasifikasi Masalah Dua Kelas Decision Boundary / Decision Surface Diberikan vektor input x berdimensi D, bagaimana mengklasifikasikannya pada salah satu kelas Salah satu cara adalah mencari batas (decision boundary/decision surface) antara area kelas (decision region) bedasarkan data pembelajaran Kelas 1 Kelas 2 Misal dengan menggunakan fungsi linear (model linear) yang dikenal juga dengan istilah fungsi diskriminan (discriminant function) 5 Klasifikasi Model Linear Model linear adalah kombinasi linear dari fungsi nonlinear dari variabel input: Dimana x = (x 1,..., x D ) T adalah variabel input, dan w = (w 0, w 1,..., w D ) T adalah parameter, φ(x) adalah fungsi basis, M adalah jumlah total parameter dari model Biasanya, φ 0 (x) = 1, sehingga w 0 berfungsi sebagai bias Ada banyak pilihan yang mungkin untuk fungsi basis φ(x), misal fungsi linear, fungsi polinomial, fungsi gaussian, fungsi sigmoidal, dll 6

Klasifikasi Hyperplane Bentuk model linear yang paling sederhana untuk fungsi diskriminan linear: y(x) = w T x + w 0 Dimana x adalah vektor input, w adalah vektor bobot dan w 0 adalah bias. Sehingga, decision boundary adalah y(x)=0, yaitu suatu hyperplane berdimensi (D-1) Suatu vektor input x akan diklasifikasikan ke kelas 1 (R 1 ) jika y(x) 0, dan kelas 2 (R 2 ) jika y(x)<0 7 Klasifikasi Sifat-Sifat Hyperplane Jika x A dan x B terletak pada decision boundary (DS), maka y(x A )=y(x B )=0 atau w T (x A -x B )=0, sehingga w tegak lurus terhadap semua vektor di DS. Dengan kata lain w menentukan orientasi dari DS Jarak titik awal ke DS adalah -w 0 / w. Dengan kata lain w 0 menentukan lokasi DS. Jarak sembarang vektor x ke DS dan searah w adalah y(x)/ w 8

Bentuk Umum Asumsikan kita memiliki data pembelajaran {x n, t n }, n = 1 sd N. Suatu vektor input x pertama-tama ditransformasi menggunakan suatu transformasi nonlinear φ(.) untuk membentuk vektor fitur φ(x) yang digunakan untuk membentuk model linear dengan bentuk: y(x) = f(w T φ(x)) dimana fungsi aktifasi nonlinear f(.) diberikan oleh fungsi tangga dengan bentuk: f(a)=+1 jika a 0 f(a)=-1 jika a<0. Vektor φ(x) biasanya mengandung komponen bias φ 0 (x)=1 9 Perceptron Kriteria Perceptron w T φ(x n ) = 0 Diberikan data pembelajaran x n dan t n, dimana t n = +1 untuk kelas w T φ(x n ) < 0 (kelas C 2 atau t = -1) w T φ(x n ) > 0 (kelas C 1 atau t = +1) C 1 dan t n = -1 untuk kelas C 2 Untuk setiap vektor x n di kelas C 1 akan membuat w T φ(x n ) > 0, dan untuk setiap vektor x n di kelas C 2 akan membuat w T φ(x n ) < 0 Sehingga, semua vektor x n akan diklasifikasi dengan benar jika w T φ(x n ) t n > 0 10

Fungsi Error Untuk setiap vektor x yang tidak diklasifikasikan dengan benar, maka metode perceptron akan meminimumkan fungsi error, disebut juga kriteria perceptron (perceptron criterion), sbb: E p w = w T x n t n n M Dimana M adalah himpunan indeks vektor x yang tidak diklasifikasikan dengan benar Sehingga, bobot diperbarui secara berulang sbb: w (τ+1) = w (τ) - η E P (w) = w (τ) + ηφ(x n )t n dimana η adalah parameter learning rate, dan τ ada langkah dari iterasi algoritma 11 Perceptron Algoritma 1) {(x 1,t 1 ),..., (x N,t N )} adalah data pembelajaran 2) Inisialisasi w (0) dengan bilangan random 3) Untuk setiap data pembelajan (x n,t n ), Jika data diklasifikasikan dengan benar maka tidak ada perubahan terhadap w 4) Untuk setiap data pembelajan (x n,t n ), Jika data pembelajaran tidak diklasifikasikan dengan benar maka w diperbarui sbb: w (τ+1) = w (τ) - η E P (w) = w (τ) + ηφ(x n )t n 12

Contoh Diberikan data sebagai berikut No x 1 x 2 Kelas (t) 1 1 1 +1 2 1-1 -1 3-1 1-1 4-1 -1-1 Tentukan hyperplane yang menjadi batas (decision boundary) dari ke dua kelas dari data tersebut dengan menggunakan metode perceptron! 13 Perceptron Contoh Misal ɳ = 1, ɸ(x) = xɸ, (x) = 1, 0 w(0) = (0, 0, 0) 1) Ambil x 1 = (1,1) T dan t 1 = +1 sebagai data pembelajaran: w (1) = w (0) + ɳɸ(x 1 ) t 1 = w (0) + ɳ (1, x 1 ) t 1 = (0, 0, 0) T + 1. (1, 1, 1) T. 1 = (1, 1, 1) T sehingga decision boundary adalah 1 + x 1 + x 2 = 0 14

Contoh 2) Ambil x 2 = (1,-1) T dan t 2 = -1 sebagai data pembelajaran: w (2) = w (1) + ɳɸ(x 2 ) t 2 = w (1) + ɳ (1, x 1 ) t 2 = (1, 1, 1) T + 1. (1, 1, -1) T. -1 = (0, 0, 2) T sehingga decision boundary adalah 2x 2 = 0 15 Perceptron Contoh 3) Ambil x 3 = (-1,1) T dan t 3 = -1 sebagai data pembelajaran: w (3) = w (2) + ɳɸ(x 3 ) t 3 = w (2) + ɳ (1, x 1 ) T t 3 = (0, 0, 2) T + 1. (1, -1, 1) T. -1 = (-1, 1, 1) T sehingga decision boundary adalah -1 + x 1 + x 2 = 0 16

Beberapa Catatan Pada tahun 1962, Novikoff telah mebuktikan teorema pertama tentang perceptron. Teorema ini memulai teori tentang pembelajaran (learning) yang menyatakan bahwa jika Norm dari vektor input x dibatasi oleh konstanta R ( x R) Data pembelajaran dapat dipisahkan dengan margin ρ: Maka setelah paling banyak K [R 2 /ρ 2 ] koreksi, hyperplane yang memisahkan data pembelajaran akan dibentuk Perceptron telah menunjukkan kapabilitas generalisasi pada contoh kasus sederhana 17 Referensi Bishop, C. H., Pattern Recognition and Machine Learning, Springer, 2006 (Bab 4.1.1, Bab 4.1.7)