Pengantar Support Vector Machine

dokumen-dokumen yang mirip
Analisis Akurasi Support Vector Machine...

PREDIKSI THD TEGANGAN SISTEM TENAGA LISTRIK MENGGUNAKAN SUPPORT VECTOR MACHINE DENGAN FUNGSI KERNEL GAUSSIAN RBF

Deteksi Mobil Menggunakan Histogram of Oriented Gradient

SVM untuk Regresi Ordinal

SUPPORT VECTOR MACHINE (SVM)

BAB 2 LANDASAN TEORI

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG

SVM untuk Regresi. Machine Learning

Support Vector Machine

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM)

Metode Kernel. Machine Learning

PENGARUH JUMLAH DATA LATIH SVM PADA PERAMALAN BEBAN LISTRIK BULANAN DI SEKTOR INDUSTRI

Analisis Perbandingan Sistem Pengenalan Rambu-Rambu Lalu Lintas Menggunakan Metode Generative Learning dan Support Vector Machine

SISTEM DETEKSI PENYAKIT DIABETES MENGGUNAKAN METODE SUPPORT VECTOR MACHINES

Pengklasifikasian Pada Data Echocardiogram Dengan Menggunakan Support Vector Machine dan Analisis Diskriminan

SVM untuk Ranking. Model Linear

PENDETEKSIAN JENIS DAN KELAS AROMA DENGAN MENGGUNAKAN METODE ONE-VS-ONE DAN METODE ONE-VS-REST

STUDI KOMPARASI METODE KLASIFIKASI DUA KELAS

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

PERAMALAN BEBAN LISTRIK BULANAN SEKTOR INDUSTRI MENGGUNAKAN SUPPORT VECTOR MACHINE DENGAN VARIASI FUNGSI KERNEL

ANALISIS PEN PRESSURE TULISAN TANGAN UNTUK MENGIDENTIFIKASI KEPRIBADIAN SESEORANG MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) Abstrak.

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

KAJIAN KEMAMPUAN GENERALISASI SUPPORT VECTOR MACHINE DALAM PENGENALAN JENIS SPLICE SITES PADA BARISAN DNA

IMPLEMENTASI METODE SUPPORT VECTOR MACHINE DALAM KLASIFIKASI KUALITAS PRODUK FURNITURE PADA PT. HERDEX SEJAHTERA

BAB II LANDASAN TEORI

SKRIPSI. Oleh : PUSPHITA ANNA OCTAVIANI NIM PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM)

ANALISA ALGORITMA SUPPORT VECTOR MACHINE (SVM) DALAM MEMPREDIKSI NASABAH YANG BERPELUANG KREDIT MACET

ANALISIS KEPADATAN LALU LINTAS DENGAN MENGGUNAKAN METODE ICA DAN SVM

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

PRESENTASI TUGAS AKHIR IMPLEMENTASI PENGGABUNGAN ALGORITMA SUPPORT VECTOR MACHINE DAN SIMULATED ANNEALING PADA PERMASALAHAN KLASIFIKASI POLA

BAB III LANDASAN TEORI. Definisi Peramalan adalah memperkiraan atau memproyeksikan sesuatu

PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION (SVR) DENGAN ALGORITMA GRID SEARCH

PENGGOLONGAN UANG KULIAH TUNGGAL MENGGUNAKAN SUPPORT VECTOR MACHINE

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-6 1

Tutorial Support Vector Machine. 1 Ide Dasar Support Vector Machine

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) ABSTRACT

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM)

ANALISIS PERFORMANSI PERUSAHAAN SYARIAH DI BURSA EFEK INDONESIA (BEI) MENGGUNAKAN METODE DISCRIMINANT ANALYSIS DAN SUPPORT VECTOR MACHINE (SVM)

IMPLEMENTASI METODE MULTIPLE KERNEL SUPPORT VECTOR MACHINE UNTUK SELEKSI FITUR DARI DATA EKSPRESI GEN DENGAN STUDI KASUS LEUKIMIA DAN TUMOR USUS BESAR

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

SUPPORT VECTOR MACHINE UNTUK IMAGE RETRIEVAL

BAB 2 LANDASAN TEORI

TRANSFORMASI MODEL WARNA YUV DAN FUZZY SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI CITRA SATELIT

UNJUK KERJA METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) DENGAN LEARNING VECTOR QUANTIZATION (LVQ) PADA APLIKASI PENGENALAN WAJAH

APLIKASI METODE SUPPORT VECTOR MACHINE UNTUK PREDIKSI KUALITAS GLISEROL MONOOLEAT

K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN

PERAMALAN DENGAN MENGGUNAKAN ARTIFICIAL NEURAL NETWORK DAN SUPPORT VECTOR REGRESSION

IMPLEMENTASI SUPPORT VECTOR MACHINE (SVM) UNTUK KLASIFIKASI DOKUMEN DEALIS HENDRA PRATAMA

IDENTIFIKASI PLAT NOMOR MENGGUNAKAN FITUR ZONING DENGAN KLASIFIKASI SUPPORT VECTOR MACHINE INTAN AYU OCTAVIA

Pengaruh Preprocessing Data pada Metode SVR dalam Memprediksi Permintaan Obat

PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE

PERBANDINGAN PERAMALAN INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR MACHINES DAN JARINGAN SARAF TIRUAN

ALGORITMA SUPPORT VECTOR MACHINE UNTUK MENDETEKSI SMS SPAM BERBAHASA INDONESIA

DETEKSI GANGGUAN ORGAN JANTUNG MENGGUNAKAN KOMPUTERISASI IRIDOLOGI DENGAN METODE KLASIFIKASI SVM

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

ANALISIS SUPPORT VECTOR REGRESSION (SVR) DALAM MEMPREDIKSI KURS RUPIAH TERHADAP DOLLAR AMERIKA SERIKAT

UNNES Journal of Mathematics

Shintya Yosvine Monro¹, Bambang Hidayat², Ari Novianty³. ¹Teknik Telekomunikasi, Fakultas Teknik Elektro, Universitas Telkom

Penerapan Sentimen Analisis Acara Televisi Pada Twitter Menggunakan Support Vector Machine dan Algoritma Genetika sebagai Metode Seleksi Fitur

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA

UJI KINERJA LEARNING TO RANK DENGAN METODE SUPPORT VECTOR REGRESSION

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

Neural Networks. Machine Learning

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

Pengaruh Variasi Jumlah Data Pelatihan SVM Terhadap Unjukkerja pada Sistem Pengenalan Pola Tulisan Tangan Aksara Jawa Nglegeno

Prediksi Pergerakan Indeks Harga Saham Menggunakan Artificial Neural Network dan Support Vector Machine

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

KLASIFIKASI PENERIMA PROGRAM BERAS MISKIN (RASKIN) DI KABUPATEN WONOSOBO DENGAN METODE SUPPORT VECTOR MACHINE MENGGUNAKAN LibSVM ABSTRACT

PENGENALAN CITRA TULISAN TANGAN DOKTER DENGAN MENGGUNAKAN SVM DAN FILTER GABOR

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER

BAB I PENDAHULUAN 1.1. Latar Belakang

1. Pendahuluan. 1.1 Latar Belakang

UJI KINERJA DAN ANALISIS K-SUPPORT VECTOR NEAREST NEIGHBOR DENGAN SVM DAN ANN BACK-PROPAGATION

( ) ( ) (3) II-1 ( ) ( )

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

2.Jenis Serangan Berikut Berikut ini daftar serangan yang terdapat dalam dataset:

ANALISIS POLA KEMIRINGAN TULISAN TANGAN UNTUK MENGIDENTIFIKASI KEPRIBADIAN SESEORANG MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM)

BAB IV HASIL DAN PEMBAHASAN

PENGENALAN HURUF TULISAN TANGAN MENGGUNAKAN METODE ZONING DAN SUPPORT VECTOR MACHINE

BAB II KAJIANPUSTAKA

BAB 2 KAJIAN PUS TAKA

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR

SISTEM PENGENALAN PLAT NOMOR OTOMATIS MENGGUNAKAN SUPPORT VECTOR MACHINE DAN NEURAL NETWORK

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

Radial Basis Function Networks

BAB II LANDASAN TEORI

Studi Perbandingan Pemilihan Fitur untuk Support Vector Machine pada Klasifikasi Penilaian Risiko Kredit

Sistem Deteksi Kebocoran pada Jaringan PipaAir PDAM MenggunakanAnalisisTekanandenganMetode Support Vector Machine

BAB I PENDAHULUAN. Jumlah spam di dunia semakin meningkat secara eksponensial.

IDENTIFIKASI TANDA TANGAN DENGAN PENDEKATAN SUPPORT VECTOR MACHINE

Model Linear untuk Klasifikasi

ABSTRAK. Kata Kunci : klasifikasi, musik digital, jenis musik, support vector machine, fitur ekstraksi, daftar putar musik digital

Abstract. Keywords: Artificial Neural Network

Transkripsi:

Pengantar Support Vector Machine Anto Satriyo Nugroho February 8, 2007 1 Pengantar Pattern Recognition (PR) didefinisikan sebagai proses pemetaan suatu data ke dalam konsep tertentu yang telah didefinisikan sebelumnya[1]. Konsep tertentu ini disebut class atau category. Contoh sederhana dari Pattern Recognition misalnya dalam problem klasifikasi yang melibatkan dua buah konsep/class: Atlet Sumo dan Pemain Sepak Bola. Seorang atlet Sumo (Gulat Jepang) dapat dibedakan dengan seorang pemain Sepak Bola dengan mengukur tinggi badan dan beratnya. Umumnya seorang atlit Sumo memiliki tinggi badan dan berat yang lebih besar daripada seorang pemain sepak bola. Tinggi dan berat badan ini adalah dua buah feature yang menentukan apakah seorang atlit diidentifikasikan/dipetakan ke konsep Atlet Sumo ataukah Pemain Sepak Bola. Aplikasi pattern recognition sangat luas, di antaranya mengenali suara dalam sistem sekuriti, membaca huruf dalam OCR, mengklasifikasikan penyakit secara otomatis berdasarkan hasil diagnosa kondisi medis pasien dan sebagainya. Berbagai metode dikenal dalam pattern recognition, seperti linear discrimination analysis, hidden markov model hingga metode yang dikembangkan atas motivasi meniru proses informasi pada manusia, misalnya seperti artificial neural network. Salah satu metode PR yang akhir-akhir ini banyak mendapat mendapat perhatian adalah Support Vector Machine (SVM)[2]. Hal ini tercermin dari hasil studi yang dilakukan oleh ICDM pada tahun 2006, mengenai top 10 algoritma dalam Data Mining. Studi yang dilakukan oleh Xindong Wu dan Vipin Kumar ini mengidentifikasikan SVM pada peringkat ke-3, setelah C4.5 dan k-nearest Neighbor Classifier. Support Vector Machine (SVM) dikembangkan oleh Boser, Guyon, Vapnik, dan pertama kali dipresentasikan pada tahun 1992 di Annual Workshop on Computational Learning Theory. Konsep dasar SVM sebenarnya merupakan kombinasi harmonis dari teoriteori komputasi yang telah ada puluhan tahun sebelumnya, seperti margin hyperplane (Duda & Hart tahun 1973, Cover tahun 1965, Vapnik 1964, dsb.), kernel diperkenalkan oleh Aronszajn tahun 1950, dan demikian juga dengan konsep-konsep pendukung yang lain. Akan tetapi hingga tahun 1992, belum pernah ada upaya merangkaikan komponenkomponen tersebut[4][5]. disampaikan pada e-tutorial SVM di milis indo-dm@yahoogroups.com 5-18 Februari 2007 Penulis adalah peneliti di BPP Teknologi, dan bekerja sebagai Visiting Professor di Chukyo University Japan, tahun 2003 2007, URL: http://asnugroho.net 1

Figure 1: SVM berusaha menemukan hyperplane terbaik yang memisahkan kedua class 1 dan +1 Berbeda dengan strategi neural network yang berusaha mencari hyperplane pemisah antar class, SVM berusaha menemukan hyperplane yang terbaik pada input space. Prinsip dasar SVM adalah linear classifier, dan selanjutnya dikembangkan agar dapat bekerja pada problem non-linear. dengan memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi. Pada e-tutorial ini akan dibahas tiga pertanyaan sebagai berikut: 1. Apakah SVM itu? 2. Apa sajakah contoh aplikasi SVM? 3. Referensi apa sajakah yang direkomendasikan untuk mempelajari SVM? Pertanyaan pertama dibahas pada Sec.2 dan Sec.3. Pertanyaan kedua dibahas pada Sec.4, sedangkan pertanyaan ketiga dibahas pada Sec.5, yang akan ditutup dengan kesimpulan. 2 Linear Support Vector Machine Konsep SVM dapat dijelaskan secara sederhana sebagai usaha mencari hyperplane terbaik yang berfungsi sebagai pemisah dua buah class pada input space. Gambar 1 memperlihatkan beberapa pattern yang merupakan anggota dari dua buah class : +1 dan 1. Pattern yang tergabung pada class 1 disimbolkan dengan warna merah (kotak), sedangkan pattern pada class +1, disimbolkan dengan warna kuning(lingkaran). 2

Problem klasifikasi dapat diterjemahkan dengan usaha menemukan garis (hyperplane) yang memisahkan antara kedua kelompok tersebut. Berbagai alternatif garis pemisah (discrimination boundaries) ditunjukkan pada gambar 1. Hyperplane pemisah terbaik antara kedua class dapat ditemukan dengan mengukur margin hyperplane tsb. dan mencari titik maksimalnya. Margin adalah jarak antara hyperplane tersebut dengan pattern terdekat dari masing-masing class. Pattern yang paling dekat ini disebut sebagai support vector.garis solid pada gambar 1 sebelah kanan menunjukkan hyperplane yang terbaik, yaitu yang terletak tepat pada tengah-tengah kedua class, sedangkan titik merah dan kuning yang berada dalam lingkaran hitam adalah support vector. Usaha untuk mencari lokasi hyperplane ini merupakan inti dari proses pembelajaran pada SVM. Tiap data (example) dinotasikan sebagai x i R D, i = 1, 2,,N. N adalah banyaknya data. Positive class dinotasikan sebagai +1, dan negative class sebagai 1. Dengan demikian, tiap data dan label class-nya dinotasikan sebagai : y i { 1, +1}. Diasumsikan bahwa kedua class tersebut dapat dipisahkan secara sempurna oleh hyperplane di D-dimensional feature space. Hyperplane tersebut didefenisikan sbb. w.x i + b = 0 (1) Data x i yang tergolong ke dalam negative class adalah mereka yang memenuhi pertidaksamaan berikut : w.x i + b 1 (2) Adapun data x i yang tergolong ke dalam positive class, adalah mereka yang memenuhi pertidaksamaan : w.x i + b 1 (3) Optimal margin dihitung dengan memaksimalkan jarak antara hyperplane dan pattern terdekat. Jarak ini dirumuskan sebagai 1/ w ( w adalah norm dari weight vector w). Selanjutnya, masalah ini diformulasikan ke dalam Quadratic Programming (QP) problem, dengan meminimalkan Eq.4 dibawah constraint Eq.5. Minimize: w 2 (4) Subject to: y i (w.x i + b) 1 0, i (5) Optimisasi ini dapat diselesaikan dengan Lagrange Multipliers: L(w,b,α) = 1 2 w 2 α i y i (w.x i + b 1) (6) α i adalah Langrange multiplier yang berkorespondensi dengan x i. Nilai α i adalah nol atau positif. Untuk menyelesaikan masalah tsb. pertama-tama meminimalkan L terhadap 3

w, dan memaksimalkan L terhadap α i. Dengan memodifikasi persamaan 6, maximization problem di atas dapat direpresentasikan dalam α i, sbb. Maximize: Subject to: α i 1 2 i,j=1 α i α j y i y j x i x j (7) α i 0, α i y i = 0 (8) Solusi dari problem ini akan menghasilkan banyak α i dengan nilai nol. Data yang berkorespondensi dengan α i yang tidak nol, merupakan s upport vectors, yaitu data yang memiliki jarak terdekat dengan hyperplane. 2.1 Soft Margin Penjelasan di atas berdasarkan asumsi bahwa kedua belah class dapat terpisah secara sempurna oleh hyperplane. Akan tetapi, pada umumnya kedua buah class tersebut tidak dapat terpisah secara sempurna. Hal ini menyebabkan proses optimisasi tidak dapat diselesaikan, karena tidak ada w dan b yang memenuhi pertidaksamaan 5. Untuk itu, pertidaksamaan 5 dimodifikasi dengan memasukkan slack variable ξ i ( ξ i 0 ), menjadi y i (w.x i + b) 1 ξ i, i (9) Demikian juga dengan 4, sehingga diperoleh : Minimize 1 2 w 2 + C ξ i (10) Parameter C bertugas mengkontrol tradeoff antara margin and classification error. Semakin besar nilai C, semakin besar penalty yang dikenakan untuk tiap classification error. 3 Non Linear Support Vector Machine Sebagaimana dijelaskan pada bab sebelumnya, SVM merupakan satu varian dari linear machine sehingga hanya dapat dipakai untuk menyelesaikan masalah yang sifatnya linearly separable. Untuk dapat dipakai dalam kasus non-linear, pertama-tama data yang berada pada ruang vektor awal ({x i R D }) berdimensi D, harus dipetakan ke ruang vektor baru yang berdimensi lebih tinggi ({x i R Q }). Misalnya saja fungsi pemetaan tersebut dinotasikan sebagai Φ(x). Pemetaan ini bertujuan untuk merepresentasikan data ke dalam format yang linear separable pada ruang vektor yang baru. Ilustrasi proses ini ditunjukkan pada gambar 2. 4

Figure 2: Fungsi Φ memetakan data ke ruang vektor yang berdimensi lebih tinggi, sehingga kedua buah class dapat dipisahkan secara linear oleh sebuah hyperplane Φ : R D R Q D < Q (11) Selanjutnya dilakukan proses training sama sebagaimana pada Linear SVM. Proses optimisasi pada fase ini memerlukan perhitungan dot product dua buah example pada ruang vektor baru. Dot product kedua buah vektor (x i ) dan (x j ) dinotasikan sebagai Φ(x i ).Φ(x j ). Nilai dot product kedua buah vektor ini dapat dihitung secara tak langsung, yaitu tanpa mengetahui fungsi transformasi Φ. Teknik komputasi ini disebut Kernel Trick, yaitu menghitung dot product dua buah vector di ruang vektor baru dengan memakai komponen kedua buah vektor tersebut di ruang vektor asal sbb. K(x i,x j ) = Φ(x i ).Φ(x j ) (12) Berbagai jenis fungsi dapat dipakai sebagai kernel K, sebagaimana tercantum pada Tabel1. Selanjutnya klasifikasi non linear pada SVM terhadap test sample x dirumuskan sbb. f(φ(x)) = w.φ(x) + b (13) 5

Table 1: Fungsi kernel yang sering dipakai dalam SVM Nama Kernel Definisi Polynomial K(x i,x j ) = (x i x j + 1) p Gaussian K(x i,x j ) = exp( x i x j 2 2σ 2 ) Sigmoid K(x i,x j ) = tanh(α x i x j + β) = =,x i SV α i y i Φ(x).Φ(x i ) + b (14) α i y i K(x,x i ) + b (15),x i SV Support vector SV adalah subset dari data training set, dengan α yang tidak negatif {x i α i 0} (i = 1, 2,,l). References [1] J. Toriwaki, Ninshiki Kougaku, Korona-sha, 1993 [2] H. Byun, S.W. Lee, A Survey on Pattern Recognition Applications of Support Vector Machines, International Journal of Pattern Recognition and Artificial Intelligence, Vol.17, No.3, pp.459 486, 2003 [3] http://www.cs.uvm.edu/ icdm/algorithms/index.shtml [4] N. Cristianini, J.S. Taylor, An Introduction to Support Vector Machine and Other Kernel-Based Learning Methods, Cambridge Press University, 2000. [5] T. Hastie et al., and P. W. Daly, The Elements of Statistical Learning : Datamining, Interference, and Prediction, Springer Verlag, 2001. [6] K. Tsuda, Overview of Support Vector Machine, Journal of IEICE, Vol.83, No.6, pp.460-466, 2000 [7] V.N. Vapnik, The Nature of Statistical Learning Theory, Springer-Verlag, New York Berlin Heidelberg, 1999 (2nd ed.) 6