Studi Kasus Klasifikasi Hutan

dokumen-dokumen yang mirip
Metode Kernel. Machine Learning

Model Linear untuk Klasifikasi

Neural Networks. Machine Learning

SVM untuk Regresi. Machine Learning

SVM untuk Regresi Ordinal

Model Linear untuk Regresi

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

Support Vector Machine

HASIL DAN PEMBAHASAN

Pendahuluan : Evaluasi*

BAB III ANALISIS DAN PENYELESAIAN MASALAH

Perangkat Lunak - Weka*

SVM untuk Ranking. Model Linear

Phased Array Type L-Band Synthetic Aperture Radar (PALSAR)

I. PENDAHULUAN 1.1 Latar Belakang

I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

KLASIFIKASI PENERIMA PROGRAM BERAS MISKIN (RASKIN) DI KABUPATEN WONOSOBO DENGAN METODE SUPPORT VECTOR MACHINE MENGGUNAKAN LibSVM SKRIPSI

Radial Basis Function Networks

BAB I PENDAHULUAN 1.1 Latar Belakang Musim hujan merupakan musim yang mutlak ada di sebagian belahan benua dunia. Dan curah hujan pasti memiliki

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

STUDI KOMPARASI METODE MULTICLASS SUPPORT VECTOR MACHINE UNTUK MASALAH ANALISIS SENTIMEN PADA TWITTER

BAB 3 METODE PENELITIAN

BUKU RANCANGAN PEMBELAJARAN

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

I PENDAHULUAN 1.1 Latar Belakang

q Tujuan dari kegiatan ini diperolehnya peta penggunaan lahan yang up-to date Alat dan Bahan :

BAB 4 HASIL DAN PEMBAHASAN

SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI PENUTUP LAHAN MENGGUNAKAN CITRA RADARSAT 2 DENGAN DUAL POLARISASI HH-HV

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

BAB II TINJAUAN PUSTAKA

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III METODE PENELITIAN

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.

4 Notepad dan Microsoft Excel sebagai editor data.

Legenda: Sungai Jalan Blok sawah PT. Sang Hyang Seri Kabupaten Subang

BAB III ANALISA DAN PERANCANGAN SISTEM

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

PENGENALAN CITRA TULISAN TANGAN DOKTER DENGAN MENGGUNAKAN SVM DAN FILTER GABOR

BAB I PENDAHULUAN 1.1 Latar Belakang

HASIL DAN PEMBAHASAN. B fch a. d b

BAB I PENDAHULUAN 1.1 Latar Belakang Perancangan dan Realisasi Antena Mikrostrip Polarisasi Sirkular dengan Catuan Proxmity Coupled

PENERAPAN MODEL MESIN BELAJAR SUPPORT VECTOR MACHINES PADA AUTOMATIC SCORING UNTUK JAWABAN SINGKAT

BAB II DASAR TEORI. 2.1 DEM (Digital elevation Model) Definisi DEM

BAB III METODE PENELITIAN

Matrix Factorization. Machine Learning

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR

KLASIFIKASI PENUTUPAN LAHAN HUTAN MANGROVE DI KECAMATAN BUDURAN, KABUPATEN SIDOARJO, PROPINSI JAWA TIMUR, DENGAN CITRA TERRASAR-X HIGH RESOLUTION

KLASIFIKASI PENERIMA PROGRAM BERAS MISKIN (RASKIN) DI KABUPATEN WONOSOBO DENGAN METODE SUPPORT VECTOR MACHINE MENGGUNAKAN LibSVM ABSTRACT

ABSTRAK. Universitas Kristen Maranatha

PENGGOLONGAN UANG KULIAH TUNGGAL MENGGUNAKAN SUPPORT VECTOR MACHINE

Hasil klasifikasi citra ALOS PALSAR filterisasi Kuan. dengan ukuran kernel size 9x dengan ukuran kernel size 3x

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

bdtbt.esdm.go.id Klasifikasi Land Use dengan Data Fusion HJ1B dan ALOS/PASLAR 1. Pendahuluan

BAB III METODOLOGI 3.1 Waktu dan Tempat 3.2 Alat dan Data 3.3 Tahapan Pelaksanaan

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

BAB III DATA DAN METODOLOGI

BAB III LANDASAN TEORI. Definisi Peramalan adalah memperkiraan atau memproyeksikan sesuatu

LAMPIRAN 1 Daftar Istilah

PENGENALAN KUALITAS BUAH JERUK KINTAMANI MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) KOMPETENSI KOMPUTASI SKRIPSI KOMANG SONIYA GUNAWAN

BAB II TINJAUAN PUSTAKA

UJI KINERJA LEARNING TO RANK DENGAN METODE SUPPORT VECTOR REGRESSION

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

ABSTRAK. Kata kunci: PiSAR-L2, Berbasis piksel, Berbasis obyek, Band tekstur

1. PENDAHULUAN 1.1. Latar Belakang

Pendahuluan* Data vs Informasi

Studi Kasus Sistem Rekomendasi

Klasifikasi Spam dengan Menggunakan Metode Support Vector Machine dan k-nearest Neighbor

Eko Yudha ( )

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG

III. METODE PENELITIAN

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM)

Interpretasi Citra SAR. Estimasi Kelembaban Tanah. Sifat Dielektrik. Parameter Target/Obyek: Sifat Dielektrik Geometri

1. Pendahuluan. 1.1 Latar Belakang

EKSTRAKSI GARIS PANTAI MENGGUNAKAN HYPSOGRAPHY TOOLS

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. Bab I Pendahuluan

Data Mining Terapan dengan Matlab

KLASIFIKASI CITRA DOKUMEN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DENGAN EKSTRAKSI CIRI TERM FREQUENCY INVERSE DOCUMENT FREQUENCY

DIAGNOSA KEGAGALAN RODA GIGI BERBASIS SINYAL GETARAN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE

BAB IV EKSPERIMEN. 4.1 Tujuan

Deteksi Kemiripan Citra Tanaman Anggrek Menggunakan Metode Support Vector Machine (SVM) Kernel Linear

Studi Perbandingan Pemilihan Fitur untuk Support Vector Machine pada Klasifikasi Penilaian Risiko Kredit

BAB II TINJAUAN PUSTAKA

STUDI PENGAMATAN PENURUNAN DAN KENAIKAN MUKA TANAH MENGGUNAKAN METODE DIFFERENTIAL INTERFEROMETRI SYNTHETIC APERTURE RADAR

PERBANDINGAN DECISION TREE

PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION DENGAN ALGORITMA GRID SEARCH

BAB II TINJAUAN PUSTAKA

KLASIFIKASI JENIS KUALITAS KEJU DENGAN MENGGUNAKAN METODE GRAY LEVEL COOCCURRENCE MATRIX (GLCM) DAN SUPPORT VECTOR MACHINE (SVM) PADA CITRA DIGITAL

Penerapan Teknik Support Vector Machine untuk Pendeteksian Intrusi pada Jaringan

IMPLEMENTASI DEEP LEARNING BERBASIS TENSORFLOW UNTUK PENGENALAN SIDIK JARI

APLIKASI PENGKLASIFIKASIAN MOTIF BATIK TULIS LASEM MENGGUNAKAN METODE GRAY LEVEL CO-OCCURRENCE MATRICES (GLCM) DAN SUPPORT VECTOR MACHINE (SVM)

Transkripsi:

MMA10991 Topik Khusus Machine Learning Studi Kasus Klasifikasi Hutan Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62 21 7862719/7863439, Fax. +62 21 7863439, Email. hendri@ui.ac.id ALOS PALSAR Data ALOS PALSAR adalah data berupa gambar permukaan bumi yang direkam dari satelit ALOS (advanced land observing satellite) dengan menggunakan sensor PALSAR (phased arrayed L band synthetic aperture radar) Data ALOS PALSAR dapat digunakan untuk pembuatan DEM, Interferometry untuk mendapatkan informasi pergeseran tanah, kandungan biomass, monitoring kehutanan, pertanian, tumpahan minyak (oil spill), soil moisture, mineral, pencarian pesawat dan kapal yang hilang, dll. 2

ALOS PALSAR Keistimewaan: sensor PALSAR adalah dapat menembus awan, serta dapat digunakan baik malam maupun siang hari Permasalahan: diberikan gambar ALOS PALSAR dari suatu permukaan bumi, bagaimana kita menentukan bagian mana merupakan hutan dan non hutan [1][2]? Sumber = [1][2] 3 Perangkat Lunak Perangkat lunak yang digunakan pada simulasi ini adalah scikitlearn [3], yaitu paket machine learning pada Python. Untuk pemodelan SVM, scikit learn menggunakan pustaka libsvm [4]. from sklearn import preprocessing from sklearn.svm import SVC from sklearn.grid_search import GridSearchCV from sklearn.cross_validation import StratifiedKFold 4

Machine Learning Input Model Output x 1 x 2 : x D y(x,w) Klasifikasi, regresi, clustering, dll Preprocessing: ektraksi fitur dan representasi data, misal dalam bentuk vektor x i = (x 1, x 2,.., x D ) T Training: pemilihan model dan penentuan parameter model, misal w, berdasarkan data pelatihan (training data) Testing: pengujian metode dengan data penguji (testing data) yang tidak sama dengan data pelatihan, sehingga didapat nilai estimasi untuk kapabilitas generalisasi dari model. 5 Preprocessing Ekstraksi Fitur Sumber = [1][2] Keterangan: Biru : mode quadpol, polarisasi HH, HV, dan VV (ALOS ALPSRP222967170), Level 1,1. Kuning : mode FBD, polarisasi HH dan HV (ALOS ALPSRP250537160, ALPSRP253017160), level 1,5. Merah : mode FBS, polarisasi HH (ALOS ALPSRP136683640), level 1,5. 6

Preprocessing Ekstraksi Fitur Fitur [1][2]: Mode quadpol, polarisasi HH, HV, dan VV (ALOS ALPSRP222967170), Level 1,1 > quad_hh, quad_hv, quad_vv Mode FBD, polarisasi HH dan HV (ALOS ALPSRP250537160, ALPSRP253017160), level 1,5. > FBD2505_HH, FBD2505_HV, FBD2530_HH, FBD2530_HV Mode FBS, polarisasi HH (ALOS ALPSRP136683640), level 1,5. > FBS_HH Data [1][2]: 973 Hutan : 679 Non Hutan : 294 7 Preprocessing Representasi Vektor Sumber data, misal dalam format csv, ditransformasi ke dalam bentuk vektor data_file = csv.reader(open('alos_palsar.csv')) data_file.next() n_samples = 973 n_features = 8 feature_names = np.array(['quad_hh', 'quad_hv', 'quad_vv', 'FBD2505_HH', 'FBD2505_HV', 'FBD2530_HH', 'FBD2530_HV', 'FBS_HH']) target_names = np.array(['hutan','non hutan']) data = np.empty((n_samples, n_features)) target = np.empty((n_samples,), dtype=np.int) for i, ir in enumerate(data_file): data[i] = np.asarray(ir[2: 1], dtype=np.int) target[i] = np.asarray(ir[ 1], dtype=np.int) 8

Preprocessing Scaling Normalisasi atau penskalaan pada masing masing data fitur sangat direkomendasikan sebelum diproses oleh SVM, yaitu dalam interval [ 1,+1] atau [0,1] [3]. Menghindari dominasi fitur dengan nilai besar terhadap fitur dengan nilai kecil Menghindari kesulitan secara numerik selama proses perhitungan Kita harus menggunakan metode yang sama dalam penskalaan data training dan data testing. 9 Preprocessing Scaling Penskalaan pada masing masing data fitur X = data scaler = preprocessing.scaler().fit(x) X = scaler.transform(x) y = target 10

Learning Pemilihan Model : Fungsi Kernel Secara umum, fungsi kernel RBF direkomendasikan sebagai pilihan utama [3]. k x i,x j =exp{ x i x j 2 } 2 = exp { x 2 i x j 2 }, 0 Fungsi ini dapat memetakan secara tidak linear data sampel ke ruang dimensi lebih tinggi sehingga diharapkan dapat menangani kasus dimana relasi antara fitur dan kelas adalah tidak linear. Alasan kedua adalah jumlah hyperparameters yang mempengaruhi kompleksitas dari pemilihan model. Fungsi kernel polynomial dan sigmoid memiliki lebih banyak hyperparameters dari pada fungsi kernel RBF Alasan berikutnya adalah fungsi kernel RBF memiliki kesulitan secara numerik yang lebih sedikit, yaitu 0 < k(i,j) 1 11 Learning Pemilihan Model : Grid Search Ada dua parameter pada SVM berbasis fungsi kernel RBF, yaitu C dan Nilai C dan yang terbaik untuk suatu masalah yang diberikan tidak dapat ditentukan didepan. Sehingga, pencarian parameter terbaik tersebut harus dilakukan Grid search adalah metode pencarian nilai pasangan (C, ) terbaik, yaitu nilai pasangan (C, ) yang membuat SVM dapat mengklasifikasikan data testing dengan tingkat akurat terbaik 12

Learning Pemilihan Model : Grid Search Karena untuk melakukan grid search secara lengkap membutuhkan waktu yang lama, maka direkomendasikan untuk melakukannya dalam dua tahap [3], yaitu: Pertama tama lakukan loose grid search pada C = 2 5, 2 3,..., 2 15 dan ρ = 2 15, 2 13,..., 2 3 Setelah diketahui daerah kandidat, lakukan fine gridsearch pada sekitar daerah kandidat tersebut. 13 Learning Pemilihan Model : Cross Validation K fold cross Validation adalah prosedur yang direkomendasikan dalam pemilihan model, yaitu nilai pasangan (C, ) [3] : Bagi data menjadi k bagian dengan ukuran yang sama Gunakan masing masing bagian sebagai data testing, dimana k 1 bagian lainnya dijadikan sebagai data training 14

Learning Pemilihan Model : Loose Grid Search dan Cross Validation C_power = np.arange( 5, 16, 2) gamma_power = np.arange( 15, 4, 2) C_range = 2.0 ** C_power gamma_range = 2.0 ** gamma_power param_grid = dict(gamma=gamma_range, C=C_range) grid = GridSearchCV(SVC(), param_grid=param_grid, cv=stratifiedkfold(y=y, k=5)) grid.fit(x, y) best_c = np.log2(grid.best_params_.values()[0]) best_gamma = np.log2(grid.best_params_.values()[1]) 15 Learning Pemilihan Model : Loose Grid Search dan Cross Validation 16

Learning Pemilihan Model : Fine Grid Search dan Cross Validation C_power = np.arange(7, 11.25, 0.25) gamma_power = np.arange( 11, 6.75, 0.25) C_range = 2.0 ** C_power gamma_range = 2.0 ** gamma_power param_grid = dict(gamma=gamma_range, C=C_range) grid = GridSearchCV(SVC(), param_grid=param_grid, cv=stratifiedkfold(y=y, k=5)) grid.fit(x, y) best_c = np.log2(grid.best_params_.values()[0]) best_gamma = np.log2(grid.best_params_.values()[1]) 17 Learning Pemilihan Model : Fine Grid Search dan Cross Validation 18

Testing Cross Validation Setelah diperoleh model yang optimal, yaitu nilai pasangan (C, ), tahap selanjutnya adalah melakukan pelatihan ulang SVM berdasar model tersebut. Setelah diperoleh model SVM akhir, k fold cross Validation adalah prosedur yang juga direkomendasikan untuk mengestimasi kapabilitas generalisasi dari model tersebut [3]. Bagi data menjadi k bagian dengan ukuran yang sama Gunakan masing masing bagian sebagai data testing, dimana k 1 bagian lainnya dijadikan sebagai data training 19 Testing Kapabilitas Generalisasi clf = SVC(kernel='rbf', C=2**12.5, gamma=2**( 9.25), probability=true) cv = cross_validation.stratifiedkfold(y, 5) # Compute Cross Validation Scores # scores = cross_validation.cross_val_score(clf, X, y, cv=cv) print "Cross Validation per Fold : %s" % scores print "Cross Validation Accuracy : %0.2f +/ %0.2f" % (scores.mean(), scores.std()/2) 20

Testing Kapabilitas Generalisasi : Confusion Matrix 21 Testing Kapabilitas Generalisasi : ROC Curve 22

Testing Kapabilitas Generalisasi : Precission Recall Curve 23 Referensi (1) Rokhmatuloh, H. Murfi, R. Tateishi. Support Vector Machine for Forest Cover Change Identification Derived from Microwave data. The 33rd Asian Conference on Remote Sensing, Pattaya, Thailand, 2012 (2) Rokhmatuloh, H. Murfi, Ardiansyah. A Method to Derive Optimal Decision Boundary in SVM for Forest and non Forest Classification in Indonesia. The 34th Asian Conference on Remote Sensing, Denpasar, Indonesia, 2013 (3) Pedregosa, et al. Scikit learn: machine learning in python. Journal Machine Learning Research, vol. 12, pp. 2825 2830, 2011. (4) C. C. Chang and C. J. Lin. LIBSVM : a library for support vector machines. ACM Transactions on Intelligent Systems and Technology, 2:27:1 27:27, 2011 (5) C. W. Hsu, C. C. Chang, C. J. Lin. A practical guide to support vector classification. http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf, April 5, 2013 24