Aplikasi Algoritma Klasifikasi Mean Shift untuk Pemetaan Habitat Bentik Studi Kasus Kepulauan Karimunjawa PramadityaWicaksono 1, Nur Mohammad Farda 1 1 Kartografi dan Penginderaan Jauh, Fakultas Geografi, Universitas Gadjah Mada, Yogyakarta, 55281 INDONESIA Email korespondensi: prama.wicaksono@geo.ugm.ac.id PENDAHULUAN Abstrak -Tujuan dari penelitian ini adalah melakukan pemetaan habitat bentik menggunakan algoritma mean shift sebagai alternatif dari algoritma klasifikasi berbasis piksel. Penelitian ini penting untuk dilakukan karena tidak semua data penginderaan jauh tersedia dalam kualitas yang optimal, baik pada kualitas spasial, radiometrik dan spektralnya, yang lebih lanjut akan mempengaruhi akurasi dari hasil klasifikasi. Algoritma klasifikasi mean shift mempunyai kelebihan dalam segmentasi citra dengan pendekatan clustering parametrik. Segmen citra didapatkan secara natural melalui interpretasi probabilitas dari nilai kesamaan melalui clustering berdasarkan Kernel Density Estimation. Data penginderaan jauh yang digunakan dalam penelitian ini adalah citra Worldview-2 asli dan yang telah terkompresi, serta data resolusi spasial tinggi terkompresi tinggi. Tujuannya adalah untuk melihat kemampuan masing-masing algoritma klasifikasi dalam pemetaan habitat bentik menggunakan data penginderaan jauh pada berbagai tingkat kualitas data. Metode yang digunakan mencakup koreksi geometrik, koreksi radiometrik, klasifikasi mean shift, dan klasifikasi berbasis piksel minimum distance, mahalanobis distance, dan maximum likelihood. Analisis Confusion Matrix dan McNemar test dilakukan untuk melihat signifikansi perbedaan akurasi hasil klasifikasi. Skema klasifikasi habitat bentik yang digunakan terdiri dari variasi terumbu karang, lamun, makro alga, dan substrat terbuka. Hasil penelitian ini menunjukkan bahwa data penginderaan jauh dengan kualitas yang tidak optimal masih dapat digunakan untuk melakukan pemetaan habitat bentik dengan relatif akurat. Kata kunci: mean shift, habitat bentik, Worldview-2, citra terkompresi, klasifikasi perpiksel Tujuan dari penelitian ini adalah melakukan pemetaan habitat bentik menggunakan algoritma mean shift sebagai alternatif dari algoritma klasifikasi berbasis piksel pada citra penginderaan jauh asli maupun terkompresi. Lebih lanjut, penelitian juga bertujuan untuk membandingkan akurasi antara hasil klasifikasi algoritma per-piksel dengan hasil integrasi klasifikasi per-piksel dan segmentasi mean shift. Latar belakang dilakukannya penelitian ini adalah semakin meningkatnya kebutuhan akan data spasial resolusi spasial tinggi dalam pemetaan habitat bentik. Pemetaan habitat bentik memerlukan data spasial resolusi spektral tinggi karena komposisi objeknya yang kompleks. Selain itu, dengan meningkatnya kebutuhan akan detil informasi habitat bentik, maka kebutuhan resolusi spasial citra juga semakin meningkat (Hedley et al. 2012). Meningkatkan kebutuhan akan citra resolusi spasial resolusi tinggi akan berimbas pada meningkatnya biaya yang dibutuhkan dalam melakukan aktivitas pemetaan habitat bentik. Oleh karena itu, diperlukan suatu data penginderaan jauh yang lebih efisien untuk mencukupi kebutuhan tersebut dengan harga yang relatif murah. Selain itu, penelitian ini juga penting untuk dilakukan karena tidak semua data penginderaan jauh tersedia dalam kualitas yang optimal, baik pada kualitas spasial, radiometrik dan spektralnya, yang lebih lanjut akan mempengaruhi akurasi dari hasil klasifikasi. Salah satu alternatif adalah dengan menggunakan data penginderaan jauh terkompresi tinggi, seperti yang banyak ditemukan pada layanan navigasi berbasis internet. Data-data tersebut tersimpan lossy format seperti JPEG (Joint Photographic Expert Group). Data ini sudah mengalami penurunan kualitas demi menghemat ukuran file. Untuk itu perlu dikaji sejauh mana data terkompresi tinggi tersebut mampu melakukan pemetaan habitat bentik jika dibandingkan dengan data asli. Penelitian ini menggunakan citra Worldview-2 asli dan yang dikompresi dengan tujuan untuk mensimulasikan data penginderaan jauh terkompresi yang banyak tersedia di pasaran. Algoritma klasifikasi mean shift diterapkan untuk mengkelaskan habitat bentik disamping klasifikasi per-piksel. Klasifikasi mean shift dipilih karena mampu mengkelaskan objek dengan baik pada data penginderaan jauh dengan kualitas yang tidak optimal. 664
Gambar 1. Wilayah penelitian di Ujung Gelam (boks biru), Kepulauan Karimunjawa, Kabupaten Jepara, Jawa Tengah Penelitian ini dilakukan di Kepulauan Karimunjawa, Kabupaten Jepara, Jawa Tengah (Gambar 1). Kepulauan ini merupakan salah satu Taman Nasional Laut di Indonesia. Wilayah Ujung Gelam dipilih sebagai wilayah kajian awal dari penelitian ini. Penelitian lanjutan akan dilakukan secara menyeluruh sebagai kalibrasi hasil dari penelitian ini dan untuk dapat menyimpulkan hasil dengan lebih konfiden. METODE PENELITIAN Survei Lapangan Survei lapangan dilakukan untuk memperoleh training area habitat bentik untuk proses klasifikasi digital dan uji akurasi. Sampling mapping unit untuk penentuan lokasi pengambilan sampel adalah kelas spektral habitat bentik yang diperoleh dari klasifikasi unsupervised Isodata dan konfigurasi lanskap habitat bentik. Survei lapangan dilakukan dengan teknik photo-transect (Roelfsema & Phinn, 2009) dan berhasil mendapatkan sampel sebanyak 710 sampel. Sebanyak 360 sampel digunakan untuk klasifikasi digital dan 350 sampel digunakan untuk uji akurasi hasil klasifikasi. Skema klasifikasi yang digunakan untuk mengelaskan 710 sampel tersebut diadopsi dari skema klasifikasi habitat bentik yang dikembangkan oleh Wicaksono (2014). Skema klasifikasi ini dibangun dengan basis komposisi habitat bentik, dan level skema klasifikasi yang digunakan pada penelitian ini adalah level 2 (Tabel 1). Tabel 1. Skema level 2 dari skema klasifikasi yang dikembangkan oleh Wicaksono (2014) yang digunakan dalam penelitian ini. Dalam penelitian ini, hanya ada 11 kelas dari 15 kelas pada skema klasifikasi level 2 yang dijumpai di wilayah kajian. Sumber skema klasifikasi: Wicaksono (2014) Level 2 Jumlah kelas 15 Jumlah kelas ditemui 11 Kelas: Algae Coral Dead Algae Sand Algae Rubble Algae Coral Sand Algae Sand Rubble Coral Sand Rubble Coral Reefs Coral Algae Seagrass Algae Seagrass Sand Pengolahan Citra Digital Pengolahan citra digital mencakup kompresi data, koreksi citra, masking citra, transformasi citra, dan klasifikasi citra. Kompresi data dilakukan pada citra Worldview-2 yang masih asli (raw, DN, 35.684 KB) dengan compression factor (CF) 0.1, 0.75, dan 1.0. Ketiga nilai CF tersebut menghasilkan besar compression ratio (CR) masing-masing 1:360 (99 KB), 1:83 (437 KB), dan 1:14 (2568 KB). Format citra hasil kompresi adalah JPEG. Tujuannya adalah untuk mengetahui pengaruh tingkat CF dan CR terhadap kualitas data dan akurasi hasil klasifikasinya. 665
Koreksi geometrik citra dilakukan sebelum proses kompresi dengan tujuan agar masing-masing data saling georeferenced, dan perbedaan hasil klasifikasi dan uji akurasi bukan akibat dari bias geometrik. Koreksi radiometrik citra hanya diterapkan pada citra Worldview-2 asli (raw), dengan asumsi bahwa citra Worldview-2 JPEG tidak memiliki informasi penyerta (header) yang digunakan untuk melakukan koreksi radiometrik. Selain itu data terkompresi juga tidak memiliki saluran NIR untuk koreksi sunglint. Koreksi radiometrik mencakup konversi dari DN ke surface reflectance, koreksi sunglint (Kay et al. 2009) dan koreksi kolom air (Lyzenga, 1978; Wicaksono & Hafizt, 2013). Transformasi citra Principle Component Analysis (PCA) diterapkan pada data asli (DN, surface reflectance, sunglint-free, terkoreksi kolom air) maupun data terkompresi. Transformasi PCA mampu meningkatkan kemampuan citra dalam identifikasi variasi habitat bentik (Wicaksono, 2014). Masking citra dilakukan untuk mengeluarkan piksel daratan dari analisis. Pengeluaran piksel daratan dari analisis mempunyai beberapa keuntungan, antara lain: 1) mempersingkat waktu pengolahan citra digital, 2) memaksimalkan kemampuan PCA dalam menonjolkan variasi habitat bentik, dan 3) mengeluarkan piksel yang tidak digunakan dalam proses klasifikasi digital. Klasifikasi digital dilakukan dengan dua pendekatan, yaitu pendekatan per-piksel dan integrasi pendekatan perpiksel dan segmentasi dengan algoritma Mean Shift. Algoritma klasfikasi per-piksel yang digunakan adalah Minimum distance to mean (mindis), Mahalanobis distance (mahalo), dan Maximum Likelihood (maxlik). Pada pendekatan kedua, ketiga algortima klasifikasi tersebut diintegrasikan dengan algoritma segmentasi mean shift. Algoritma klasifikasi mean shift mempunyai kelebihan dalam segmentasi citra dengan pendekatan clustering parametrik. Segmen citra didapatkan secara natural melalui interpretasi probabilitas dari nilai kesamaan melalui clustering berdasarkan Kernel Density Estimation. Algoritma segmentasi mean shift terbukti mampu digunakan untuk meningkatkan akurasi klasifikasi penutup lahan menggunakan data penginderaan jauh terkompresi tinggi (JPEG) (Farda, 2008). Uji Akurasi Uji akurasi hasil klasifikasi dilakukan dengan tabel kontingensi yang dalam ilmu penginderaan jauh disebut dengan teknik confusion matrix (Congalton, 1991). Sampel yang digunakan untuk uji akurasi adalah sampel habitat bentik independen, yang artinya adalah sampel yang tidak digunakan dalam proses klasifikasi digital. Akurasi dari tiap hasil klasifikasi akan dibandingkan satu sama lain dengan menggunakan analisis McNemar Test (Foody, 2004). Analisis ini bertujuan untuk menarik kesimpulan hasil klasifikasi manakah yang akurasinya signifikan berbeda lebih tinggi atau lebih rendah secara dibanding hasil klasifikasi lainnya. HASIL DAN PEMBAHASAN Hasil Akurasi tertinggi dari hasil klasifikasi Citra Worldview-2 asli adalah sebesar 32.38%, yang diperoleh dari citra pada level DN dan surface reflectance. Hasil klasifikasi dari mahalanobis distance dan maximum likelihood menunjukkan pola serupa. Hanya klasifikasi minimum distance yang menghasilkan pola berbeda dimana DII-PC band menghasilkan akurasi tertinggi. Integrasi dengan mean shift tidak berhasil meningkatkan akurasi klasifikasi habitat bentik. Akurasi tertinggi yang diperoleh dari integrasi mean shift adalah 27.71%, yang signifikan lebih rendah dari akurasi klasifikasi dengan algoritma per-piksel. Algoritma mean shift gagal diterapkan untuk data surface reflectance dan DII. Penelitian lanjutan akan dilakukan untuk mencari penyebab kegagalan ini. Rekapitulasi hasil uji akurasi klasifikasi Citra Worldview-2 asli disajikan pada Tabel 2. Tabel 2. Akurasi klasifikasi habitat bentik menggunakan citra Worldview-2 asli pada berbagai tingkat pengolahan citra digital. Untuk hasil citra terkompresi, hanya JPEG pada CF 0.75 yang ditampilkan. Keterangan, Deglint = sunglintfree band, DII = band terkoreksi kolom air, PC band = band hasil transformasi PCA. Warna kuning adalah akurasi tertinggi Klasifikasi algoritma per-piksel Input Mindis Mahalo Maxlik Mean DN 19.71 26.28 32.38 26.12 Surface Reflectance 18.00 26.28 32.38 25.55 Surface Ref PC band 18.28 24.57 28.12 23.65 Deglint band 18.00 20.00 29.54 22.51 Deglint PC band 14.85 22.28 31.25 22.79 DII 21.71 20.85 20.73 21.09 666
Klasifikasi algoritma per-piksel Input Mindis Mahalo Maxlik Mean DII PC band 22.00 22.28 24.43 22.90 Mean 18.93 23.22 28.40 23.52 Std Deviasi 2.46 2.52 4.39 3.12 CL95% 1.82 1.87 3.25 2.31 Bottom 17.11 21.34 25.15 21.21 Upper 20.76 25.09 31.65 25.83 Integrasi klasifikasi per-piksel dan segmentasi mean shift Input Mindis Mahalo Maxlik Mean DN 13.71 26.57 27.71 22.66 Deglint band 17.42 23.71 17.14 19.42 Mean 15.56 25.14 22.42 21.04 Std Deviasi 2.62 2.02 7.47 4.03 CL95% 1.94 1.49 5.53 2.99 Bottom 13.60 23.64 16.88 18.05 Upper 17.50 26.63 27.96 24.03 Akurasi klasifikasi dari citra Worldview-2 terkompresi jauh lebih tinggi dibandingkan hasil akurasi citra Worldview-2 asli. Akurasi tertinggi yang diperoleh citra terkompresi adalah 61.36% dari hasil klasifikasi maximum likelihood pada citra JPEG PC band. Akurasi rata-rata dari citra terkompresi juga jauh lebih tinggi, yaitu 57.97±0.89% berbanding 23.52±2.31%. Hasil klasifikasi mean-shift pada citra terkompresi juga tidak meningkat dibandingkan dengan akurasi hasil klasifikasi per-piksel. Meskipun demikian, integrasi mean shift pada algortima minimum distance dan mahalanobis distance mampu menghasilkan akurasi yang lebih baik dibanding hasil akurasi dari algoritma serupa pada citra Worldview-2 asli. Tabel 3. Akurasi klasifikasi habitat bentik menggunakan citra Worldview-2 terkompresi pada level DN dan DN PC band. Untuk hasil citra terkompresi, hanya JPEG pada CF 0.75 yang ditampilkan. Keterangan, PC band = band hasil transformasi PCA. Warna kuning adalah akurasi tertinggi Klasifikasi algoritma per-piksel Input: JPEG Mindis Mahalo Maxlik Mean DN 55.71 58.85 59.65 58.07 DN PC band 56.28 56 61.36 57.88 Mean 55.99 57.42 60.5 57.97 Std Deviasi 0.41 2.01 1.21 1.21 CL95% 0.29 1.49 0.89 0.89 Bottom 55.69 55.93 59.61 57.07 Upper 56.29 58.91 61.4 58.87 Integrasi klasifikasi per-piksel dan segmentasi mean shift Input: JPEG Mindis Mahalo Maxlik Mean DN 14.57 17.71 9.71 13.99 DN PC band 32.28 28.85 4.57 21.9 Mean 23.425 23.28 7.14 17.94 Std Deviasi 12.52 7.87 3.63 5.58 CL95% 9.275 5.83 2.69 5.93 Bottom 14.14 17.44 4.44 12.01 Upper 32.71 29.11 9.83 23.88 Jika dibandingkan, maka akan tampak sangat jelas bahwa citra Worldview-2 terkompresi mempunyai akurasi klasifikasi yang signifikan jauh lebih tinggi dari pada klasifikasi lainnya (Gambar 2). Algoritma klasifikasi per- 667
piksel juga mampu bekerja lebih baik ketika diterapkan secara tunggal dibandingkan ketika diintegrasikan dengan algoritma segmentasi mean shift. Overall accuracy (%) 70 60 50 40 30 20 10 0 (A) 50 Minimum distance Mahalanobis distance Maximum likelihood Overall accuracy (%) 40 30 20 10 (B) 0 Raw Raw+MeanShift JPEG JPEG+MeanShift Gambar 2. Perbandingan akurasi antar hasil klasifikasi (A) dan rata-rata akurasinya disertai error bar (95%CL) (B) Hasil klasifikasi habitat bentik dengan akurasi terbaik dari masing-masing kombinasi input disajikan pada Gambar 3 hingga Gambar 6. Gambar 3. Klasifikasi habitat bentik dari citra Worldview-2 asli pada level DN menggunakan algoritma klasifikasi maximum likelihood dengan akurasi 32.38% 668
Gambar 4. Klasifikasi habitat bentik dari citra Worldview-2 asli pada level DN menggunakan integrasi klasifikasi maximum likelihood dan segmentasi mean shift dengan akurasi 27.71% Gambar 5. Klasifikasi habitat bentik dari DN-PC band citra Worldview-2 terkompresi menggunakan algoritma klasifikasi maximum likelihood dengan akurasi 61.36% 669
Gambar 6. Klasifikasi habitat bentik dari DN-PC band citra Worldview-2 terkompresi menggunakan algoritma klasifikasi minimum distance dengan akurasi 32.28% Pembahasan Pada area kajian penelitian, algoritma klasifikasi mean shift belum berhasil meningkatkan akurasi pemetaan habitat bentik, baik pada citra Worldview-2 asli maupun yang terkompresi. Perbedaan akurasi yang signifikan antara hasil Worldview-2 terkompresi dengan hasil lainnya tidak hanya sebatas statistik uji akurasi namun juga pada distribusi spasial habitat bentiknya seperti yang tersaji pada Gambar 7. Pada Gambar 7 dapat dilihat bahwa kelas-kelas terumbu karang, makro alga dan substrat terbuka terdistribusi dengan benar pada Gambar (B), yang mempunyai akurasi tertinggi. Substrat terbuka mengisi ruang antar terumbu karang, makro alga dan komposisi substrat terbuka lainnya mendominasi garis pantai. Pada Gambar (A), terlalu banyak isolated pixels dan habitat bentik saling tercampur satu sama lain. Hasil klasifikasi mean shift pada Gambar (C) dan Gambar (D) menunjukkan distribusi kelas yang acak pada area terumbu karang. Meskipun demikian, distribusi habitat bentik pada area sekitar garis pantai cukup baik. (A) (B) 670
(C) Gambar 7. Perbandingan detil klasifikasi antar kualitas data dan algoritma klasifikasi: (A) Worldview-2 asli dengan maximum likelihood (32.38%), (B) PC band Worldview-2 terkompresi maximum likelihood (61.36%), (C) Worldview-2 asli dengan integrasi maximum likelihood dan mean shift (27.71%), dan (D) PC band Worldview-2 terkompresi dengan integrasi minimum distance dan mean shift (32.28%) (D) Ada beberapa penyebab tidak optimalnya penggunaan klasifikasi mean shift dalam penelitian ini. Pertama, ada gap dalam proses integrasi sampel photo-transect dan cluster pada hasil segmentasi mean shift. Mengkonversi informasi photo-transect untuk tiap area hasil segmentasi mean shift memerlukan pendekatan khusus, yang berbeda dengan pendekatan pada klasifikasi per-piksel. Kedua, sampel uji akurasi kurang sesuai untuk diterapkan pada hasil klasifikasi algoritma segmentasi mean shift, sehingga menimbulkan bias akurasi. Hasil klasifikasi mean shift berupa area perlu sampel uji akurasi yang berupa area pula, dan sampel uji akurasi jenis ini sulit diperoleh untuk habitat bentik. Tidak ada data spasial berupa area (misal: peta) yang dapat dijadikan referensi untuk menguji hasil klasifikasi mean shift. Sehingga perlu dikembangkan sebuah pendekatan yang dapat mengoptimalkan penggunaan sampel photo-transect untuk klasifikasi menggunakan teknik segmentasi. Karena adanya beberapa isyu diatas, maka hasil penelitian ini belum dapat menyimpulkan secara utuh kemampuan algoritma mean shift dalam pemetaan habitat bentik. Meskipun demikian, penelitian ini mampu memberikan gambaran potensi kemampuan algoritma klasifikasi mean shift dalam memetakan habitat bentik, terutama untuk citra penginderaan jauh terkompresi. Kedepan, penting untuk mengembangkan prosedur uji akurasi untuk hasil klasifikasi segmentasi. Selain itu juga perlu dikembangkan prosedur integrasi efektif sampel photo-transect dan hasil segmentasi dalam klasifikasi habitat bentik. Penting juga untuk melakukan penelitian dengan lossy format lainnya seperti JPEG2000, untuk mengkaji efektifitas masing-masing algoritma kompresi. Terakhir, untuk dapat menyimpulkan kemampuan klasifikasi mean shift, maka perlu untuk melakukan penelitian serupa pada area habitat bentik yang lebih luas dengan komposisi spesies yang berbeda. KESIMPULAN 1. Algoritma klasifikasi mean shift dapat diintegrasikan dengan algoritma klasifikasi per-piksel dalam pemetaan habitat bentik, baik menggunakan data penginderaan jauh asli maupun terkompresi. Meskipun demikian, dengan prosedur yang ada sekarang, akurasi klasifikasi dari algoritma mean shift masih lebih rendah dibandingkan dengan hasil dari klasifikasi per-piksel. 2. Hasil klasifikasi menggunakan citra Worldview-2 terkompresi dengan CF 0.75 menghasilkan akurasi yang lebih baik dibanding citra Worldview-2 asli maupun citra Worldview-2 terkompresi dengan tingkat CF yang lain 671
UCAPAN TERIMA KASIH Kami ucapkan terima kasih kepada Prof. Stuart Phinn dari University of Queensland dan Digital Globe atas penggunaan citra Worldview-2 wilayah Kepulauan Karimunjawa. Terima kasih banyak kepada Muhammad Hafizt atas bantuannya dalam survei lapangan. DAFTAR PUSTAKA Congalton, R. G. (1991). A review of assessing the accuracy of classifications of remotely sensed data. Remote Sensing of Environment, 37, 35-46. Farda, N. M. (2008). Klasifikasi Berorientasi Obyek Berdasarkan Segmentasi untuk Analisis Citra Penginderaan Jauh Resolusi Spasial Tinggi. Universitas Gadjah Mada, Ilmu Komputer, MIPA. Yogyakarta: Universitas Gadjah Mada. Foody, G. M. (2004). Thematic Map Comparison: Evaluating the Statistical Significance of Differences in Classification Accuracy. Photogrammetric Engineering & Remote Sensing, 70 (5), 627 633. Hedley, J. D., Roelfsema, C. M., Phinn, S. R., & Mumby, P. J. (2012). Environmental and sensor limitations in optical remote sensing of coral reefs: implications for monitoring and sensor design. Remote Sensing, 4, 271-302. Kay, S., Hedley, J. D., & Lavender, S. (2009). Sun Glint Correction of High and Low Spatial Resolution Images of Aquatic Scenes: a Review of Methods for Visible and Near-Infrared Wavelengths. Remote Sensing, 1, 697-730. Lyzenga, D. R. (1978). Passive Remote-Sensing Techniques for Mapping Water Depth and Bottom Features. Applied Optics, 17, 379-383. Roelfsema, C. M., & Phinn, S. R. (2009). A manual for conducting georeferenced photo transects surveys to assess the benthos of coral reef and seagrass habitats. Queensland: Centre for Remote Sensing & Spatial Information Science, School of Geography, Planning & Environmental Management, University of Queensland. Wicaksono, P. (2014). The use of image rotations on multispectral-based benthic habitats mapping. The 12th Biennial Conference of PORSEC 2014. Denpasar, Bali: PORSEC. Wicaksono, P., & Hafizt, M. (2013). Mapping seagrass from space: Addressing the complexity of seagrass LAI mapping. European Journal of Remote Sensing, 46, 18-39. 672