1.1 Latar Belakang BAB I PENDAHULUAN Kartu Perlindungan Sosial (KPS) adalah kartu yang diterbitkan oleh Pemerintah Indonesia dalam Percepatan dan Perluasan Perlindungan Sosial (P4S). Rumah tangga yang memiliki KPS berhak menerima program-program perlindungan sosial seperti Subsidi Beras untuk Masyarakat Berpenghasilan Rendah (Raskin), Bantuan Siswa Miskin (BSM), dan Program Simpanan Keluarga Sejahtera (PSKS) sesuai dengan ketentuan yang berlaku. KPS membantu memastikan agar rumah tangga miskin dan rentan miskin dapat menerima manfaat dari semua program perlindungan sosial yang berhak diterimanya sehingga membantu upaya rumah tangga untuk keluar dari kemiskinan. Data Rumah Tangga Sasaran (RTS) bersumber dari Basis Data Terpadu (BDT) yang dikelola oleh Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K). Pendataan RTS telah dilakukan sebanyak tiga kali oleh Badan Pusat Statistik (BPS), yaitu: Pendataan Sosial Ekonomi (PSE) pada tahun 2005, Pendataan Program Perlindungan Sosial (PPLS) pada tahun 2008, dan yang terakhir PPLS pada tahun 2011 (www.psks.info). Pada masyarakat penyebaran penerima Kartu Perlindungan Sosial belum sepenuhnya tepat sasaran, walau sumber data penerima KPS dari Basis Data Terpadu Pemerintah. Seperti yang disebutkan dalam Booklet Penetapan Sasaran Solusi Kepesertaan dan Pemutakhiran Data Penerima KPS yang tersedia pada web resmi pemerintah untuk program penanggulangan kemiskinan www.tnp2k.go.id penetapan sasaran program bantuan sosial berbasis rumah tangga tidak pernah mencapai keakuratan seratus persen. Kemungkinan terjadinya rumah tangga yang luput maupun salah sasaran dapat terjadi pada setiap penyaluran program bantuan masih tetap ada. Hal ini dikarenakan terdapat rumah tangga yang pindah lokasi maupun rumah tangga yang keadaan ekonominya membaik. Permasalahan yang sama juga terjadi pada lingkungan di Kelurahan Pagesangan. Kelurahan Pagesangan merupakan salah satu dari 9 kelurahan yang 12
13 ada pada wilayah Kecamatan Kota Mataram, Nusa Tenggara Barat. Pada halaman web Program Nasional Pemberdayaan Masyarakat Mandiri www.pnpmperkotaan-org dituliskan tentang profil Kelurahan Pagesangan yang salah satunya mengenai informasi jumlah penduduk berdasarkan data per 30 April 2009, jumlah penduduk Kelurahan Pagesangan mencapai 26.436 orang yang terdiri dari 6.139 kepala keluarga. Dari keseluruhan jumlah kepala keluarga pada Kelurahan Pagesangan tidak dapat dipungkiri adanya rumah tangga yang luput dari sasaran maupun salah sasaran penyaluran program bantuan pemerintah. Masyarakat setempat mengeluhkan permasalahan mengenai penyaluran program perlindungan sosial pemerintah yang tidak merata. Terdapat rumah tangga yang luput dari sasaran dan terjadinya kesalahan sasaran dalam penyaluran program pemerintah ini. Klasifikasi adalah salah satu task dalam Data Mining yang banyak dilakukan dan telah diimplementasikan di bidang statistik, pengenalan pola, pengambilan keputusan, machine learning, neural network dan lain-lain. Klasifikasi merupakan metode pembelajaran yang terawasi (supervised). Salah satu metode klasifikasi yang paling populer adalah K-Nearest Neighbor. Metode KNN diperkenalkan oleh Fix dan Hog. KNN mengklasifikasikan suatu objek baru berdasarkan kedekatan jarak suatu data dengan data yang lain. (Yan : 2013) Algortima KNN memiliki kelemahan. Salah satunya yaitu kelas objek baru ditentukan berdasarkan voting mayoritas kelas pada K jarak terdekat. Untuk memperbaiki kinerja dari algoritma KNN dalam melakukan klasifikasi, telah dilakukan beberapa modifikasi pada algoritma KNN. Salah satu modifikasi algoritma KNN yang telah diperkenalkan adalah algoritma Modified K-Nearest Neighbor (MKNN). Algoritma ini diperkenalkan oleh Parvin dkk yang bertujuan untuk mengatasi masalah tingkat akurasi yang rendah pada algoritma KNN dan meningkatkan performa algoritma KNN. Berdasarkan pemaparan diatas, akan dilakukan proses klasifikasi pada rumah tangga yang berada pada Lingkungan Kelurahan Pagesangan menggunakan metode Modified K-Nearest Neighbor (MKNN). Dua lingkungan di Kelurahan Pagesangan akan diambil datanya untuk
14 dijadikan dataset penelitian dan disesuaikan variabel-variabel penentu penerima KPS. 1.2 Rumusan Masalah Masalah yang ditemukan pada penelitian ini adalah sebagai berikut: 1. Bagaimana proses klasifikasi rumah tangga menggunakan metode Modified K-Nearest Neighbor (MKNN)? 2. Bagaimana performa metode Modified K-Nearest Neighbor (MKNN) dan K-Nearest Neighbor (KNN) dalam klasifikasi rumah tangga untuk menentukan penerima KPS? 1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah sebagai berikut: 1. Untuk mengetahui proses klasifikasi rumah tangga menggunakan metode Modified K-Nearest Neighbor (MKNN) 2. Untuk menganalisis performa metode Modified K-Nearest Neighbor (MKNN) dan K-Nearest Neighbor (KNN) dalam klasifikasi rumah tangga untuk menentukan penerima KPS. 1.4 Batasan Masalah Batasan masalah pada penelitian ini adalah : 1. Ruang lingkup penelitian dibatasi hanya untuk dua lingkungan pada Kelurahan Pagesangan Kecamatan Mataram Kota Mataram agar ruang lingkup penelitian tidak terlalu luas. 1.5 Manfaat Penelitian Manfaat dari penelitian ini adalah: 1. Dapat membantu pemerintah khususnya pemerintah daerah dalam menentukan daftar rumah tangga sasaran (RTS) baru untuk penerima program bantuan pada lingkungan Kelurahan Pagesangan. 2. Dapat membantu masyarakat yang tergolong miskin yang luput dari daftar RTS agar dapat masuk kedalam daftar RTS.
15 1.6 Metodelogi Penelitian Pada sub bab metode penelitian akan dijelaskan mengenai proses yang dilalui untuk melakukan klasifikasi rumah tangga. Adapun sub bab metode penelitian akan menjelaskan tentang studi literatur, penentuan fitur klasifikasi, pengumpulan data, pengolahan data, metode yang digunakan, dan pengujian yang dilakukan. 1.6.1 Studi Literatur Pada tahap ini akan dilakukan penggalian teori yang relevan dan mendalam mengenai masalah yang diteliti. Studi literatur ini meliputi pemahaman metode Modified K-Nearest Neighbor untuk diterapkan dalam proses klasifikasi data rumah tangga. Sumber literatur yang digunakan berupa buku dan jurnaljurnal ilmiah tentang permasalahan terkait untuk mendapatkan gambaran menyeluruh mengenai tahapan klasifikasi menggunakan metode Modified K- Nearest Neighbor 1.6.2 Penentuan Fitur Fitur yang digunakan dalam proses klasifikasi diadaptasi berdasarkan variabel kriteria dalam menentukan kondisi rumah tangga sasaran (RTS) sebagai calon penerima KPS yang diperoleh dari Booklet Penetapan Sasaran Solusi Kepesertaan dan Pemutakhiran Data Penerima KPS. Berikut ini kelompok variabel kriteria dalam menentukan kondisi RTS yang nantinya akan digunakan sebagai fitur dalam proses klasifikasi rumah tangga. Kelompok Kriteria Tabel 1. 1 Kelompok Variabel Kriteria Penentu Kondisi RTS Detail Kriteria Status kepala rumah tangga Deskripsi Kepala rumah tangga tunggal/menikah Jumlah anggota rumah Karakteristik Lebih banyak / sedikit tangga Rumah Jumlah anggota rumah Tangga tangga usia produktif Lebih banyak / sedikit (bekerja) Jumlah anak bersekolah Lebih banyak / sedikit Kondisi Tingkat pendidikan kepala Pendidikan dasar, menengah,
16 Sosial Ekonomi rumah tangga Tingkat pendidikan anggota rumah tangga Status Pekerjaan utama kepala rumah tangga tinggi Pendidikan dasar, menengah, tinggi Berusaha sendiri, buruh, karyawan Keadaan Rumah Tinggal Kepemilikan Aset Status kepemilikan rumah Dinding Atap Lantai Sumber penerangan/listrik Bahan bakar untuk memasak Sumber air minum Cara memperoleh air minum Pemakaian fasilitas tempat buang air/toilet Tempat Buang Air Kulkas Tabung gas 12 kg Telepon selular Kendaraan Milik sendiri / keluarga / sewa Bahan/kondisi Bahan/Kondisi Bahan/kondisi PLN/Non PLN ; daya terpasang Listrik / gas / minyak tanah / arang Air kemasan / isi ulang / leding / sumur Beli / tidak membeli Bersama / milik sendiri Tangki/lubang/tanah/kolam/sung ai/lapangan Memiliki / tidak memiliki Memiliki / tidak memiliki Memiliki / tidak memiliki Sepeda/ perahu / sepeda motor / perahu motor / mobil / kapal bermotor Berdasarkan variabel kriteria penentu kondisi rumah tangga RTS diatas, dapat ditentukan fitur-fitur yang dapat digunakan dalam proses klasifikasi rumah tangga untuk penentuan penerima KPS. Berikut ialah detail dari fitur yang akan digunakan untuk proses klasifikasi: Tabel 1. 2 Fitur Klasifikasi Rumah Tangga No Fitur Keterangan Fitur 1 Status kepala rumah tangga Tunggal / Menikah Fitur 2 Jumlah anggota rumah tangga Numerik
17 Fitur 3 Jumlah anggota rumah tangga usia produktif Numerik Fitur 4 Jumlah anak bersekolah Numerik Fitur 5 Fitur 6 Fitur 7 Tingkat pendidikan kepala rumah tangga Rata-rata tingkat pendidikan anggota rumah tangga Status pada pekerjaan utama Dasar, menengah, tinggi Kontinue. Rata-rata pendidikan anggota rumah tangga dihitung berdasarkan pendidikan masingmasing anggota keluarga yang telah diubah ke numerik kemudian dijumlahkan dan di rata-ratakan. Berusaha sendiri, buruh, karyawan Fitur 8 Status kepemilikan rumah Milik sendiri, keluarga, sewa Fitur 9 Kondisi Dinding Fitur 10 Bahan Dinding Fitur 11 Kondisi atap Fitur 12 Bahan atap Fitur 13 Kondisi lantai Fitur 14 Bahan lantai Fitur 15 Daya listrik Fitur 16 Bahan bakar untuk memasak Fitur 17 Sumber air minum Fitur 18 Cara memperoleh air minum Fitur 19 Pemakaian fasilitas buang air/toilet Fitur 20 Tempat buang air Fitur 21 Kepemilikan aset kulkas Fitur 22 Kepemilikan aset tabung gas 12 Sangat kurang, kurang, sedang, baik Bambu, tanah, batako, bata, beton Sangat kurang, kurang, sedang, baik Seng, genteng, beton Sangat kurang, kurang, sedang, baik Tanah, semen, keramik 0 (Sumber penerangan bukan dari PLN), 450, 900, 1300 Arang, minyak tanah, gas, listrik Air kemasan, isi ulang, sumur Beli, tidak beli Bersama, milik sendiri Sungai, WC Punya, tidak punya Punya, tidak punya
18 kg Fitur 23 Kepemilikan aset telpon selular Fitur 24 Kepemilikan aset kendaraan Punya, tidak punya Tidak punya, Sepeda, sepeda motor, mobil. Setiap data testing dengan 24 atribut diatas akan diklasifikasikan menjadi 2 kelas yakni rumah tangga sasaran (RTS) penerima KPS dan non rumah tangga sasaran (Non RTS). 1.6.3 Pengumpulan Data Data yang digunakan dalam penelitian bersumber dari data rumah tangga dua lingkungan pada Kelurahan Pagesangan, yakni Lingkungan Pagesangan Barat dan Lingkungan Pagesangan Bebidas. Teknik pengumpulan data yang digunakan ialah menggunakan data primer dan data sekunder. Data sekunder yang digunakan berupa daftar penerima dan non penerima KPS di kedua lingkungan, serta data kartu keluarga (KK) yang diperoleh langsung dari pihak kedua lingkungan tersebut. Data primer yang akan dikumpulkan berupa data karakteristik rumah tangga berdasarkan fitur yang diadaptasi dari variabel kriteria penentu kondisi RTS. Proses pengumpulan data rumah tangga tersebut dilakukan dengan melakukan kerjasama dengan Kepala Lingkungan Pagesangan Barat dan Pagesangan Bebidas dengan menggunakan form isian pendataan rumah tangga pada rumah tangga yang berada pada lingkungannya. Berikut ialah form isian pendataan data rumah tangga yang disebarkan untuk mendapatkan data rumah yang diperlukan pada penelitian:
19 Gambar 1. 1 From Pendataan Rumah Tangga 1.6.4 Pengolahan Data Data yang telah dikumpulkan akan diolah terlebih dahulu sebelum digunakan untuk proses klasifikasi. Seluruh data yang diperoleh diolah sedemikan rupa kedalam bentuk file dengan format xlsx. Pengolahan data pendidikan aggota keluarga juga akan diolah untuk mendapatkan nilai rata-rata pendidikan anggota keluarga. Nilai rata-rata pendidikan anggota rumah tangga diperoleh dengan cara
20 mengubah kategori pendidikan menjadi numerik, kemudian akan dilakukan perhitungan untuk mendapatkan nilai rata-rata pendidikan anggota keluarga. Adapun perubahan kategori pendidikan ke nilai numerik yang dilakukan ialah sebagai berikut: Tidak sekolah = 1; Pendidikan dasar = 2; Menengah = 3; Tinggi = 4. Sebagai contoh satu data rumah tangga memiliki 2 anggota keluarga yang telah berstatus tamat sekolah. Satu anggota keluarga tingkat pendidikan terakhirnya ialah pendidikan dasar, dan pendidikan terakhir satu anggota keluarga lainnya ialah menengah. Nilai numerik untuk pendidikan dasar ialah 2 dan nilai numerik untuk kategori pendidikan menengah adalah 3, maka dari itu rata-rata pendidikan anggota keluarga tersebut ialah 2,5. 1.6.5 Metode yang Digunakan Dalam penelitian ini, metode yang digunakan dalam proses klasifikasi rumah tangga untuk penentuan penerima Kartu Perlindungan Sosial (KPS) ialah metode Modified K-Nearest Neighbor. Metode ini merupakan pengembangan dari metode klasifikasi K-Nearest Neighbor yang diusulkan oleh Parvin dkk yang bertujuan untuk mengatasi masalah tingkat akurasi yang rendah pada algoritma KNN. Metode MKNN menambahkan proses validasi pada setiap dataset. Selanjutnya proses klasifikasi dijalankan dengan melakukan pembobotan pada dataset dengan menggunakan nilai validasi sebagai faktor perkalian. MKNN memerlukan metode perhitungan jarak untuk mengukur jarak antara dataset dan data testing atau vektor inputan baru. Dataset dan data testing yang digunakan terdiri dari atribut yang heterogen yakni atribut kategorikal dan atribut numerik, maka dari itu metode perhitungan jarak yang digunakan ialah metode Heterogenous Value Difference Metric (HVDM). Metode perhitungan
21 jarak ini diperkenalkan oleh Wilson dan Martinez pada tahun 1997 untuk menghitung jarak data dengan atribut yang heterogen. 1.6.6 Pengujian dan Evaluasi Pengujian dilakukan dengan menghitung tingkat keakuratan dari hasil klasifikasi menggunakan metode Modified K-Nearest Neighbor. Nilai akurasi diperoleh dari perbandingan antara label kelas yang diperoleh dari hasil klasifikasi dan label kelas asli dari data testing. Selanjutnya juga akan dilakukan pengujian pengaruh parameter K terhadap nilai akurasi yang diperoleh. Selain itu juga akan dilakukan pengujian performa algoritma Modified K-Nearest Neighbor dengan membandingkan nilai akurasi yang diperoleh dengan algoritma K-Nearest Neighbor. Pengujian juga akan dilakukan untuk mendapatkan nilai (smoothing regulator) yang optimum dalam proses pembobotan dataset. Nilai alfa yang akan diuji bernilai 0 hingga 1. Nilai akurasi dari proses klasifikasi dengan metode MKNN dihitung dengan persamaan berikut ini:...(1.1) Berikut ini ialah tabel untuk mencatat nilai akurasi yang didapat: Tabel 1. 3 Tabel Hasil Pengujian K 1 2 3 4 5... 50 KNN MKNN Alfa 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1