KAJIAN PENGARUH PENAMBAHAN INFORMASI GEROMBOL TERHADAP HASIL PREDIKSI AREA NIRCONTOH

dokumen-dokumen yang mirip
ANALISIS REGRESI TERPOTONG BEBERAPA NILAI AMATAN NURHAFNI

METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE KUSMAN SADIK

APROKSIMASI BOOTSTRAP PARAMETRIK PADA PENDUGAAN SELANG PREDIKSI STATISTIK AREA KECIL LA ODE ABDUL RAHMAN

PENDUGAAN ANGKA PUTUS SEKOLAH DI KABUPATEN SEMARANG DENGAN METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK PADA MODEL PENDUGAAN AREA KECIL SKRIPSI

PREDIKSI TERBAIK EMPIRIK UNTUK MODEL TRANSFORMASI LOGARITMA DI DALAM PENDUGAAN AREA KECIL DENGAN PENERAPAN PADA DATA SUSENAS ANANG KURNIA

KAJIAN TRANSFORMASI LOGARITMA UNTUK PENDUGA SPATIAL EMPIRICAL BEST LINEAR UNBIASED PREDICTION PADA PENDUGAAN AREA KECIL HAZAN AZHARI ZAINUDDIN

PERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER

APROKSIMASI BOOTSTRAP PARAMETRIK PADA PENDUGAAN SELANG PREDIKSI STATISTIK AREA KECIL LA ODE ABDUL RAHMAN

PENDUGAAN PENGELUARAN PER KAPITA DI KABUPATEN BREBES

PERBANDINGAN METODE PENDUGAAN PARAMETER DALAM PEMODELAN PERSAMAAN STRUKTURAL LA MBAU

4. HASIL DAN PEMBAHASAN. Tabel 1. Hasil pendugaan selang prediksi dari data simulasi yang menyebar Gamma dengan D i = 1 dan tanpa peubah penyerta

ANALISIS POLA KELAHIRAN MENURUT UMUR STUDI KASUS DI INDONESIA TAHUN 1987 DAN TAHUN 1997 SUMIHAR MEINARTI

SEBARAN ASIMTOTIK PENDUGA KOMPONEN PERIODIK FUNGSI INTENSITAS PROSES POISSON PERIODIK DENGAN TREN FUNGSI PANGKAT RO FAH NUR RACHMAWATI

PENDUGAAN PARAMETER WAKTU PERUBAHAN PROSES PADA 2 CONTROL CHART MENGGUNAKAN PENDUGA KEMUNGKINAN MAKSIMUM SITI MASLIHAH

PENDUGAAN AREA KECIL TERHADAP PENGELUARAN PER KAPITA DI KABUPATEN SRAGEN DENGAN PENDEKATAN KERNEL SKRIPSI

PERBANDINGAN METODE INTERPOLASI ABRIDGED LIFE TABLE

PERBANDINGAN ANTARA UNWEIGHTED LEAST SQUARES (ULS) DAN PARTIAL LEAST SQUARES (PLS) DALAM PEMODELAN PERSAMAAN STRUKTURAL MUHAMMAD AMIN PARIS

ANALISIS POLA KELAHIRAN MENURUT UMUR STUDI KASUS DI INDONESIA TAHUN 1987 DAN TAHUN 1997 SUMIHAR MEINARTI

TINJAUAN PUSTAKA Profil Kabupaten Jember Pengeluaran Per kapita

II. TINJAUAN PUSTAKA

ANALISIS MODEL PELUANG BERTAHAN HIDUP DAN APLIKASINYA SUNARTI FAJARIYAH

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

PERATURAN BUPATI TENTANG PEMBENTUKAN, ORGANISASI DAN TATA KERJA UNIT PELAKSANA TEKNIS PAJAK DAERAH PADA BADAN PENGELOLAAN PENDAPATAN DAERAH

MODIFIKASI METODE RELE UNTUK MODEL PENDUDUK QUASI-STABIL CECEP A.H.F. SANTOSA

PENDUGAAN PARAMETER BEBERAPA SEBARAN POISSON CAMPURAN DAN BEBERAPA SEBARAN DISKRET DENGAN MENGGUNAKAN ALGORITME EM ADE HARIS HIMAWAN

Sekapur Sirih. Jakarta, Agustus 2010 Kepala Badan Pusat Statistik Kabupaten Bogor, Ahmad Koswara, MA

Karakteristik Pendugaan Emperical Best Linear Unbiased Prediction (EBLUP) Pada Pendugaan Area Kecil

STRATEGI PENGEMBANGAN DAYA SAING PRODUK UNGGULAN DAERAH INDUSTRI KECIL MENENGAH KABUPATEN BANYUMAS MUHAMMAD UNGGUL ABDUL FATTAH

PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK DALAM PENDUGAAN AREA KECIL

III. METODOLOGI PENELITIAN GUNUNG DEPOK SINDUR PARUNG RUMPIN CISEENG CIBINONG BOJONG GEDE KEMANG RANCA BUNGUR KOTA BOGOR CIBUNGBULANG CIAMPEA DRAMAGA

ANALISIS SITUASI DAN KONDISI KABUPATEN BOGOR

PEMODELAN REGRESI 2-LEVEL DENGAN METODE ITERATIVE GENERALIZED LEAST SQUARE (IGLS) (Studi Kasus: Tingkat pendidikan Anak di Kabupaten Semarang)

MODEL DISTRIBUSI PERTUMBUHAN EKONOMI ANTARKELOMPOK PADA DUA DAERAH ADE LINA HERLIANI

PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI

ESTIMASI PARAMETER PADA MODEL REGRESI LINIER MULTILEVEL DENGAN METODE RESTRICTED MAXIMUM LIKELIHOOD (REML) abang Semarang SKRIPSI.

PENERAPAN METODE BOOTSTRAP RESIDUAL DALAM MENGATASI BIAS PADA PENDUGA PARAMETER ANALISIS REGRESI

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

SKRIPSI WANDA SURIANTO

TABEL 1 Nilai dan Kontribusi Sektor dalam PDRB Kabupaten Bogor Atas Dasar Harga Konstan Tahun

METODE BINOMIAL UNTUK MENENTUKAN HARGA OPSI CALL INDONESIA DAN STRATEGI LINDUNG NILAINYA JAENUDIN

ANALISIS BIPLOT UNTUK MEMETAKAN MUTU SEKOLAH YANG SESUAI DENGAN NILAI UJIAN NASIONAL SUJITA

ARAHAN PEMANFAATAN DAYA DUKUNG LAHAN PERTANIAN DI KABUPATEN BOGOR

PERBANDINGAN TRANSFORMASI BOX-COX DAN REGRESI KUANTIL MEDIAN DALAM MENGATASI HETEROSKEDASTISITAS

MODEL DISTRIBUSI PERTUMBUHAN EKONOMI ANTARKELOMPOK PADA DUA DAERAH ADE LINA HERLIANI

PERAN MODEL ARSITEKTUR RAUH DAN NOZERAN TERHADAP PARAMETER KONSERVASI TANAH DAN AIR DI HUTAN PAGERWOJO, TULUNGAGUNG NURHIDAYAH

PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI

PERBANDINGAN REGRESI METODE ROBUST DENGAN METODE OLS STUDY KASUS PENGARUH INFLASI DAN PDRB TERHADAP PENGANGGURAN TERBUKA DI PROVINSI JAWA TEGAH

PEMERINTAH KABUPATEN BOGOR RINGKASAN PERUBAHAN APBD MENURUT URUSAN PEMERINTAHAN DAERAH DAN ORGANISASI TAHUN ANGGARAN 2015

PENGARUH SERTIFIKASI GURU TERHADAP KESEJAHTERAAN DAN KINERJA GURU DI KABUPATEN SUMEDANG RIZKY RAHADIKHA

BAB 2 LANDASAN TEORI

HASIL DAN PEMBAHASAN. Pola Spasial Pembangunan Manusia dan Sosial. Sumberdaya Manusia

BAB IV GAMBARAN UMUM WILAYAH KABUPATEN BOGOR

PENANGANAN MASALAH HETEROSKEDASITAS DENGAN MODEL ARCH-GARCH DAN MODEL BLACK-SCHOLES MOSES ALFIAN SIMANJUNTAK

PEMODELAN SISTEM PENDULUM TERBALIK DENGAN LINTASAN MIRING DAN KARAKTERISASI PARAMETER PADA MASALAH TRACKING ERROR OPTIMAL BAMBANG EDISUSANTO

PERBAIKAN DAN EVALUASI KINERJA ALGORITMA PIXEL- VALUE DIFFERENCING ( PVD) ROJALI

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

ANALISIS PERAN KECAMATAN CIBINONG SEBAGAI PUSAT PERTUMBUHAN EKONOMI DI KABUPATEN BOGOR

KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H

BEBERAPA METODE PENDUGAAN JUMLAH KOMPONEN DALAM CAMPURAN SENYAWA KIMIA MURDAN ALFA SATYAWAN SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008

FORMULASI HAMILTONIAN UNTUK MENGGAMBARKAN GERAK GELOMBANG INTERNAL PADA LAUT DALAM RINA PRASTIWI

MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR

KAJIAN METODE ROBUST LEAST TRIMMED SQUARE (LTS) DALAM MENGESTIMASI PARAMETER REGRESI LINEAR BERGANDA UNTUK DATA YANG MENGANDUNG PENCILAN SKRIPSI

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 1, Tahun 2014, Halaman Online di:

PENGARUH MIXED DISTRIBUTION PADA PENDEKATAN QUASI-LIKELIHOOD DALAM MODEL LINEAR 1)

V. KARAKTERISTIK DAN KEMAMPUAN DAYA BELI MASYARAKAT MISKIN DI KABUPATEN BOGOR. Tabel. 22 Dasar Perwilayahan di Kabupaten Bogor

Kata Kunci: Autokorelasi, Heteroskedastisitas, Metode Kuadrat Terkecil, Metode Newey West

Judul : Perbandingan Metode MCD Bootstrap dan. Analisis Regresi Linear Berganda. Pembimbing : 1. Dra. Ni Luh Putu Suciptawati,M.Si

(R.11) PENGGUNAAN MATRIKS PEMBOBOT SPASIAL PADA MODEL SMALL AREA ESTIMATION DENGAN METODE SPATIAL EMPIRICAL BEST LINEAR UNBIASED PREDICTION

PENDUGAAN TURUNAN PERTAMA DAN TURUNAN KEDUA DARI FUNGSI INTENSITAS SUATU PROSES POISSON PERIODIK SYAMSURI

PENDEKATAN LOGIKA FUZZY UNTUK MEMPREDIKSI IPK AKHIR MAHASISWA MATEMATIKA INSTITUT PERTANIAN BOGOR

ANALISIS KETAHANAN DAN APLIKASINYA UNTUK PEMODELAN INTERVAL KELAHIRAN ANAK PERTAMA HARNANTO

PERBANDINGAN KEKONVERGENAN BEBERAPA MODEL BINOMIAL UNTUK PENENTUAN HARGA OPSI EROPA PONCO BUDI SUSILO

ESTIMASI PARAMETER DISTRIBUSI PARETO DENGAN METODE KUADRAT TERKECIL, MAXIMUM PRODUCT OF SPACING DAN REGRESI RIDGE SKRIPSI MEILISA MALIK

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

HASIL DAN PEMBAHASAN Penyebaran Desa IDT

PREDIKSI KECEPATAN PHASE GELOMBANG SOLITER TERGANGGU AHMAD HAKIM

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 4, Tahun 2015, Halaman Online di:

PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA

Jumlah rumah tangga usaha pertanian di Kabupaten Bogor Tahun 2013 sebanyak rumah tangga

PERBANDINGAN METODE MKT, LTS, WIN, DAN THEIL PADA PENDUGAAN PARAMETER REGRESI APABILA GALATNYA MENYEBAR EKSPONENSIAL HELGA ARINA PRAMUDITYA

RATA-RATA KUADRAT SESATAN PENDUGA REGRESI DENGAN KOMBINASI LINIER DUA VARIABEL BANTU PADA SAMPEL ACAK SEDERHANA

HUBUNGAN EFEKTIVITAS SISTEM PENILAIAN KINERJA DENGAN KINERJA KARYAWAN PADA KANTOR PUSAT PT PP (PERSERO), TBK JULIANA MAISYARA

MODEL PEMBERIAN KOMPENSASI BAGI PENGANGGUR UNTUK MENCAPAI KESEJAHTERAAN EKONOMI HADI KUSWANTO

PREDIKSI KECEPATAN PHASE GELOMBANG SOLITER TERGANGGU AHMAD HAKIM

PERBANDINGAN REGRESI ROBUST DENGAN OLS PADA PRODUKSI UBI JALAR PROVINSI JAWA TENGAH TAHUN 2015

MODEL MATEMATIKA PERPINDAHAN KELOMPOK BELALANG DENGAN METODE GELOMBANG BERJALAN NURUDIN MAHMUD

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA

STK 511 Analisis statistika. Materi 7 Analisis Korelasi dan Regresi

MODEL MATEMATIKA STRUKTUR UMUR INFEKSI VIRUS HIV DENGAN KOMBINASI TERAPI OBAT MUHAMMAD BUWING

PERAMALAN JUMLAH WISATAWAN GROJOGAN SEWU MENGGUNAKAN MODEL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE EXOGENOUS (ARIMAX) DENGAN VARIASI KALENDER

KETERKONTROLAN BEBERAPA SISTEM PENDULUM SAKIRMAN

MODEL MATEMATIKA UNTUK PERUBAHAN SUHU DAN KONSENTRASI DOPANT PADA PEMBENTUKAN SERAT OPTIK MIFTAHUL JANNAH

METODE EKSPLORATIF UNTUK MENGUJI KESAMAAN SPEKTRUM FTIR TEMULAWAK

oleh PRITA DEWI HUTRIANA SARI NIM. M

RISIKO GEMUK (FAT-TAILED ADRINA LONY SEKOLAH

PEMODELAN SISTEM PENDULUM TERBALIK GANDA DAN KARAKTERISASI PARAMETER PADA MASALAH REGULASI OPTIMAL HASBY ASSIDIQI

MODEL MATEMATIKA PENYEBARAN PENYAKIT DEMAM BERDARAH DENGUE JUMADI

PERAN TRANSFORMASI TUSTIN PADA RUANG KONTINU DAN RUANG DISKRET SAMSURIZAL

MODEL SKEDUL MIGRASI DAN APLIKASINYA DALAM PROYEKSI PENDUDUK MULTIREGIONAL MUSLIMAH

PERBANDINGAN KEKONVERGENAN BEBERAPA MODEL BINOMIAL UNTUK PENENTUAN HARGA OPSI EROPA PONCO BUDI SUSILO

Transkripsi:

KAJIAN PENGARUH PENAMBAHAN INFORMASI GEROMBOL TERHADAP HASIL PREDIKSI AREA NIRCONTOH (Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan Kabupaten Bogor) RAHMA ANISA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014

PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA* Dengan ini saya menyatakan bahwa tesis berjudul Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area Nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan Kabupaten Bogor) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Maret 2014 Rahma Anisa NIM G151110011

RINGKASAN RAHMA ANISA. Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area Nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan Kabupaten Bogor). Dibimbing oleh ANANG KURNIA dan INDAHWATI. Metode Prediksi Takbias Linear Terbaik Empirik atau Empirical Best Linear Unbiased Prediction (EBLUP) telah banyak digunakan untuk memprediksi parameter pada area dengan ukuran contoh yang kecil atau bahkan area nircontoh (non-sample area). Permasalahan yang terjadi adalah ketika model ini digunakan untuk memprediksi parameter area nircontoh. EBLUP baku memprediksi parameter menggunakan model sintetik yang mengabaikan pengaruh acak area karena kurangnya informasi pada area nircontoh. Akibatnya, seluruh nilai penduga parameter yang dihasilkan untuk area nircontoh akan terdistorsi pada satu garis model sintetik. Salah satu gagasan yang dikembangkan dalam penelitian ini adalah dengan menganggap bahwa terdapat kemiripan karakteristik antar-area tertentu. Hubungan antar-area tersebut dapat dianalisis dengan teknik penggerombolan (clustering). Informasi dari hasil penggerombolan ini ditambahkan ke dalam model untuk memodifikasi titik potong model prediksi EBLUP baku atau memodifikasi baik titik potong maupun kemiringan model EBLUP baku. Modifikasi ini dilakukan dengan menambahkan nilai tengah penduga pengaruh acak dari area dan peubah penyerta (auxiliary variable) pada setiap gerombol. Pada penelitian ini, kebaikan model yang diusulkan dibandingkan dengan model EBLUP baku berdasarkan simulasi. Seluruh model dievaluasi berdasarkan nilai Bias Relatif atau Relative Bias (RB) dan Akar Kuadrat Tengah Galat Relatif atau Relative Root Mean Squares Error (RRMSE). Hasil simulasi menunjukkan bahwa penambahan informasi gerombol dapat meningkatkan kebaikan model dalam memprediksi parameter pada area nircontoh. Pendugaan ragam pada model linier campuran EBLUP umumnya menggunakan pendekatan Kemungkinan Maksimum Terbatas atau Restricted Maximum Likelihood (REML) yang memerlukan asumsi kenormalan. Pelanggaran asumsi ini banyak ditemukan pada kasus-kasus terapan. Skenario yang berbeda, yaitu salah satu atau seluruh komponen acak tidak berasal dari sebaran normal, ditambahkan kedalam simulasi untuk mengkaji kebaikan model yang diusulkan pada kondisi tersebut. Hasilnya menunjukkan bahwa pada kondisi tersebut, model yang diusulkan mampu memprediksi dengan nilai RB dan RRMSE yang lebih kecil dibandingkan dengan EBLUP baku, terutama pada area nircontoh. Data SUSENAS 2010 dan PODES 2011 digunakan sebagai studi kasus untuk memprediksi rata-rata pengeluaran per kapita kecamatan di kota dan kabupaten Bogor. Penerapan model modifikasi EBLUP menghasilkan nilai prediksi yang berbeda, namun terlihat adanya kemiripan pola. Penggerombolan memegang peranan penting dalam menerapkan model yang diusulkan pada studi kasus. Pola penggerombolan yang cenderung tidak linier terhadap peubah respon dapat menyebabkan prediksi kecamatan nircontoh yang dihasilkan model yang diusulkan menjadi tidak lebih baik dibandingkan model EBLUP baku. Namun demikian, masih terdapat model dengan penambahan informasi gerombol yang

menunjukkan kemampuan yang lebih baik dibandingkan dengan EBLUP baku dalam memprediksi nilai tengah kecamatan nircontoh. Kata kunci: Analisis Gerombol, EBLUP, Model Campuran Linier

SUMMARY RAHMA ANISA. Study on the Effects of Cluster Information in Prediction of Non-sampled Area (A Case Study of per Capita Expenditures at Subdistrict Level in Regency and Municipality of Bogor). Supervised by ANANG KURNIA and INDAHWATI. Empirical Best Linear Unbiased Predictor (EBLUP) has been widely used to predict parameters in area with small or even zero sample size, known as nonsampled area. It has been noted that there is a problem when this model will be used to predict the parameters of non-sampled area. Usually EBLUP is used to predict the parameters using a synthetic model ignoring the area random effects due to lack of non-sampled area information. Hence, this prediction will be distorted based on a single line of the synthetic model. The idea developed in this thesis is to modify the prediction model by adding cluster information assuming that there are similiarities among particular areas. These information have been incorporated into the model to modify the intercept of prediction models as well as both intercept and slope of the prediction model. In this paper, a simulation is carried out to study the performance of the proposed models compared with ordinary EBLUP. All models were evaluated based on the value of Relative Bias (RB) and Relative Root Mean Squares Error (RRMSE). It was shown, by mean of simulation, that the addition of cluster information has improved the ability of the model to predict non-sampled areas. Restricted Maximum Likelihood (REML), a common method for estimating variance component in EBLUP models, requires normality assumption. But the conditions in which the area random effects or sampling error are not normally distributed may encountered in many applications. Therefore we also used different scenarios, such as either one of random component was not normally distributed or both of area random effects and sampling error area were not normally distributed, to study the performance of the proposed models when the area random effects or auxiliary variables are not normally distributed. The result showed that under these conditions, the proposed models has been able to estimate the parameter with smaller Relative Bias (RB) and Relative Root Mean Squares Error (RRMSE) than ordinary EBLUP, especially in non-sampled areas. It was shown that all models could be used to predict average per capita expenditures per month at subdistrict level in regency and municipality in Bogor. The analysis was based on SUSENAS 2010 and PODES 2011 data sets. Even though the resulting predictions of the models were different, similar pattern among them has been observed. Clustering technique played an important role in implementing the proposed model in the case study. Clustering pattern which tend not to be linearly correlated with response variable can lead to the result that proposed model was not better than standard EBLUP model. However, there were some proposed models that showed a better accuracy than the standard EBLUP prediction of non-sampled subdistrict parameter. Keywords: EBLUP, Clustering, Linear Mixed Models

Hak Cipta Milik IPB, Tahun 2014 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB

KAJIAN PENGARUH PENAMBAHAN INFORMASI GEROMBOL TERHADAP HASIL PREDIKSI AREA NIRCONTOH (Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan Kabupaten Bogor) RAHMA ANISA Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014

Penguji pada Ujian Sidang: Prof. Dr. Ir. Khairil Anwar Notodiputro, MS

Judul Tesis : Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area Nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan Kabupaten Bogor) Nama : Rahma Anisa NIM : G151110011 Disetujui oleh Komisi Pembimbing Dr. Anang Kurnia Ketua Dr. Ir. Indahwati, MSi Anggota Diketahui oleh Ketua Program Studi Magister Statistika Dekan Sekolah Pascasarjana Dr. Ir. Anik Djuraidah, MS Dr. Ir. Dahrul Syah, MSc.Agr. Tanggal Ujian: 21 Januari 2014 Tanggal Lulus:

JuduJ Tesis Nama NIM : Kajian Pengaruh Penambahan Inforrnasi Gerombol terhadap Hasil Prediksi Area Nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan Kabupaten Bogor) : Rahma Anisa : G 1511100 11 Disetujui oleh Komisi Pembimbing Dr. Anan Kurnia Ketla Dr. Ir. Indahwati, MSi Anggota Diketahui o]eh Ketua Program Studi Magister Statistika Dr.lr. Anik Djuraida~ MS Tanggal Ujian: 21 Januari 2014 Tanggal Lulus: 0 7 APR 20 14

PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta ala atas segala karunia-nya sehingga karya ilmiah ini berhasil diselesaikan. Sholawat serta salam semoga selalu tercurah kepada pemimpin umat nabi Muhammad SAW, beserta keluarga, sahabat, dan umatnya. Karya ilmiah ini Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatan Kota dan Kabupaten Bogor). Terima kasih yang sebesar-besarnya kepada semua pihak yang telah turut peran serta dalam penyusunan karya ilmiah ini, terutama kepada : 1. Bapak Dr. Anang Kurnia dan Ibu Dr. Ir. Indahwati, MSi selaku dosen pembimbing, 2. Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, MS sebagai dosen penguji pada ujian sidang tesis, 3. Badan Pusat Statistik (BPS), atas segala informasi yang telah diberikan, 4. Keluarga Besar Program Studi Statistika IPB, 5. Ayah, ibu, serta seluruh keluarga dan sahabat, atas segala dukungan, doa dan kasih sayangnya. Semoga semua bantuan yang diberikan kepada penulis mendapatkan balasan dari Allah SWT, dan semoga karya ilmiah ini dapat bermanfaat bagi semua pihak yang membutuhkan. Bogor, Maret 2014 Rahma Anisa

DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN 1 PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 2 2 TINJAUAN PUSTAKA 2 Pendugaan Area Kecil (Small Area Estimation (SAE)) 2 Empirical Best Linear Unbiased Predictor (EBLUP) 3 Restricted Maximum Likelihood (REML) 4 Analisis Gerombol (Clustering) 4 3 METODE 5 Pengembangan Model 6 Kajian Simulasi 7 Studi Kasus 10 4 HASIL DAN PEMBAHASAN 11 Kajian Simulasi 11 Studi Kasus 15 5 SIMPULAN DAN SARAN 20 Simpulan 20 Saran 20 DAFTAR PUSTAKA 20 LAMPIRAN 23 vi vi vii

DAFTAR TABEL 1 Titik potong dan kemiringan pada populasi skenario 1 8 2 Titik potong dan kemiringan pada populasi skenario 2 8 3 Jumlah area contoh dan nircontoh pada gerombol ke- 9 4 Kuadrat tengah sisaan prediksi area nircontoh 12 5 Median dari Relative Bias (RB) pada area contoh (%) 13 6 Median dari RRMSE pada area contoh (%) 13 7 Median dari Relative Bias (RB) pada area nircontoh (%) 14 8 Median dari RRMSE pada area nircontoh (%) 14 9 Uji Kenormalan Anderson-Darling 17 10 Penggerombolan kecamatan di Kota dan Kabupaten Bogor 17 11 Prediksi rata-rata pengeluaran per kapita dan evaluasi pemodelan pada kecamatan nircontoh 19 DAFTAR GAMBAR 1 Garis prediksi area nircontoh skenario 1 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan oleh Model-0, Model-1, Model-2, Model-3, Model-4, dan Model-5 11 2 Boxplot nilai RB dari prediksi nilai tengah area nircontoh skenario 2 14 3 Nilai RRMSE (%) prediksi area nircontoh model modifikasi EBLUP pada seluruh skenario simulasi 15 4 Nilai RB (%) prediksi area nircontoh model modifikasi EBLUP pada seluruh skenario simulasi 15 5 Kepekatan peluang peubah, yaitu rata-rata pengeluaran per kapita per bulan dan bentuk tranformasi logaritma peubah Y 16 6 Plot kuantil-kuantil peubah 16 7 Hubungan antara peubah penyerta jumlah poliklinik dan jumlah minimarket terhadap peubah respon 18

DAFTAR LAMPIRAN 1 Garis prediksi area nircontoh skenario 2 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh model 23 2 Garis prediksi area nircontoh skenario 3 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh model 24 3 Garis prediksi area nircontoh skenario 4 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh model 25 4 Garis prediksi area nircontoh skenario 5 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh model 26 5 Relative Bias (RB) prediksi nilai tengah area contoh pada skenario 1 27 6 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contoh pada skenario 1 28 7 Relative Bias (RB) prediksi nilai tengah area contoh pada skenario 2 29 8 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contoh pada skenario 2 30 9 Relative Bias (RB) prediksi nilai tengah area contoh pada skenario 3 31 10 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contoh pada skenario 3 32 11 Relative Bias (RB) prediksi nilai tengah area contoh pada skenario 4 33 12 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contoh pada skenario 4 34 13 Relative Bias (RB) prediksi nilai tengah area contoh pada skenario 5 35 14 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contoh pada skenario 5 36 15 Relative Bias (RB) prediksi nilai tengah area nircontoh pada skenario 1 37 16 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontoh pada skenario 1 37 17 Relative Bias (RB) prediksi nilai tengah area nircontoh pada skenario 2 38 18 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontoh pada skenario 2 38 19 Relative Bias (RB) prediksi nilai tengah area nircontoh pada skenario 3 39 20 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontoh pada skenario 3 39

21 Relative Bias (RB) prediksi nilai tengah area nircontoh pada skenario 4 40 22 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontoh pada skenario 4 40 23 Relative Bias (RB) prediksi nilai tengah area nircontoh pada skenario 5 41 24 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontoh pada skenario 5 41 25 Peubah yang terpilih sebagai dasar penggerombolan kecamatan di Kota dan Kabupaten Bogor 42 26 Korelasi antar peubah dasar penggerombolan kecamatan di Kota dan Kabupaten Bogor 43 27 Dendogram analisis gerombol kecamatan di Kota dan Kabupaten Bogor 44 28 Rataan setiap peubah pada masing-masing gerombol 45 29 Pemilihan peubah untuk pemodelan dengan seleksi model regresi stepwise 46 30 Prediksi rata-rata pengeluaran per kapita per bulan pada kecamatan contoh di Kota dan Kabupaten Bogor 47 31 Prediksi rata-rata pengeluaran per kapita kecamatan contoh pada masing-masing gerombol 48 32 Root Mean Squares Error (RMSE) dari prediksi rata-rata pengeluaran per kapita per bulan pada kecamatan contoh di Kota dan Kabupaten Bogor 49 32 Root Mean Squares Error (RMSE) dari prediksi rata-rata pengeluaran per kapita per bulan pada kecamatan contoh di Kota dan Kabupaten Bogor ( Lanjutan ) 50 33 Prediksi rata-rata pengeluaran per kapita pada kecamatan nircontoh menggunakan seluruh model 50 34 Evaluasi pemodelan pada kecamatan nircontoh menggunakan seluruh model 50

1 PENDAHULUAN Latar Belakang Pengumpulan data banyak dilakukan melalui survei contoh karena dapat memperkecil biaya dibandingkan apabila melakukan sensus. Pendugaan parameter berdasarkan informasi yang diperoleh dari suatu survei dapat dilakukan dengan pendugaan langsung (direct estimation). Pendugaan langsung akan memberi hasil yang baik ketika ukuran contoh untuk setiap area cukup besar. Namun, survei untuk memperoleh informasi rinci pada setiap area akan memerlukan waktu dan biaya yang besar. Ketika terdapat area contoh dengan ukuran yang sangat kecil atau bahkan nol, maka pendugaan langsung tidak lagi baik untuk digunakan karena dapat menghasilkan galat baku yang sangat besar (Rao 2003). Oleh karenanya, telah dikembangkan metode pendugaan tidak langsung (indirect estimation) yang diperoleh dengan memanfaatkan peubah lain (auxiliary variable), serta menambahkan pengaruh acak dari area. Pendekatan ini dikenal sebagai metode Empirical Best Linear Unbiased Prediction (EBLUP). Permasalahan lain yang muncul adalah ketika melakukan pendugaan parameter untuk area yang tidak disurvei (nircontoh). Penduga EBLUP baku untuk area nircontoh menggunakan model sintetik yang bersifat global. Model sintetik akan mengabaikan pengaruh acak area karena tidak adanya informasi pengaruh acak pada area nircontoh (Saei dan Chambers 2005). Akibatnya, nilai prediksi yang dihasilkan untuk semua area nircontoh akan terdistorsi menuju satu garis model sehingga memungkinkan terjadi bias yang cukup besar. Salah satu gagasan yang dikembangkan pada penelitian ini adalah dengan mengasumsikan bahwa suatu area memiliki pola kedekatan hubungan dengan area lain. Pola kedekatan tersebut dapat dianalisis berdasarkan karakteristik peubah tertentu untuk setiap area. Informasi dari pola hubungan tersebut akan ditambahkan ke dalam model sehingga diharapkan mampu memperbaiki pendugaan pada area nircontoh. Salah satu pendekatan untuk menganalisis pola hubungan antar-area tersebut adalah dengan teknik penggerombolan (clustering). Pendekatan lain yang dikembangkan pada penelitian ini adalah dengan menambahkan nilai tengah penduga pengaruh acak dari area dan peubah penyerta pada setiap gerombol ke dalam model prediksi. Penambahan pengaruh tetap gerombol serta pengaruh acak area dan peubah penyerta secara bersamaan pada model diharapkan mampu menghasilkan penduga yang lebih baik, terutama untuk area nircontoh. Penerapan dari metode yang dikembangkan dalam penelitian ini adalah untuk menduga rata-rata pengeluaran per kapita per bulan pada kecamatan nircontoh berdasarkan data SUSENAS tahun 2010 dan PODES tahun 2011 yang diperoleh dari Badan Pusat Statistik (BPS). Data SUSENAS hanya mencakup sebagian desa/keluharan dan kecamatan pada setiap kota dan kabupaten. Pembentukan gerombol berdasarkan data PODES, yang mencakup seluruh desa/kelurahan dan kecamatan, dapat menambah informasi untuk menduga parameter yang ingin diamati. Hal ini diperlukan terutama pada saat menduga parameter dari area yang tidak disurvei pada SUSENAS. Pada kasus ini pendugaan yang dilakukan dibatasi untuk wilayah Kota dan Kabupaten Bogor.

2 Tujuan Penelitian Tujuan yang ingin dicapai pada penelitian ini adalah: 1. memodifikasi model prediksi EBLUP baku dengan menambahkan informasi gerombol, dengan pendekatan sebagai pengaruh tetap maupun sebagai pengaruh acak, 2. mengkaji kebaikan model yang diusulkan dibandingkan dengan model dasar yaitu EBLUP baku, 3. menerapkan model yang diusulkan untuk menduga rata-rata pengeluaran per kapita per kapita per bulan pada kecamatan nircontoh di Kota dan Kabupaten Bogor. 2 TINJAUAN PUSTAKA Pendugaan Area Kecil (Small Area Estimation (SAE)) Menurut Rao (2003), suatu area dikatakan besar apabila ukuran contoh pada area tersebut mampu menghasilkan presisi pendugaan yang baik dengan penduga langsung. Sebaliknya, suatu area dikatakan kecil apabila ukuran contoh pada area tersebut tidak cukup untuk menunjang penduga langsung agar mampu menghasilkan presisi pendugaan yang baik. Pendekatan lain seringkali diperlukan untuk mengatasi permasalahan tersebut, salah satunya adalah penduga tak langsung. Penduga tak langsung meminjam informasi dengan menggunakan nilai peubah dari contoh pada area lain yang terkait dengan area yang diamati. Model pendugaan area kecil terdiri dari Model Level Area (Tipe-A) dan Model Level Satuan (Tipe-B). a. Model Level Area (Tipe-A) Model ini digunakan ketika informasi peubah penyerta pada level satuan tidak diketahui dengan mengasumsikan bahwa ( ) untuk ( ) tertentu berhubungan dengan peubah penyerta pada area, yaitu ( ), melalui model linier berikut: dengan ( ) merupakan pengaruh acak pada area ke-i. Penduga langsung diasumsikan diketahui untuk menarik kesimpulan tentang nilai tengah area kecil, yaitu:. / dengan menganggap bahwa adalah galat penarikan contoh yang menyebar normal ( ), dan diketahui. Model deterministik pada diperoleh dengan menetapkan bahwa. Model tersebut mengarah pada model sintetik yang tidak memperhitungkan keragaman lokal selain dari keragaman yang bersumber pada peubah penyerta. Model berikut diperoleh dengan menggabungkan kedua model di atas:

3 b. Model Level Satuan (Tipe-B) Model ini digunakan dengan asumsi bahwa data peubah penyerta untuk setiap satuan ( ) tersedia. Peubah yang diamati berhubungan dengan peubah penyerta melalui model regresi galat tersarang berikut: Anggapan yang digunakan pada model ini adalah terdapat satuan yang disurvei (contoh) dan satuan yang tidak disurvei (nircontoh) sehingga model di atas dapat diuraikan menjadi: 0 1 [ ] [ ] 0 1 dan penduga nilai tengah area kecil dapat dituliskan sebagai berikut: ( ) dengan, serta dan berturut-turut adalah nilai tengah untuk satuan contoh dan satuan nircontoh. Penduga nilai tengah area dengan ukuran contoh nol dapat dinyatakan sebagai. Empirical Best Linear Unbiased Predictor (EBLUP) Menurut Das et al. (2004), secara umum, model campuran linear (linear mixed model) dapat dituliskan dalam bentuk berikut: (1) dengan merupakan vektor berukuran yang berisi nilai pengamatan contoh, dan adalah matriks yang nilainya diketahui, serta dan merupakan pengaruh acak yang bersebaran saling bebas dengan nilai tengah nol dan matriks ragam koragam masing-masing adalah dan, yang bergantung pada suatu parameter yang disebut komponen ragam. Model ini menganggap bahwa berpangkat penuh p ( ), dengan catatan bahwa ragam dari peubah adalah ( ). Salah satu kasus khusus dari model (1) untuk area ke- dan satuan keadalah sebagai berikut: dengan ( ) dan ( ), yang bergantung pada suatu parameter yaitu komponen ragam ( ). Menurut Das et al. (2004), penduga EBLUP adalah suatu penduga dua tahap yang digunakan dalam menduga suatu parameter ( ) yang bergantung pada yang tidak diketahui. Pendekatan ini dilakukan dengan mengganti parameter dengan penduganya, yaitu, sehingga pendugaan dilakukan terhadap parameter ( ). Jika didefinisikan bahwa terdapat pendugaan untuk kombinasi linier dari dan yaitu: dengan dan adalah suatu vektor konstanta, maka dapat diperoleh prediktor tak bias terbaik atau Best Linear Unbiased Predictor (BLUP) bagi adalah: ( ) ( ) ( ) ( ) ( )

4 dengan ( ) ( ) adalah penduga kuadrat terkecil terampat (generalized least square), atau penduga takbias terbaik (Best Linear Unbiased Estimator (BLUE)) dari, dengan penduga dari pengaruh acak adalah ( ) ( ), dan ( ). Penduga EBLUP diperoleh dengan mengganti menjadi ( ), sehingga diperoleh ( ) (Rao 2003). Kackar dan Harville (1981) dalam Das et al. (2004) menyatakan bahwa penduga dua tahap ( ) merupakan penduga tak bias bagi, dengan asumsi bahwa dan berdistribusi simetrik. Penduga EBLUP pada area contoh ke- dapat dituliskan sebagai: ( ) dengan adalah satuan contoh dan adalah satuan nircontoh, sehingga yang merupakan nilai dugaan untuk satuan nircontoh dapat dihitung dengan rumus: Penduga EBLUP pada area nircontoh ke- adalah sebagai berikut: ( ) dengan merupakan nilai dugaan yang dihitung dengan rumus berikut: Restricted Maximum Likelihood (REML) Terdapat beberapa metode untuk memperoleh penduga komponen ragam. Salah satu pendekatannya adalah metode kemungkinan maksimum terbatas atau Restricted Maximum Likelihood (REML) yang memaksimumkan kombinasi linier dari. Jika didefinisikan bahwa ( ) dengan, maka dapat dinyatakan bahwa: ( ). Menurut McCullloch dan Searle (2001), fungsi kemungkinan maksimum dari dapat dituliskan dalam bentuk berikut: ( ) (2) dengan ( ). (3) Pendekatan REML dilakukan dengan mencari solusi persamaan (2) dan (3) terhadap yang ada di dalam. Metode REML memerlukan anggapan kenormalan karena persamaan tersebut diturunkan dari sebaran normal. Analisis Gerombol (Clustering) Analisis gerombol merupakan teknik peubah ganda yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan kemiripan karakteristik yang dimilikinya (Mattjik dan Sumertajaya 2011). Kemiripan karakteristik antar objek dapat diukur dengan jarak euclid, jarak mahalanobis, dan ukuran jarak

5 lainnya. Jarak euclid banyak digunakan karena perhitungannya yang sederhana, yaitu: ( ) ( ) ( ) dengan anggapan bahwa semua peubah diukur dengan skala yang sama. Apabila terdapat perbedaan skala pengukuran diantara peubah maka harus dilakukan pembakuan peubah. Johnson dan Wichern (2007) menjelaskan bahwa terdapat dua pendekatan dalam metode penggerombolan, yaitu metode berhirarkhi dan metode nirhirakhi. Metode penggerombolan berhirarkhi dapat dilakukan dengan pendekatan aglomeratif (penggabungan) maupun divisif (pemisahan). Penggabungan atau pemisahan antar objek dalam penggerombolan dapat disajikan dalam bentuk dendogram yang biasanya dijadikan sebagai dasar penentuan banyaknya gerombol. Metode penggerombolan nirhirarkhi digunakan apabila banyaknya gerombol yang ingin dibentuk telah ditentukan, yaitu sebanyak k gerombol. Kendala yang mungkin ditemukan pada proses analisis gerombol di antaranya adalah pelanggaran asumsi multikolinieritas dan terdapatnya pencilan. Metode analisis gerombol berhirarkhi k-medoid dapat menjadi salah satu alternatif untuk mengatasi pencilan. Permasalahan lain yang mungkin ditemukan adalah apabila penggerombolan dilakukan berdasarkan peubah yang bersifat kategorik, atau campuran antara peubah kategorik dan numerik. Salah satu pendekatan yang dapat menangani permasalahan tersebut adalah metode penggerombolan dua tahap (two step cluster). Selain itu, metode penggerombolan dua tahap juga mampu menangani penggerombolan pada data yang besar. 3 METODE Model dasar yang digunakan pada penelitian ini adalah model EBLUP baku, yang selanjutnya disebut sebagai Model-0. Pemodelan area kecil yang digunakan pada penelitian ini adalah model level satuan (tipe-b), dengan i dan j masingmasing menunjukkan area dan satuan pada area contoh, sedangkan dan masing-masing menunjukkan area dan satuan pada area nircontoh. a) Model untuk populasi: b) Model prediksi untuk area contoh: c) Model prediksi untuk area nircontoh: dengan menunjukkan nilai respon yang diamati, menunjukkan peubah penyerta, menunjukkan pengaruh acak area, dan adalah galat penarikan contoh pada area contoh. Penduga nilai respon yang diamati pada area nircontoh ( ) diperoleh dengan memanfaatkan informasi peubah penyerta pada area nircontoh ( ). Model ini menganggap bahwa ( ) dan ( ). Penelitian dilakukan dengan membangun model baru yang dikembangkan dari Model-0 tersebut.

6 Pengembangan Model Pengembangan model dilakukan dengan menambahkan informasi gerombol ke-k pada Model-0. Penambahan informasi gerombol sebagai bentuk modifikasi model dasar EBLUP menghasilkan lima model yang diusulkan pada penelitian ini. Kelima model tersebut memiliki model prediksi yang berbeda-beda, terutama untuk prediksi pada area nircontoh. 1. Model-1, yaitu modifikasi model EBLUP (Model-0) dengan menambahkan nilai tengah dari penduga pengaruh acak area masing-masing gerombol pada model prediksi area nircontoh. Penambahan tersebut dinyatakan sebagai ( ), dengan merupakan banyaknya area contoh pada gerombol ke-. a) Model untuk populasi: b) Model prediksi untuk area contoh: c) Model prediksi untuk area nircontoh: ( ) 2. Model-2, yaitu modifikasi model EBLUP (model-0) dengan menambah pengaruh tetap gerombol ke-k (model-1). Pengaruh tetap gerombol dinyatakan sebagai yang merupakan bentuk penyederhanaan notasi penduga koefisien peubah dummy untuk gerombol. Sehingga untuk sejumlah gerombol dapat diuraikan bahwa, dengan merupakan peubah dummy untuk gerombol dan merupakan penduga koefisien bagi peubah dummy. a) Model untuk populasi: b) Model prediksi untuk area contoh: c) Model prediksi untuk area nircontoh: 3. Model-3, yaitu kombinasi dari Model-1 dan Model-2. a) Model untuk populasi: b) Model prediksi untuk area contoh: c) Model prediksi untuk area nircontoh: ( ) 4. Model-4, yaitu modifikasi Model-1 dengan menambahkan nilai tengah pengaruh acak peubah penyerta setiap area pada gerombol ke-. Model ini mengasumsikan sebagai peubah acak, sehingga diperoleh dan yang merupakan pengaruh acak area ke- dan pengaruh acak peubah pada area

7 ke-. Nilai tengah pengaruh acak area area ke- pada gerombol kedinyatakan sebagai berikut: ( ) Nilai tengah pengaruh acak peubah dinyatakan sebagai berikut: ( ) a) Model untuk populasi: ( ) ( ) b) Model prediksi untuk area contoh: ( ) ( ) c) Model prediksi untuk area nircontoh: ( ( )) ( ( )) area ke- pada gerombol ke- 5. Model-5, yaitu modifikasi dari Model-4 dengan menambahkan pengaruh tetap dari gerombol ke-. a) Model untuk populasi: ( ) ( ) b) Model prediksi untuk area contoh: ( ) ( ) c) Model prediksi untuk area nircontoh: ( ( )) ( ( )) Model-5 secara diharapkan mampu menghasilkan prediksi dengan akurasi yang lebih tinggi karena model ini memiliki penambahan komponen yang paling banyak dibandingkan model-model sebelumnya. Model ini memiliki tiga komponen tambahan yaitu pengaruh acak area, pengaruh acak peubah penyerta setiap area, dan pengaruh tetap gerombol sehingga model ini memiliki titik potong dan kemiringan yang berbeda, mirip seperti Model-4, namun model ini turut memperhitungkan pengaruh tetap dari setiap gerombol. Kajian Simulasi Simulasi dilakukan untuk mengevaluasi kebaikan model yang dikembangkan. Proses simulasi dilakukan dengan langkah-langkah berikut ini. 1. Membangun populasi yang terdiri dari 40 area, dengan ukuran populasi masing-masing area berkisar antara 100 hingga 1500 satuan. Populasi tersebut diasumsikan terdiri dari 5 gerombol. Simulasi ini menggunakan satu peubah respon dan satu peubah penyerta. Respon yang diamati ( ) merupakan kombinasi linier dari peubah penyerta ( ), pengaruh acak area ( ), dan galat penarikan contoh ( ), dengan menunjukkan area, menunjukkan satuan, dan menunjukkan gerombol. Hubungan tersebut dapat dinyatakan dalam model campuran linier berikut: (4)

8 Parameter pada model (4) memiliki nilai yang berbeda untuk setiap gerombol ke-. Peubah penyerta dibangkitkan dari sebaran normal ( ), sedangkan komponen acak dan berasal dari sebaran tertentu. Beberapa skenario dibangun untuk mengkaji kebaikan model yang diusulkan pada berbagai kondisi tertentu. a) Skenario 1, populasi terdiri dari 5 gerombol yang saling terpisah dengan nilai masing-masing gerombol sebagai berikut: Tabel 1 Titik potong dan kemiringan pada populasi skenario 1 Gerombol 1 8 2 2 18 5 3 28 8 4 38 11 5 48 14 Populasi ini memiliki heterogenitas antar gerombol yang tinggi. Seluruh komponen acak pada skenario ini berasal dari sebaran normal, yaitu ( ) dan ( ) sehingga model campuran linier yang dibangun pada skenario ini akan memenuhi asumsi kenormalan. Skenario ini dibangun untuk mengkaji kemampuan model pada kondisi populasi yang ideal, yaitu karakteristik antar gerombol mampu dibedakan dengan baik dan tidak terdapat gangguan terhadap asumsi kenormalan. b) Skenario 2, populasi terdiri dari 5 gerombol yang tidak terpisah sempurna dengan nilai masing-masing gerombol sebagai berikut: Tabel 2 Titik potong dan kemiringan pada populasi skenario 2 Gerombol 1 8.00 2.00 2 8.90 2.42 3 9.90 3.37 4 11.00 4.11 5 12.20 5.47 Komponen acak pada skenario ini berasal dari sebaran normal, yaitu ( ) dan ( ). Skenario ini dibangun untuk mengkaji kemampuan model pada kondisi penggerombolan yang beririsan, atau heterogenitas antar gerombol yang rendah dan tanpa ada gangguan terhadap asumsi kenormalan. c) Skenario 3, populasi terdiri dari 5 gerombol yang terpisah sempurna, yaitu dengan nilai yang sama dengan skenario 1. Perbedaannya dengan skenario 1 adalah salah satu komponen acak yang digunakan pada skenario ini tidak berasal dari sebaran normal. Pengaruh acak area pada skenario ini dibangkitkan dari sebaran khi-kuadrat ( ), sedangkan galat penarikan contoh tetap berasal dari sebaran normal ( ). Skenario ini dibangun untuk mengkaji kemampuan model pada kondisi dengan pelanggaran asumsi kenormalan pada komponen pengaruh acak area,

9 dengan mengasumsikan karakteristik antar gerombol mampu dibedakan dengan baik. d) Skenario 4, populasi terdiri dari 5 gerombol yang terpisah sempurna, yaitu dengan nilai yang sama dengan skenario 1. Komponen pengaruh acak area pada skenario ini berasal dari sebaran normal ( ), namun komponen acak galat penarikan contoh pada populasi ini tidak berasal dari sebaran normal. Galat penarikan contoh berasal dari sebaran khi-kuadrat ( ). Skenario ini dibangun untuk mengkaji kemampuan model pada kondisi dengan pelanggaran asumsi kenormalan pada komponen galat penarikan contoh, dengan mengasumsikan karakteristik antar gerombol mampu dibedakan dengan baik. e) Skenario 5, populasi terdiri dari 5 gerombol yang terpisah sempurna, yaitu dengan nilai yang sama dengan skenario 1. Seluruh komponen acak pada skenario ini tidak berasal dari sebaran normal melainkan berasal dari sebaran khi-kuadrat, yaitu ( ) dan ( ). Skenario ini dibangun untuk mengkaji kemampuan model pada kondisi dengan pelanggaran asumsi kenormalan pada seluruh komponen acak, dengan mengasumsikan karakteristik antar gerombol mampu dibedakan dengan baik. Langkah-langkah yang dilakukan untuk membangun populasi pada setiap skenario adalah sebagai berikut: (i) membangkitkan peubah penyerta ( ) sebanyak satuan, nilai yang diperoleh pada langkah ini digunakan untuk seluruh skenario pada proses simulasi, (ii) membangkitkan pengaruh acak area dan galat penarikan contoh berdasarkan sebaran tertentu sesuai dengan skenario, (iii) menghitung nilai peubah respon berdasarkan model (4) dengan nilai koefisien yang telah ditentukan untuk masing-masing gerombol sesuai dengan skenario. 2. Mengambil contoh acak dari populasi yang dibangkitkan pada langkah (1), yaitu sebanyak area contoh yang berasal dari kelima gerombol, sehingga terdapat area nircontoh (Tabel 3). Tabel 3 Jumlah area contoh dan nircontoh pada gerombol ke- Gerombol Jumlah Area Contoh Jumlah Area Nircontoh Total Area 1 4 1 5 2 6 2 8 3 8 2 10 4 4 2 6 5 8 3 11 Penarikan contoh acak pada level satuan untuk setiap area contoh dilakukan secara proporsional dengan ukuran contoh sebesar 3% dari ukuran populasi. 3. Melakukan pemodelan dan menduga nilai tengah area contoh ke-i dan nilai tengah area nircontoh ke-. Proses ini dilakukan menggunakan model dasar

10 (Model-0) dan kelima model yang diusulkan (Model-1, Model-2, Model-3, Model-4, dan Model-5). 4. Mengulangi proses pada langkah (2) dan (3) sebanyak B=1000 kali sehingga dapat dihitung nilai Relative Bias (RB) dan Relative Root Mean Squares Error (RRMSE) dari hasil pendugaan parameter pada setiap area dengan rumus sebagai berikut: ( ). / ( ) ( ). 5. Mengevaluasi model berdasarkan nilai RB dan RRMSE. Studi Kasus Studi kasus pada penelitian ini menggunakan data SUSENAS tahun 2010 dan PODES tahun 2011 yang dikeluarkan oleh Badan Pusat Statistik (BPS). Peubah yang diamati pada penelitian ini adalah rata-rata pengeluaran per kapita per bulan untuk kecamatan di wilayah Kota dan Kabupaten Bogor. Data yang tersedia pada SUSENAS tidak mendukung pendugaan langsung pada tingkat kecamatan. Hal ini dikarenakan contoh pada tingkat kecamatan berukuran kecil, bahkan terdapat kecamatan yang tidak disurvei. Model yang dikembangkan pada penelitian ini digunakan sebagai alternatif untuk mengatasi permasalahan tersebut. Pemodelan dilakukan dengan memanfaatkan informasi dari peubah yang dipilih dari data PODES sebagai peubah penyerta. Proses analisis data PODES dan SUSENAS adalah sebagai berikut: 1. melakukan eksplorasi data, yaitu dengan memeriksa distribusi data yang akan digunakan, memeriksa peubah-peubah yang berkorelasi kuat terhadap peubah respon, serta melakukan pemilihan peubah yang mampu membedakan karakteristik setiap gerombol, 2. melakukan penggerombolan area berdasarkan peubah-peubah yang dipilih dari data PODES, dengan asumsi bahwa PODES memuat informasi seluruh anggota populasi hingga di tingkat desa, 3. mengelompokan area berdasarkan gerombol yang terbentuk, 4. melakukan pemodelan dengan model dasar EBLUP dan kelima model yang dikembangkan, 5. menduga nilai tengah pengeluaran per kapita per bulan setiap kecamatan, 6. mengevaluasi hasil pendugaan dengan membandingkan nilai root mean squares error (RMSE) dari penduga parameter setiap area, dengan ( ) ( ) ( ) ( ) ( ) ( ) ( * +, * + - { }) ( ) ( 2 ( )3 [ ( ) ])

11 4 HASIL DAN PEMBAHASAN Kajian Simulasi Data pada populasi dibagi menjadi dua, yaitu data contoh dan nircontoh. Data contoh digunakan untuk membangun enam model prediksi, model dasar (Model-0) dan model yang diusulkan (Model-1 hingga Model-5). Parameter yang diamati adalah nilai tengah seluruh area kecil dalam populasi, yaitu area contoh ke- dan area nircontoh ke-. Model EBLUP baku menghasilkan model prediksi area nircontoh yang bersifat global, sedangkan model yang diusulkan menghasilkan model prediksi area nircontoh yang bersifat lokal. Suatu model dikatakan bersifat global apabila model tersebut berlaku untuk seluruh pengamatan. Model yang bersifat lokal tidak berlaku untuk seluruh pengamatan, melainkan bersifat unik untuk level tertentu. Model lokal yang diusulkan pada penelitian ini bersifat unik untuk masing-masing gerombol. Skenario 1 mengasumsikan bahwa karakteristik antar gerombol mampu dibedakan dengan baik, sehingga pola hubungan antara peubah penyerta dan peubah respon memiliki rentang nilai yang berbeda-beda untuk masing-masing gerombol pada area nircontoh (Gambar 1). Gerombol 1 memiliki rentang nilai terendah dan gerombol 5 memiliki rentang nilai tertinggi dengan jarak antar gerombol yang relatif renggang. Pendekatan garis prediksi Model-0 yang bersifat global tidak mampu menggambarkan keragaman yang dimiliki oleh masingmasing gerombol. (a) (b) (c) (d) (e) (f) Gambar 1 Garis prediksi area nircontoh skenario 1 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan oleh: (a) Model-0, (b) Model-1, (c) Model-2, (d) Model-3, (e) Model-4, dan (f) Model-5. Gerombol 1 ( ), gerombol 2 ( ), gerombol 3 ( ), gerombol 4 ( ), dan gerombol 5 ( ).

12 Model-0 hanya menghasilkan satu garis prediksi area nircontoh (perhatikan garis berwarna hitam), sedangkan kelima model yang diusulkan menghasilkan lima garis prediksi area nircontoh, sesuai dengan banyaknya gerombol pada area tersebut. Model prediksi yang dihasilkan oleh Model-0 mengabaikan pengaruh acak area sehingga prediksinya diperoleh dari model sintetik yang bersifat global. Prediksi area nircontoh yang dihasilkan oleh Model-0 akan terdistorsi pada satu garis prediksi yang bersifat global tersebut (Gambar 1a). Garis prediksi yang dihasilkan oleh Model-1, Model-2, dan Model-3 memiliki titik potong yang berbeda-beda pada setiap gerombol, namun kemiringan garis yang dihasilkan tetap sama (Gambar 1b, Gambar 1c, Gambar 1d). Prediksi area nircontoh dari ketiga model tersebut lebih mampu menghampiri nilai yang sebenarnya dibandingkan dengan Model-0, dengan asumsi bahwa penggerombolan yang dilakukan telah mampu membedakan karakteristik antargerombol dengan sangat baik. Model-4 dan Model-5 merupakan hasil modifikasi titik potong dan kemiringan dari model EBLUP baku. Kedua model ini mengasumsikan bahwa peubah penyerta bersifat acak. Garis prediksi area nircontoh yang dihasilkan kedua model tersebut memiliki titik potong dan kemiringan yang berbeda-beda pada setiap gerombol (Gambar 1e, Gambar 1f). Kondisi tersebut secara teoritis memungkinkan agar prediksi yang dihasilkan lebih baik dibandingkan modelmodel sebelumnya. Hal ini berlaku pada data dengan kondisi penggerombolan yang dicerminkan oleh data simulasi ini. Lampiran 1 hingga Lampiran 4 menunjukkan garis prediksi area nircontoh skenario 2 hingga skenario 5. Skenario 2 mencerminkan kodisi karakteristik antar gerombol yang cukup sulit untuk dibedakan sehingga kondisi data menjadi beririsan antara suatu gerombol dan gerombol lainnya (Lampiran 1). Model-1 menghasilkan garis prediksi area nircontoh yang berhimpit, terutama untuk gerombol 1 dan gerombol 2, sementara garis prediksi Model-2 dan Model-3 sedikit lebih renggang. Model-4 menunjukkan garis prediksi yang cenderung lebih mendekati pengamatan area nircontoh yang sebenarnya, jika dibandingkan dengan Model-5. Selain itu, kuadrat tengah sisaan prediksi area nircontoh Model-4 lebih kecil dibandingkan dengan Model-5 (Tabel 4). Hal ini mengindikasikan bahwa penambahan pengaruh tetap gerombol pada model prediksi area nircontoh dengan asumsi peubah penyerta bersifat acak dapat dinilai kurang tepat pada kondisi penggerombolan yang beririsan. Tabel 4 Kuadrat tengah sisaan prediksi area nircontoh Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5 1 387.23 60.29 59.70 59.70 27.41 27.21 2 551.65 54.67 54.27 54.27 37.48 37.52 3 5595.57 177.91 179.73 179.73 26.46 26.69 4 5754.56 169.39 167.88 167.88 14.65 14.60 5 5556.56 154.76 155.67 155.67 2.67 2.67 Skenario 3 hingga skenario 5 mencerminkan data dengan gangguan asumsi kenormalan pada komponen acak. Skenario 4 mencerminkan kondisi data dengan galat penarikan contoh yang tidak bersebaran normal. Plot pengamatan area nircontoh skenario ini menunjukkan pola yang cenderung menjulur ke kanan (Lampiran 3). Hal ini menunjukkan bahwa pola sebaran komponen acak galat

13 penarikan contoh yang berasal dari sebaran khi-kuadrat mempengaruhi bentuk sebaran data yang diamati. Simulasi dengan berbagai skenario secara umum menunjukkan model prediksi area nircontoh EBLUP baku bersifat global, sementara model yang diusulkan bersifat lokal. Garis prediksi model yang bersifat lokal lebih mampu menghampiri pengamatan area nircontoh yang sebenarnya. Hal ini dapat dilihat berdasarkan plot garis prediksi area nircontoh yang dihasilkan oleh masingmasing model. Selain itu, nilai kuadrat tengah sisaan dari prediksi area nircontoh yang diperoleh pada model lokal jauh lebih kecil dibandingkan dengan model EBLUP baku yang bersifat global (Tabel 4). Kuadrat tengah sisaan dari model dengan modifikasi titik potong dan kemiringan, yaitu Model-4 dan Model-5, memiliki nilai yang paling kecil dibandingkan model lain. Hal ini menunjukkan bahwa kedua model tersebut merupakan model lokal yang paling menghampiri pengamatan area nircontoh yang sebenarnya. Tabel 5 Median dari Relative Bias (RB) pada area contoh (%) Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5 1 10.56 10.56 0.57 0.57 10.50 0.94 2 7.27 7.27 1.67 1.67 6.67 1.05 3 10.13 10.13 0.20 0.20 9.96 2.04 4 10.49 10.49 0.59 0.59 10.48 0.35 5 10.11 10.11 0.22 0.22 9.94 0.60 Tabel 6 Median dari RRMSE pada area contoh (%) Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5 1 34.32 34.32 1.14 1.14 34.54 11.13 2 25.34 25.34 2.77 2.77 25.53 7.73 3 33.74 33.74 0.66 0.66 33.85 14.40 4 34.18 34.18 1.09 1.09 34.40 6.62 5 33.59 33.59 0.67 0.67 33.69 7.87 Model prediksi EBLUP baku (Model-0) pada area contoh bersifat lokal. Model tersebut dipengaruhi oleh pengaruh acak area sehingga secara teoritis model ini sudah memiliki kemampuan prediksi yang cukup baik pada area contoh. Prediksi yang dihasilkan oleh Model-0 akan memiliki keragaman yang berbeda di setiap area contoh sehingga hasil yang diperoleh akan mendekati nilai sebenarnya. Namun demikian, hasil simulasi pada skenario 1 hingga skenario 4 memperlihatkan bahwa Model-0 bukan model terbaik pada prediksi area contoh. Model-2, Model-3, dan Model-5 menghasilkan prediksi nilai tengah area contoh dengan kisaran nilai RB dan RRMSE yang jauh lebih kecil dibandingkan dengan model lain pada semua skenario (Tabel 5 dan Tabel 6). Ketiga model tersebut merupakan model dengan penambahan informasi gerombol sebagai pengaruh tetap, sehingga dapat dikatakan bahwa secara umum penambahan tersebut mampu memperbaiki prediksi area contoh. Nilai RB dari penduga nilai tengah area contoh Model-2 dan Model-3 memiliki nilai yang paling kecil pada skenario 1, skenario 3, dan skenario 5 (Tabel 5). Nilai RB terkecil pada skenario 2 dan skenario 4 diperoleh pada prediksi yang dihasilkan oleh Model-5, namun perbedaannya dengan Model-2 dan Model-3 relatif kecil. Nilai RRMSE yang terkecil pada setiap skenario (Tabel 6) diperoleh dari prediksi area contoh Model-2 dan Model-3. Hal ini

14 mengindikasikan bahwa Model-2 dan Model-3 memiliki kemampuan yang paling baik untuk melakukan prediksi pada area contoh, prediksi yang dihasilkan memiliki ketepatan yang relatif lebih baik dibandingkan model lain. Tabel 7 Median dari Relative Bias (RB) pada area nircontoh (%) Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5 1-6.63-1.11-1.07-1.07-1.01-0.97 2 0.60-2.48-2.66-2.66-2.67-2.58 3-6.55 0.24 0.35 0.35 0.37 0.40 4-6.63-1.02-0.99-0.99-0.91-0.91 5-6.53 0.31 0.31 0.31 0.48 0.47 Tabel 8 Median dari RRMSE pada area nircontoh (%) Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5 1 38.60 2.29 2.46 2.46 2.32 2.37 2 30.25 5.48 6.20 6.20 5.47 6.10 3 38.12 0.68 0.69 0.69 0.45 0.47 4 38.35 2.16 2.32 2.32 2.20 2.20 5 37.87 0.68 0.69 0.69 0.48 0.47 Prediksi nilai tengah area nircontoh skenario 1 yang dihasilkan oleh Model- 5 memiliki nilai median RB yang paling mendekati nol dibandingkan model lain (Tabel 7). Nilai median RRMSE yang terkecil diperoleh pada prediksi yang dihasilkan oleh Model-1 (Tabel 8). Namun demikian, nilai median RB dan RRMSE yang diperoleh pada Model-1 hingga Model-5 memiliki perbedaan yang relatif kecil, yaitu berkisar antara 0.03% hingga 0.17%. Hal ini mengindikasikan bahwa secara umum penambahan informasi gerombol pada kelima model yang diusulkan mampu meningkatkan kemampuan prediksi parameter area nircontoh pada kondisi populasi yang paling ideal. Hasil prediksi area nircontoh pada skenario 3, 4, dan 5 yang dihasilkan oleh Model-1 hingga Model-5 secara umum lebih baik dibandingkan dengan Model-0 berdasarkan nilai median RB dan RRMSE. Nilai median RB prediksi area nircontoh skenario 2 yang paling mendekati nol diperoleh pada Model-0 (Tabel 7), namun nilai RB pada prediksi area nircontoh Model-0 secara keseluruhan memiliki rentang nilai (range) yang jauh lebih lebar dibandingkan dengan kelima model yang diusulkan (Gambar 2). Selain itu, nilai median RRMSE terkecil diperoleh pada prediksi area nircontoh Model-4 (Tabel 8), sehingga Model-4 dapat dianggap sebagai model terbaik pada prediksi area nircontoh skenario ini. Gambar 2 Boxplot nilai RB dari prediksi nilai tengah area nircontoh skenario 2

15 RRMSE (%) 7 6 5 4 3 2 Model-1 Model-2 Model-3 Model-4 Model-5 1 0 1 2 3 4 5 Skenario Gambar 3 Nilai RRMSE (%) prediksi area nircontoh model modifikasi EBLUP pada seluruh skenario simulasi Simulasi menunjukkan bahwa model yang diusulkan secara umum memiliki akurasi yang lebih baik daripada model EBLUP baku dalam memprediksi parameter area nircontoh, pada berbagai skenario populasi. Model-4 cenderung menghasilkan prediksi dengan nilai median RRMSE yang terkecil pada seluruh skenario (Gambar 3). Nilai RB prediksi area nircontoh yang dihasilkan kelima model yang diusulkan relatif sama (Gambar 4). Dengan demikian, dapat dikatakan bahwa Model-4 memiliki kemampuan yang relatif lebih baik dibandingkan model lain dalam memprediksi parameter area nircontoh. 1 0.5 RB (%) 0-0.5-1 -1.5-2 -2.5-3 1 2 3 4 5 Skenario Model-1 Model-2 Model-3 Model-4 Model-5 Gambar 4 Nilai RB (%) prediksi area nircontoh model modifikasi EBLUP pada seluruh skenario simulasi

16 Studi Kasus Eksplorasi Data Kota Bogor terdiri dari 6 kecamatan dan 64 kelurahan. Kabupaten Bogor terdiri dari 40 kecamatan dan 428 desa/kelurahan. Data PODES diasumsikan mencakup seluruh desa dan kecamatan di Kota dan Kabupaten Bogor sehingga penggerombolan pada tingkat kecamatan dilakukan berdasarkan peubah yang dipilih dari data tersebut. Peubah pada data PODES 2011 (Lampiran 25) yang dipilih sebagai peubah dasar penggerombolan mewakili empat bidang berikut: 1. keterangan umum desa/kelurahan, 2. kependudukan dan ketenagakerjaan, 3. pendidikan dan kesehatan, 4. ekonomi. Peubah yang dipilih tersebut merupakan peubah yang memiliki ragam yang besar dan memiliki sedikit nilai nol (Lampiran 25). (a) Gambar 5 Kepekatan peluang (a) peubah, yaitu rata-rata pengeluaran per kapita per bulan (Rupiah) dan (b) bentuk tranformasi logaritma peubah Y Peubah pada data SUSENAS 2010 digunakan sebagai peubah respon ( ), yaitu rata-rata pengeluaran per kapita per bulan. Data SUSENAS mencakup 44 kecamatan dan 111 desa/kelurahan di Kota dan Kabupaten Bogor. Rata-rata pengeluaran per kapita tidak berdistribusi normal. Hal ini dapat dilihat dari plot peubah yang menjulur ke kanan (Gambar 5). (b) Gambar 6 Plot kuantil-kuantil peubah

17 Tabel 9 Uji Kenormalan Anderson-Darling Peubah ( ) AD 9.367 0.506 Nilai-p < 0.005 0.197 Uji kenormalan Anderson-Darling terhadap peubah menghasilkan nilai signifikansi < 0.005 sehingga pada taraf nyata 5% dapat dikatakan bahwa data tersebut tidak mengikuti sebaran normal (Tabel 9). Transformasi logaritma terhadap peubah dilakukan untuk mengatasi ketaknormalan data. Plot kuantilkuantil peubah ( ) menunjukkan pola yang mengikuti garis kenormalan (Gambar 6). Uji kenormalan terhadap hasil transformasi peubah menghasilkan nilai signifikansi sebesar 0.197, artinya pada taraf nyata 5% hipotesis nol yang menyatakan bahwa data mengikuti sebaran normal dapat diterima. Analisis Gerombol Pembentukan gerombol dilakukan dengan pendekatan analisis gerombol berhirarki berdasarkan peubah yang dipilih pada tahap eksplorasi data. Jarak yang digunakan adalah jarak euclid yang mengasumsikan bahwa tidak terdapat multikolinieritas. Analisis Komponen Utama (AKU) digunakan untuk mengatasi multikolineritas pada data (Lampiran 26). Analisis gerombol dilakukan menggunakan seluruh Komponen Utama (KU) untuk mempertahankan seluruh keragaman data. Analisis gerombol dilakukan dengan metode Ward. Penentuan gerombol untuk tingkat kecamatan Kota dan Kabupaten Bogor dilakukan berdasarkan dendogram dengan nilai cutoff pada jarak ketakmiripan 8.20 (Lampiran 27). Penggerombolan tersebut menghasilkan 8 gerombol (Tabel 10). Tabel 10 Penggerombolan kecamatan di Kota dan Kabupaten Bogor Gerombol Banyaknya Anggota Gerombol Anggota 1 11 Pamijahan, Cigombong, Megamendung, Babakan Madang, Jonggol, Kemang, Ciseeng, Gunung Sindur, Rumpin, Cigudeg 2 12 Nanggung, Leuwisadeng, Cibungbulang, Tenjolaya, Cijeruk, Sukamakmur, Cariu, Tanjungsari, Ranca Bungur, Sukajaya, Jasinga, Tenjo 3 2 Gunung Putri, Cibinong 4 1 Cisarua 5 6 Parung, Bogor Timur, Bogor Utara, Bogor Tengah, Bogor Barat, Tanah Sereal 6 6 Dramaga, Ciomas, Tamansari, Caringin, Kelapa Nunggal, Tajur Halang 7 4 Leuwiliang, Ciampea, Ciawi, Parung Panjang 8 5 Sukaraja, Cileungsi, Citeureup, Bojong Gede, Bogor Selatan Karakteristik setiap gerombol dapat dilihat dari statistik rataan peubah dasar penggerombolan (Lampiran 28). Gerombol 1 dan 2 merupakan kelompok kecamatan dengan sebagian besar mata pencaharian utama penduduknya adalah dari sektor pertanian. Gerombol 1 memiliki jumlah sarana kesehatan dan

18 pariwisata yang lebih banyak dibandingkan dengan gerombol 2. Gerombol 2 merupakan kawasan dengan jumlah penduduk yang paling sedikit dibanding gerombol lain. Gerombol 3 merupakan kawasan yang paling banyak penduduknya, sehingga kawasan ini juga memiliki sarana pendidikan dan kesehatan yang paling banyak pula. Sebagian besar mata pencaharian pada gerombol 3 berasal dari sektor industri. Gerombol 4 merupakan kawasan pariwisata dengan jumlah hotel dan penginapan yang jauh lebih banyak dibandingkan kawasan lain. Sebagian besar kecamatan di wilayah kota Bogor termasuk ke dalam Gerombol 5. Gerombol ini merupakan kawasan dengan persentase keluarga pertanian paling sedikit. Proporsi jumlah desa/kelurahan dengan sumber mata pencaharian dari sektor jasa pada gerombol ini mencapai sekitar 50%, jauh lebih besar dibandingkan dengan gerombol lain. Gerombol 6 merupakan kawasan dengan rata-rata jumlah industri kecil terbanyak dibandingkan kawasan lain. Gerombol 7 merupakan kelompok kecamatan dengan proporsi jumlah desa mencapai 100%, sama halnya dengan gerombol 2, namun persentase keluarga pertanian pada gerombol 7 lebih sedikit dibandingkan gerombol 2. Jumlah sarana kesehatan dan pendidikan, serta sarana perekonomian pada gerombol ini juga lebih banyak daripada gerombol 2. Gerombol 8 merupakan kelompok kecamatan dengan jumlah koperasi terbanyak dibandingkan gerombol lain. Pemodelan Small Area Estimation (SAE) Model area kecil dibangun menggunakan transformasi logaritma dari ratarata pengeluaran per kapita per bulan (rupiah) sebagai peubah respon ( ) dan peubah penyerta ( ) adalah: (1) jumlah minimarket (unit), (2) jumlah poliklinik (unit), dan (3) sumber mata pencaharian utama sebagian besar penduduk adalah pertanian atau bukan pertanian. Peubah penyerta dipilih berdasarkan seleksi dengan metode regresi bertatar atau stepwise (Lampiran 29). Model yang digunakan adalah model level satuan dengan desa/kelurahan sebagai level satuan dan kecamatan sebagai level area. Hubungan antara jumlah poliklinik dan minimarket terhadap peubah menunjukkan pola penggerombolan yang bercampur (Gambar 7). Kondisi ini relatif mirip dengan kondisi skenario 2 pada kajian simulasi apabila diasumsikan bahwa hasil penggerombolan sudah tepat. (a) Gambar 7 Hubungan antara peubah penyerta: (a) jumlah poliklinik (unit) dan (b) jumlah minimarket (unit) terhadap peubah respon. Gerombol 1 ( ), gerombol 2 ( ), gerombol 3 ( ), gerombol 4 ( ), gerombol 5 ( ), gerombol 6 ( ), gerombol 7 ( ), dan gerombol 8 ( ). (b)

19 Pemodelan area kecil dilakukan dengan menggunakan model EBLUP baku (Model-0) dan Model-4 yang berdasarkan hasil simulasi dianggap sebagai model terbaik untuk memprediksi parameter kecamatan nircontoh. Prediksi rata-rata pengeluaran per kapita per bulan untuk kecamatan di Kota dan Kabupaten Bogor yang dihasilkan oleh kedua model berbeda-beda, namun masih memiliki kemiripan pola (Lampiran 31). Prediksi untuk kecamatan yang disurvei (contoh) adalah sebanyak 44 kecamatan. Seluruh model memprediksi bahwa kecamatan Gunung Putri memiliki rata-rata pengeluaran per kapita tertinggi dibandingkan kecamatan lain. Kecamatan yang diprediksi memiliki rata-rata pengeluaran per kapita terendah adalah kecamatan Nanggung. Tabel 11 Prediksi rata-rata pengeluaran per kapita dan evaluasi pemodelan pada kecamatan nircontoh Rata-rata pengeluaran per kapita Root Mean Squares Error Kecamatan (ribu rupiah) (ribu rupiah) nirsampel Model-0 Model-4 Model-0 Model-4 Leuwisadeng 592.89 586.58 180.884 199.759 Tenjolaya 570.33 559.23 131.250 132.776 Kecamatan yang tidak disurvei (nircontoh) pada studi kasus ini adalah kecamatan Leuwisadeng dan Tenjolaya. Prediksi rata-rata pengeluaran per kapita yang dihasilkan kedua model tersebut tidak jauh berbeda (Tabel 11). Prediksi pada kecamatan nircontoh yang dihasilkan Model-0 memiliki nilai RMSE yang lebih kecil dibandingkan dengan Model-4. Hal ini menunjukkan bahwa pada studi kasus ini, Model-0 dapat dikatakan lebih baik dibandingkan dengan Model-4 pada prediksi kecamatan nircontoh. Evaluasi model pada studi kasus menunjukkan hasil yang berbeda dengan simulasi. Perlu digarisbawahi bahwa data simulasi memiliki pola penggerombolan yang memiliki hubungan linier terhadap peubah respon (Lampiran 1). Data studi kasus memiliki pola penggerombolan yang cenderung tidak linier terhadap peubah respon (Gambar 7), jika dibandingkan dengan data simulasi. Hal ini mungkin disebabkan oleh keragaman di dalam gerombol pada studi kasus yang relatif besar jika dibandingkan dengan data simulasi. Fenomena ini menunjukkan kelemahan dari model yang diusulkan pada penelitian ini. Model ini memerlukan asumsi bahwa penggerombolan mampu membedakan karakteristik antar-area dengan baik dengan keragaman antar anggota gerombol yang minimum, dan pola penggerombolan memiliki hubungan yang linier terhadap peubah respon. Hasil prediksi area nircontoh dengan model-model lain disajikan pada Lampiran 34. Hasil pemodelan ini menunjukkan bahwa pada prediksi kecamatan nircontoh, terdapat model dengan penambahan informasi gerombol pada prediksi area nircontoh menunjukkan akurasi yang lebih baik dibandingkan EBLUP baku, yaitu Model-1 dan Model-5 (Lampiran 35). Model dengan kompleksitas yang lebih rendah lebih dianjurkan untuk digunakan pada kasus terapan sehingga Model-1 dapat dipilih untuk memprediksi parameter area nircontoh pada studi kasus yang lain. Hal ini didukung oleh hasil kajian simulasi yang menunjukkan bahwa kemampuan kelima model yang diusulkan hampir sama baiknya dalam memprediksi parameter area nircontoh, termasuk di dalamnya adalah Model-1.

20 5 SIMPULAN DAN SARAN Simpulan Kajian simulasi menunjukkan bahwa secara umum model dengan penambahan informasi gerombol memiliki kemampuan prediksi yang lebih baik dibandingkan dengan model EBLUP baku, khususnya pada kasus prediksi area nircontoh. Model-4 dianggap sebagai model terbaik untuk memprediksi area nircontoh karena model ini cenderung menghasilkan prediksi dengan nilai RRMSE terkecil pada berbagai skenario. Studi kasus rata-rata pengeluaran per kapita tingkat kecamatan di Kota dan Kabupaten Bogor menunjukkan bahwa prediksi pada kecamatan nircontoh yang dihasilkan Model-0 memiliki nilai RMSE yang lebih kecil dibandingkan dengan Model-4. Hal ini mungkin disebabkan oleh keragaman di dalam gerombol pada studi kasus yang relatif besar sehingga pola penggerombolan cenderung tidak linier terhadap peubah respon, jika dibandingkan dengan data simulasi. Namun demikian, terdapat model yang menghasilkan prediksi rata-rata pengeluaran per kapita kecamatan nircontoh dengan nilai RMSE yang lebih kecil dibandingkan model EBLUP baku, yaitu Model-1 dan Model-5. Saran Mean Squares Error (MSE) yang digunakan pada evaluasi pemodelan pada penelitian ini masih mengadopsi dari rumus yang sudah ada. Oleh karenanya, diperlukan pengembangan dalam penguraian MSE bagi penduga yang dihasilkan oleh model modifikasi EBLUP yang dikembangkan pada penelitian ini. Selain itu, hasil penelitian ini menunjukkan bahwa penggerombolan memegang peranan penting dalam menerapkan model yang diusulkan pada studi kasus sehingga kajian mengenai penggerombolan yang sesuai dengan pemodelan area kecil akan sangat berguna bagi pengembangan metode yang diusulkan pada penelitian ini. DAFTAR PUSTAKA Anisa R, Kurnia A, Indahwati. 2014. Cluster Information of Non-Sampled Area in Small Area Estimation. IOSR Journal of Mathematics 10(1): 15-19. doi: 10.9790/5728-10121519 Das K, Jiang J, Rao JNK. 2004. Mean Square Error of Empirical Predictor. The Annals of Statistics 32(2): 818-840. doi: 10.1214/009053604000000201. Johnson RA, Wichern DW. 2007. Applied Multivariate Statistical Analysis 6th Edition. London : Prentice-Hall. Kurnia A. 2009. Prediksi terbaik empirik untuk model transformasi logaritma di dalam pendugaan area kecil dengan penerapan pada data susenas [disertasi]. Bogor (ID): Program Pasca Sarjana, Institut Pertanian Bogor.

Mattjik AA, Sumertajaya IM. 2011. Sidik Peubah Ganda. Bogor: Departemen Statistika FMIPA-IPB. McCulloch CE, Searle SR. 2001. Generalized, Linear, and Mixed Models. New York: John Wiley & Sons. Rao JNK. 2003. Small Area Estimation. New York: John Wiley & Sons. Saei A, Chambers R. 2005. Empirical Best Linear Unbiased Prediction for Out of Sample Area, Working paper M05/03, Southampton Statistical Sciences Research Institute. 21

LAMPIRAN

23 Lampiran 1 Garis prediksi area nircontoh skenario 2 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh model (a) Model-0 (b) Model-1 (c) Model-2 (d) Model-3 (e) Model-4 (f) Model-5

24 Lampiran 2 Garis prediksi area nircontoh skenario 3 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh model (a) Model-0 (b) Model-1 (c) Model-2 (d) Model-3 (e) Model-4 (f) Model-5

25 Lampiran 3 Garis prediksi area nircontoh skenario 4 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh model (a) Model-0 (b) Model-1 (c) Model-2 (d) Model-3 (e) Model-4 (f) Model-5

26 Lampiran 4 Garis prediksi area nircontoh skenario 5 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh model (a) Model-0 (b) Model-1 (c) Model-2 (d) Model-3 (e) Model-4 (f) Model-5