dimana n HASIL DAN PEMBAHASAN

dokumen-dokumen yang mirip
PERBANDINGAN METODE IMPUTASI GANDA : METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI

SAMPLING METHODS Metode Penarikan Contoh STK221 3(2-2)

KAJIAN METODE IMPUTASI DALAM MENANGANI MISSING DATA. Triyani Hendrawati Staf Pengajar Statistika Universitas Padjadjaran

MODEL SPASIAL BAYES DALAM PENDUGAAN AREA KECIL DENGAN PEUBAH RESPON BINER

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN

PENDUGAAN DATA HILANG DENGAN MENGGUNAKAN DATA AUGMENTATION. Abstract

HASIL DAN PEMBAHASAN

JURNAL MATEMATIKA DAN KOMPUTER Vol. 4. No. 2, 71-81, Agustus 2001, ISSN :

K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA. Susanti, Shantika Martha, Evy Sulistianingsih INTISARI

MODUL TEORI ESTIMASI ATAU MENAKSIR TEORI ESTIMASI ATAU MENAKSIR

METODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE

PENAKSIRAN PARAMETER REGRESI LINIER DENGAN METODE BOOTSTRAP MENGGUNAKAN DATA BERDISTRIBUSI NORMAL DAN UNIFORM

Pendugaan Selang Kepercayaan Persentil Bootstrap Nonparametrik untuk Parameter Regresi

PENERAPAN METODE PENDUGAAN AREA KECIL (SMALL AREA ESTIMATION) PADA PENENTUAN PROPORSI RUMAH TANGGA MISKIN DI KABUPATEN KLUNGKUNG

SIMULASI PENGUKURAN KETEPATAN MODEL VARIOGRAM PADA METODE ORDINARY KRIGING DENGAN TEKNIK JACKKNIFE

VI. PEMBAHASAN. dengan metode kemungkinan maksimum, tetapi terhadap

mengsumsikan tidak ada kesalahan pengukuran, validitas dapat dievaluasi dengan mengamati nilai bias dari penduganya. Bias, B ( ) dari populasi

PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA. Tatik Widiharih Jurusan Matematika FMIPA UNDIP

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

HASIL DAN PEMBAHASAN. Algoritma Cepat Penduga GS

(DS.5) MODEL SPASIAL BAYES DALAM PENDUGAAN AREA KECIL DENGAN PEUBAH RESPON BINER

ESTIMASI. Arna Fariza PENDAHULUAN

BAB I PENDAHULUAN. 1.1 Latar Belakang dan Permasalahan

STATISTIKA II IT

HASIL DAN PEMBAHASAN. dengan hipotesis nolnya adalah antar peubah saling bebas. Statistik ujinya dihitung dengan persamaan berikut:

METODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER

PENENTUAN UKURAN CONTOH DAN REPLIKASI BOOTSTRAP UNTUK MENDUGA MODEL REGRESI LINIER SEDERHANA

PENERAPAN METODE BOOTSTRAP RESIDUAL DALAM MENGATASI BIAS PADA PENDUGA PARAMETER ANALISIS REGRESI

STATISTIKA I. Ari Wibowo, MPd Prodi PAI Jurusan Tarbiyah STAIN Surakarta. Kode Matakuliah: PAI111, 2sks Tujuan Instruksional Umum:

Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas

BAB I PENDAHULUAN. Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan

REGRESI LINIER NONPARAMETRIK DENGAN METODE THEIL

HASIL DAN PEMBAHASAN. Model Regresi Logistik Biner untuk data Hasil Pembangkitan

METODE KEMUNGKINAN MAKSIMUM UNTUK KOREKSI SEBARAN BERSYARAT PADA ANALISIS KORELASI

TINJAUAN PUSTAKA. Gambar 1 Plot jenis pengamatan pencilan.

TINJAUAN PUSTAKA. Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan

STATISTIKA INDUSTRI 2 TIN 4004

Kata Kunci: Analisis Regresi Linier, Penduga OLS, Penduga GLS, Autokorelasi, Regresor Bersifat Stokastik


PENDETEKSIAN OUTLIER PADA MODEL REGRESI GANDA: STUDI KASUS TINGKAT PENGHUNIAN KAMAR HOTEL DI KENDARI

S T A T I S T I K A OLEH : WIJAYA

Karakteristik Pendugaan Emperical Best Linear Unbiased Prediction (EBLUP) Pada Pendugaan Area Kecil

Analisis Perbandingan Berbagai Uji Pencilan Pada Analisis Regresi Admi Nazra Jurusan Matematika FMIPA Universitas Andalas

PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA

BAB 1 PENDAHULUAN. awal peradaban manusia. Pada awal zaman Masehi, bangsa-bangsa

BAB 2 LANDASAN TEORI

PENAKSIR RASIO UNTUK VARIANSI POPULASI MENGGUNAKAN KOEFISIEN VARIASI DAN KURTOSIS PADA SAMPLING ACAK SEDERHANA

REGRESI LINIER. b. Variabel tak bebas atau variabel respon -> variabel yang terjadi karena variabel bebas. Dapat dinyatakan dengan Y.

METODE PENELITIAN Sumber Data

: Purnomo Satria NIM : PENDISKRIPSIAN DATA

ESTIMASI REGRESI ROBUST M PADA FAKTORIAL RANCANGAN ACAK LENGKAP YANG MENGANDUNG OUTLIER

BAB 1 PENDAHULUAN. Perkembangan dunia teknologi berkembang sangat pesat di dalam kehidupan

Analisis Korelasi dan Regresi. Dr. Kusman Sadik, M.Si Dept. Statistika IPB

MODUL 1 PRINSIP DASAR PERANCANGAN PERCOBAAN

Tingkat Efisiensi Metode Regresi Robust dalam Menaksir Koefisien Garis Regresi Jika Ragam Galat Tidak Homogen

BAB 3 METODOLOGI PENELITIAN

SENSITIFITAS MODEL GARCH UNTUK MENGATASI HETEROKEDASTIK PADA DATA DERET WAKTU

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

S T A T I S T I K A OLEH : WIJAYA FAKULTAS PERTANIAN UNIVERSITAS SWADAYA GUNUNG JATI CIREBON

BAB I PENDAHULUAN 1.1 Latar Belakang

LEAST SQUARE AND RIDGE REGRESSION ESTIMATION ABSTRAK ( ) = ( + ) Kata kunci: regresi linear ganda, multikolinearitas, regresi gulud.

BAB 1 PENDAHULUAN. banyak diterapkan pada berbagai bidang sebagai dasar bagi pengambilan

BAB I PENDAHULUAN. Analisis regresi merupakan suatu metode yang digunakan untuk

BAB 2 LANDASAN TEORI. regresi adalah sebuah teknik statistik untuk membuat model dan menyelediki

IV. METODOLOGI PENELITIAN. Kabupaten Bogor, Propinsi Jawa Barat. Pemilihan lokasi penelitian ini dilakukan

MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO

ANALISIS RAGAM SKOR KOMPONEN UTAMA PADA PERCOBAAN RESPONS-GANDA. Bahriddin Abapihi 1)

ESTIMASI RASIO MENGGUNAKAN KOEFISIEN REGRESI DAN KORELASI PADA PRODUKSI KACANG TANAH DI PROVINSI JAWA TENGAH

PERMASALAHAN AUTOKORELASI PADA ANALISIS REGRESI LINIER SEDERHANA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENDUGAAN ANGKA PUTUS SEKOLAH DI KABUPATEN SEMARANG DENGAN METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK PADA MODEL PENDUGAAN AREA KECIL SKRIPSI

Estimasi Interval Kepercayaan Bootstrap pada Parameter Regresi Komponen Utama

BAB. IX ANALISIS REGRESI FAKTOR (REGRESSION FACTOR ANALYSIS)

SATUAN ACARA PERKULIAHAN MATA KULIAH : STATISTIKA DASAR (3 SKS) KODE MATA KULIAH : MT308

Resume Regresi Linear dan Korelasi

BAB IV HASIL PENELITIAN. Data yang dikumpulkan dalam penelitian ini terdiri dari tiga variabel yaitu

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

Semakin besar persentase CCR yang dihasilkan, maka tingkat akurasi yang dihasilkan semakin tinggi (Hair et. al., 1995).

BAB 2 TINJAUAN TEORITIS. penjelasan tentang pola hubungan (model) antara dua variabel atau lebih.. Dalam

PERBANDINGAN METODE BOOTSTRAP DAN JACKKNIFE DALAM MENAKSIR PARAMETER REGRESI UNTUK MENGATASI MULTIKOLINEARITAS

Pelanggaran Asumsi Normalitas Model Multilevel Pada Galat Level yang Lebih Tinggi. Bertho Tantular 1)

PENAKSIRAN RATAAN DAN VARIANSPOPULASI PADA SAMPEL ACAK TERSTRATIFIKA DENGAN AUXILIARY VARIABLE

REGRESI LINEAR SEDERHANA

OPTIMASI PRODUKSI DENGAN METODE RESPONSE SURFACE (Studi Kasus pada Industri Percetakan Koran)

IV HASIL DAN PEMBAHASAN

PENERAPAN REGRESI ZERO INFLATED POISSON DENGAN METODE BAYESIAN

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

PENGGUNAAN UJI MULTIVARIAT FRIEDMAN PADA RANCANGAN ACAK KELOMPOK LENGKAP

BAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah

Prosiding Seminar Nasional Matematika dan Pendidikan Matematika (SESIOMADIKA) 2017 ISBN: Statistika, hal

Percobaan Satu Faktor: Rancangan Acak Lengkap (RAL) Oleh: Arum Handini Primandari, M.Sc.

BAB 2 LANDASAN TEORI

BAB 3 METODOLOGI PENELITIAN

Spesifikasi Model. a. ACF

TEORI PENDUGAAN (TEORI ESTIMASI)

ANALISIS PELUANG STATUS GIZI ANAK DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK MULTINOMIAL BERBASIS KOMPUTER

BAB IV KAJIAN SIMULASI: PENDEKATAN BAYES PADA DATA n<<p DAN TERDAPAT KEKOLINEARAN-GANDA

STK511 Analisis Statistika. Bagus Sartono

Transkripsi:

5. Proses penghilangan data dilakukan secara acak untuk memenuhi asumsi mekanisme kehilangan data yang acak (MAR). 6. Ulangan yang digunakan sebanyak 1 kali pada setiap simulasi untuk memberikan peluang hilang yang sama kepada setiap data. 7. Setiap gugus data diimputasi ganda dengan m=5 (pada proc MI nimpute=5). 8. Setelah didapatkan nilai dugaan semua data hilang, dihitung selisih antara nilai dugaan dengan nilai aslinya. Dari selisih tersebut kemudian dihitung rata-rata dan ragam dari rata-rata tersebut. 9. Dari gugus data yang telah terlengkapi dengan nilai dugaan data hilang kemudian dihitung dugaan nilai tengah peubah X 3. Karena dilakukan ulangan 1 kali maka akan didapatkan 1 gugus data contoh yang kemudian akan didapatkan pendekatan bagi nilai KTS, dengan rumus: KTS ( x) = Ragam( x) + Bias 2 ( x) dimana Ragam n ( x) = [ xi E( x) ] i= 1 dan Bias ( x) = E( x) μ 2 1. n 1. Metode imputasi yang baik akan menghasilkan selisih antara nilai dugaan data hilang dengan nilai aslinya yang lebih kecil dan ragam dari rata-rata yang kecil pula. Gugus data contoh yang dibentuk dari metode imputasi tersebut juga mempunyai nilai KTS yang lebih kecil dalam pendugaan parameter populasi. 11. Menerapkan metode imputasi ganda ke dalam contoh kasus. HASIL DAN PEMBAHASAN Suatu penduga nilai akan dikatakan lebih baik dari penduga lainnya jika nilainya lebih mendekati nilai yang diduga. Pembandingan kedua metode imputasi ganda yang dilakukan adalah dengan membandingkan nilai penduga, dalam hal ini selisih nilai imputan dengan nilai sebenarnya. Proses Imputasi pada Proc MI Dengan mempertahankan urutan letak peubah X 1, X 2, dan X 3, maka cara kerja proc MI pada SAS 9.1 konsep proses imputasinya adalah dengan terlebih dahulu memprediksi data hilang pada peubah X 2. Caranya adalah dengan membentuk model resi dari unitunit dengan data teramati pada peubah X 1 dan X 2, dengan X 2 sebagai peubah respon sedangkan X 1 sebagai peubah penjelas. Dari model resi yang terbentuk maka akan terdapat parameter resi dan kuadrat tengah galat (σ 2 ) yang kemudian akan disimulasikan sehingga terbentuk model resi baru yang berbeda dengan model resi awal. Pada model resi baru terdapat tambahan unsur yang dapat dianggap sebagai galat. Data hilang pada peubah X 2 pada unit ke-i akan diprediksi melalui model resi baru dengan memasukkan nilai peubah X 1 pada unit yang sama. Karena banyaknya imputasi yang digunakan adalah 5 (m = 5) maka proses tersebut diulang sebanyak 5 kali. Perbedaan nilai hasil imputasi berasal dari pengambilan bilangan acak dari sebaran tertentu yang berbeda-beda dalam simulasi terhadap parameter resi dan kuadrat tengah galat. Setelah data hilang pada peubah X 2 diduga, proses imputasi dilanjutkan ke data hilang pada peubah X 3. Pada proses ini model resi awal dibentuk dari unit-unit dengan data teramati untuk peubah X 1, X 2, dan X 3, dengan peubah X 3 sebagai peubah respon. Selanjutnya serupa dengan proses imputasi pada peubah X 2, pada akhirnya akan diperoleh model resi baru setelah melalui simulasi terhadap parameterparameter resi dan kuadrat tengah galat resi. Data hilang pada peubah X 3 pada unit ke-i akan diprediksi melalui model resi baru dengan memasukkan nilai peubah X 1 dan X 2 pada unit yang sama. Nilai hasil imputasi pada peubah X 2 juga digunakan untuk menduga data hilang pada peubah X 3. Hampir sama dengan metode resi, metode PMM melakukan proses imputasi dimana model resi awal yang terbentuk dari unit-unit dengan data teramati pada peubah X 1 dan X 2 untuk imputasi data hilang pada peubah X 2 dan unit-unit dengan data teramati pada peubah X 1, X 2, dan X 3 untuk imputasi data hilang pada peubah X 3. Dari model resi awal, parameter-parameter resi dan ragam dari galat disimulasikan. Selanjutnya diperoleh model resi baru, hanya saja tidak ada penambahan unsur seperti model resi baru pada metode resi. Data hilang pada peubah dan unit tertentu akan diprediksi dengan nilai pada unit lain dari peubah yang sama dimana nilainya paling dekat dengan nilai respon yang dihasilkan dari model resi baru. Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 2% pada Peubah X 3 Dari contoh berukuran 1 unit, simulasi yang pertama dilakukan adalah dengan menghilangkan data sebanyak 2% pada peubah 5

X 2 dan 2% pada peubah X 3 (selisih %). Simulasi ini dilakukan dengan ulangan 1 kali, sehingga terdapat 1 posisi kehilangan data yang berbeda. Adapun data yang dihilangkan pada simulasi ini dapat dilihat di tabel 2. Tabel 2. Data Asli yang Dihilangkan Data Asli Unit 89 159.661 73.211 9 157.48 71.5882 Hasil pendugaan data hilang dengan menggunakan metode resi dan PMM dapat dilihat pada tabel 3 dan 4. Tabel 3. Data Hasil Imputasi dengan Metode Regresi pada Ulangan 1 Unit Imputasi Data Dugaan Regresi 89 1 159.924 73.173 9 1 157.21 71.8198 89 2 159.782 73.1 9 2 157.238 71.748 89 3 159.727 73.918 9 3 157.226 71.6288 89 4 159.433 73.2599 9 4 157.367 71.6781 89 5 16.73 73.187 9 5 157.449 71.834 Tabel 4. Data Hasil Imputasi dengan Metode PMM pada Ulangan 1 Unit Imputasi Data Dugaan PMM 89 1 159.497 73.2354 9 1 157.55 71.64 89 2 159.859 73.111 9 2 157.83 71.6272 89 3 159.588 73.3183 9 3 157.479 71.3163 89 4 159.588 73.111 9 4 157.55 71.3163 89 5 159.588 73.77 9 5 157.111 71.345 Dari hasil yang diperoleh menunjukkan bahwa metode imputasi ganda resi lebih baik dari metode PMM. Hal ini dapat ditunjukkan oleh nilai rata-rata beda antara nilai imputan dan nilai sebenarnya,.16928 untuk metode resi dan.314217 untuk metode PMM. Dan dari rata-rata ragam selisih pun metode resi lebih kecil dari metode PMM (Tabel 5). Tabel 5. Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X 3 Rata-rata Selisih Ragam Selisih Ulangan REG PMM REG PMM 1.1134.1544.57.16 2.635.1867.34.211 3.2568.735.46.5114 4.1686.7113.71.5711 5.25.1592.121.8 6.1683.219.119.122 7.135.2312.12.12 8.2476.1782.18.192 9.1825.2967.25.5 1.1565.3191.78.429 Rata-rata.1693.3142.147.1212 Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 5% pada Peubah X 3 Simulasi yang dilakukan berikutnya adalah dengan menghilangkan data 2% pada peubah X 2 dan 5% pada peubah X 3 (selisih 3%). Hasil dari simulasi ini menunjukkan bahwa metode resi lebih baik daripada metode PMM, ditinjau dari nilai rata-rata selisih antara data asli dan data dugaannya juga dari nilai rata-rata ragam selisihnya. Nilai rata-rata selisih metode resi lebih kecil daripada metode PMM, demikian juga nilai ragam selisihnya. Hasil tersebut dapat dilihat pada tabel 6. Tabel 6. Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X 3 Rata-rata Selisih Ragam Selisih Ulangan REG PMM REG PMM 1.1682.2161.137.378 2.1956.1557.17.316 3.1963.4949.197.2151 4.2294.394.232.1972 5.184.4163.162.333 6.1827.2514.171.392 7.15.129.159.93 8.224.2199.155.35 9.1631.4485.198.346 1.1682.2161.137.378 rata-rata.1854.2942.172.1279 Ringkasan Hasil Seluruh Simulasi Dari semua simulasi yang dilakukan, jumlah data hilang 2%, 5%, 1%, dan 15% serta selisih jumlah data hilang, 3, 5, 1, 15, dan 2 didapatkan hasil bahwa metode resi selalu lebih baik daripada metode PMM ditinjau dari nilai rata-rata selisih antara data 6

asli dengan data dugaan dan ragam selisih antara data asli dengan data dugaan. Dari gambar 3 tampak bahwa nilai ratarata selisih antara data asli dengan data dugaan dari metode resi cenderung lebih kecil dan lebih stabil dari kondisi jumlah data hilang satu ke kondisi lainnya jika dibandingkan dengan nilai rata-rata selisih dari metode PMM. Rata-rata Selisih Data Asli vs Data Dugaan.5.4.3.2.1 1 3 5 7 9 11 13 15 17 19 21 23 Gambar 3. Rata-rata Selisih antara Data Asli dengan Data Dugaan Peubah X 3 untuk Seluruh Kelompok Beda Jumlah Data Hilang Nilai rata-rata selisih antara data asli dengan data dugaan metode PMM dari kondisi jumlah data hilang terkecil sampai terbesar cenderung mengalami kenaikan. Hal ini dapat disebabkan oleh data bangkitan yang nilainya berbeda untuk setiap unit. Sehingga semakin banyak jumlah data hilang akan membuat selisih dugaan dengan data asli semakin besar. Penjelasannya adalah berdasarkan teori imputasi ganda metode PMM, nilai imputan unit tertentu didapat dari nilai unit lain yang jaraknya paling dekat dengan nilai hasil resi antara peubah respon dengan penjelas yang ditunjuk. Kandidat donor atau unit yang nilainya akan dipakai sebagai dugaan bagi data hilang semakin berkurang jumlahnya jika jumlah data hilang semakin banyak. Sedangkan nilai rata-rata selisih antara data asli dengan data dugaan pada metode resi, seiring dengan peningkatan jumlah kehilangan data, relatif stabil. Berbeda dengan metode PMM, metode resi mendapatkan nilai dugaan untuk data hilang langsung dari model resi baru yang terbentuk melalui simulasi koefisien resi awal. Nilai dugaan data hilangnya bukan diambil dari unit lain (donor). Analisis Data untuk Data yang Telah Dilengkapi Data Dugaan Suatu gugus data yang sebelumnya mempunyai beberapa data hilang tentunya akan dianalisis lebih lanjut. Dalam pendugaan parameter, hasil analisis berdasarkan metode imputasi ganda merupakan kombinasi dari hasil analisis setiap gugus data terlengkapi. Salah satu contoh penggunaan hasil nilai dugaan dari imputasi ganda yang dilakukan dalam penelitian ini adalah pendugaan nilai tengah populasi, dalam hal ini nilai tengah peubah lingkar pinggang X 3. Pembandingan kedua metode imputasi selanjutnya adalah dengan cara melihat nilai KTS pada saat melakukan pendugaan nilai tengah ukuran lingkar pinggang (X 3 ) dari sebuah populasi. Simulasi yang dilakukan adalah dengan cara menghitung rata-rata peubah lingkar pinggang dari semua gugus data contoh hasil imputasi. Terdapat 24 gugus data dengan karakteristik yang berbeda-beda sesuai dengan jumlah data hilang pada peubah X 3 dan jumlah data hilang pada peubah X 2. Gugus- gugus data yang telah diberi perlakuan penghilangan data kemudian dilengkapi kembali nilai-nilainya yang hilang dengan kedua metode imputasi ganda. Dari satu gugus data tak lengkap yang telah diimputasi ganda akan didapatkan 5 gugus data terlengkapi (m=5), sehingga terdapat 5 nilai statistik peubah X 2. Dari SAS (dengan Proc MI) akan secara otomatis dihasilkan satu nilai rata-rata dari kelima nilai statistik tersebut. KTS (xbar).15.1.5. 1 4 7 1 13 16 19 22 Gambar 4. Nilai KTS untuk Pendugaan Nilai Tengah Peubah X 3 Bias (xbar).4.3.2.1. 1 3 5 7 9 11 13 15 17 19 21 23 Gambar 5. Nilai Bias (xbar) untuk Pendugaan Nilai Tengah Peubah X 3 Karena simulasi yang dilakukan dengan ulangan 1 kali maka akan didapatkan 1 nilai rata-rata untuk menduga nilai tengah X 2. Dari nilai-nilai itulah nilai KTS dihitung (nilai tengah peubah lingkar pinggang yang sebenarnya adalah 71.854). 7

Hasil dari simulasi dapat dilihat pada gambar 4. tidak terdapat perbedaan yang berarti antara nilai KTS yang dihasilkan dari metode imputasi resi dan PMM. Dilihat dari nilai biasnya juga tidak terdapat perbedaan yang berarti di antara kedua metode tersebut (gambar 5). Kedua metode menghasilkan penduga yang nilainya lebih besar dari nilai parameter yang sebenarnya (overestimate). Pembandingan Metode Imputasi Ganda dengan Metode Baku untuk Data Lengkap Pada praktiknya, metode baku untuk data lengkap sering digunakan dalam menganalisis data yang mengandung data hilang. Metode tersebut dilakukan dengan cara menghapus unit-unit yang mempunyai data hilang. Untuk melihat akibat dari penggunaan metode penghapusan unit pada data yang mengandung data hilang dilakukan pendugaan parameter populasi dengan jumlah kehilangan data yang berbeda. Kemudian hasilnya dibandingkan dengan pendugaan parameter melalui metode imputasi ganda, baik PM maupun resi. bias (xbar).2.15.1.5 -.5 2% 5% 1% 15% 2% 25% jumlah data hilang hapus unit PMM Gambar 6. Pembandingan Nilai Bias Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X 3. KTS (xbar).4.3.2.1 2% 5% 1% 15% 2% 25% junmlah data hilang hapus unit PMM Gambar 7. Pembandingan Nilai KTS Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X 3. Pembandingan masih dilihat dari nilai bias dan nilai KTS, dengan jumlah data hilang yang dicobakan adalah 2%, 5%, 1%, 15%, 2% dan 25% baik pada peubah X 2 maupun X 3. Gambar 6 dan 7 menunjukkan bahwa metode penghapusan menghasilkan nilai bias dan KTS yang jauh lebih tinggi daripada kedua metode imputasi ganda pada jumlah kehilangan data lebih besar dan sama dengan 5%. Pada jumlah kehilangan data 2% ketiga metode tersebut memberikan nilai bias yang tidak jauh berbeda. Terlebih dengan meningkatnya jumlah data hilang, semakin banyak data hilang pada data maka nilai dugaan terhadap parameter populasi akan semakin buruk jika metode penghapusan unit dengan data hilang digunakan. Dari contoh pembandingan tersebut maka dapat ditunjukkan bahwa penggunaan metode baku untuk data lengkap kurang tepat dalam proses analisis data yang mengandung data hilang. Contoh Kasus untuk Penerapan Imputasi Ganda Dari data sekunder yang didapatkan peneliti hanya mengambil beberapa peubah untuk digunakan sebagai contoh penerapan metode imputasi ganda. Peubah-peubah yang digunakan adalah Sistem Kekerabatan (X 1 ), Jenis Kelamin Bayi (X 2 ), Umur Bayi (X 3 ), Bobot Ibu (X 4 ), dan Bobot Bayi (X 5 ), sedangkan peubah yang mempunyai data hilang adalah X 4 dan X 5 dengan total jumlah kehilangan data sebesar 9.73% dan pola kehilangan data yang terbentuk adalah pola data hilang monoton. Keterangan tersebut dapat dilihat di lampiran 6. Untuk menduga nilai data hilang yang ada pada peubah-peubah tersebut digunakan proc MI dengan menggunakan metode PMM. Adapun analisis lanjut yang digunakan setelah menduga data hilang adalah analsis resi untuk menduga hubungan antara peubah respon X 5 dengan peubah penjelas X 1, X 2, X 3, dan X 4. Oleh karena itu, setelah dilakukan pendugaan data hilang dengan metode imputasi ganda dilakukan analisis resi dengan menggunakan proc terhadap tiap gugus data yang telah dilengkapi datanya. Hasil analisis masing-masing gugus data yang telah dilengkapi dapat dilihat pada lampiran 7. Tabel 7. Penduga-penduga Koefisien Regresi Gugus b b 1 BB2 b 3 b 4 1 3.47 -.86 -.299.328.48 2 3.298 -.11 -.48.35.43 3 2.54 -.55 -.377.345.57 4 2.836 -.88 -.298.339.51 5 2.889 -.116 -.176.36.52 Mean 2.922 -.89 -.312.333.5 Var.78.1.8.. Pada tabel 7 dapat dilihat hasil akhir pendugaan koefisien resi yang merupakan kombinasi tiap pendugaan dari gugus data yang telah dilengkapi (rata-rata penduga koefisien 8

resi dari tiap gugus data). Sedangkan ragam dari tiap penduga koefisien menduga keragaman nilai penduga koefisien karena dilakukan imputasi sebanyak 5 kali. Sedangkan dari tabel 8 dapat diperoleh informasi bahwa rata-rata dari nilai S 2 b sebesar.658, nilai ini menduga keragaman dalam b karena penarikan contoh (sampling). Dari analisis resi yang dihasilkan dari proc MIAnalyze dapat disimpulkan bahwa peubah Sistem Kekerabatan dan Jenis Kelamin Bayi tidak berpengaruh nyata terhadap peubah Bobot Bayi. Hasil tersebut dapat dilihat pada pengujian parsial terhadap tiap penduga koefisien resi dalam output proc MIAnalyze (lampiran 8). Tabel 8. Statistik untuk b Gugus b SEb S 2 b 1 3.47.83.644 2 3.298.816.665 3 2.54.834.695 4 2.836.828.685 5 2.889.776.62 Mean 2.922.658 Var.78 hilang tidak memberikan pengaruh yang besar terhadap perubahan nilai KTS. Pada simulasi sederhana yang dilakukan dalam penelitian ini, telah ditunjukkan bahwa metode penghapusan unit yang mengandung data hilang memberikan hasil yang kurang baik, terlebih dengan jumlah kehilangan data yang cenderung besar. Saran Maka para analis data hendaknya lebih berhati-hati dalam penanganan data yang mengandung data hilang, sehubungan dengan metode analisis baku untuk data lengkap atau metode penghapusan unit yang sering diterapkan pada kasus dengan data hilang. Sebagai saran untuk penelitian selanjutnya yaitu perlu dilakukan simulasi serupa tapi dengan data yang tidak semua unitnya mempunyai nilai yang berbeda (terdapat beberapa unit yang mempunyai nilai sama). Hal ini dimungkinkan akan memberikan hasil yang berbeda khususnya untuk metode PMM. Masih terdapat faktor-faktor yang dapat dan perlu dilihat untuk membandingkan metode imputasi ganda resi dan PMM selain dari yang sudah diteliti dalam penelitian ini. KESIMPULAN & SARAN Kesimpulan Dalam hal pendugaan terhadap data hilang dalam data contoh metode imputasi ganda resi lebih baik daripada metode PMM, karena nilai dugaan yang dihasilkan lebih dekat dengan nilai sebenarnya. Dengan jumlah kehilangan data yang semakin meningkat, selisih nilai dugaan dengan nilai aslinya juga akan meningkat pada metode PMM. Sedangkan pada metode resi, peningkatan jumlah kehilangan data tersebut tidak mempengaruhi selisih nilai dugaan dengan nilai aslinya (cenderung stabil). Dengan kata lain, keragaman selisih nilai dugaan dengan nilai asli pada metode resi lebih kecil daripada keragaman yang diperoleh pada metode PMM. Sedangkan dari segi pendugaan parameter populasi melalui data contoh yang telah dilengkapi dengan data imputan, kedua metode imputasi ganda tersebut tidak memiliki perbedaan yang nyata. Hal ini bisa dilihat dari nilai KTS untuk pendugaan parameter populasi yang dihasilkan. Meningkatnya jumlah data DAFTAR PUSTAKA Cochran, W. G. 1977. Sampling Technique. New York: Wiley. Kish, Leslie. 1965. Survey Sampling. New York: Wiley. Levy, P. S. and Lemeshow, S. 1999. Sampling of Populations: Methods & Applications 3 rd ed. New York: Willey. Little, R. J. A. and Rubin, D. B. 1987. Statistical Analysis with Missing Data. New York: Wiley. Longford, N. T. 25. Missing Data and Small- Area Estimation. New York: Springer. Rubin, D. B. 1987. Multiple Imputation for Nonresponse in Sample Surveys. New York: Willey Lepkowski, J. M. 1989. Treatment of Wave Nonresponse in Panel Surveys dalam Panel Surveys. New York: John Willey & Sons. Little, R. J. A. & Su, Hong Lin. 1989. Item Nonresponse in Panel Surveys dalam Panel Surveys. New York: John Willey & Sons. Musa, Sjarkani. 27. Metodologi Penelitian dengan Statistika. Departemen Statistika IPB. Bogor: inpress. 9