PERBANDINGAN METODE IMPUTASI GANDA : METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI

Transkripsi

1 PERBANDINGAN METODE IMPUTASI GANDA : METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI Nur Malahayati G DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

2 ABSTRAK NUR MALAHAYATI. Perbandingan Metode Imputasi Ganda: Metode Regresi versus Metode Predictive Mean Matching untuk Mengatasi Data Hilang pada Data Survei. Dibimbing oleh BUDI SUSETYO dan INDAHWATI. Kegiatan survei dilakukan untuk mendapatkan informasi dari sebuah populasi dengan hanya mengamati sebagian unit dalam populasi itu (contoh), yang telah dipilih melalui teknik penarikan contoh tertentu. Dalam survei seringkali ditemukan adanya item nonrespon yang dapat terjadi baik karena unit contoh tidak menjawab pertanyaan maupun karena kesalahan dalam proses pemindahan data. Adanya item nonrespon, yang selanjutnya disebut data hilang, akan mengakibatkan pendugaan parameter menjadi tidak efisien karena ukuran data yang berkurang. Selain itu juga menyebabkan metode baku untuk data lengkap tidak dapat digunakan dalam proses analisis. Sehubungan dengan permasalahan yang timbul karena data hilang dalam data survei ini, terdapat beberapa metode yang dapat digunakan untuk memprediksi data hilang tersebut, salah satunya adalah metode imputasi. Metode imputasi yang ada antara lain imputasi ganda dengan metode regresi dan dengan metode Predictive Mean Matching (PMM). Pada penelitian ini dilakukan simulasi untuk membandingkan metode imputasi ganda regresi dan metode imputasi ganda PMM. Dari data survei contoh yang dibangkitkan, dilakukan penghilangan data dengan jumlah kehilangan yang berbeda-beda. Pembandingan yang dilakukan adalah dengan melihat rata-rata selisih nilai dugaan dari kedua metode dengan nilai aslinya. Pada pendugaan parameter populasi juga dilihat nilai Kuadrat Tengah Sisaan (KTS) data survei contoh terimputasi dari kedua metode tersebut. Hasil yang diperoleh adalah dari segi rata-rata selisih nilai dugaan dengan nilai asliya, metode regresi lebih baik daripada metode PMM, sedangkan dari segi pendugaan parameter populasi kedua metode memberikan nilai KTS yang tidak jauh berbeda.

3 PERBANDINGAN METODE IMPUTASI GANDA : METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Oleh: Nur Malahayati G DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

4 Judul Nama NIM : PERBANDINGAN METODE IMPUTASI GANDA: METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI : Nur Malahayati : G Menyetujui, Pembimbing I Pembimbing II Dr. Ir. Budi Susetyo, MS Ir. Indahwati, M.Si NIP NIP Mengetahui, Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Dr. Drh. Hasim, DEA NIP Tanggal lulus :...

5 RIWAYAT HIDUP Penulis dilahirkan di Banjarnegara, 4 Februari 1985 sebagai anak pertama dari pasangan Edi Kusdiyanto dan Sri Kustinah. Setelah menyelesaikan pendidikan dasar di SDN Krandegan 4 Banjarnegara pada tahun 1997, studi penulis dilanjutkan di SLTPN 1 Banjarnegara yang ditamatkan pada tahun Tahun 2003 penulis lulus dari SMUN 1 Banjarnegara dan pada tahun yang sama diterima di Departemen Statistika Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB. Semasa menjadi mahasiswa penulis aktif di Himpunan Keprofesian Departemen Statistika Gamma Sigma Beta, sebagai staff Departemen Olahraga dan Seni periode 2003/2004 dan 2004/2005, staff Departemen Keilmuan periode 2005/2006. Praktik lapang dilakukan penulis di PT. Tempo Inti Media, Tbk pada Februari-Mei 2007.

6 PRAKATA Alhamdulillahirabbil alamin, puji syukur kepada Allah SWT atas karunia-nya sehingga karya ilmiah ini dapat terselesaikan dengan baik. Sebagai manusia yang tak pernah sempurna, karena kesempurnaan hanya milik-nya, penulis ingin mengucapkan terima kasih kepada seluruh pihak yang telah membantu tersusunnya karya ilmiah ini. Terima kasih kepada: 1. Bapak Dr. Ir. Budi Susetyo, MS dan Ibu Ir. Indahwati, M.Si selaku pembimbing skripsi yang selalu sabar dalam membimbing dan mengarahkan penulis selama proses pembuatan karya ilmiah ini hingga selesai. 2. Ibu dan Bapak atas segala kasih sayang, kesabaran, nasihat dan doa yang tak pernah putus. 3. Bayu Alfiansyah yang senantiasa menjadi penyemangat hidup. 4. Buper (rara) thanks for being my best friend. 5. Yudi sebagai teman yang paling mengerti perjalanan penulis dalam penyusunan karya ilmiah ini (Ganbatte kudasai!) 6. Rekan-rekanku: Ema (yang penuh keceriaan, ga ada matinya), Aang (teman setia Offpeak), D Re (perhatianmu membuatku terharu), Mas Icus 38 (wejangan-wejangannya oke juga) 7. Teman-teman STK 40 atas kebersamaannya yang indah. 8. Adik-adik STK 41 (seminarku jadi rame lho!). 9. Seluruh staff Departemen Statistika. 10. Jaikers yang mengisi hari-hari penulis, you all guys, are my nice sisters. Penulis menyadari bahwa karya ilmiah ini masih jauh dari sempurna. Untuk itu kritik dan saran sangat penulis hargai demi perbaikan karya ilmiah ini. Semoga karya ilmiah ini dapat bermanfaat bagi kita semua. Bogor, Desember 2007 Nur Malahayati

7 DAFTAR ISI Halaman DAFTAR GAMBAR... viii DAFTAR TABEL... viii DAFTAR LAMPIRAN... ix PENDAHULUAN... 1 Latar Belakang... 1 Tujuan... 1 TINJAUAN PUSTAKA Metode Pendugaan Item Nonrespon... 1 Imputasi Tunggal (Single Imputation)... 2 Imputasi Ganda (Multiple Imputation)... 2 Pola Data Hilang... 2 Mekanisme Data Hilang... 2 Prosedur Imputasi Ganda... 3 Teori Pembuatan Nilai Imputan Ganda dengan Model Eksplisit... 3 Imputasi Ganda dengan Metode Regresi... 3 Imputasi Ganda dengan Metode Predictive Mean Matching... 4 BAHAN DAN METODE Bahan... 4 Metode... 4 HASIL DAN PEMBAHASAN Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 2% pada Peubah X Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 5% pada Peubah X Ringkasan Hasil Seluruh Simulasi... 6 Analisis Data untuk Data yang Telah Dilengkapi Data Dugaan... 7 Contoh Kasus untuk Penerapan Imputasi Ganda... 8 KESIMPULAN Kesimpulan... 9 Saran... 9 DAFTAR PUSTAKA... 9 LAMPIRAN... 10

8 DAFTAR TABEL Halaman 1. Metode Imputasi dalam Proc MI Data Asli yang Dihilangkan pada Simulasi Ulangan Data Hasil Imputasi dengan Metode Regresi pada Ulangan Data Hasil Imputasi dengan Metode PMM pada Ulangan Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X Penduga-penduga Koefisien Regresi Statistik untuk b DAFTAR GAMBAR 1. Ilustrasi pola data hilang monoton Ilustrasi pola data hilang nonmonoton Rata-rata Selisih antara Data Asli dengan Data Dugaan Peubah X 3 untuk Seluruh Kelompok Beda Jumlah Data Hilang Nilai KTS untuk Pendugaan Nilai Tengah Peubah X Nilai Bias (xbar) untuk pendugaan Nilai Tengah Peubah X Pembandingan Nilai Bias Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X Pembandingan Nilai KTS Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X

9 DAFTAR LAMPIRAN Halaman 1. Data Contoh Kombinasi Jumlah (%) Data Hilang pada Peubah X 2 dan X 3 Data Asli yang Dihilangkan pada Simulasi 2% pada X 2 dan 5% pada X Data Asli yang dihilangkan pada Simulasi kedua Data Hasil Imputasi dengan Metode Regresi untuk Data Hilang 2% pada X 2 dan 5% pada X 3 Ulangan Data Hasil Imputasi dengan Metode PMM untuk Data Hilang 2% pada X 2 dan 5% pada X 3 Ulangan Hasil Pendugaan Nilai Tengah Peubah X 3 dari Simulasi Jumlah Data Hilang 2% pada X 2 dan 2% pada X Output Proc MI Output Proc Reg Output Proc MIAnalyze... 16

10 PENDAHULUAN Latar Belakang Sensus sebuah populasi adalah usaha yang dilakukan untuk mendapatkan informasi dari setiap unit dalam populasi tersebut, sedangkan survei hanya dilakukan hanya terhadap beberapa unit populasi (contoh). Perancangan survei yang baik akan memilih contoh dengan benar agar kesimpulan terhadap populasi yang menjadi perhatian bersifat terandal dan cukup untuk menyimpulkan keadaan populasi. Dalam sensus maupun survei, seringkali ditemukan unit-unit yang tidak merespon sejumlah pertanyaan yang diajukan (nonrespon). Kish (1965) mendefinisikan nonrespon sebagai kegagalan untuk mendapatkan nilai pengamatan dari beberapa unit yang menjadi contoh. Nonrespon, yang dalam beberapa literatur sering disebut dengan data hilang umumnya dibagi menjadi dua tipe, yaitu unit nonrespon dan item nonrespon. Unit nonrespon terjadi karena unit contoh tidak memberikan respon sama sekali dalam suatu survei. Sedangkan item nonrespon dapat terjadi karena beberapa item dalam kuesioner tidak direspon oleh responden. Secara umum, nonrespon dapat disebabkan karena responden tidak mau menjawab, tidak mampu menjawab atau tidak tahu jawabannya. Nonrespon dapat juga terjadi karena terdapat kesalahan dalam penulisan jawaban atau dalam proses input data (Longford, 2005). Adanya data hilang akibat nonrespon ini menimbulkan data hasil survei/sensus tidak lengkap. Data hilang tersebut tidak hanya menyebabkan pendugaan parameter menjadi tidak efisien karena ukuran data yang berkurang tetapi juga menyebabkan metode baku untuk data lengkap tidak dapat digunakan untuk menganalisis data. Pada praktiknya, metode analisis untuk data lengkap sering digunakan untuk data-data yang mempunyai data hilang dengan cara menghapus unit-unit pengamatan yang mempunyai data hilang. Terdapat beberapa alasan logis yang memperlihatkan kenyataan bahwa prosedur tersebut tidak baik. Pertama, penghapusan unit-unit pengamatan yang mempunyai data hilang akan mengurangi ukuran contoh yang sudah ditentukan dari awal penelitian. Hal ini otomatis akan mengurangi ketepatan pendugaan populasi. Kedua, jika unit-unit pengamatan yang dihilangkan dalam analisis sangat berbeda dengan unit-unit yang tersisa, maka hasil dugaan akan menjadi berbias (Levy and Lemeshow, 1999). Sehubungan dengan permasalahan yang ditimbulkan oleh data hilang dalam survei/sensus tersebut terdapat beberapa metode untuk mengatasinya. Dalam penelitian ini dilakukan pembandingan terhadap beberapa metode. Tujuan Tujuan penelitian ini adalah: 1. Memperkenalkan metode pendugaan data hilang karena adanya nonrespon pada data survei untuk kasus item nonrespon, yaitu metode imputasi 2. Mengkaji dan membandingkan beberapa metode imputasi ganda, yaitu metode regresi dan metode Predictive Mean Matching TINJAUAN PUSTAKA Metode Pendugaan Item Nonrespon Imputasi adalah metode yang digunakan untuk memprediksi data hilang pada kumpulan data survei karena tidak adanya respon terhadap beberapa pertanyaan. Kumpulan data dengan beberapa data hilang yang telah diprediksi akan lebih mudah untuk ditangani secara analitik (Little, 1987). Menurut Little & Su (1989), metode imputasi dapat diklasifikasikan berdasarkan kriterianya. Klasifikasinya adalah sebagai berikut: a. Imputasi Peubah Tunggal dan Peubah Ganda (Multivariate vs Univariate) Misalkan adalah satu gugus peubah Y obs, i teramati pada unit i dan Y adalah gugus mis, i peubah yang hilang pada unit yang sama. Ketika Y terdiri lebih dari satu peubah, mis, i maka imputasi peubah tunggal akan memprediksi setiap peubah Y secara mis, i terpisah. Sedangkan imputasi peubah ganda akan megimputasi peubah-peubah secara Y mis, i simultan, dengan memperhatikan hubungan antar peubah tersebut. Imputasi peubah tunggal terlihat lebih sederhana, akan tetapi metode ini mengabaikan hubungan antar peubah. b. Imputasi Bersyarat dan Tak Bersyarat (Conditional vs Marginal) Imputasi marjinal untuk unit i didasarkan pada sebaran marjinal dari Y, mis, i sedangkan imputasi bersyarat didasarkan pada sebaran bersyarat dengan nilai Y mis, i Y obs, i diketahui. Baik sebaran marjinal maupun sebaran bersyarat diduga dari data yang ada. 1

11 c. Imputasi Stokastik vs Rata-rata (Stochastic vs Mean) Imputasi rata-rata memprediksi Y mis, i dengan rata-rata nilai data yang teramati dalam peubah yang sama, sedangkan imputasi stokastik memprediksi Y dengan nilai dari mis, i sebaran bersyarat atau tak bersyarat dari Y. mis, i Imputasi rata-rata umumnya tidak cocok untuk peubah kategorik. Jika data-data kuantitatif dilengkapi dengan metode ini, dugaan terhadap rataan data yang dihasilkan cukup memuaskan, tetapi juga akan menghasilkan dugaan yang melenceng terhadap keragaman dalam sebaran. Contohnya, jika data hilang terjadi pada peubah pendapatan diprediksi dengan menggunakan metode rata-rata, maka pendugaan terhadap persentase kemiskinan akan menjadi bias. Imputasi Tunggal (Single Imputation) Strategi imputasi yang mengisi nilai data hilang dengan sebuah nilai ini sering digunakan untuk mengatasi adanya item nonrespon pada praktek survei (Little, 1987). Jadi, selanjutnya pada tahap analisis data, nilai imputan/prediksi yang diperoleh dari imputasi tunggal dianggap seakan-akan seperti data yang sebenarnya. Metode imputasi ini mempunyai kelemahan yaitu, satu nilai yang digunakan untuk menggantikan data hilang ini tidak mencerminkan keragaman penarikan contoh nilai-nilai sebenarnya saat satu model untuk nonrespon terbentuk. Kelemahan yang lain, tidak dapat mencerminkan ketidakpastian saat terdapat lebih dari satu model untuk nonrespon. Kelemahan tersebut dapat diperbaiki dengan metode imputasi ganda (Rubin, 1987). Imputasi Ganda (Multiple Imputation) Berbeda dengan imputasi tunggal, imputasi ini mengganti nilai data hilang dengan beberapa nilai (dua atau lebih) yang diterima sebagai representasi ketakpastian nilai-nilai data hilang (Rubin, 1987). Terdapat sejumlah m nilai untuk setiap data hilang dan akhirnya akan membentuk m buah gugus data yang telah terlengkapi. Dari masing-masing gugus data tersebut diterapkan metode analisis baku untuk data lengkap, kemudian hasil dari analisis itu dirata-ratakan. Pola Data Hilang Menurut Little (1987) terdapat dua pola data hilang, yaitu pola data hilang monoton dan pola data hilang nonmonoton. Sebuah set data dengan peubah Y 1, Y 2, dan Y 3 dikatakan mempunyai data hilang yang berpola monoton jika kejadian hilangnya sebuah peubah Y j untuk unit tertentu mengakibatkan semua subsequent peubah Y k, k > j hilang untuk individu unit tersebut. Jika peubah Y j teramati untuk sebuah unit maka semua peubah sebelumnya, Y k, k < j, juga teramati pada unit tersebut. Ilustrasi untuk pola ini dapat dilihat pada gambar 1. Group Y 1 Y 2 Y 3 1 X X X 2 X X. 3 X.. Gambar 1. Ilustrasi pola data hilang monoton. Sedangkan pada pola nonmonoton tidak ada keteraturan letak data hilang. Ilustrasinya dapat dilihat pada gambar 2. Group Y 1 Y 2 Y 3 1 X X X 2 X. X 3. X. 4.. X Gambar 2. Ilustrasi pola data hilang nonmonoton. Pola data hilang sangat penting diperhatikan dalam penggunaan metode imputasi peubah ganda. Karena hal ini berkaitan dengan proses imputasi yang dilakukan. Imputasi akan dimulai untuk peubah dengan data hilang paling sedikit, dilanjutkan untuk peubah dengan data hilang tersedikit kedua, demikian seterusnya. Mekanisme Data Hilang Pengetahuan tentang mekanisme yang menyebabkan data hilang adalah kunci dasar dalam pemilihan analisis yang sesuai dan bagaimana menginterpretasikan hasilnya (Little, 1987). Beberapa tipe mekanisme data hilang adalah sebagai berikut: a. MCAR (Missing Completely at Random) Keterisian data dari peubah tertentu tidak tergantung dari besarnya nilai peubah itu maupun peubah lainnya. Contohnya, misalkan Y 1 peubah pendapatan dan Y2 peubah umur. Jika peluang teramatinya peubah pendapatan sama untuk setiap unit, tidak tergantung pada nilai pendapatan itu sendiri dan pada peubah umur maka mekanisme hilangnya data pada peubah pendapatan bertipe MCAR. b. MAR (Missing at Random) Keterisian data dari peubah tertentu hanya tergantung pada nilai peubah itu dan tidak 2

12 tergantung pada peubah lain. Dengan mengambil contoh seperti sebelumnya, maka mekanisme hilangnya data pada peubah pendapatan bertipe MAR jika nilai pendapatan tergantung pada peubah umur. tetapi tidak tergantung pada nilai pendapatan c. Nonignorable Keterisian data pada peubah tertentu tergantung pada nilai peubah itu dan peubah lain, sedangkan dua poin di atas, (a) dan (b) termasuk mekanisme data hilang ignorable. Prosedur Imputasi Ganda Terdapat beberapa metode imputasi ganda untuk menangani kasus data hilang. Beberapa metode ini, dalam penggunaannya perlu memperhatikan beberapa hal, yaitu pola data hilang (monoton atau nonmonoton), mekanisme data hilang (Missing at Random, Missing Completely at Random, dll), jenis peubah (kategorik atau numerik) dan sebaran data (kenormalan). Prosedur imputasi ganda dalam SAS 9.1 mengasumsikan mekanisme data hilang Missing at Random. Untuk sebaran data, metode regresi, Predictive Mean Matching dan MCMC mengasumsikan sebaran normal ganda. Jenis-jenis metode imputasi ganda dapat dilihat pada tabel 1. Sintaks untuk prosedur imputasi ganda di SAS 9.1 adalah sebagai berikut: PROC MI <pilihan-pilihan>; MONOTONE<metode <(<peubahterimputasi< =peubah penjelas > > < /detail > ) > >; VAR <peubah-peubah>; Tabel 1. Metode Imputasi dalam Proc MI Pola Data Hilang Jenis Data Metode Monoton Kontinu 1. Regresi 2. Predictive Mean Matching 3. Propensity Score Monoton Kategorik (Ordinal) Regresi Logistik Monoton Kategorik (Nominal) Fungsi Diskriminan Arbitrary Kontinu Markov Chain Monte Carlo (MCMC) Pada Proc MI juga terdapat statement untuk mengatasi pola data hilang yang tidak monoton dengan mengubah pola data hilang tersebut menjadi monoton. Statement yang digunakan adalah MCMC. Metode MCMC selain digunakan untuk memprediksi data dengan pola data hilang yang tidak monoton juga dapat mengubah pola data hilang yang tidak monoton menjadi monoton. Konsep cara kerjanya adalah dengan cara memprediksi beberapa data (bukan semua data hilang) sehingga pola datanya menjadi monoton (SAS 9.1 Help & Documentation). PROC MI <pilihan-pilihan>; MCMC impute=monotone; VAR <peubah-peubah>; Teori Pembuatan Nilai Imputan Ganda dengan Model Eksplisit Terdapat tiga tahapan (task) yang diperlukan untuk membuat nilai-nilai imputan yang mensimulasi sebaran posterior Y mis, i dengan model eksplisit Bayesian. Tiga tahapan tersebut adalah tahap pemodelan (Modelling Task), tahap pendugaan (Estimation Task), dan tahap imputasi (Imputation Task). Tahap pertama memilih model yang khusus untuk data. Tahap kedua membuat formula untuk sebaran posterior parameter dari model yang terpilih, dan tahap ketiga mengambil secara acak satu nilai parameter dari sebaran posterior yang didapatkan dari tahap kedua lalu mengambil secara acak nilai Y mis,i dari sebaran posterior bersyarat. Tahap yang ketiga jika diulang sebanyak m kali maka akan didapatkan m imputasi untuk setiap data hilang (Rubin, 1987). Imputasi Ganda dengan Metode Regresi Dari teori tentang pembuatan nilai-nilai imputan dengan model eksplisit Bayesian, jika diterapkan pada metode regresi maka tahapannya adalah sebagai berikut: 1. Tahap Pemodelan Tahap ini terletak pada pembentukan model, dalam hal ini model yang digunakan adalah model regresi linear normal, dengan Y i ~ N(X i β, σ 2 ). 2. Tahap Pendugaan Pada tahap ini didapatkan nilai-nilai dugaan parameter dari model. 2 2 σ = Y X ˆ /( n q) ( ) ˆ1 i i β1 1 obs = X t 1 ˆβ V iyi obs dimana 1 t V = X i X i obs 3. Tahap Imputasi Dari nilai-nilai dugaan parameter yang diperoleh dari tahap kedua lalu dilanjutkan ke langkah-langkah berikut: 3

13 a. Ambil satu nilai dari peubah acak 2 yang menyebar χ n 1 q, misalkan g dan hitung 2 σ ˆ 2 * = σ 1( n 1 q) / g. b. Ambil q buah peubah acak yang menyebar N(0, 1) untuk membuat q- komponen vektor Z dan hitung. ˆ 1/ 2 β * = β1 + σ *[ V ] Z, 1/ 2 dimana [ V ] merupakan matriks segitiga atas pada dekomposisi Cholesky. c. Kemudian Ymis akan didapat dengan menghitung Y, i* = X iβ* + ziσ * dimana normal deviasi z i diambil secara bebas dari N(0, 1). Sebuah nilai imputan yang baru untuk Ymis didapatkan dengan dimulai mengambil 2 sebuah nilai baru dari parameter σ *. Dengan demikian, jika imputasi diulang sebanyak m kali maka ketiga langkah di atas juga diulang m kali. Untuk kasus peubah ganda, misal data hilang Y i = (Y i1, Y i2 ) dengan Y i1 mempunyai n 1 data teramati dan Y i2 mempunyai n 2 data teramati dan n 2 n 1. Maka peubah yang akan diimputasi terlebih dahulu adalah data hilang pada peubah Y i1 (abaikan Y i2 ) dengan menggunakan X (peubah dengan data lengkap) sebagai peubah penjelasnya. Kemudian untuk mengimputasi data hilang pada Y i2, model regresi diperoleh dari unit-unit yang teramati pada peubah X, Y i1, dan Y i2. Nilai dugaan untuk data hilang pada peubah Y i2 diperoleh dari nilai-nilai yang sudah ada dan nilai hasil imputan pada peubah Y i1. Demikian seterusnya untuk jumlah Y i yang lebih banyak (Rubin, 1987). Imputasi Ganda dengan Metode Predictive Mean Matching (PMM) Imputasi ini konsep dasarnya seperti metode regresi. Serupa dengan langkahlangkah pada model regresi linear normal, hanya saja langkah (c) pada tahap imputasi digantikan dengan langkah-langkah sebagai berikut: 1. Hitung nilai Ymis dengan Yi* = X i β * i mis. 2. Untuk setiap Y i * i mis, cari responden Yi yang nilainya paling dekat dengan Y i*, dan imput nilai tersebut untuk Ymis. Metode ini adalah gabungan antara metode regresi dan Hot-Deck (Rubin, 1987). Pada proc MI, untuk setiap Y i* akan dibentuk satu set unit (sebanyak k unit) yang mempunyai nilai Y obs terdekat dengan Y i*. Default yang digunakan dalam prosedur tersebut adalah k=5, pada option. Kemudian dari k buah nilai akan diambil secara acak satu nilai untuk memprediksi data hilang. BAHAN DAN METODE Bahan Penelitian ini menggunakan data hasil simulasi. Data yang dibangkitkan dibuat sedemikian rupa seperti data survei. Skenario yang digunakan adalah survei ini dilakukan untuk menduga nilai tengah lingkar pinggang pada suatu populasi perempuan di suatu kota. Diasumsikan peubah ini adalah peubah yang berpeluang besar terjadi nonrespon karena beberapa sebab dalam survei ini. Adapun peubah-peubah yang dianggap mempengaruhi lingkar pinggang tersebut adalah berat badan dan tinggi badan. Jadi dalam pembangkitan data, ketiga peubah, berat badan (X 1 ), tinggi badan (X 2 ), dan lingkar pinggang (X 3 ), tersebut dibuat agar mempunyai korelasi yang cukup tinggi. Masing-masing peubah dibangkitkan dari sebaran normal. Adapun data riil yang akan digunakan sebagai contoh kasus penggunaan metode imputasi ganda adalah data sekunder hasil survei yang dilakukan oleh Yayah Karliah Husaini (Musa, 2007). Metode 1. Data populasi sebesar 1000 unit dibangkitkan. Hitung nilai tengah peubah X Dari data populasi diambil contoh berukuran 100 (lampiran 1), kemudian terhadap data ini dilakukan penghilangan data dengan jumlah data yang berbedabeda. 3. Perlakuan penghilangan data hanya diberikan kepada peubah X 2 dan X 3, sedangkan peubah X 1 dibiarkan lengkap. Penghilangan data dilakukan sedemikian rupa sehingga pola data hilang yang terbentuk adalah monoton. 4. Jumlah data yang dihilangkan pada peubah X 2 adalah sebanyak 2%, 5%, 10%, dan 15%. Adapun jumlah data pada peubah X 3 disesuaikan dengan jumlah data hilang pada peubah X 2 berdasarkan beda jumlah data hilang yang telah ditetapkan yaitu 0, 3, 5, 10, 15, dan 20. Untuk lebih jelasnya dapat dilihat pada lampiran 2. 4

14 5. Proses penghilangan data dilakukan secara acak untuk memenuhi asumsi mekanisme kehilangan data yang acak (MAR). 6. Ulangan yang digunakan sebanyak 10 kali pada setiap simulasi untuk memberikan peluang hilang yang sama kepada setiap data. 7. Setiap gugus data diimputasi ganda dengan m=5 (pada proc MI nimpute=5). 8. Setelah didapatkan nilai dugaan semua data hilang, dihitung selisih antara nilai dugaan dengan nilai aslinya. Dari selisih tersebut kemudian dihitung rata-rata dan ragam dari rata-rata tersebut. 9. Dari gugus data yang telah terlengkapi dengan nilai dugaan data hilang kemudian dihitung dugaan nilai tengah peubah X 3. Karena dilakukan ulangan 10 kali maka akan didapatkan 10 gugus data contoh yang kemudian akan didapatkan pendekatan bagi nilai KTS, dengan rumus: KTS ( x) = Ragam( x) + Bias 2 ( x) dimana Ragam n ( x) = [ xi E( x) ] i= 1 dan Bias ( x) = E( x) μ 2 1. n 10. Metode imputasi yang baik akan menghasilkan selisih antara nilai dugaan data hilang dengan nilai aslinya yang lebih kecil dan ragam dari rata-rata yang kecil pula. Gugus data contoh yang dibentuk dari metode imputasi tersebut juga mempunyai nilai KTS yang lebih kecil dalam pendugaan parameter populasi. 11. Menerapkan metode imputasi ganda ke dalam contoh kasus. HASIL DAN PEMBAHASAN Suatu penduga nilai akan dikatakan lebih baik dari penduga lainnya jika nilainya lebih mendekati nilai yang diduga. Pembandingan kedua metode imputasi ganda yang dilakukan adalah dengan membandingkan nilai penduga, dalam hal ini selisih nilai imputan dengan nilai sebenarnya. Proses Imputasi pada Proc MI Dengan mempertahankan urutan letak peubah X 1, X 2, dan X 3, maka cara kerja proc MI pada SAS 9.1 konsep proses imputasinya adalah dengan terlebih dahulu memprediksi data hilang pada peubah X 2. Caranya adalah dengan membentuk model regresi dari unitunit dengan data teramati pada peubah X 1 dan X 2, dengan X 2 sebagai peubah respon sedangkan X 1 sebagai peubah penjelas. Dari model regresi yang terbentuk maka akan terdapat parameter regresi dan kuadrat tengah galat (σ 2 ) yang kemudian akan disimulasikan sehingga terbentuk model regresi baru yang berbeda dengan model regresi awal. Pada model regresi baru terdapat tambahan unsur yang dapat dianggap sebagai galat. Data hilang pada peubah X 2 pada unit ke-i akan diprediksi melalui model regresi baru dengan memasukkan nilai peubah X 1 pada unit yang sama. Karena banyaknya imputasi yang digunakan adalah 5 (m = 5) maka proses tersebut diulang sebanyak 5 kali. Perbedaan nilai hasil imputasi berasal dari pengambilan bilangan acak dari sebaran tertentu yang berbeda-beda dalam simulasi terhadap parameter regresi dan kuadrat tengah galat. Setelah data hilang pada peubah X 2 diduga, proses imputasi dilanjutkan ke data hilang pada peubah X 3. Pada proses ini model regresi awal dibentuk dari unit-unit dengan data teramati untuk peubah X 1, X 2, dan X 3, dengan peubah X 3 sebagai peubah respon. Selanjutnya serupa dengan proses imputasi pada peubah X 2, pada akhirnya akan diperoleh model regresi baru setelah melalui simulasi terhadap parameterparameter regresi dan kuadrat tengah galat regresi. Data hilang pada peubah X 3 pada unit ke-i akan diprediksi melalui model regresi baru dengan memasukkan nilai peubah X 1 dan X 2 pada unit yang sama. Nilai hasil imputasi pada peubah X 2 juga digunakan untuk menduga data hilang pada peubah X 3. Hampir sama dengan metode regresi, metode PMM melakukan proses imputasi dimana model regresi awal yang terbentuk dari unit-unit dengan data teramati pada peubah X 1 dan X 2 untuk imputasi data hilang pada peubah X 2 dan unit-unit dengan data teramati pada peubah X 1, X 2, dan X 3 untuk imputasi data hilang pada peubah X 3. Dari model regresi awal, parameter-parameter regresi dan ragam dari galat disimulasikan. Selanjutnya diperoleh model regresi baru, hanya saja tidak ada penambahan unsur seperti model regresi baru pada metode regresi. Data hilang pada peubah dan unit tertentu akan diprediksi dengan nilai pada unit lain dari peubah yang sama dimana nilainya paling dekat dengan nilai respon yang dihasilkan dari model regresi baru. Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 2% pada Peubah X 3 Dari contoh berukuran 100 unit, simulasi yang pertama dilakukan adalah dengan menghilangkan data sebanyak 2% pada peubah 5

15 X 2 dan 2% pada peubah X 3 (selisih 0%). Simulasi ini dilakukan dengan ulangan 10 kali, sehingga terdapat 10 posisi kehilangan data yang berbeda. Adapun data yang dihilangkan pada simulasi ini dapat dilihat di tabel 2. Tabel 2. Data Asli yang Dihilangkan Data Asli Unit X2 X Hasil pendugaan data hilang dengan menggunakan metode regresi dan PMM dapat dilihat pada tabel 3 dan 4. Tabel 3. Data Hasil Imputasi dengan Metode Regresi pada Ulangan 1 Unit Imputasi Data Dugaan Regresi X2 X Tabel 4. Data Hasil Imputasi dengan Metode PMM pada Ulangan 1 Unit Imputasi Data Dugaan PMM X2 X Dari hasil yang diperoleh menunjukkan bahwa metode imputasi ganda regresi lebih baik dari metode PMM. Hal ini dapat ditunjukkan oleh nilai rata-rata beda antara nilai imputan dan nilai sebenarnya, untuk metode regresi dan untuk metode PMM. Dan dari rata-rata ragam selisih pun metode regresi lebih kecil dari metode PMM (Tabel 5). Tabel 5. Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X 3 Rata-rata Selisih Ragam Selisih Ulangan REG PMM REG PMM Rata-rata Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 5% pada Peubah X 3 Simulasi yang dilakukan berikutnya adalah dengan menghilangkan data 2% pada peubah X 2 dan 5% pada peubah X 3 (selisih 3%). Hasil dari simulasi ini menunjukkan bahwa metode regresi lebih baik daripada metode PMM, ditinjau dari nilai rata-rata selisih antara data asli dan data dugaannya juga dari nilai rata-rata ragam selisihnya. Nilai rata-rata selisih metode regresi lebih kecil daripada metode PMM, demikian juga nilai ragam selisihnya. Hasil tersebut dapat dilihat pada tabel 6. Tabel 6. Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X 3 Rata-rata Selisih Ragam Selisih Ulangan REG PMM REG PMM rata-rata Ringkasan Hasil Seluruh Simulasi Dari semua simulasi yang dilakukan, jumlah data hilang 2%, 5%, 10%, dan 15% serta selisih jumlah data hilang 0, 3, 5, 10, 15, dan 20 didapatkan hasil bahwa metode regresi selalu lebih baik daripada metode PMM ditinjau dari nilai rata-rata selisih antara data 6

16 asli dengan data dugaan dan ragam selisih antara data asli dengan data dugaan. Dari gambar 3 tampak bahwa nilai ratarata selisih antara data asli dengan data dugaan dari metode regresi cenderung lebih kecil dan lebih stabil dari kondisi jumlah data hilang satu ke kondisi lainnya jika dibandingkan dengan nilai rata-rata selisih dari metode PMM. Rata-rata Selisih Data Asli vs Data Dugaan Kelas Jumlah Data Hilang reg pmm Gambar 3. Rata-rata Selisih antara Data Asli dengan Data Dugaan Peubah X 3 untuk Seluruh Kelompok Beda Jumlah Data Hilang Nilai rata-rata selisih antara data asli dengan data dugaan metode PMM dari kondisi jumlah data hilang terkecil sampai terbesar cenderung mengalami kenaikan. Hal ini dapat disebabkan oleh data bangkitan yang nilainya berbeda untuk setiap unit. Sehingga semakin banyak jumlah data hilang akan membuat selisih dugaan dengan data asli semakin besar. Penjelasannya adalah berdasarkan teori imputasi ganda metode PMM, nilai imputan unit tertentu didapat dari nilai unit lain yang jaraknya paling dekat dengan nilai hasil regresi antara peubah respon dengan penjelas yang ditunjuk. Kandidat donor atau unit yang nilainya akan dipakai sebagai dugaan bagi data hilang semakin berkurang jumlahnya jika jumlah data hilang semakin banyak. Sedangkan nilai rata-rata selisih antara data asli dengan data dugaan pada metode regresi, seiring dengan peningkatan jumlah kehilangan data, relatif stabil. Berbeda dengan metode PMM, metode regresi mendapatkan nilai dugaan untuk data hilang langsung dari model regresi baru yang terbentuk melalui simulasi koefisien regresi awal. Nilai dugaan data hilangnya bukan diambil dari unit lain (donor). Analisis Data untuk Data yang Telah Dilengkapi Data Dugaan Suatu gugus data yang sebelumnya mempunyai beberapa data hilang tentunya akan dianalisis lebih lanjut. Dalam pendugaan parameter, hasil analisis berdasarkan metode imputasi ganda merupakan kombinasi dari hasil analisis setiap gugus data terlengkapi. Salah satu contoh penggunaan hasil nilai dugaan dari imputasi ganda yang dilakukan dalam penelitian ini adalah pendugaan nilai tengah populasi, dalam hal ini nilai tengah peubah lingkar pinggang X 3. Pembandingan kedua metode imputasi selanjutnya adalah dengan cara melihat nilai KTS pada saat melakukan pendugaan nilai tengah ukuran lingkar pinggang (X 3 ) dari sebuah populasi. Simulasi yang dilakukan adalah dengan cara menghitung rata-rata peubah lingkar pinggang dari semua gugus data contoh hasil imputasi. Terdapat 24 gugus data dengan karakteristik yang berbeda-beda sesuai dengan jumlah data hilang pada peubah X 3 dan jumlah data hilang pada peubah X 2. Gugus- gugus data yang telah diberi perlakuan penghilangan data kemudian dilengkapi kembali nilai-nilainya yang hilang dengan kedua metode imputasi ganda. Dari satu gugus data tak lengkap yang telah diimputasi ganda akan didapatkan 5 gugus data terlengkapi (m=5), sehingga terdapat 5 nilai statistik peubah X 2. Dari SAS (dengan Proc MI) akan secara otomatis dihasilkan satu nilai rata-rata dari kelima nilai statistik tersebut. KTS (xbar) Kelas Jumlah Data Hilang pmm reg Gambar 4. Nilai KTS untuk Pendugaan Nilai Tengah Peubah X 3 Bias (xbar) Kelas Jumlah Data Hilang pmm reg Gambar 5. Nilai Bias (xbar) untuk Pendugaan Nilai Tengah Peubah X 3 Karena simulasi yang dilakukan dengan ulangan 10 kali maka akan didapatkan 10 nilai rata-rata untuk menduga nilai tengah X 2. Dari nilai-nilai itulah nilai KTS dihitung (nilai tengah peubah lingkar pinggang yang sebenarnya adalah ). 7

17 Hasil dari simulasi dapat dilihat pada gambar 4. tidak terdapat perbedaan yang berarti antara nilai KTS yang dihasilkan dari metode imputasi regresi dan PMM. Dilihat dari nilai biasnya juga tidak terdapat perbedaan yang berarti di antara kedua metode tersebut (gambar 5). Kedua metode menghasilkan penduga yang nilainya lebih besar dari nilai parameter yang sebenarnya (overestimate). Pembandingan Metode Imputasi Ganda dengan Metode Baku untuk Data Lengkap Pada praktiknya, metode baku untuk data lengkap sering digunakan dalam menganalisis data yang mengandung data hilang. Metode tersebut dilakukan dengan cara menghapus unit-unit yang mempunyai data hilang. Untuk melihat akibat dari penggunaan metode penghapusan unit pada data yang mengandung data hilang dilakukan pendugaan parameter populasi dengan jumlah kehilangan data yang berbeda. Kemudian hasilnya dibandingkan dengan pendugaan parameter melalui metode imputasi ganda, baik PM maupun regresi. bias (xbar) % 5% 10% 15% 20% 25% jumlah data hilang hapus unit PMM reg Gambar 6. Pembandingan Nilai Bias Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X 3. KTS (xbar) % 5% 10% 15% 20% 25% junmlah data hilang hapus unit PMM reg Gambar 7. Pembandingan Nilai KTS Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X 3. Pembandingan masih dilihat dari nilai bias dan nilai KTS, dengan jumlah data hilang yang dicobakan adalah 2%, 5%, 10%, 15%, 20% dan 25% baik pada peubah X 2 maupun X 3. Gambar 6 dan 7 menunjukkan bahwa metode penghapusan menghasilkan nilai bias dan KTS yang jauh lebih tinggi daripada kedua metode imputasi ganda pada jumlah kehilangan data lebih besar dan sama dengan 5%. Pada jumlah kehilangan data 2% ketiga metode tersebut memberikan nilai bias yang tidak jauh berbeda. Terlebih dengan meningkatnya jumlah data hilang, semakin banyak data hilang pada data maka nilai dugaan terhadap parameter populasi akan semakin buruk jika metode penghapusan unit dengan data hilang digunakan. Dari contoh pembandingan tersebut maka dapat ditunjukkan bahwa penggunaan metode baku untuk data lengkap kurang tepat dalam proses analisis data yang mengandung data hilang. Contoh Kasus untuk Penerapan Imputasi Ganda Dari data sekunder yang didapatkan peneliti hanya mengambil beberapa peubah untuk digunakan sebagai contoh penerapan metode imputasi ganda. Peubah-peubah yang digunakan adalah Sistem Kekerabatan (X 1 ), Jenis Kelamin Bayi (X 2 ), Umur Bayi (X 3 ), Bobot Ibu (X 4 ), dan Bobot Bayi (X 5 ), sedangkan peubah yang mempunyai data hilang adalah X 4 dan X 5 dengan total jumlah kehilangan data sebesar 9.73% dan pola kehilangan data yang terbentuk adalah pola data hilang monoton. Keterangan tersebut dapat dilihat di lampiran 6. Untuk menduga nilai data hilang yang ada pada peubah-peubah tersebut digunakan proc MI dengan menggunakan metode PMM. Adapun analisis lanjut yang digunakan setelah menduga data hilang adalah analsis regresi untuk menduga hubungan antara peubah respon X 5 dengan peubah penjelas X 1, X 2, X 3, dan X 4. Oleh karena itu, setelah dilakukan pendugaan data hilang dengan metode imputasi ganda dilakukan analisis regresi dengan menggunakan proc reg terhadap tiap gugus data yang telah dilengkapi datanya. Hasil analisis masing-masing gugus data yang telah dilengkapi dapat dilihat pada lampiran 7. Tabel 7. Penduga-penduga Koefisien Regresi Gugus b 0 b 1 BB2 b 3 b Mean Var Pada tabel 7 dapat dilihat hasil akhir pendugaan koefisien regresi yang merupakan kombinasi tiap pendugaan dari gugus data yang telah dilengkapi (rata-rata penduga koefisien 8

18 regresi dari tiap gugus data). Sedangkan ragam dari tiap penduga koefisien menduga keragaman nilai penduga koefisien karena dilakukan imputasi sebanyak 5 kali. Sedangkan dari tabel 8 dapat diperoleh informasi bahwa rata-rata dari nilai S 2 b 0 sebesar 0.658, nilai ini menduga keragaman dalam b 0 karena penarikan contoh (sampling). Dari analisis regresi yang dihasilkan dari proc MIAnalyze dapat disimpulkan bahwa peubah Sistem Kekerabatan dan Jenis Kelamin Bayi tidak berpengaruh nyata terhadap peubah Bobot Bayi. Hasil tersebut dapat dilihat pada pengujian parsial terhadap tiap penduga koefisien regresi dalam output proc MIAnalyze (lampiran 8). Tabel 8. Statistik untuk b 0 Gugus b 0 SEb 0 S 2 b Mean Var hilang tidak memberikan pengaruh yang besar terhadap perubahan nilai KTS. Pada simulasi sederhana yang dilakukan dalam penelitian ini, telah ditunjukkan bahwa metode penghapusan unit yang mengandung data hilang memberikan hasil yang kurang baik, terlebih dengan jumlah kehilangan data yang cenderung besar. Saran Maka para analis data hendaknya lebih berhati-hati dalam penanganan data yang mengandung data hilang, sehubungan dengan metode analisis baku untuk data lengkap atau metode penghapusan unit yang sering diterapkan pada kasus dengan data hilang. Sebagai saran untuk penelitian selanjutnya yaitu perlu dilakukan simulasi serupa tapi dengan data yang tidak semua unitnya mempunyai nilai yang berbeda (terdapat beberapa unit yang mempunyai nilai sama). Hal ini dimungkinkan akan memberikan hasil yang berbeda khususnya untuk metode PMM. Masih terdapat faktor-faktor yang dapat dan perlu dilihat untuk membandingkan metode imputasi ganda regresi dan PMM selain dari yang sudah diteliti dalam penelitian ini. KESIMPULAN & SARAN Kesimpulan Dalam hal pendugaan terhadap data hilang dalam data contoh metode imputasi ganda regresi lebih baik daripada metode PMM, karena nilai dugaan yang dihasilkan lebih dekat dengan nilai sebenarnya. Dengan jumlah kehilangan data yang semakin meningkat, selisih nilai dugaan dengan nilai aslinya juga akan meningkat pada metode PMM. Sedangkan pada metode regresi, peningkatan jumlah kehilangan data tersebut tidak mempengaruhi selisih nilai dugaan dengan nilai aslinya (cenderung stabil). Dengan kata lain, keragaman selisih nilai dugaan dengan nilai asli pada metode regresi lebih kecil daripada keragaman yang diperoleh pada metode PMM. Sedangkan dari segi pendugaan parameter populasi melalui data contoh yang telah dilengkapi dengan data imputan, kedua metode imputasi ganda tersebut tidak memiliki perbedaan yang nyata. Hal ini bisa dilihat dari nilai KTS untuk pendugaan parameter populasi yang dihasilkan. Meningkatnya jumlah data DAFTAR PUSTAKA Cochran, W. G Sampling Technique. New York: Wiley. Kish, Leslie Survey Sampling. New York: Wiley. Levy, P. S. and Lemeshow, S Sampling of Populations: Methods & Applications 3 rd ed. New York: Willey. Little, R. J. A. and Rubin, D. B Statistical Analysis with Missing Data. New York: Wiley. Longford, N. T Missing Data and Small- Area Estimation. New York: Springer. Rubin, D. B Multiple Imputation for Nonresponse in Sample Surveys. New York: Willey Lepkowski, J. M Treatment of Wave Nonresponse in Panel Surveys dalam Panel Surveys. New York: John Willey & Sons. Little, R. J. A. & Su, Hong Lin Item Nonresponse in Panel Surveys dalam Panel Surveys. New York: John Willey & Sons. Musa, Sjarkani Metodologi Penelitian dengan Statistika. Departemen Statistika IPB. Bogor: inpress. 9

19 Lampiran 1. Tabel Data Contoh Unit BB TB LP Unit BB TB LP

20 Lampiran 2. Kombinasi (kelas) Jumlah (%) Data Hilang pada Peubah X 2 dan X 3 Kelas X 2 X Lampiran 3. Data Asli yang Dihilangkan pada Simulasi kedua Unit Data Asli X 2 X

21 Lampiran 4. Data Hasil Imputasi dengan Metode Regresi untuk Data Hilang 2% pada X 2 dan 5% pada X 3 Ulangan 1 Unit Imputasi Data Dugaan Regresi X 2 X

22 Lampiran 5. Data Hasil Imputasi dengan Metode PMM untuk Data Hilang 2% pada X 2 dan 5% pada X 3 Ulangan 1 Unit Imputasi Data Dugaan PMM X 2 X Lampiran 6. Hasil Pendugaan Nilai Tengah Peubah X 3 dari Simulasi Jumlah Data Hilang 2% pada X 2 dan 2% pada X 3 Ulangan Nilai Rata-rata X 3 PMM REG Var(xbar) B (xbar) MSE(xbar)

23 Lampiran 7. Output Proc MI The MI Procedure Model Information Data Set WORK.SURVEI2 Method Monotone Number of Imputations 5 Seed for random number generator Monotone Model Specification Method Regression-PMM( K= 5) Imputed Variables JkBy UmBy Bibu BBy Missing Data Patterns Jk Um Group Ker By By Bibu BBy Freq Percent 1 X X X X X X X X X X X X Missing Data Patterns Group Means Group Ker JkBy UmBy Bibu BBy Multiple Imputation Variance Information Variance Variable Between Within Total DF Bibu BBy Multiple Imputation Variance Information Relative Fraction Increase Missing Relative Variable in Variance Information Efficiency Bibu BBy Multiple Imputation Parameter Estimates Variable Mean Std Error 95% Confidence Limits DF Bibu BBy

24 Lampiran 8. Output Proc Reg REG Model Coefficients and Covariance matrices Obs _Imput TYPE NAME_ Intercept Ker JkBy UmBy Bibu 1 1 PARMS COV Intrcept COV Ker COV JkBy COV UmBy COV Bibu PARMS COV Intercept COV Ker COV JkBy E COV UmBy COV Bibu PARMS COV Intercept COV Ker COV JkBy COV UmBy COV Bibu PARMS COV Intercept COV Ker COV JkBy COV UmBy COV Bibu PARMS COV Intercept COV Ker COV JkBy COV UmBy COV Bibu

25 Lampiran 9. Output Proc MIAnalyze The MIANALYZE Procedure Model Information Data Set WORK.OUTREG Number of Imputations 5 Multiple Imputation Variance Information Variance Parameter Between Within Total DF Intercept Ker JkBy UmBy Bibu Multiple Imputation Variance Information Relative Fraction Increase Missing Relative Parameter in Variance Information Efficiency Intercept Ker JkBy UmBy Bibu Multiple Imputation Parameter Estimates Parameter Estimate Std Error 95% Confidence Limits DF Intercept Ker JkBy UmBy Bibu Multiple Imputation Parameter Estimates 16

Menunjukkan lagi