BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan Pengambilan sampel dari suatu populasi melalui metode survei sampel memberikan manfaat yang cukup besar dalam suatu penelitian. Survei sampel dilakukan dengan tujuan membuat inferensi tentang parameter atau karakteristik populasi seperti mean, variansi, proporsi, korelasi, koefisien regresi dan sebagainya berdasarkan sampel yang diambil dari populasi tersebut. Berbagai penelitian terkait survei sampel terus dikembangkan untuk mengatasi berbagai permasalahan yang muncul. Adanya data yang hilang (missing data) akibat tidak adanya respon dari responden (nonresponse) merupakan salah satu permasalahan yang sering muncul baik dalam sensus maupun survei sampel. Hal ini terjadi ketika suatu unit sampel atau responden tidak merespon seluruh kuesioner survei (unit nonresponse) maupun tidak merespon beberapa item pertanyaan tertentu (item nonresponse). Salah satu teknik yang dapat digunakan untuk mengatasi item nonresponse adalah dengan imputasi. Little dan Rubin (1987) menyatakan bahwa tujuan dari imputasi adalah untuk mengisi atau mengganti item nonresponse dengan nilainilai yang logis sehingga peneliti tetap dapat memperoleh informasi yang optimal dari variabel yang telah tercatat dari responden (item response). Menurut Sarndal (2005), imputasi adalah sebuah prosedur pengisian nilai yang hilang pada satu atau lebih variabel dengan suatu nilai tertentu. Alasan penggunaan imputasi adalah untuk memfasilitasi agar peneliti dapat menggunakan metode analisis data lengkap dan untuk mereduksi bias nonresponse (Kim dan Rao, 2009). Ada beragam metode imputasi, salah satunya adalah metode imputasi hot deck. Imputasi hot deck menggunakan nilai dari sampel yang diperoleh sebagai nilai imputasi. Dengan demikian setiap nilai yang hilang diganti dengan nilai item response yang teramati dan memiliki karakteristik yang mirip dengan item nonresponse. Pada metode ini nilai yang hilang disebut penerima (recipient) 1
2 sedangkan nilai yang digunakan untuk mengimputasi item nonresponse disebut donor. Sehingga ada juga yang menyebut metode ini sebagai metode donor. Secara histosis nama hot deck pertama kali digunakan oleh Biro Sensus Amerika Serikat untuk mendeskripsikan prosedur imputasi dengan menggunakan kartu penyimpanan data pada komputer untuk memproses data. Terdapat setumpuk kartu yang tersedia sebagai donor bagi resipien. Donor tersebut merupakan elemen yang dekat dengan resipien di dalam dek kartu. Dek tersebut dikatakan panas karena menggunakan data yang sedang diproses, hal ini berbeda dari metode imputasi dek dingin (cold deck) yang menggunakan data sebelum diproses atau data lain dari luar sebagai donor. Pada Biro Sensus Amerika Serikat, prosedur hot deck klasik dikembangkan untuk item nonresponse dalam survei penduduk mengenai tambahan penghasilan dan metode ini terus berkembang sejak saat itu (Andridge dan Little, 2010). Beberapa penelitian telah meninjau berbagai bentuk imputasi hot deck dan sifat statistiknya. Imputasi hot deck juga menjadi salah satu metode yang pernah digunakan dalam penelitian yang dilakukan oleh Departemen Kesehatan dan Layanan Kemanusiaan di Amerika dalam Survei Kesehatan Nasional dan Gizi III (NHANES III). Pada sensus penduduk 2010 yang dilakukan oleh BPS, pada salah satu tahapan pengolahan datanya juga dilakukan imputasi menggunakan metode cold-deck dan hot deck. Meskipun telah digunakan cukup luas dalam praktek penelitian, namun secara teori metode ini masih menjadi area yang potensial untuk diteliti karena belum ada konsensus mengenai cara terbaik penerapan metode hot deck (Andridge dan Little, 2010). Pada tesis ini akan dibahas mengenai imputasi hot deck fraksional dan imputasi nearest neighbour. Kedua metode ini merupakan pengembangan dari metode hot deck. Menurut Rubin (1987), keuntungan dari metode hot deck adalah bahwa nilai donor yang digunakan untuk mengimputasi item nonresponse berasal dari nilai yang juga terdapat dalam sampel, sehingga nilai hasil imputasi akan mempunyai bentuk ditribusi yang sesuai dengan data pengamatan. Durrant (2005) juga menyebutkan bahwa metode hot deck merupakan metode nonparametrik (atau semiparametrik) dan bertujuan menghindari asumsi distribusi, oleh karena
3 itu sering digunakan dalam praktek penelitian. Disamping memiliki keuntungan, ternyata metode hot deck klasik juga memiliki kelemahan. Pemilihan donor secara random menyebabkan timbulnya variabilitas yang disebabkan variansi imputasi. Brick dan Kalton (1996) mendiskripsikan dua metode untuk mereduksi variansi imputasi yaitu dengan metode pemilihan donor melalui desain sampel dan metode fraksional. Untuk itulah diusulkan metode hot deck fraksional yang merupakan gabungan antara metode hot deck dan metode fraksional dengan tujuan agar dapat mereduksi variansi sehingga dapat diperoleh performance imputasi yang lebih baik (Kim dan Fuller, 2004). Adapun imputasi nearest neighbour yang juga merupakan pengembangan metode hot deck mencoba mereduksi variansi dengan cara mendefinisikan metode pemilihan donor dengan meminimalkan jarak tertentu (Chen dan Shao, 2001). Imputasi hot deck fraksional dan imputasi nearest neighbour merupakan metode nonparametrik. Oleh karena itu untuk membandingkan performance estimasi variansi estimator dari hasil imputasi kedua metode tersebut digunakan estimasi variansi estimator dengan metode Jackknife yang juga merupakan metode nonparametrik. 1.2 Tujuan Penelitian Berdasarkan apa yang telah diuraikan pada latar belakang dan permasalahan, maka tujuan dari penulisan tesis ini adalah: 1. Melakukan imputasi untuk mengatasi item nonresponse dengan metode imputasi hot deck fraksional dan imputasi nearest neighbour. 2. Mencari dan membandingkan performance estimasi variansi estimator hasil imputasi hot deck fraksional dan imputasi nearest neighbour dengan metode Jackknife pada data studi kasus dengan menggunakan bantuan software R.
4 1.3 Manfaat Penelitian Manfaat yang diharapkan diperoleh dari penulisan tesis ini adalah : 1. Dapat menambah pemahaman mengenai prosedur dan performance estimasi variansi estimator hasil imputasi hot deck fraksional dan imputasi nearest neighbour. 2. Dapat memberikan kontribusi terhadap perkembangan ilmu pengetahuan dan menambah wawasan pengetahuan dalam bidang statistika terutama mengenai metode imputasi dan penerapannya sebagai salah satu alternatif untuk mengatasi permasalahan nonsampling error yang berupa item nonresponse. 1.4 Tinjauan Pustaka Pemilihan donor secara random menyebabkan timbulnya variabilitas yang disebabkan variansi imputasi. Brick dan Kalton (1996) mendiskripsikan dua metode untuk mereduksi variansi imputasi. Metode yang pertama yaitu melalui desain sampel yang digunakan untuk memilih donor dalam tiap-tiap kelas imputasi. Sedangkan metode yang kedua adalah menggunakan imputasi fraksional, yaitu menggunakan lebih dari sebuah nilai untuk sebuah item nonresponse. Imputasi ganda yang diperkenalkan oleh Rubin (1978) dan imputasi fraksional merupakan imputasi pengulangan (repeated imputation), karena keduanya sama-sama menggunakan lebih dari satu nilai untuk dimasukkan ke dalam item yang hilang. Durrant (2005) menyebutkan ada dua alasan penggunaan imputasi pengulangan yaitu untuk mereduksi variansi estimator setelah imputasi yang mungkin terjadi karena adanya komponen random dan untuk penyederhanaan estimasi variansi dari estimator titik. Imputasi fraksional dirancang untuk mereduksi variansi imputasi sedangkan imputasi ganda untuk menyederhanakan estimasi dan memberikan estimator variansi. Rhao dan Shao (1992) dalam jurnalnya membahas mengenai estimasi variansi Jackknife untuk imputasi hot deck dengan probabilitas pemilihan donornya proporsional dengan bobot sampling dan dipilih dengan pengembalian. Sementara Chen dan Shao (2001) mengusulkan estimasi variansi Jackknife untuk imputasi nearest neighbour yang merupakan salah satu pengembangan dari metode hot deck. Kim dan Fuller
5 (2004) mendeskripsikan aplikasi dari estimator variansi Jackknife untuk imputasi hot deck fraksional yang kemudian dikembangkan oleh Kim dan Rao (2009) yang membahas mengenai pendekatan terpadu untuk estimasi variansi estimator setelah dilakukan imputasi pada item nonresponse. 1.5 Metode Penelitian Metodologi yang digunakan dalam penelitian ini adalah studi literatur. Langkah-langkah yang dilakukan penulis adalah sebagai berikut: 1. Mencari, mengumpulkan dan mempelajari jurnal dan buku pendukung yang berkaitan dengan permasalahan penelitian. 2. Membahas topik penelitian yang meliputi teori survei sampel, nonresponse, imputasi hot deck, imputasi fraksional, imputasi nearest neighbour dan estimasi variansi estimator dengan metode Jackknife. 3. Studi kasus mengenai topik yang diteliti dengan bantuan software R meliputi: melakukan imputasi hot deck fraksional dan imputasi nearest neighbour pada data studi kasus yang memiliki item nonresponse, mencari estimasi variansi estimator dengan metode Jackknife pada data lengkap hasil imputasi dan membandingkan performance estimasi variansi estimator hasil imputasi kedua metode tersebut. 4. Menyusun laporan penelitian sesuai dengan buku petunjuk penulisan tesis yang berlaku. 1.6 Sistematika Penulisan BAB I PENDAHULUAN : Pada bab ini membahas tentang latar belakang dan permasalahan, tujuan dan manfaat penelitian, tinjauan pustaka, metodologi penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI : Pada bab ini membahas tentang ide dasar survei sampel, nonresponse, imputasi hot deck, imputasi fraksional, imputasi nearest neighbour dan estimasi variansi estimator dengan metode Jackknife.
6 BAB III PEMBAHASAN : Pada bab ini akan dipaparkan mengenai proses imputasi hot deck fraksional, imputasi nearest neighbour dan estimasi variansi estimator dengan metode Jackknife setelah dilakukan imputasi tersebut. BAB IV STUDI KASUS : Pada bab ini berisi tentang studi kasus sebagai contoh penerapan mengenai topik penelitian dengan bantuan software R meliputi : melakukan imputasi hot deck fraksional, imputasi nearest neighbour, mencari estimasi variansi estomator dengan metode Jackknife setelah dilakukan imputasi dan membandingkan performance estimasi variansi estimator hasil kedua metode imputasi tersebut. BAB V KESIMPULAN DAN SARAN : Bab ini berisi pembahasan mengenai kesimpulan yang diperoleh dari bab-bab sebelumnya dan saran untuk penelitian selanjutnya berdasarkan pada materi yang telah dibahas.