PERBANDINGAN METODE IMPUTASI GANDA : METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI
|
|
- Ratna Hardja
- 7 tahun lalu
- Tontonan:
Transkripsi
1 PERBANDINGAN METODE IMPUTASI GANDA : METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI Nur Malahayati G DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008
2 ABSTRAK NUR MALAHAYATI. Perbandingan Metode Imputasi Ganda: Metode Regresi versus Metode Predictive Mean Matching untuk Mengatasi Data Hilang pada Data Survei. Dibimbing oleh BUDI SUSETYO dan INDAHWATI. Kegiatan survei dilakukan untuk mendapatkan informasi dari sebuah populasi dengan hanya mengamati sebagian unit dalam populasi itu (contoh), yang telah dipilih melalui teknik penarikan contoh tertentu. Dalam survei seringkali ditemukan adanya item nonrespon yang dapat terjadi baik karena unit contoh tidak menjawab pertanyaan maupun karena kesalahan dalam proses pemindahan data. Adanya item nonrespon, yang selanjutnya disebut data hilang, akan mengakibatkan pendugaan parameter menjadi tidak efisien karena ukuran data yang berkurang. Selain itu juga menyebabkan metode baku untuk data lengkap tidak dapat digunakan dalam proses analisis. Sehubungan dengan permasalahan yang timbul karena data hilang dalam data survei ini, terdapat beberapa metode yang dapat digunakan untuk memprediksi data hilang tersebut, salah satunya adalah metode imputasi. Metode imputasi yang ada antara lain imputasi ganda dengan metode regresi dan dengan metode Predictive Mean Matching (PMM). Pada penelitian ini dilakukan simulasi untuk membandingkan metode imputasi ganda regresi dan metode imputasi ganda PMM. Dari data survei contoh yang dibangkitkan, dilakukan penghilangan data dengan jumlah kehilangan yang berbeda-beda. Pembandingan yang dilakukan adalah dengan melihat rata-rata selisih nilai dugaan dari kedua metode dengan nilai aslinya. Pada pendugaan parameter populasi juga dilihat nilai Kuadrat Tengah Sisaan (KTS) data survei contoh terimputasi dari kedua metode tersebut. Hasil yang diperoleh adalah dari segi rata-rata selisih nilai dugaan dengan nilai asliya, metode regresi lebih baik daripada metode PMM, sedangkan dari segi pendugaan parameter populasi kedua metode memberikan nilai KTS yang tidak jauh berbeda.
3 PERBANDINGAN METODE IMPUTASI GANDA : METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Oleh: Nur Malahayati G DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008
4 Judul Nama NIM : PERBANDINGAN METODE IMPUTASI GANDA: METODE REGRESI VERSUS METODE PREDICTIVE MEAN MATCHING UNTUK MENGATASI DATA HILANG PADA DATA SURVEI : Nur Malahayati : G Menyetujui, Pembimbing I Pembimbing II Dr. Ir. Budi Susetyo, MS Ir. Indahwati, M.Si NIP NIP Mengetahui, Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Dr. Drh. Hasim, DEA NIP Tanggal lulus :...
5 RIWAYAT HIDUP Penulis dilahirkan di Banjarnegara, 4 Februari 1985 sebagai anak pertama dari pasangan Edi Kusdiyanto dan Sri Kustinah. Setelah menyelesaikan pendidikan dasar di SDN Krandegan 4 Banjarnegara pada tahun 1997, studi penulis dilanjutkan di SLTPN 1 Banjarnegara yang ditamatkan pada tahun Tahun 2003 penulis lulus dari SMUN 1 Banjarnegara dan pada tahun yang sama diterima di Departemen Statistika Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB. Semasa menjadi mahasiswa penulis aktif di Himpunan Keprofesian Departemen Statistika Gamma Sigma Beta, sebagai staff Departemen Olahraga dan Seni periode 2003/2004 dan 2004/2005, staff Departemen Keilmuan periode 2005/2006. Praktik lapang dilakukan penulis di PT. Tempo Inti Media, Tbk pada Februari-Mei 2007.
6 PRAKATA Alhamdulillahirabbil alamin, puji syukur kepada Allah SWT atas karunia-nya sehingga karya ilmiah ini dapat terselesaikan dengan baik. Sebagai manusia yang tak pernah sempurna, karena kesempurnaan hanya milik-nya, penulis ingin mengucapkan terima kasih kepada seluruh pihak yang telah membantu tersusunnya karya ilmiah ini. Terima kasih kepada: 1. Bapak Dr. Ir. Budi Susetyo, MS dan Ibu Ir. Indahwati, M.Si selaku pembimbing skripsi yang selalu sabar dalam membimbing dan mengarahkan penulis selama proses pembuatan karya ilmiah ini hingga selesai. 2. Ibu dan Bapak atas segala kasih sayang, kesabaran, nasihat dan doa yang tak pernah putus. 3. Bayu Alfiansyah yang senantiasa menjadi penyemangat hidup. 4. Buper (rara) thanks for being my best friend. 5. Yudi sebagai teman yang paling mengerti perjalanan penulis dalam penyusunan karya ilmiah ini (Ganbatte kudasai!) 6. Rekan-rekanku: Ema (yang penuh keceriaan, ga ada matinya), Aang (teman setia Offpeak), D Re (perhatianmu membuatku terharu), Mas Icus 38 (wejangan-wejangannya oke juga) 7. Teman-teman STK 40 atas kebersamaannya yang indah. 8. Adik-adik STK 41 (seminarku jadi rame lho!). 9. Seluruh staff Departemen Statistika. 10. Jaikers yang mengisi hari-hari penulis, you all guys, are my nice sisters. Penulis menyadari bahwa karya ilmiah ini masih jauh dari sempurna. Untuk itu kritik dan saran sangat penulis hargai demi perbaikan karya ilmiah ini. Semoga karya ilmiah ini dapat bermanfaat bagi kita semua. Bogor, Desember 2007 Nur Malahayati
7 DAFTAR ISI Halaman DAFTAR GAMBAR... viii DAFTAR TABEL... viii DAFTAR LAMPIRAN... ix PENDAHULUAN... 1 Latar Belakang... 1 Tujuan... 1 TINJAUAN PUSTAKA Metode Pendugaan Item Nonrespon... 1 Imputasi Tunggal (Single Imputation)... 2 Imputasi Ganda (Multiple Imputation)... 2 Pola Data Hilang... 2 Mekanisme Data Hilang... 2 Prosedur Imputasi Ganda... 3 Teori Pembuatan Nilai Imputan Ganda dengan Model Eksplisit... 3 Imputasi Ganda dengan Metode Regresi... 3 Imputasi Ganda dengan Metode Predictive Mean Matching... 4 BAHAN DAN METODE Bahan... 4 Metode... 4 HASIL DAN PEMBAHASAN Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 2% pada Peubah X Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 5% pada Peubah X Ringkasan Hasil Seluruh Simulasi... 6 Analisis Data untuk Data yang Telah Dilengkapi Data Dugaan... 7 Contoh Kasus untuk Penerapan Imputasi Ganda... 8 KESIMPULAN Kesimpulan... 9 Saran... 9 DAFTAR PUSTAKA... 9 LAMPIRAN... 10
8 DAFTAR TABEL Halaman 1. Metode Imputasi dalam Proc MI Data Asli yang Dihilangkan pada Simulasi Ulangan Data Hasil Imputasi dengan Metode Regresi pada Ulangan Data Hasil Imputasi dengan Metode PMM pada Ulangan Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X Penduga-penduga Koefisien Regresi Statistik untuk b DAFTAR GAMBAR 1. Ilustrasi pola data hilang monoton Ilustrasi pola data hilang nonmonoton Rata-rata Selisih antara Data Asli dengan Data Dugaan Peubah X 3 untuk Seluruh Kelompok Beda Jumlah Data Hilang Nilai KTS untuk Pendugaan Nilai Tengah Peubah X Nilai Bias (xbar) untuk pendugaan Nilai Tengah Peubah X Pembandingan Nilai Bias Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X Pembandingan Nilai KTS Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X
9 DAFTAR LAMPIRAN Halaman 1. Data Contoh Kombinasi Jumlah (%) Data Hilang pada Peubah X 2 dan X 3 Data Asli yang Dihilangkan pada Simulasi 2% pada X 2 dan 5% pada X Data Asli yang dihilangkan pada Simulasi kedua Data Hasil Imputasi dengan Metode Regresi untuk Data Hilang 2% pada X 2 dan 5% pada X 3 Ulangan Data Hasil Imputasi dengan Metode PMM untuk Data Hilang 2% pada X 2 dan 5% pada X 3 Ulangan Hasil Pendugaan Nilai Tengah Peubah X 3 dari Simulasi Jumlah Data Hilang 2% pada X 2 dan 2% pada X Output Proc MI Output Proc Reg Output Proc MIAnalyze... 16
10 PENDAHULUAN Latar Belakang Sensus sebuah populasi adalah usaha yang dilakukan untuk mendapatkan informasi dari setiap unit dalam populasi tersebut, sedangkan survei hanya dilakukan hanya terhadap beberapa unit populasi (contoh). Perancangan survei yang baik akan memilih contoh dengan benar agar kesimpulan terhadap populasi yang menjadi perhatian bersifat terandal dan cukup untuk menyimpulkan keadaan populasi. Dalam sensus maupun survei, seringkali ditemukan unit-unit yang tidak merespon sejumlah pertanyaan yang diajukan (nonrespon). Kish (1965) mendefinisikan nonrespon sebagai kegagalan untuk mendapatkan nilai pengamatan dari beberapa unit yang menjadi contoh. Nonrespon, yang dalam beberapa literatur sering disebut dengan data hilang umumnya dibagi menjadi dua tipe, yaitu unit nonrespon dan item nonrespon. Unit nonrespon terjadi karena unit contoh tidak memberikan respon sama sekali dalam suatu survei. Sedangkan item nonrespon dapat terjadi karena beberapa item dalam kuesioner tidak direspon oleh responden. Secara umum, nonrespon dapat disebabkan karena responden tidak mau menjawab, tidak mampu menjawab atau tidak tahu jawabannya. Nonrespon dapat juga terjadi karena terdapat kesalahan dalam penulisan jawaban atau dalam proses input data (Longford, 2005). Adanya data hilang akibat nonrespon ini menimbulkan data hasil survei/sensus tidak lengkap. Data hilang tersebut tidak hanya menyebabkan pendugaan parameter menjadi tidak efisien karena ukuran data yang berkurang tetapi juga menyebabkan metode baku untuk data lengkap tidak dapat digunakan untuk menganalisis data. Pada praktiknya, metode analisis untuk data lengkap sering digunakan untuk data-data yang mempunyai data hilang dengan cara menghapus unit-unit pengamatan yang mempunyai data hilang. Terdapat beberapa alasan logis yang memperlihatkan kenyataan bahwa prosedur tersebut tidak baik. Pertama, penghapusan unit-unit pengamatan yang mempunyai data hilang akan mengurangi ukuran contoh yang sudah ditentukan dari awal penelitian. Hal ini otomatis akan mengurangi ketepatan pendugaan populasi. Kedua, jika unit-unit pengamatan yang dihilangkan dalam analisis sangat berbeda dengan unit-unit yang tersisa, maka hasil dugaan akan menjadi berbias (Levy and Lemeshow, 1999). Sehubungan dengan permasalahan yang ditimbulkan oleh data hilang dalam survei/sensus tersebut terdapat beberapa metode untuk mengatasinya. Dalam penelitian ini dilakukan pembandingan terhadap beberapa metode. Tujuan Tujuan penelitian ini adalah: 1. Memperkenalkan metode pendugaan data hilang karena adanya nonrespon pada data survei untuk kasus item nonrespon, yaitu metode imputasi 2. Mengkaji dan membandingkan beberapa metode imputasi ganda, yaitu metode regresi dan metode Predictive Mean Matching TINJAUAN PUSTAKA Metode Pendugaan Item Nonrespon Imputasi adalah metode yang digunakan untuk memprediksi data hilang pada kumpulan data survei karena tidak adanya respon terhadap beberapa pertanyaan. Kumpulan data dengan beberapa data hilang yang telah diprediksi akan lebih mudah untuk ditangani secara analitik (Little, 1987). Menurut Little & Su (1989), metode imputasi dapat diklasifikasikan berdasarkan kriterianya. Klasifikasinya adalah sebagai berikut: a. Imputasi Peubah Tunggal dan Peubah Ganda (Multivariate vs Univariate) Misalkan adalah satu gugus peubah Y obs, i teramati pada unit i dan Y adalah gugus mis, i peubah yang hilang pada unit yang sama. Ketika Y terdiri lebih dari satu peubah, mis, i maka imputasi peubah tunggal akan memprediksi setiap peubah Y secara mis, i terpisah. Sedangkan imputasi peubah ganda akan megimputasi peubah-peubah secara Y mis, i simultan, dengan memperhatikan hubungan antar peubah tersebut. Imputasi peubah tunggal terlihat lebih sederhana, akan tetapi metode ini mengabaikan hubungan antar peubah. b. Imputasi Bersyarat dan Tak Bersyarat (Conditional vs Marginal) Imputasi marjinal untuk unit i didasarkan pada sebaran marjinal dari Y, mis, i sedangkan imputasi bersyarat didasarkan pada sebaran bersyarat dengan nilai Y mis, i Y obs, i diketahui. Baik sebaran marjinal maupun sebaran bersyarat diduga dari data yang ada. 1
11 c. Imputasi Stokastik vs Rata-rata (Stochastic vs Mean) Imputasi rata-rata memprediksi Y mis, i dengan rata-rata nilai data yang teramati dalam peubah yang sama, sedangkan imputasi stokastik memprediksi Y dengan nilai dari mis, i sebaran bersyarat atau tak bersyarat dari Y. mis, i Imputasi rata-rata umumnya tidak cocok untuk peubah kategorik. Jika data-data kuantitatif dilengkapi dengan metode ini, dugaan terhadap rataan data yang dihasilkan cukup memuaskan, tetapi juga akan menghasilkan dugaan yang melenceng terhadap keragaman dalam sebaran. Contohnya, jika data hilang terjadi pada peubah pendapatan diprediksi dengan menggunakan metode rata-rata, maka pendugaan terhadap persentase kemiskinan akan menjadi bias. Imputasi Tunggal (Single Imputation) Strategi imputasi yang mengisi nilai data hilang dengan sebuah nilai ini sering digunakan untuk mengatasi adanya item nonrespon pada praktek survei (Little, 1987). Jadi, selanjutnya pada tahap analisis data, nilai imputan/prediksi yang diperoleh dari imputasi tunggal dianggap seakan-akan seperti data yang sebenarnya. Metode imputasi ini mempunyai kelemahan yaitu, satu nilai yang digunakan untuk menggantikan data hilang ini tidak mencerminkan keragaman penarikan contoh nilai-nilai sebenarnya saat satu model untuk nonrespon terbentuk. Kelemahan yang lain, tidak dapat mencerminkan ketidakpastian saat terdapat lebih dari satu model untuk nonrespon. Kelemahan tersebut dapat diperbaiki dengan metode imputasi ganda (Rubin, 1987). Imputasi Ganda (Multiple Imputation) Berbeda dengan imputasi tunggal, imputasi ini mengganti nilai data hilang dengan beberapa nilai (dua atau lebih) yang diterima sebagai representasi ketakpastian nilai-nilai data hilang (Rubin, 1987). Terdapat sejumlah m nilai untuk setiap data hilang dan akhirnya akan membentuk m buah gugus data yang telah terlengkapi. Dari masing-masing gugus data tersebut diterapkan metode analisis baku untuk data lengkap, kemudian hasil dari analisis itu dirata-ratakan. Pola Data Hilang Menurut Little (1987) terdapat dua pola data hilang, yaitu pola data hilang monoton dan pola data hilang nonmonoton. Sebuah set data dengan peubah Y 1, Y 2, dan Y 3 dikatakan mempunyai data hilang yang berpola monoton jika kejadian hilangnya sebuah peubah Y j untuk unit tertentu mengakibatkan semua subsequent peubah Y k, k > j hilang untuk individu unit tersebut. Jika peubah Y j teramati untuk sebuah unit maka semua peubah sebelumnya, Y k, k < j, juga teramati pada unit tersebut. Ilustrasi untuk pola ini dapat dilihat pada gambar 1. Group Y 1 Y 2 Y 3 1 X X X 2 X X. 3 X.. Gambar 1. Ilustrasi pola data hilang monoton. Sedangkan pada pola nonmonoton tidak ada keteraturan letak data hilang. Ilustrasinya dapat dilihat pada gambar 2. Group Y 1 Y 2 Y 3 1 X X X 2 X. X 3. X. 4.. X Gambar 2. Ilustrasi pola data hilang nonmonoton. Pola data hilang sangat penting diperhatikan dalam penggunaan metode imputasi peubah ganda. Karena hal ini berkaitan dengan proses imputasi yang dilakukan. Imputasi akan dimulai untuk peubah dengan data hilang paling sedikit, dilanjutkan untuk peubah dengan data hilang tersedikit kedua, demikian seterusnya. Mekanisme Data Hilang Pengetahuan tentang mekanisme yang menyebabkan data hilang adalah kunci dasar dalam pemilihan analisis yang sesuai dan bagaimana menginterpretasikan hasilnya (Little, 1987). Beberapa tipe mekanisme data hilang adalah sebagai berikut: a. MCAR (Missing Completely at Random) Keterisian data dari peubah tertentu tidak tergantung dari besarnya nilai peubah itu maupun peubah lainnya. Contohnya, misalkan Y 1 peubah pendapatan dan Y2 peubah umur. Jika peluang teramatinya peubah pendapatan sama untuk setiap unit, tidak tergantung pada nilai pendapatan itu sendiri dan pada peubah umur maka mekanisme hilangnya data pada peubah pendapatan bertipe MCAR. b. MAR (Missing at Random) Keterisian data dari peubah tertentu hanya tergantung pada nilai peubah itu dan tidak 2
12 tergantung pada peubah lain. Dengan mengambil contoh seperti sebelumnya, maka mekanisme hilangnya data pada peubah pendapatan bertipe MAR jika nilai pendapatan tergantung pada peubah umur. tetapi tidak tergantung pada nilai pendapatan c. Nonignorable Keterisian data pada peubah tertentu tergantung pada nilai peubah itu dan peubah lain, sedangkan dua poin di atas, (a) dan (b) termasuk mekanisme data hilang ignorable. Prosedur Imputasi Ganda Terdapat beberapa metode imputasi ganda untuk menangani kasus data hilang. Beberapa metode ini, dalam penggunaannya perlu memperhatikan beberapa hal, yaitu pola data hilang (monoton atau nonmonoton), mekanisme data hilang (Missing at Random, Missing Completely at Random, dll), jenis peubah (kategorik atau numerik) dan sebaran data (kenormalan). Prosedur imputasi ganda dalam SAS 9.1 mengasumsikan mekanisme data hilang Missing at Random. Untuk sebaran data, metode regresi, Predictive Mean Matching dan MCMC mengasumsikan sebaran normal ganda. Jenis-jenis metode imputasi ganda dapat dilihat pada tabel 1. Sintaks untuk prosedur imputasi ganda di SAS 9.1 adalah sebagai berikut: PROC MI <pilihan-pilihan>; MONOTONE<metode <(<peubahterimputasi< =peubah penjelas > > < /detail > ) > >; VAR <peubah-peubah>; Tabel 1. Metode Imputasi dalam Proc MI Pola Data Hilang Jenis Data Metode Monoton Kontinu 1. Regresi 2. Predictive Mean Matching 3. Propensity Score Monoton Kategorik (Ordinal) Regresi Logistik Monoton Kategorik (Nominal) Fungsi Diskriminan Arbitrary Kontinu Markov Chain Monte Carlo (MCMC) Pada Proc MI juga terdapat statement untuk mengatasi pola data hilang yang tidak monoton dengan mengubah pola data hilang tersebut menjadi monoton. Statement yang digunakan adalah MCMC. Metode MCMC selain digunakan untuk memprediksi data dengan pola data hilang yang tidak monoton juga dapat mengubah pola data hilang yang tidak monoton menjadi monoton. Konsep cara kerjanya adalah dengan cara memprediksi beberapa data (bukan semua data hilang) sehingga pola datanya menjadi monoton (SAS 9.1 Help & Documentation). PROC MI <pilihan-pilihan>; MCMC impute=monotone; VAR <peubah-peubah>; Teori Pembuatan Nilai Imputan Ganda dengan Model Eksplisit Terdapat tiga tahapan (task) yang diperlukan untuk membuat nilai-nilai imputan yang mensimulasi sebaran posterior Y mis, i dengan model eksplisit Bayesian. Tiga tahapan tersebut adalah tahap pemodelan (Modelling Task), tahap pendugaan (Estimation Task), dan tahap imputasi (Imputation Task). Tahap pertama memilih model yang khusus untuk data. Tahap kedua membuat formula untuk sebaran posterior parameter dari model yang terpilih, dan tahap ketiga mengambil secara acak satu nilai parameter dari sebaran posterior yang didapatkan dari tahap kedua lalu mengambil secara acak nilai Y mis,i dari sebaran posterior bersyarat. Tahap yang ketiga jika diulang sebanyak m kali maka akan didapatkan m imputasi untuk setiap data hilang (Rubin, 1987). Imputasi Ganda dengan Metode Regresi Dari teori tentang pembuatan nilai-nilai imputan dengan model eksplisit Bayesian, jika diterapkan pada metode regresi maka tahapannya adalah sebagai berikut: 1. Tahap Pemodelan Tahap ini terletak pada pembentukan model, dalam hal ini model yang digunakan adalah model regresi linear normal, dengan Y i ~ N(X i β, σ 2 ). 2. Tahap Pendugaan Pada tahap ini didapatkan nilai-nilai dugaan parameter dari model. 2 2 σ = Y X ˆ /( n q) ( ) ˆ1 i i β1 1 obs = X t 1 ˆβ V iyi obs dimana 1 t V = X i X i obs 3. Tahap Imputasi Dari nilai-nilai dugaan parameter yang diperoleh dari tahap kedua lalu dilanjutkan ke langkah-langkah berikut: 3
13 a. Ambil satu nilai dari peubah acak 2 yang menyebar χ n 1 q, misalkan g dan hitung 2 σ ˆ 2 * = σ 1( n 1 q) / g. b. Ambil q buah peubah acak yang menyebar N(0, 1) untuk membuat q- komponen vektor Z dan hitung. ˆ 1/ 2 β * = β1 + σ *[ V ] Z, 1/ 2 dimana [ V ] merupakan matriks segitiga atas pada dekomposisi Cholesky. c. Kemudian Ymis akan didapat dengan menghitung Y, i* = X iβ* + ziσ * dimana normal deviasi z i diambil secara bebas dari N(0, 1). Sebuah nilai imputan yang baru untuk Ymis didapatkan dengan dimulai mengambil 2 sebuah nilai baru dari parameter σ *. Dengan demikian, jika imputasi diulang sebanyak m kali maka ketiga langkah di atas juga diulang m kali. Untuk kasus peubah ganda, misal data hilang Y i = (Y i1, Y i2 ) dengan Y i1 mempunyai n 1 data teramati dan Y i2 mempunyai n 2 data teramati dan n 2 n 1. Maka peubah yang akan diimputasi terlebih dahulu adalah data hilang pada peubah Y i1 (abaikan Y i2 ) dengan menggunakan X (peubah dengan data lengkap) sebagai peubah penjelasnya. Kemudian untuk mengimputasi data hilang pada Y i2, model regresi diperoleh dari unit-unit yang teramati pada peubah X, Y i1, dan Y i2. Nilai dugaan untuk data hilang pada peubah Y i2 diperoleh dari nilai-nilai yang sudah ada dan nilai hasil imputan pada peubah Y i1. Demikian seterusnya untuk jumlah Y i yang lebih banyak (Rubin, 1987). Imputasi Ganda dengan Metode Predictive Mean Matching (PMM) Imputasi ini konsep dasarnya seperti metode regresi. Serupa dengan langkahlangkah pada model regresi linear normal, hanya saja langkah (c) pada tahap imputasi digantikan dengan langkah-langkah sebagai berikut: 1. Hitung nilai Ymis dengan Yi* = X i β * i mis. 2. Untuk setiap Y i * i mis, cari responden Yi yang nilainya paling dekat dengan Y i*, dan imput nilai tersebut untuk Ymis. Metode ini adalah gabungan antara metode regresi dan Hot-Deck (Rubin, 1987). Pada proc MI, untuk setiap Y i* akan dibentuk satu set unit (sebanyak k unit) yang mempunyai nilai Y obs terdekat dengan Y i*. Default yang digunakan dalam prosedur tersebut adalah k=5, pada option. Kemudian dari k buah nilai akan diambil secara acak satu nilai untuk memprediksi data hilang. BAHAN DAN METODE Bahan Penelitian ini menggunakan data hasil simulasi. Data yang dibangkitkan dibuat sedemikian rupa seperti data survei. Skenario yang digunakan adalah survei ini dilakukan untuk menduga nilai tengah lingkar pinggang pada suatu populasi perempuan di suatu kota. Diasumsikan peubah ini adalah peubah yang berpeluang besar terjadi nonrespon karena beberapa sebab dalam survei ini. Adapun peubah-peubah yang dianggap mempengaruhi lingkar pinggang tersebut adalah berat badan dan tinggi badan. Jadi dalam pembangkitan data, ketiga peubah, berat badan (X 1 ), tinggi badan (X 2 ), dan lingkar pinggang (X 3 ), tersebut dibuat agar mempunyai korelasi yang cukup tinggi. Masing-masing peubah dibangkitkan dari sebaran normal. Adapun data riil yang akan digunakan sebagai contoh kasus penggunaan metode imputasi ganda adalah data sekunder hasil survei yang dilakukan oleh Yayah Karliah Husaini (Musa, 2007). Metode 1. Data populasi sebesar 1000 unit dibangkitkan. Hitung nilai tengah peubah X Dari data populasi diambil contoh berukuran 100 (lampiran 1), kemudian terhadap data ini dilakukan penghilangan data dengan jumlah data yang berbedabeda. 3. Perlakuan penghilangan data hanya diberikan kepada peubah X 2 dan X 3, sedangkan peubah X 1 dibiarkan lengkap. Penghilangan data dilakukan sedemikian rupa sehingga pola data hilang yang terbentuk adalah monoton. 4. Jumlah data yang dihilangkan pada peubah X 2 adalah sebanyak 2%, 5%, 10%, dan 15%. Adapun jumlah data pada peubah X 3 disesuaikan dengan jumlah data hilang pada peubah X 2 berdasarkan beda jumlah data hilang yang telah ditetapkan yaitu 0, 3, 5, 10, 15, dan 20. Untuk lebih jelasnya dapat dilihat pada lampiran 2. 4
14 5. Proses penghilangan data dilakukan secara acak untuk memenuhi asumsi mekanisme kehilangan data yang acak (MAR). 6. Ulangan yang digunakan sebanyak 10 kali pada setiap simulasi untuk memberikan peluang hilang yang sama kepada setiap data. 7. Setiap gugus data diimputasi ganda dengan m=5 (pada proc MI nimpute=5). 8. Setelah didapatkan nilai dugaan semua data hilang, dihitung selisih antara nilai dugaan dengan nilai aslinya. Dari selisih tersebut kemudian dihitung rata-rata dan ragam dari rata-rata tersebut. 9. Dari gugus data yang telah terlengkapi dengan nilai dugaan data hilang kemudian dihitung dugaan nilai tengah peubah X 3. Karena dilakukan ulangan 10 kali maka akan didapatkan 10 gugus data contoh yang kemudian akan didapatkan pendekatan bagi nilai KTS, dengan rumus: KTS ( x) = Ragam( x) + Bias 2 ( x) dimana Ragam n ( x) = [ xi E( x) ] i= 1 dan Bias ( x) = E( x) μ 2 1. n 10. Metode imputasi yang baik akan menghasilkan selisih antara nilai dugaan data hilang dengan nilai aslinya yang lebih kecil dan ragam dari rata-rata yang kecil pula. Gugus data contoh yang dibentuk dari metode imputasi tersebut juga mempunyai nilai KTS yang lebih kecil dalam pendugaan parameter populasi. 11. Menerapkan metode imputasi ganda ke dalam contoh kasus. HASIL DAN PEMBAHASAN Suatu penduga nilai akan dikatakan lebih baik dari penduga lainnya jika nilainya lebih mendekati nilai yang diduga. Pembandingan kedua metode imputasi ganda yang dilakukan adalah dengan membandingkan nilai penduga, dalam hal ini selisih nilai imputan dengan nilai sebenarnya. Proses Imputasi pada Proc MI Dengan mempertahankan urutan letak peubah X 1, X 2, dan X 3, maka cara kerja proc MI pada SAS 9.1 konsep proses imputasinya adalah dengan terlebih dahulu memprediksi data hilang pada peubah X 2. Caranya adalah dengan membentuk model regresi dari unitunit dengan data teramati pada peubah X 1 dan X 2, dengan X 2 sebagai peubah respon sedangkan X 1 sebagai peubah penjelas. Dari model regresi yang terbentuk maka akan terdapat parameter regresi dan kuadrat tengah galat (σ 2 ) yang kemudian akan disimulasikan sehingga terbentuk model regresi baru yang berbeda dengan model regresi awal. Pada model regresi baru terdapat tambahan unsur yang dapat dianggap sebagai galat. Data hilang pada peubah X 2 pada unit ke-i akan diprediksi melalui model regresi baru dengan memasukkan nilai peubah X 1 pada unit yang sama. Karena banyaknya imputasi yang digunakan adalah 5 (m = 5) maka proses tersebut diulang sebanyak 5 kali. Perbedaan nilai hasil imputasi berasal dari pengambilan bilangan acak dari sebaran tertentu yang berbeda-beda dalam simulasi terhadap parameter regresi dan kuadrat tengah galat. Setelah data hilang pada peubah X 2 diduga, proses imputasi dilanjutkan ke data hilang pada peubah X 3. Pada proses ini model regresi awal dibentuk dari unit-unit dengan data teramati untuk peubah X 1, X 2, dan X 3, dengan peubah X 3 sebagai peubah respon. Selanjutnya serupa dengan proses imputasi pada peubah X 2, pada akhirnya akan diperoleh model regresi baru setelah melalui simulasi terhadap parameterparameter regresi dan kuadrat tengah galat regresi. Data hilang pada peubah X 3 pada unit ke-i akan diprediksi melalui model regresi baru dengan memasukkan nilai peubah X 1 dan X 2 pada unit yang sama. Nilai hasil imputasi pada peubah X 2 juga digunakan untuk menduga data hilang pada peubah X 3. Hampir sama dengan metode regresi, metode PMM melakukan proses imputasi dimana model regresi awal yang terbentuk dari unit-unit dengan data teramati pada peubah X 1 dan X 2 untuk imputasi data hilang pada peubah X 2 dan unit-unit dengan data teramati pada peubah X 1, X 2, dan X 3 untuk imputasi data hilang pada peubah X 3. Dari model regresi awal, parameter-parameter regresi dan ragam dari galat disimulasikan. Selanjutnya diperoleh model regresi baru, hanya saja tidak ada penambahan unsur seperti model regresi baru pada metode regresi. Data hilang pada peubah dan unit tertentu akan diprediksi dengan nilai pada unit lain dari peubah yang sama dimana nilainya paling dekat dengan nilai respon yang dihasilkan dari model regresi baru. Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 2% pada Peubah X 3 Dari contoh berukuran 100 unit, simulasi yang pertama dilakukan adalah dengan menghilangkan data sebanyak 2% pada peubah 5
15 X 2 dan 2% pada peubah X 3 (selisih 0%). Simulasi ini dilakukan dengan ulangan 10 kali, sehingga terdapat 10 posisi kehilangan data yang berbeda. Adapun data yang dihilangkan pada simulasi ini dapat dilihat di tabel 2. Tabel 2. Data Asli yang Dihilangkan Data Asli Unit X2 X Hasil pendugaan data hilang dengan menggunakan metode regresi dan PMM dapat dilihat pada tabel 3 dan 4. Tabel 3. Data Hasil Imputasi dengan Metode Regresi pada Ulangan 1 Unit Imputasi Data Dugaan Regresi X2 X Tabel 4. Data Hasil Imputasi dengan Metode PMM pada Ulangan 1 Unit Imputasi Data Dugaan PMM X2 X Dari hasil yang diperoleh menunjukkan bahwa metode imputasi ganda regresi lebih baik dari metode PMM. Hal ini dapat ditunjukkan oleh nilai rata-rata beda antara nilai imputan dan nilai sebenarnya, untuk metode regresi dan untuk metode PMM. Dan dari rata-rata ragam selisih pun metode regresi lebih kecil dari metode PMM (Tabel 5). Tabel 5. Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X 3 Rata-rata Selisih Ragam Selisih Ulangan REG PMM REG PMM Rata-rata Hasil Pendugaan untuk Data Hilang 2% pada Peubah X 2 dan 5% pada Peubah X 3 Simulasi yang dilakukan berikutnya adalah dengan menghilangkan data 2% pada peubah X 2 dan 5% pada peubah X 3 (selisih 3%). Hasil dari simulasi ini menunjukkan bahwa metode regresi lebih baik daripada metode PMM, ditinjau dari nilai rata-rata selisih antara data asli dan data dugaannya juga dari nilai rata-rata ragam selisihnya. Nilai rata-rata selisih metode regresi lebih kecil daripada metode PMM, demikian juga nilai ragam selisihnya. Hasil tersebut dapat dilihat pada tabel 6. Tabel 6. Nilai Rata-rata Selisih dan Ragam Selisih Antara Data Asli dan Data Dugaan untuk Peubah X 3 Rata-rata Selisih Ragam Selisih Ulangan REG PMM REG PMM rata-rata Ringkasan Hasil Seluruh Simulasi Dari semua simulasi yang dilakukan, jumlah data hilang 2%, 5%, 10%, dan 15% serta selisih jumlah data hilang 0, 3, 5, 10, 15, dan 20 didapatkan hasil bahwa metode regresi selalu lebih baik daripada metode PMM ditinjau dari nilai rata-rata selisih antara data 6
16 asli dengan data dugaan dan ragam selisih antara data asli dengan data dugaan. Dari gambar 3 tampak bahwa nilai ratarata selisih antara data asli dengan data dugaan dari metode regresi cenderung lebih kecil dan lebih stabil dari kondisi jumlah data hilang satu ke kondisi lainnya jika dibandingkan dengan nilai rata-rata selisih dari metode PMM. Rata-rata Selisih Data Asli vs Data Dugaan Kelas Jumlah Data Hilang reg pmm Gambar 3. Rata-rata Selisih antara Data Asli dengan Data Dugaan Peubah X 3 untuk Seluruh Kelompok Beda Jumlah Data Hilang Nilai rata-rata selisih antara data asli dengan data dugaan metode PMM dari kondisi jumlah data hilang terkecil sampai terbesar cenderung mengalami kenaikan. Hal ini dapat disebabkan oleh data bangkitan yang nilainya berbeda untuk setiap unit. Sehingga semakin banyak jumlah data hilang akan membuat selisih dugaan dengan data asli semakin besar. Penjelasannya adalah berdasarkan teori imputasi ganda metode PMM, nilai imputan unit tertentu didapat dari nilai unit lain yang jaraknya paling dekat dengan nilai hasil regresi antara peubah respon dengan penjelas yang ditunjuk. Kandidat donor atau unit yang nilainya akan dipakai sebagai dugaan bagi data hilang semakin berkurang jumlahnya jika jumlah data hilang semakin banyak. Sedangkan nilai rata-rata selisih antara data asli dengan data dugaan pada metode regresi, seiring dengan peningkatan jumlah kehilangan data, relatif stabil. Berbeda dengan metode PMM, metode regresi mendapatkan nilai dugaan untuk data hilang langsung dari model regresi baru yang terbentuk melalui simulasi koefisien regresi awal. Nilai dugaan data hilangnya bukan diambil dari unit lain (donor). Analisis Data untuk Data yang Telah Dilengkapi Data Dugaan Suatu gugus data yang sebelumnya mempunyai beberapa data hilang tentunya akan dianalisis lebih lanjut. Dalam pendugaan parameter, hasil analisis berdasarkan metode imputasi ganda merupakan kombinasi dari hasil analisis setiap gugus data terlengkapi. Salah satu contoh penggunaan hasil nilai dugaan dari imputasi ganda yang dilakukan dalam penelitian ini adalah pendugaan nilai tengah populasi, dalam hal ini nilai tengah peubah lingkar pinggang X 3. Pembandingan kedua metode imputasi selanjutnya adalah dengan cara melihat nilai KTS pada saat melakukan pendugaan nilai tengah ukuran lingkar pinggang (X 3 ) dari sebuah populasi. Simulasi yang dilakukan adalah dengan cara menghitung rata-rata peubah lingkar pinggang dari semua gugus data contoh hasil imputasi. Terdapat 24 gugus data dengan karakteristik yang berbeda-beda sesuai dengan jumlah data hilang pada peubah X 3 dan jumlah data hilang pada peubah X 2. Gugus- gugus data yang telah diberi perlakuan penghilangan data kemudian dilengkapi kembali nilai-nilainya yang hilang dengan kedua metode imputasi ganda. Dari satu gugus data tak lengkap yang telah diimputasi ganda akan didapatkan 5 gugus data terlengkapi (m=5), sehingga terdapat 5 nilai statistik peubah X 2. Dari SAS (dengan Proc MI) akan secara otomatis dihasilkan satu nilai rata-rata dari kelima nilai statistik tersebut. KTS (xbar) Kelas Jumlah Data Hilang pmm reg Gambar 4. Nilai KTS untuk Pendugaan Nilai Tengah Peubah X 3 Bias (xbar) Kelas Jumlah Data Hilang pmm reg Gambar 5. Nilai Bias (xbar) untuk Pendugaan Nilai Tengah Peubah X 3 Karena simulasi yang dilakukan dengan ulangan 10 kali maka akan didapatkan 10 nilai rata-rata untuk menduga nilai tengah X 2. Dari nilai-nilai itulah nilai KTS dihitung (nilai tengah peubah lingkar pinggang yang sebenarnya adalah ). 7
17 Hasil dari simulasi dapat dilihat pada gambar 4. tidak terdapat perbedaan yang berarti antara nilai KTS yang dihasilkan dari metode imputasi regresi dan PMM. Dilihat dari nilai biasnya juga tidak terdapat perbedaan yang berarti di antara kedua metode tersebut (gambar 5). Kedua metode menghasilkan penduga yang nilainya lebih besar dari nilai parameter yang sebenarnya (overestimate). Pembandingan Metode Imputasi Ganda dengan Metode Baku untuk Data Lengkap Pada praktiknya, metode baku untuk data lengkap sering digunakan dalam menganalisis data yang mengandung data hilang. Metode tersebut dilakukan dengan cara menghapus unit-unit yang mempunyai data hilang. Untuk melihat akibat dari penggunaan metode penghapusan unit pada data yang mengandung data hilang dilakukan pendugaan parameter populasi dengan jumlah kehilangan data yang berbeda. Kemudian hasilnya dibandingkan dengan pendugaan parameter melalui metode imputasi ganda, baik PM maupun regresi. bias (xbar) % 5% 10% 15% 20% 25% jumlah data hilang hapus unit PMM reg Gambar 6. Pembandingan Nilai Bias Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X 3. KTS (xbar) % 5% 10% 15% 20% 25% junmlah data hilang hapus unit PMM reg Gambar 7. Pembandingan Nilai KTS Metode Penghapusan Unit dengan Metode Imputasi Ganda pada Pendugaan Parameter X 3. Pembandingan masih dilihat dari nilai bias dan nilai KTS, dengan jumlah data hilang yang dicobakan adalah 2%, 5%, 10%, 15%, 20% dan 25% baik pada peubah X 2 maupun X 3. Gambar 6 dan 7 menunjukkan bahwa metode penghapusan menghasilkan nilai bias dan KTS yang jauh lebih tinggi daripada kedua metode imputasi ganda pada jumlah kehilangan data lebih besar dan sama dengan 5%. Pada jumlah kehilangan data 2% ketiga metode tersebut memberikan nilai bias yang tidak jauh berbeda. Terlebih dengan meningkatnya jumlah data hilang, semakin banyak data hilang pada data maka nilai dugaan terhadap parameter populasi akan semakin buruk jika metode penghapusan unit dengan data hilang digunakan. Dari contoh pembandingan tersebut maka dapat ditunjukkan bahwa penggunaan metode baku untuk data lengkap kurang tepat dalam proses analisis data yang mengandung data hilang. Contoh Kasus untuk Penerapan Imputasi Ganda Dari data sekunder yang didapatkan peneliti hanya mengambil beberapa peubah untuk digunakan sebagai contoh penerapan metode imputasi ganda. Peubah-peubah yang digunakan adalah Sistem Kekerabatan (X 1 ), Jenis Kelamin Bayi (X 2 ), Umur Bayi (X 3 ), Bobot Ibu (X 4 ), dan Bobot Bayi (X 5 ), sedangkan peubah yang mempunyai data hilang adalah X 4 dan X 5 dengan total jumlah kehilangan data sebesar 9.73% dan pola kehilangan data yang terbentuk adalah pola data hilang monoton. Keterangan tersebut dapat dilihat di lampiran 6. Untuk menduga nilai data hilang yang ada pada peubah-peubah tersebut digunakan proc MI dengan menggunakan metode PMM. Adapun analisis lanjut yang digunakan setelah menduga data hilang adalah analsis regresi untuk menduga hubungan antara peubah respon X 5 dengan peubah penjelas X 1, X 2, X 3, dan X 4. Oleh karena itu, setelah dilakukan pendugaan data hilang dengan metode imputasi ganda dilakukan analisis regresi dengan menggunakan proc reg terhadap tiap gugus data yang telah dilengkapi datanya. Hasil analisis masing-masing gugus data yang telah dilengkapi dapat dilihat pada lampiran 7. Tabel 7. Penduga-penduga Koefisien Regresi Gugus b 0 b 1 BB2 b 3 b Mean Var Pada tabel 7 dapat dilihat hasil akhir pendugaan koefisien regresi yang merupakan kombinasi tiap pendugaan dari gugus data yang telah dilengkapi (rata-rata penduga koefisien 8
18 regresi dari tiap gugus data). Sedangkan ragam dari tiap penduga koefisien menduga keragaman nilai penduga koefisien karena dilakukan imputasi sebanyak 5 kali. Sedangkan dari tabel 8 dapat diperoleh informasi bahwa rata-rata dari nilai S 2 b 0 sebesar 0.658, nilai ini menduga keragaman dalam b 0 karena penarikan contoh (sampling). Dari analisis regresi yang dihasilkan dari proc MIAnalyze dapat disimpulkan bahwa peubah Sistem Kekerabatan dan Jenis Kelamin Bayi tidak berpengaruh nyata terhadap peubah Bobot Bayi. Hasil tersebut dapat dilihat pada pengujian parsial terhadap tiap penduga koefisien regresi dalam output proc MIAnalyze (lampiran 8). Tabel 8. Statistik untuk b 0 Gugus b 0 SEb 0 S 2 b Mean Var hilang tidak memberikan pengaruh yang besar terhadap perubahan nilai KTS. Pada simulasi sederhana yang dilakukan dalam penelitian ini, telah ditunjukkan bahwa metode penghapusan unit yang mengandung data hilang memberikan hasil yang kurang baik, terlebih dengan jumlah kehilangan data yang cenderung besar. Saran Maka para analis data hendaknya lebih berhati-hati dalam penanganan data yang mengandung data hilang, sehubungan dengan metode analisis baku untuk data lengkap atau metode penghapusan unit yang sering diterapkan pada kasus dengan data hilang. Sebagai saran untuk penelitian selanjutnya yaitu perlu dilakukan simulasi serupa tapi dengan data yang tidak semua unitnya mempunyai nilai yang berbeda (terdapat beberapa unit yang mempunyai nilai sama). Hal ini dimungkinkan akan memberikan hasil yang berbeda khususnya untuk metode PMM. Masih terdapat faktor-faktor yang dapat dan perlu dilihat untuk membandingkan metode imputasi ganda regresi dan PMM selain dari yang sudah diteliti dalam penelitian ini. KESIMPULAN & SARAN Kesimpulan Dalam hal pendugaan terhadap data hilang dalam data contoh metode imputasi ganda regresi lebih baik daripada metode PMM, karena nilai dugaan yang dihasilkan lebih dekat dengan nilai sebenarnya. Dengan jumlah kehilangan data yang semakin meningkat, selisih nilai dugaan dengan nilai aslinya juga akan meningkat pada metode PMM. Sedangkan pada metode regresi, peningkatan jumlah kehilangan data tersebut tidak mempengaruhi selisih nilai dugaan dengan nilai aslinya (cenderung stabil). Dengan kata lain, keragaman selisih nilai dugaan dengan nilai asli pada metode regresi lebih kecil daripada keragaman yang diperoleh pada metode PMM. Sedangkan dari segi pendugaan parameter populasi melalui data contoh yang telah dilengkapi dengan data imputan, kedua metode imputasi ganda tersebut tidak memiliki perbedaan yang nyata. Hal ini bisa dilihat dari nilai KTS untuk pendugaan parameter populasi yang dihasilkan. Meningkatnya jumlah data DAFTAR PUSTAKA Cochran, W. G Sampling Technique. New York: Wiley. Kish, Leslie Survey Sampling. New York: Wiley. Levy, P. S. and Lemeshow, S Sampling of Populations: Methods & Applications 3 rd ed. New York: Willey. Little, R. J. A. and Rubin, D. B Statistical Analysis with Missing Data. New York: Wiley. Longford, N. T Missing Data and Small- Area Estimation. New York: Springer. Rubin, D. B Multiple Imputation for Nonresponse in Sample Surveys. New York: Willey Lepkowski, J. M Treatment of Wave Nonresponse in Panel Surveys dalam Panel Surveys. New York: John Willey & Sons. Little, R. J. A. & Su, Hong Lin Item Nonresponse in Panel Surveys dalam Panel Surveys. New York: John Willey & Sons. Musa, Sjarkani Metodologi Penelitian dengan Statistika. Departemen Statistika IPB. Bogor: inpress. 9
19 Lampiran 1. Tabel Data Contoh Unit BB TB LP Unit BB TB LP
20 Lampiran 2. Kombinasi (kelas) Jumlah (%) Data Hilang pada Peubah X 2 dan X 3 Kelas X 2 X Lampiran 3. Data Asli yang Dihilangkan pada Simulasi kedua Unit Data Asli X 2 X
21 Lampiran 4. Data Hasil Imputasi dengan Metode Regresi untuk Data Hilang 2% pada X 2 dan 5% pada X 3 Ulangan 1 Unit Imputasi Data Dugaan Regresi X 2 X
22 Lampiran 5. Data Hasil Imputasi dengan Metode PMM untuk Data Hilang 2% pada X 2 dan 5% pada X 3 Ulangan 1 Unit Imputasi Data Dugaan PMM X 2 X Lampiran 6. Hasil Pendugaan Nilai Tengah Peubah X 3 dari Simulasi Jumlah Data Hilang 2% pada X 2 dan 2% pada X 3 Ulangan Nilai Rata-rata X 3 PMM REG Var(xbar) B (xbar) MSE(xbar)
23 Lampiran 7. Output Proc MI The MI Procedure Model Information Data Set WORK.SURVEI2 Method Monotone Number of Imputations 5 Seed for random number generator Monotone Model Specification Method Regression-PMM( K= 5) Imputed Variables JkBy UmBy Bibu BBy Missing Data Patterns Jk Um Group Ker By By Bibu BBy Freq Percent 1 X X X X X X X X X X X X Missing Data Patterns Group Means Group Ker JkBy UmBy Bibu BBy Multiple Imputation Variance Information Variance Variable Between Within Total DF Bibu BBy Multiple Imputation Variance Information Relative Fraction Increase Missing Relative Variable in Variance Information Efficiency Bibu BBy Multiple Imputation Parameter Estimates Variable Mean Std Error 95% Confidence Limits DF Bibu BBy
24 Lampiran 8. Output Proc Reg REG Model Coefficients and Covariance matrices Obs _Imput TYPE NAME_ Intercept Ker JkBy UmBy Bibu 1 1 PARMS COV Intrcept COV Ker COV JkBy COV UmBy COV Bibu PARMS COV Intercept COV Ker COV JkBy E COV UmBy COV Bibu PARMS COV Intercept COV Ker COV JkBy COV UmBy COV Bibu PARMS COV Intercept COV Ker COV JkBy COV UmBy COV Bibu PARMS COV Intercept COV Ker COV JkBy COV UmBy COV Bibu
25 Lampiran 9. Output Proc MIAnalyze The MIANALYZE Procedure Model Information Data Set WORK.OUTREG Number of Imputations 5 Multiple Imputation Variance Information Variance Parameter Between Within Total DF Intercept Ker JkBy UmBy Bibu Multiple Imputation Variance Information Relative Fraction Increase Missing Relative Parameter in Variance Information Efficiency Intercept Ker JkBy UmBy Bibu Multiple Imputation Parameter Estimates Parameter Estimate Std Error 95% Confidence Limits DF Intercept Ker JkBy UmBy Bibu Multiple Imputation Parameter Estimates 16
dimana n HASIL DAN PEMBAHASAN
5. Proses penghilangan data dilakukan secara acak untuk memenuhi asumsi mekanisme kehilangan data yang acak (MAR). 6. Ulangan yang digunakan sebanyak 1 kali pada setiap simulasi untuk memberikan peluang
Lebih terperinciKAJIAN METODE IMPUTASI DALAM MENANGANI MISSING DATA. Triyani Hendrawati Staf Pengajar Statistika Universitas Padjadjaran
KAJIAN METODE IMPUTASI DALAM MENANGANI MISSING DATA Triyani Hendrawati Staf Pengajar Statistika Universitas Padjadjaran triyani.hendrawati@gmail.com ABSTRAK. Pada sebuah survey, adakalanya tidak semua
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang dan Permasalahan
BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Cabang ilmu statistika dewasa ini semakin mengalami perkembangan yang pesat diikuti dengan arus berbagai permasalahan dunia yang kompleks bermunculan.
Lebih terperinciMETODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE
METODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2010 RINGKASAN
Lebih terperinciPENDUGAAN DATA HILANG DENGAN MENGGUNAKAN DATA AUGMENTATION. Abstract
Pendugaan Data Hilang Mesra Nova) PENDUGAAN DATA HILANG DENGAN MENGGUNAKAN DATA AUGMENTATION Mesra Nova 1, Moch. Abdul Mukid 2 1 Alumni Program Studi Statistika UNDIP 2 Staf Pengajar Program Studi Statistika
Lebih terperinciSAMPLING METHODS Metode Penarikan Contoh STK221 3(2-2)
SAMPLING METHODS Metode Penarikan Contoh STK221 3(2-2) Pustaka Scheaffer RL, Mendenhall W, Ott RL. 2006. Elementary Survey Sampling, 6th ed. Belmont: Duxbury Press. Levy PS, Lemeshow S. 1999. Sampling
Lebih terperinciMetode Statistika Pertemuan XII. Analisis Korelasi dan Regresi
Metode Statistika Pertemuan XII Analisis Korelasi dan Regresi Analisis Hubungan Jenis/tipe hubungan Ukuran Keterkaitan Skala pengukuran variabel Pemodelan Keterkaitan Relationship vs Causal Relationship
Lebih terperinciPENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA
PENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciPENDUGAAN ANGKA PUTUS SEKOLAH DI KABUPATEN SEMARANG DENGAN METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK PADA MODEL PENDUGAAN AREA KECIL SKRIPSI
PENDUGAAN ANGKA PUTUS SEKOLAH DI KABUPATEN SEMARANG DENGAN METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK PADA MODEL PENDUGAAN AREA KECIL SKRIPSI Disusun Oleh: NANDANG FAHMI JALALUDIN MALIK NIM. J2E 009
Lebih terperinciPENERAPAN METODE PENDUGAAN AREA KECIL (SMALL AREA ESTIMATION) PADA PENENTUAN PROPORSI RUMAH TANGGA MISKIN DI KABUPATEN KLUNGKUNG
E-Jurnal Matematika Vol. 2, No.3, Agustus 2013, 35-39 ISSN: 2303-1751 PENERAPAN METODE PENDUGAAN AREA KECIL (SMALL AREA ESTIMATION) PADA PENENTUAN PROPORSI RUMAH TANGGA MISKIN DI KABUPATEN KLUNGKUNG PUTU
Lebih terperinciAnalisis Korelasi & Regresi
Analisis Korelasi & Regresi Oleh: Ki Hariyadi,, S.Si., M.PH Nuryadi, S.Pd.Si UIN JOGJAKARTA 1 Pokok Bahasan Analisis Korelasi Uji Kemaknaan terhadap ρ (rho) Analisis Regresi Linier Analisis Kemaknaan terhadap
Lebih terperinciSTK 511 Analisis statistika. Materi 7 Analisis Korelasi dan Regresi
STK 511 Analisis statistika Materi 7 Analisis Korelasi dan Regresi 1 Pendahuluan Kita umumnya ingin mengetahui hubungan antar peubah Analisis Korelasi digunakan untuk melihat keeratan hubungan linier antar
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan
BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan Pengambilan sampel dari suatu populasi melalui metode survei sampel memberikan manfaat yang cukup besar dalam suatu penelitian. Survei sampel dilakukan
Lebih terperinciPENGARUH MIXED DISTRIBUTION PADA PENDEKATAN QUASI-LIKELIHOOD DALAM MODEL LINEAR 1)
PENGARUH MIXED DISTRIBUTION PADA PENDEKATAN QUASI-LIKELIHOOD DALAM MODEL LINEAR 1) Anang Kurnia Departemen Statistika FMIPA IPB Jl. Meranti, Wing 22 Level 4 Kampus IPB Darmaga, Bogor Email: anangk@ipb.ac.id
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang Masalah
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Missing data atau data hilang adalah informasi yang tidak tersedia dalam sebuah subyek atau kasus. Fenomena missing data banyak dijumpai dalam survei. Banyak
Lebih terperinciPENENTUAN UKURAN CONTOH DAN REPLIKASI BOOTSTRAP UNTUK MENDUGA MODEL REGRESI LINIER SEDERHANA
Jurnal Matematika UNAND Vol. 3 No. 2 Hal. 53 61 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PENENTUAN UKURAN CONTOH DAN REPLIKASI BOOTSTRAP UNTUK MENDUGA MODEL REGRESI LINIER SEDERHANA OLIVIA ATINRI,
Lebih terperinciK NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA. Susanti, Shantika Martha, Evy Sulistianingsih INTISARI
Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster) Volume 07, No. 1 (2018), hal 9-14. K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA Susanti, Shantika Martha, Evy Sulistianingsih INTISARI Missing data
Lebih terperinciAnalisis Korelasi dan Regresi. Dr. Kusman Sadik, M.Si Dept. Statistika IPB
Analisis Korelasi dan Regresi Dr. Kusman Sadik, M.Si Dept. Statistika IPB - 015 1 Hubungan Dua Peubah atau Lebih PEUBAH KASUS PENGUMPULAN DATA JENIS HUBUNGANNYA 1.Dosis pupuk.banyaknya padi yg dihasilkan
Lebih terperinciANALISIS KORELASI KANONIK ANTARA CURAH HUJAN GCM DAN CURAH HUJAN DI INDRAMAYU. Oleh : Heru Novriyadi G
ANALISIS KORELASI KANONIK ANTARA CURAH HUJAN GCM DAN CURAH HUJAN DI INDRAMAYU Oleh : Heru Novriyadi G4004 PROGRAM STUDI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciSTATISTIKA I. Ari Wibowo, MPd Prodi PAI Jurusan Tarbiyah STAIN Surakarta. Kode Matakuliah: PAI111, 2sks Tujuan Instruksional Umum:
STATISTIKA I Ari Wibowo, MPd Prodi PAI Jurusan Tarbiyah STAIN Surakarta Kode Matakuliah: PAI111, 2sks Tujuan Instruksional Umum: Setelah mengikuti mata kuliah ini selama satu semester, mahasiswa akan dapat
Lebih terperinciMODEL SPASIAL BAYES DALAM PENDUGAAN AREA KECIL DENGAN PEUBAH RESPON BINER
MODEL SPASIAL BAYES DALAM PENDUGAAN AREA KECIL DENGAN PEUBAH RESPON BINER Etis Sunandi 1), Khairil A Notodiputro 2), Anik Djuraidah 2) 1) Jurusan Matematika FMIPA Universitas Bengkulu 2) Jurusan Statistika,
Lebih terperinciANALISIS REGRESI TERPOTONG BEBERAPA NILAI AMATAN NURHAFNI
ANALISIS REGRESI TERPOTONG DENGAN BEBERAPA NILAI AMATAN NOL NURHAFNI SEKOLAH PASCASARJANAA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini saya menyatakan
Lebih terperinciPENERAPAN MODEL REGRESI LINIER BAYESIAN UNTUK MENGESTIMASI PARAMETER DAN INTERVAL KREDIBEL
PENERAPAN MODEL REGRESI LINIER BAYESIAN UNTUK MENGESTIMASI PARAMETER DAN INTERVAL KREDIBEL Vania Mutiarani 1, Adi Setiawan, Hanna Arini Parhusip 3 1 Mahasiswa Program Studi Matematika FSM UKSW, 3 Dosen
Lebih terperinciBAB IV KAJIAN SIMULASI: PENDEKATAN BAYES PADA DATA n<<p DAN TERDAPAT KEKOLINEARAN-GANDA
BAB IV KAJIAN SIMULASI: PENDEKATAN BAYES PADA DATA n
Lebih terperinciRATA-RATA KUADRAT SESATAN PENDUGA REGRESI DENGAN KOMBINASI LINIER DUA VARIABEL BANTU PADA SAMPEL ACAK SEDERHANA
RATA-RATA KUADRAT SESATAN PENDUGA REGRESI DENGAN KOMBINASI LINIER DUA VARIABEL BANTU PADA SAMPEL ACAK SEDERHANA oleh INTAN LISDIANA NUR PRATIWI NIM. M0110040 SKRIPSI ditulis dan diajukan untuk memenuhi
Lebih terperinciBAB. IX ANALISIS REGRESI FAKTOR (REGRESSION FACTOR ANALYSIS)
BAB. IX ANALII REGREI FAKTOR (REGREION FACTOR ANALYI) 9. PENDAHULUAN Analisis regresi faktor pada dasarnya merupakan teknik analisis yang mengkombinasikan analisis faktor dengan analisis regresi linier
Lebih terperinciTINJAUAN PUSTAKA. merupakan nilai peubah bebas ke-p pada merupakan nilai koefisien peubah penjelas merupakan galat acak pengamatan ke-i.
TINJAUAN PUSTAKA Model egresi Berganda egresi linier adalah persamaan matematika yang menggambarkan hubungan antara peubah respon y dan peubah bebas X X X2 Xp. Hubungan antara kedua peubah tersebut dinyatakan
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan
BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan Analisis regresi merupakan suatu metode dalam statistik yang popular, karena banyak digunakan pada penelitian dalam berbagai bidang. Contoh dari penggunaan
Lebih terperinciPENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA DIMAS FAJAR AIRLANGGA
PENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA DIMAS FAJAR AIRLANGGA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciMasalah Overdispersi dalam Model Regresi Logistik Multinomial
Statistika, Vol. 16 No. 1, 29 39 Mei 2016 Masalah Overdispersi dalam Model Regresi Logistik Multinomial Annisa Lisa Nurjanah, Nusar Hajarisman, Teti Sofia Yanti Prodi Statistika, Fakultas Matematika dan
Lebih terperinciSTATISTIKA INDUSTRI 2 TIN 4004
STATISTIKA INDUSTRI 2 TIN 4004 Pertemuan 8 Outline: Simple Linear Regression and Correlation Multiple Linear Regression and Correlation Referensi: Montgomery, D.C., Runger, G.C., Applied Statistic and
Lebih terperinciSTK511 Analisis Statistika. Bagus Sartono
STK511 Analisis Statistika Bagus Sartono Pokok Bahasan Pengenalan analisis dan deskripsi data Sebaran peluang peubah acak. Sebaran penarikan contoh Pendugaan parameter Pengujian hipotesis (t-test, one-way
Lebih terperinciKOEFISIEN DETERMINASI REGRESI FUZZY SIMETRIS UNTUK PEMILIHAN MODEL TERBAIK. Iqbal Kharisudin. Jurusan Matematika FMIPA Universitas Negeri Semarang
KOEFISIEN DETERMINASI REGRESI FUZZY SIMETRIS UNTUK PEMILIHAN MODEL TERBAIK S-33 Iqbal Kharisudin Jurusan Matematika FMIPA Universitas Negeri Semarang Email: iqbal_kh@staff.unnes.ac.id Abstrak: Dalam analisis
Lebih terperinciPENGGUNAAN REGRESI SPLINE ADAPTIF BERGANDA UNTUK DATA RESPON BINER AZWIRDA AZIZ SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2005
1 PENGGUNAAN REGRESI SPLINE ADAPTIF BERGANDA UNTUK DATA RESPON BINER AZWIRDA AZIZ SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2005 2 SURAT PERNYATAAN Dengan ini saya menyatakan bahwa tesis yang berjudul
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Himpunan Fuzzy Tidak semua himpunan yang dijumpai dalam kehidupan sehari-hari terdefinisi secara jelas, misalnya himpunan orang miskin, himpunan orang pandai, himpunan orang tinggi,
Lebih terperinciREGRESI KEKAR SIMPANGAN MUTLAK TERKECIL DENGAN MODIFIKASI SIMPLEKS MUHAMMAD YUSUF DWIHARJANGGI
REGRESI KEKAR SIMPANGAN MUTLAK TERKECIL DENGAN MODIFIKASI SIMPLEKS MUHAMMAD YUSUF DWIHARJANGGI DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 ABSTRAK
Lebih terperincimengsumsikan tidak ada kesalahan pengukuran, validitas dapat dievaluasi dengan mengamati nilai bias dari penduganya. Bias, B ( ) dari populasi
TINJAUAN PUSTAKA Teori penarikan contoh mempunyai tujuan untuk membuat penarikan contoh menjadi lebih efisien. Teori penarikan contoh mencoba untuk mengembangkan metode pemilihan contoh dengan biaya yang
Lebih terperinciRegresi Logistik Nominal dengan Fungsi Hubung CLOGLOG
Regresi Logistik Nominal dengan Fungsi Hubung CLOGLOG Julio Adisantoso, G16109011/STK 11 Mei 2010 Ringkasan Regresi logistik merupakan suatu pendekatan pemodelan yang dapat digunakan untuk mendeskripsikan
Lebih terperinciSTK511 Analisis Statistika. Pertemuan 10 Analisis Korelasi & Regresi (1)
STK511 Analisis Statistika Pertemuan 10 Analisis Korelasi & Regresi (1) Analisis Hubungan Jenis/tipe hubungan Ukuran Keterkaitan Skala pengukuran peubah Pemodelan Keterkaitan anang kurnia (anangk@apps.ipb.ac.id)
Lebih terperinciMODEL REGRESI LOGISTIK UNTUK KEJADIAN INFEKSI LUKA OPERASI NOSOKOMIAL ANTON
MODEL REGRESI LOGISTIK UNTUK KEJADIAN INFEKSI LUKA OPERASI NOSOKOMIAL ANTON DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2006 Untuk Mama dan Andri Aku tahu
Lebih terperinciSTK511 Analisis Statistika. Pertemuan - 1
STK511 Analisis Statistika Pertemuan - 1 PERKULIAHAN 1. Dosen : Anang Kurnia (anangk@apps.ipb.ac.id) 2. Asisten : Septian Rahardiantoro 3. Waktu : Rabu > 08.00 09.40 Jumat > 08.00 10.00 4. Office Hours
Lebih terperinciBAB ΙΙ LANDASAN TEORI
7 BAB ΙΙ LANDASAN TEORI Berubahnya nilai suatu variabel tidak selalu terjadi dengan sendirinya, bisa saja berubahnya nilai suatu variabel disebabkan oleh adanya perubahan nilai pada variabel lain yang
Lebih terperinciResume Regresi Linear dan Korelasi
Rendy Dwi Ardiansyah Putra 7410040018 / 2 D4 IT A Statistika Resume Regresi Linear dan Korelasi 1. Regresi Linear Regresi linear merupakan suatu metode analisis statistik yang mempelajari pola hubungan
Lebih terperinciHETEROSKEDASTISITAS DALAM ANALISIS REGRESI LINIER SKRIPSI. Oleh: YOGIE DANA INSANI NIM
HETEROSKEDASTISITAS DALAM ANALISIS REGRESI LINIER SKRIPSI Diajukan Untuk Memenuhi Persyaratan Penyelesaian Program Sarjana Sains Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas
Lebih terperinci(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN
4 karena adanya perbedaan satuan pengukuran antar peubah. 1.. Memastikan tidak adanya pencilan pada data dengan mengidentifikasi adanya pencilan pada data. Pengidentifikasian pencilan dilakukan dengan
Lebih terperinciMANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO
MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2011 RINGKASAN MAGRI HANDOKO. Manajemen
Lebih terperinciBAB I PENDAHULUAN. Statistika adalah salah satu cabang ilmu yang mempelajari prosedur-prosedur
BAB I PENDAHULUAN 1.1 Latar Belakang Statistika adalah salah satu cabang ilmu yang mempelajari prosedur-prosedur yang digunakan dalam pengumpulan, penyajian, analisis dan interpretasi data. Statistika
Lebih terperinciKata Kunci: Analisis Regresi Linier, Penduga OLS, Penduga GLS, Autokorelasi, Regresor Bersifat Stokastik
Jurnal Matematika UNAND Vol. 3 No. 4 Hal. 168 176 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PERBANDINGAN PENDUGA ORDINARY LEAST SQUARES (OLS) DAN GENERALIZED LEAST SQUARES (GLS) PADA MODEL REGRESI
Lebih terperinciBAB 2 LANDASAN TEORI
BAB LANDASAN TEORI.1 Konsep Dasar Statistika Statistik merupakan cara cara tertentu yang digunakan dalam mengumpulkan, menyusun atau mengatur, menyajikan, menganalisa dan memberi interpretasi terhadap
Lebih terperinciOleh : Muhammad Amin Paris, S.Pd., M.Si (Dosen Fak. Tarbiyah IAIN Antasari Banjarmasin) Abstrak
MODEL PERSAMAAN STRUKTURAL PENGARUH MOTIVASI, KAPABILITAS DAN LINGKUNGAN TERHADAP PRESTASI BELAJAR MAHASISWA TAHUN PERTAMA PROGRAM STUDI S1 MATEMATIKA FMIPA-IPB Oleh : Muhammad Amin Paris, SPd, MSi (Dosen
Lebih terperinciBAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel
BAB LANDASAN TEORI.1 Pengertian Regresi Regresi dalam statistika adalah salah satu metode untuk menentukan tingkat pengaruh suatu variabel terhadap variabel yang lain. Variabel yang pertama disebut dengan
Lebih terperinciBEBERAPA FAKTOR YANG MEMPENGARUHI PENGELUARAN KONSUMSI PANGAN RUMAH TANGGA MISKIN (Studi Kasus di Kelurahan Sidomulyo Kecamatan Medan Tuntungan)
Saintia Matematika Vol. 1, No. 3 (2013), pp. 249 259. BEBERAPA FAKTOR YANG MEMPENGARUHI PENGELUARAN KONSUMSI PANGAN RUMAH TANGGA MISKIN (Studi Kasus di Kelurahan Sidomulyo Kecamatan Medan Tuntungan) Yuliana,
Lebih terperinciMetode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas
Vol. 14, No. 1, 93-99, Juli 2017 Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas Nurhasanah Abstrak Regresi berganda dengan peubah bebas saling berkorelasi (multikolinearitas)
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Analisis regresi adalah suatu metode yang digunakan untuk menganalisa hubungan antara variabel respon dan variabel prediktor. Pada umumnya analisis regresi
Lebih terperinciANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEPUTUSAN KONSUMEN MEMBELI SUATU PRODUK DENGAN METODE ANALISIS REGRESI LOGISTIK ORDINAL
J u r n a l E K B I S / V o l. V I / N o. / e d i s i M a r e t 2 0 2 379 ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEPUTUSAN KONSUMEN MEMBELI SUATU PRODUK DENGAN METODE ANALISIS REGRESI LOGISTIK ORDINAL
Lebih terperinciBAB IV DESKRIPSI DAN ANALISIS DATA
BAB IV DESKRIPSI DAN ANALISIS DATA A. Deskripsi Data Hasil Penelitian Untuk menjawab beberapa rumusan masalah yang telah disebutkan dalam Bab I halaman 6-7, dibutuhkan data-data terkait penelitian ini.
Lebih terperinciSTK 211 Metode statistika. Pengajar : Dr. Agus Mohamad Soleh, SSi, MT 2016
STK 211 Metode statistika Pengajar : Dr. Agus Mohamad Soleh, SSi, MT 2016 http://www.stat.ipb.ac.id/ Pengantar Kode Matakuliah: STK211, 3(2-3) Tujuan Instruksional Umum: Setelah mengikuti mata kuliah ini
Lebih terperinciPERBANDINGAN ANTARA UNWEIGHTED LEAST SQUARES (ULS) DAN PARTIAL LEAST SQUARES (PLS) DALAM PEMODELAN PERSAMAAN STRUKTURAL MUHAMMAD AMIN PARIS
PERBANDINGAN ANTARA UNWEIGHTED LEAST SQUARES (ULS) DAN PARTIAL LEAST SQUARES (PLS) DALAM PEMODELAN PERSAMAAN STRUKTURAL MUHAMMAD AMIN PARIS SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 PERNYATAAN
Lebih terperinciMETODE PENELITIAN Sumber Data
13 METODE PENELITIAN Sumber Data Data yang digunakan dalam penelitian ini merupakan hasil simulasi melalui pembangkitan dari komputer. Untuk membangkitkan data, digunakan desain model persamaan struktural
Lebih terperinciESTIMASI PARAMETER REGRESI RIDGE MENGGUNAKAN ITERASI HOERL, KENNARD, DAN BALDWIN (HKB) UNTUK PENANGANAN MULTIKOLINIERITAS
ESTIMASI PARAMETER REGRESI RIDGE MENGGUNAKAN ITERASI HOERL, KENNARD, DAN BALDWIN (HKB) UNTUK PENANGANAN MULTIKOLINIERITAS (Studi Kasus Pengaruh BI Rate, Jumlah Uang Beredar, dan Nilai Tukar Rupiah terhadap
Lebih terperinciPERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER
PERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER LATHIFATURRAHMAH SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2010 PERNYATAAN MENGENAI TUGAS AKHIR DAN SUMBER
Lebih terperinciVI. PEMBAHASAN. dengan metode kemungkinan maksimum, tetapi terhadap
89 VI. PEMBAHASAN Pada analisis yang menggunakan pendekatan model acak satu faktor (model persamaan 4.1), metode kuadrat terkecil secara umum memberikan hasil dugaan yang berbeda dengan metode kemungkinan
Lebih terperinciRegresi dengan Microsoft Office Excel
Regresi dengan Microsoft Office Excel Author: Junaidi Junaidi 1. Pengantar Dalam statistik, regresi merupakan salah satu peralatan yang populer digunakan, baik pada ilmu-ilmu sosial maupun ilmu-ilmu eksak.
Lebih terperinciLampiran 2. Fungsi dari masing-masing pernyataan yang digunakan dalam PROC MIXED
LAMPIRAN Lampiran. Bentuk Umum Dari PROC MIXED PROC MIXED pilihan-pilihan ; BY nama-nama peubah ; CLASS nama-nama peubah ; ID nama-nama peubah; MODEL peubah respon = nama-nama peubah / pilihan-pilihan
Lebih terperinciBAB 2 LANDASAN TEORI. berarti ramalan atau taksiran pertama kali diperkenalkan Sir Francis Galton pada
BAB 2 LANDASAN TEORI 2.1 Pengertian Regresi Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk mengetahui pola hubungan antara dua atau lebih variabel. Istilah regresi yang berarti
Lebih terperinciSkala pengukuran dan Ukuran Pemusatan. Ukuran Pemusatan
Skala Pengukuran Nominal (dapat dikelompokkan, tidak punya urutan) Ordinal (dapat dikelompokkan, dapat diurutkan, jarak antar nilai tidak tetap sehingga tidak dapat dijumlahkan) Interval (dapat dikelompokkan,
Lebih terperinciKAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI. Oleh : SITI NURBAITI G
KAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI Oleh : SITI NURBAITI G14102022 DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007 ABSTRAK SITI
Lebih terperinciREVIEW BIOSTATISTIK DESKRIPTIF
REVIEW BIOSTATISTIK DESKRIPTIF POKOK BAHASAN 1. Konsep statistik deskriptif 2. Data dan variabel 3. Nilai Tengah (Ukuran Pusat), posisi dan variasi) pada data tunggal dan kelompok 4. Penyajian data 5.
Lebih terperinciPEMODELAN REGRESI TIGA LEVEL PADA DATA PENGAMATAN BERULANG. Indahwati, Yenni Angraeni, Tri Wuri Sastuti
S-25 PEMODELAN REGRESI TIGA LEVEL PADA DATA PENGAMATAN BERULANG Indahwati, Yenni Angraeni, Tri Wuri Sastuti Departemen Statistika FMIPA IPB Email : Indah_stk@yahoo.com Abstrak Pemodelan multilevel adalah
Lebih terperincioleh YUANITA KUSUMA WARDANI M
ESTIMASI PARAMETER MODEL REGRESI PROBIT SPASIAL MENGGUNAKAN SOFTWARE R DENGAN ALGORITME GIBBS SAMPLING oleh YUANITA KUSUMA WARDANI M0111083 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan
Lebih terperinciPERBANDINGAN METODE PENDUGAAN PARAMETER DALAM PEMODELAN PERSAMAAN STRUKTURAL LA MBAU
v PERBANDINGAN METODE PENDUGAAN PARAMETER DALAM PEMODELAN PERSAMAAN STRUKTURAL LA MBAU Tesis Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Departemen Matematika SEKOLAH PASCASARJANA
Lebih terperinciBAB II LANDASAN TEORI. Analisis regresi (regressison analysis) merupakan suatu teknik untuk membangun persamaan
BAB II LANDASAN TEORI 21 Konsep Dasar Analisis Regresi Analisis regresi (regressison analysis) merupakan suatu teknik untuk membangun persamaan dan menggunakan persamaan tersebut untuk membuat perkiraan
Lebih terperinciForum Statistika dan Komputasi, Oktober 2010 p : ISSN :
, Oktober 2010 p : 23-31 ISSN : 0853-8115 Vol 15 No.2 APLIKASI REGRESI LOGISTIK ORDINAL MULTILEVEL UNTUK PEMODELAN DAN KLASIFIKASI HURUF MUTU MATA KULIAH METODE STATISTIKA (The Application of Multilevel
Lebih terperinciBAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel
BAB 2 LANDASAN TEORI 2.1 Pengertian Regresi Regresi dalam statistika adalah salah satu metode untuk menentukan tingkat pengaruh suatu variabel terhadap variabel yang lain. Variabel yang pertama disebut
Lebih terperinciESTIMASI PARAMETER MODEL REGRESI ZERO-INFLATED POISSON (ZIP) MENGGUNAKAN METODE BAYESIAN
ESTIMASI PARAMETER MODEL REGRESI ZERO-INFLATED POISSON (ZIP) MENGGUNAKAN METODE BAYESIAN Karima Puspita Sari, Respatiwulan, dan Bowo Winarno Program Studi Matematika FMIPA UNS Abstrak. Model regresi zero-inflated
Lebih terperinciANALISIS VAR (VECTOR AUTOREGRESSIVE) UNTUK MEKANISME PEMODELAN PRODUKSI, KONSUMSI, EKSPOR, IMPOR, DAN HARGA MINYAK BUMI AGUS WAHYULI
ANALISIS VAR (VECTOR AUTOREGRESSIVE) UNTUK MEKANISME PEMODELAN PRODUKSI, KONSUMSI, EKSPOR, IMPOR, DAN HARGA MINYAK BUMI AGUS WAHYULI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPENERAPAN MODEL FINITE LENGTH LINE SOURCE UNTUK MENDUGA KONSENTRASI POLUTAN DARI SUMBER GARIS (STUDI KASUS: JL. M.H. THAMRIN, DKI JAKARTA)
PENERAPAN MODEL FINITE LENGTH LINE SOURCE UNTUK MENDUGA KONSENTRASI POLUTAN DARI SUMBER GARIS (STUDI KASUS: JL. M.H. THAMRIN, DKI JAKARTA) EKO SUPRIYADI DEPARTEMEN GEOFISIKA DAN METEOROLOGI FAKULTAS MATEMATIKA
Lebih terperinciANALISIS PENERAPAN METODE KUADRAT TERKECIL DAN REGRESI KOMPONEN UTAMA DALAM MULTIKOLINEARITAS OLEH : GUGUN M. SIMATUPANG
ANALISIS PENERAPAN METODE KUADRAT TERKECIL DAN REGRESI KOMPONEN UTAMA DALAM MULTIKOLINEARITAS OLEH : GUGUN M. SIMATUPANG PROGRAM PASCASARJANA INSTITUT PERTANIAN BOGOR 2002 ABSTRAK GUGUN M. SIMATUPANG.
Lebih terperinciPenerapan Model ARIMA
Penerapan Model ARIMA (Bagian I) Dr. Kusman Sadik, M.Si Departemen Statistika IPB, 016 1 Ada tiga tahapan iterasi dalam pemodelan data deret waktu, yaitu: 1. Penentuan model tentatif (spesifikasi model)
Lebih terperinciJURNAL MATEMATIKA DAN KOMPUTER Vol. 4. No. 2, 71-81, Agustus 2001, ISSN :
PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA Tatik Widiharih Jurusan Matematika FMIPA UNDIP Abstrak Multikolinearitas yang tinggi diantara peubah-peubah bebas,
Lebih terperinciPendugaan Selang Kepercayaan Persentil Bootstrap Nonparametrik untuk Parameter Regresi
Statistika, Vol. No., Mei Pendugaan Selang Kepercayaan Persentil Bootstrap Nonparametrik untuk Parameter Regresi MARZUKI, HIZIR SOFYAN, ASEP RUSYANA Jurusan Matematika FMIPA Universitas Syiah Kuala Jl.
Lebih terperinciTINJAUAN PUSTAKA. Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan
4 II. TINJAUAN PUSTAKA 2.1 Konsep Dasar Matriks 2.1.1 Matriks Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan dalam susunan itu disebut anggota dalam matriks tersebut. Suatu
Lebih terperinciPERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 1-5 ISSN: 2303-1751 PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA NI WAYAN
Lebih terperinciBAB 2 LANDASAN TEORI
BAB LANDASAN TEORI.1 Konsep Dasar Statistika Statistik adalah ilmu yang mempelajari tentang seluk beluk data, yaitu tentang pengumpulan, pengolahan, penganalisisa, penafsiran, dan penarikan kesimpulan
Lebih terperinciMETODE STATISTIKA (Pendahuluan)
METODE STATISTIKA (Pendahuluan) Kode: STK211 SKS: 3(2-3) Dr. Ir. Kusman Sadik, M.Si Dept. Statistika IPB, 2015 1 Pokok Bahasan Minggu Ke I II-III IV V VI-VII VIII IX-X XI-XII XIII-XIV XV XVI Pokok Bahasan
Lebih terperinciAnalisis Regresi 1. Pokok Bahasan Pengujian pada Regresi Ganda
Analisis Regresi Pokok Bahasan Pengujian pada Regresi Ganda Model Regresi Linier Berganda Model Regresi Linier Berganda, dengan k peubah penjelas : Y β β X β X β X k k Parameter regresi sebanyak k+ diduga
Lebih terperinciPenerapan SAS/IML Algoritma EM, Pembangkitan sebaran normal ganda, dan Bootstrap
Penerapan SAS/IML Algoritma EM, Pembangkitan sebaran normal ganda, dan Bootstrap τρ Application EM Algorithm Complete-data specification f(x Φ) f x Φ = b x eφt(x) a(φ) E-step : Estimate the complete data
Lebih terperinci(DS.5) MODEL SPASIAL BAYES DALAM PENDUGAAN AREA KECIL DENGAN PEUBAH RESPON BINER
(DS.5) MODEL SPASIAL BAYES DALAM PENDUGAAN AREA KECIL DENGAN PEUBAH RESPON BINER (Kasus : Pendugaan Proporsi Keluarga Miskin Di kabupaten Jember Jawa Timur) Etis Sunandi 1), Khairil A Notodiputro 2), Anik
Lebih terperinciBAB IV HASIL PENELITIAN
BAB IV HASIL PENELITIAN A. Deskripsi Data Penelitian ini berlokasi di SMPN 1 Kauman dengan populasinya semua kelas VIII yaitu kelas VIII A, B, C, D, E, F, G, H, I dan J tahun pelajaran 2016/2017. Teknik
Lebih terperinciPENDUGAAN AREA KECIL TERHADAP PENGELUARAN PER KAPITA DI KABUPATEN SRAGEN DENGAN PENDEKATAN KERNEL SKRIPSI
PENDUGAAN AREA KECIL TERHADAP PENGELUARAN PER KAPITA DI KABUPATEN SRAGEN DENGAN PENDEKATAN KERNEL SKRIPSI Disusun Oleh : BITORIA ROSA NIASHINTA 24010211120021 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA
Lebih terperinciAnalisis Regresi: Regresi Linear Berganda
Analisis Regresi: Regresi Linear Berganda Pengantar Pada sesi sebelumnya kita hanya menggunakan satu buah X, dengan model Y = b 0 + b 1 X 0 1 Dalam banyak hal, yang mempengaruhi X bisa lebih dari satu.
Lebih terperinciMETODE KEMUNGKINAN MAKSIMUM UNTUK KOREKSI SEBARAN BERSYARAT PADA ANALISIS KORELASI
METODE KEMUNGKINAN MAKSIMUM UNTUK KOREKSI SEBARAN BERSYARAT PADA ANALISIS KORELASI Restu Arisanti Departemen Statistika FMIPA Universitas Padjadjaran restu.arisanti@unpad.ac.id ABSTRAK. Masalah umum pada
Lebih terperinciPEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA
PEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 RINGKASAN TENDI
Lebih terperinciII. HASIL DAN PEMBAHASAN
II. HASIL DAN PEMBAHASAN 2.1 Karakteristik Responden Berdasarkan jawaban responden yang telah diklasifikasikan menurut jenis kelamin, umur, pendidikan, jenis pekerjaan, dan pengeluaran dalam satu bulan,
Lebih terperinciPEMODELAN PRODUKSI KEDELAI NASIONAL DENGAN METODE SUR PAULUS BASUKI KUWAT SANTOSO
PEMODELAN PRODUKSI KEDELAI NASIONAL DENGAN METODE SUR PAULUS BASUKI KUWAT SANTOSO SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2006 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini saya
Lebih terperinciBAB III LANDASAN TEORI. A. Regresi
BAB III LANDASAN TEORI A. Regresi 1. Pengertian Regresi Regeresi adalah alat yang berfungsi untuk membantu memperkirakan nilai suatu varibel yang tidak diketahui dari satu atau beberapa variabel yang tidak
Lebih terperinciEstimasi Interval Kepercayaan Bootstrap pada Parameter Regresi Komponen Utama
Estimasi Interval Kepercayaan Bootstrap pada Parameter Regresi Komponen Utama Shinta Anisa Putri Y 1, Raupong 2, Sri Astuti Thamrin 3 1 Program Studi Statistika, Jurusan Matematika, Fakultas Matematika
Lebih terperinciBAB III METODE PENELITIAN. September). Data yang dikumpulkan berupa data jasa pelayanan pelabuhan, yaitu
BAB III METODE PENELITIAN 3.1 Jenis dan Sumber Data Data yang digunakan dalam penelitian ini berasal dari data sekunder dengan jenis data bulanan mulai tahun 2004 sampai dengan tahun 2011 (bulan September).
Lebih terperinciMETODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER
Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 03, No. 3 (2014), hal 163-168. METODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER
Lebih terperinciESTIMASI PARAMETER DAN INTERVAL KREDIBEL DENGAN MODEL REGRESI LINIER BERGANDA BAYESIAN
ESTIMASI PARAMETER DAN INTERVAL KREDIBEL DENGAN MODEL REGRESI LINIER BERGANDA BAYESIAN Vania Mutiarani a, Adi Setiawan b, Hanna Arini Parhusip c a Program Studi Matematika FSM UKSW Jl. Diponegoro 52-6
Lebih terperinci