1 BAB I PENDAHULUAN 1.1 Latar Belakang Analisis statistika pada dasarnya adalah analisis terhadap sampel yang kemudian hasil analisisnya akan digeneralisasikan untuk mengetahui karakteristik populasi. Dalam analisis statistika, peneliti sering dihadapkan pada tiga pertanyaan paling mendasar (Efron dan Tibshirani,1993), yaitu : 1. Bagaimana seharusnya cara peneliti mengumpulkan data? 2. Bagaimana cara menganalisis dan mengambil kesimpulan berdasarkan data yang dikumpulkan? 3. Seberapa akurat kesimpulan yang diambil berdasarkan data? Pertanyaan terakhir mengarah pada suatu proses yang dikenal dengan inferensi statistik. Bila data sampel berukuran kecil sedangkan data populasi berukuran besar, mungkin saja sampel tersebut tidak mewakili populasi. Sehingga rata-rata yang dihasilkan mempunyai tingkat keakuratan yang rendah. Bootstrap merupakan salah satu inferensi yang berbasis komputer. Salah satu prinsip kerjanya menggunakan komputer dalam membangkitkan kerandoman untuk mendapatkan sampel tiruan dari data asli yang berukuran sama. Data hasil bootstrap digunakan untuk menggantikan data real sehingga masalah-masalah dalam dunia nyata dapat diselesaikan. Tujuan utama penggunaan bootstrap adalah untuk memperoleh estimasi yang sebaik-baiknya berdasarkan data yang minimal dengan bantuan komputer. Bootsrap pertama kali diperkenalkan oleh Bradley pada tahun 1979. Penggunaan kata bootstrap sendiri diambil dari istilah to pull oneself up by one s bootstrap yang dapat diartikan berusaha dengan sumber daya minimal. Dalam statistika, sumber daya yang minimal dapat diartikan sebagai data yang sedikit,
2 data yang menyimpang dari asumsi tertentu atau bahkan tidak memiliki asumsi apapun untuk distribusinya. Model regresi merupakan suatu hubungan sebab akibat yang paling banyak manfaat dan sering digunakan dalam metode statistika. Metode yang dipakai untuk menyelesaikan masalah regresi untuk data longitudinal, yakni dengan mencari model untuk menyelesaikan masalah kausalitas, adalah Generallized Estimating Equations (GEE). Estimator yang didapat dengan menggunakan metode ini menggunakan estimator yang tak bias. Pendekatan klasik digunakan untuk mengestimasi tingkat akurasi dari estimator-estimator yang didapatkan melalui Generalized Estimating Equations (GEE). Namun dalam pendekatan klasik terdapat kelemahan-kelemahan diantaranya dibutuhkan sampel yang besar untuk mendapatkan estimator variansi yang tepat.oleh karena itu, dengan sampel yang minimum masalah regresi untuk data longitudinal dapat diselesaikan dengan diselesaikan dengan menggunakan metode bootstrap. Metode bootstrap digunakan untuk mengestimasi koefisien dari suatu persamaan regresi dengan melakukan penyampelan ulang dari sampel yang sudah ada. Shao dan Tu (1995) menyatakan bahwa dalam konteks regresi untuk data longitudinal, metode bootstrap memiliki 2 cara : 1. Bootstrap berpasangan (paired bootstrap) atau model korelasi. 2. Bootstrap eksternal atau dikenal dengan wild bootstrap. 1.2 Pembatasan Masalah Pembahasan pada skripsi ini difokuskan pada aplikasi metode bootstrap dalam masalah regresi dalam data longitudinal dengan menggunakan bootstrap berpasangan atau model korelasi. Dalam mengestimasi parameter akan digunakan Generalized Estimating Equations dengan struktur korelasi independence, exchangeable, dan autoregressive order 1. Untuk statistik yang akan digunakan sebagai parameter tingkat akurasi dari penduga parameter regresi adalah standar error dan bias.
3 1.3 Tujuan Penulisan 1. Mempelajari metode alternatif, dalam penelitian ini adalah metode bootstrap berpasangan. 2. Menjelaskan metode bootstrap berpasangan dalam analisis regresi untuk data longitudinal. 3. Mengetahui Generalized Estimating Equations (GEE) dengan menggunakan metode bootstrap berpasangan. 4. Mengetahui tingkat akurasi Generalized Estimating Equations (GEE) yang didapat dengan menggunakan metode bootstrap berpasangan. 1.4 Metode Penulisan Penulis menggunakan metode studi literatur yang dipelajari dari bukubuku dan jurnal-jurnal yang berhubungan dengan skripsi ini. Sumber lain yang digunakan adalah situs-situs pendukung yang ada di internet. Penulis akan melakukan aplikasi metode bootstrap berpasangan pada Generalized Estimating Equations (GEE) untuk data penurunan jarak gigi marmut. 1.5 Tinjauan Pustaka Bootstrap merupakan metode komputasi untuk inferensi statistik seperti bias dan standar error yang berdasarkan resampling. Bootstrap pertama kali diperkenalkan oleh Efron pada tahun 1979. Bootstrap berkembang sangat pesaat dan telah dikaji ulang oleh beberapa ilmuwan lain, antara lain Efron dan Tibshirani (1993). Efron dan Tibshirani menerangkan kekakuratan estimasi titik dan interval yang menggunakan sampel bootstrap. Estimasi bootstrap lebih akurat atau lebih mendekati populasinya dibandingkan dengan pengambilan sampel yang lainnya. Keakuratan dari sampel bootstrap untuk estimasi titik dan estimasi intervalnya diketahui dengan menggunakan standar error. Diterangkan juga proses pengambilan sampel bootsrap. Algoritma bootstrap adalah cara perhitungan menggunakan komputer untuk mendapatkan pendekatan yang terbaik untuk nilai numerik standar error.
4 Shao dan Tu (1995) juga membahas tentang prosedur bootstrap. Shao dan Tu menjelaskan prosedur bootstrap untuk Generalized Estimating Equations (GEE). Prosedur untuk melukukan bootstrap dalam GEE yaitu bootstrap berpasangan dan bootstrap eksternal. Pemodelan untuk data longitudinal dan pendekatan Generalized Estimating Equations (GEE) untuk mendapatkan parameter-parameter yang konsisten telah dipaparkan oleh Albert, Liang dan Zeger (1988). Pada skripsi sebelumnya telah dibahs tentang model korelasi bootstrap pada regresi. Filiola (2006) menjelaskan bahwa model korelasi bootstrap dapat mengestimasi parameter regresi dengan lebih akurat daripada menggunakan metode klasik. Skripsi tersebut tidak mengestimasi parameter untuk data longitudinal. Perbedaan skripsi ini dengan skripsi sebelumnya adalah hanya membahas estimasi parameter regresi dengan pengamatan respon dalam satu waktu saja. Sedangkan pada skripsi ini akan dibahas pemodelan pada data longitudinal dan pendekatan GEE menggunakan metode bootstrap berpasangan. 1.6 Sistematika Penulisan Skripsi ini akan disusun dengan sistematika penulisan sebagai berikut. BAB I PENDAHULUAN Bab ini membahas mengenai latar belakang, pembatasan masalah, tujuan penulisan, metode penulisan dan sistematika penulisan. BAB II LANDASAN TEORI Bab ini membahas tentang teori penunjang yang digunakan dalam pembahasan, diantaranya : variabel random, matriks, distribusi empiris, prinsip plug-in, ukuran akurasi suatu statistik, regresi linear klasik, model linear tergeneralisasi, dan data longitudinal.
5 BAB III PEMBAHASAN Bab ini akan membahas definisi bootstrap, inferensi statistika berdasarkan metode bootstrap, Generalized Estimating Equations, dan metode bootstrap berpasangan pada estimasi Generalized Estimating Equations. BAB IV STUDI KASUS Bab ini akan membahas mengenai aplikasi metode bootstrap berpasangan dengan menggunakan pemrograman pada software R. Analisis diawali dengan pemilihan model regresi longitudinal dan dilanjutkan dengan pemilihan struktur korelasi terpakai. Kemudian dilakukan Generalized Estimating Equations (GEE) dengan metode bootstrap berpasangan. BAB V PENUTUP Bab ini membahas mengenai kesimpulan dan saran berdasarkan pembahasan pada bab-bab sebelumnya.