BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Analisis regresi adalah suatu metode yang digunakan untuk menganalisa hubungan antara variabel respon dan variabel prediktor. Pada umumnya analisis regresi digunakan untuk menganalisa variabel respon yang merupakan data kontinu dan mengikuti distribusi normal. Namun dalam beberapa aplikasinya, variabel respon yang akan dianalisisa dapat berupa data diskrit. Salah satu contoh dimana variabel responnya diskrit adalah banyaknya kejadian yang jarang terjadi (rare event). Misalkan banyaknya kecelakaan mobil setiap bulan, banyaknya hujan badai setiap tahun, banyaknya kebakaran hutan setiap tahun, dan banyaknya penderita kanker paru-paru yang meninggal setiap tahun. Salah satu model regresi yang dapat digunakan untuk menjelaskan hubungan antara variabel respon Y yang berupa data diskrit dengan variabel prediktor X berupa data diskrit, kontinu, kategorik atau campuran adalah model regresi Poisson. Model regresi Poisson berasal dari distribusi Poisson dengan parameter intensitas yang bergantung pada variabel prediktor. Dalam model regresi Poisson terdapat beberapa asumsi yang harus dipenuhi yakni equidispersi yang berarti nilai variansi dari variabel respon Y yang diberikan oleh X = x harus sama dengan nilai meannya yaitu ( ) ( ) Var Y x = E Y x = µ. Menurut McCullagh dan Nelder (1989), regresi Poisson merupakan bagian dari Generalized Linear Model (GLM) dimana GLM tidak mengharuskan variabel dependen berdistribusi normal dan tidak mengharuskan kehomogenan atau kekonstanan dari variansinya. Dalam Generalized Linier Model (GLM), terdapat 1
2 sebuah fungsi yang menghubungkan rata-rata dari variabel responnya dengan sebuah prediktor linier. Pada model regresi prediktor linier adalah hubungan E( Y x ) melalui fungsi log dan model regresi ini dikatakan mempunyai sebuah log link. Model regresi Poisson adalah Generalized Linear Model, sebab model regresi Poisson berhubungan dengan sebuah fungsi ekspektasi ke sebuah prediktor linear. Pendugaan koefisien parameter model regresi Poisson pada umumnya menggunakan metode Maksimum Likelihood dengan menggunakan pendekatan distribusi. Pada umumnya metode klasik ini hanya berkutat pada informasi saat ini yang diperoleh dari sampel tanpa memperhitungkan informasi awal dan hanya mendasarkan inferensinya pada sampel. Sehingga jika distribusi populasi tidak diketahui metode Maksimum Likelihood tidak dapat digunakan. Inferensi akan lebih bagus jika data yang digunakan adalah data gabungan antara data sampel saat ini dengan data penelitian sebelumnya (data prior). Metode inferensi dengan menggunakan data sampel dan data prior disebut dengan metode Bayes. Dalam mengestimasi parameter pada regresi Poisson menggunakan metode Bayesian tidak seperti pada kasus regresi biasa dengan distribusi prior untuk β adalah distribusi normal multivariat. Namun, pada regresi Poisson distribusi prior berasal dari hasil kelas dalam distribusi posterior yang normal multivariat untuk β. Selanjutnya, standar konjugat distribusi prior untuk Generalized Linear Model (GLM) tidak ada (kecuali untuk model regresi normal). Situasi dimana sebuah distribusi posterior yang diperoleh tidak dapat diselesaikan secara analitis seperti pada kasus regresi Poisson, maka untuk menghitung estimasi dari distribusi posterior dapat menggunakan menggunakan algoritma Markov Chain Monte Carlo (MCMC). Salah satu metode MCMC yang digunakan untuk membangkitkan barisan sampel dari suatu distribusi, yang sulit untuk dilakukan penarikan sampel secara langsung yaitu metode Algoritma
3 Metropolis Hasting. Pada tesis ini akan lebih lanjut dibahas mengenai estimasi parameter model regresi Poisson menggunakan Algoritma Metropolis Hasting. 1.2 Rumusan Masalah Berdasarkan uraian dalam latar belakang tersebut, penulis dapat merumuskan beberapa permasalahan yang menjadi kajian dalam penelitian ini, yaitu: 1. Bagaimana mengestimasi parameter model regresi Poisson menggunakan Algoritma Metropolis Hasting. 2. Bagaimana menerapkan analisis model regresi Poisson menggunakan Algoritma Metropolis Hasting. 1.3 Manfaat Penelitian 1. Menambah keilmuan Statistika terutama dibidang estimasi parameter model regresi Poisson dengan menggunakan Algoritma Metropolis Hasting. 2. Memberikan alternatif pilihan dari banyak pilihan untuk memecahkan masalah dalam analisis regresi Poisson. 1.4 Tinjauan Pustaka Pada umumnya ketika distribusi posterior pada regresi Poisson untuk suatu parameter β tidak memiliki bentuk yang mudah untuk dipahami maka tidak bisa lagi ditarik sebuah distribusi posterior bersyarat seperti pada Gibbs sampler. Menurut Hoff (2009) mengemukakan bahwa ketika distribusi prior konjugat atau semikonjugat digunakan, ditribusi posterior dapat didekati dengan metode Monte Carlo atau Gibbs sampler. Situasi dimana sebuah distribusi prior tidak tersedia atau tidak diinginkan, parameter pada distribusi bersyarat penuh tidak mempunyai sebuah standar bentuk dan Gibbs sampler tidak dapat dengan mudah digunakan. Sehingga dikenalkan Algoritma Metropolis Hasting sebagai metode yang umum didekati dari distribusi posterior sesuai dengan banyak kombinasi distribusi prior dan model sampling.
4 Sedangkan, menurut Gilks, Richardson, dan Spiegelhalter (1996) MCMC pada dasarnya adalah penggabungan Monte Carlo menggunakan rantai Markov. Bayesian, dan juga frequensi, membutuhkan gabungan distribusi probabilitas dimensi tinggi untuk membuat prediksi kesimpulan model parameter prediksi. Bayesian perlu penggabungan distribusi posterior dari model parameter yang diberikan pada data, dan frequentist membutuhkan gabungan atas distribusi nilai parameter yang diamati. Seperti dijelaskan, integrasi Monte Carlo menarik sampel dari distribusi yang diperlukan, dan kemudian membentuk rata-rata sampel dengan harapan perkiraan. Markov Chain Monte Carlo menarik sampel ini dengan menjalankan rantai Markov yang dibangun untuk waktu yang lama. Ada banyak cara untuk membangun rantai ini, diantaranya dengan menggunakan Gibbs Sampler, kasus khusus dari bentuk umum pada Metropolis. Penelitian tentang algoritma Metropolis Hasting sebelumnya juga telah dilakukan oleh Irwanti, Mukid, dan Rahmawati membahas tentang pembangkitan sampel random dengan algoritma Metropolis Hasting, sampel random yang digunakan adalah distribusi beta dan distribusi poisson lalu diaplikasikan dalam masalah yang sering ditemui. 1.5 Metodologi Penelitian Metode yang digunakan dalam penelitian ini adalah studi literatur. Dalam mempelajari Prior Non Konjugat dan Algoritma Metropolis Hasting digunakan refrensi dari buku A First Course in Bayesian Statistical Methods (Peter D. Hoff). Langkah awal dalam penelitian ini adalah dimulai dengan mempelajari tentang model regresi Poisson, kemudian dilanjutkan dengan mencari estimasi parameter menggunakan algoritma Metropolis Hasting.
5 1.6 Sistematika Penulisan Tesis ini disusun dengan sistematika penulisan sebagai berikut: BAB I PENDAHULUAN Bab ini berisi tentang Latar Belakang Masalah, Rumusan Masalah, Manfaat Masalah, Tinjauan Pustaka, serta Sistematika Penulisan. BAB II DASAR TEORI Bab ini membahas beberapa definisi, teorema-teorema yang menunjang pembahasan pada bab-bab berikutnya. BAB III PEMBAHASAN Bab ini akan membahas tentang pokok permasalahan utama yaitu estimasi parameter model regresi Poisson menggunakan algoritma Metropolis Hasting. BAB IV STUDI KASUS Bab ini membahas tentang penerapan analisis regresi Poisson menggunakan algoritma Metropolis Hasting. BAB V KESIMPULAN Bab ini membahas tentang kesimpulan yang diperoleh.