E-Jurnal Matematika Vol., No., Mei 013, 49-53 ISSN: 303-1751 PENERAPAN REGRESI GENERALIZED POISSON UNTUK MENGATASI FENOMENA OVERDISPERSI PADA KASUS REGRESI POISSON I PUTU YUDANTA EKA PUTRA 1, I PUTU EKA NILA KENCANA, I GUSTI AYU MADE SRINADI 3 1,,3 Jurusan Matematika FMIPA Universitas Udayana, Bukit Jimbaran-Bali e-mail: 1 yudantaekautra@yahoo.com, i.utu.enk@gmail.com, 3 srinadiigustiayumade@yahoo.co.id Abstract The Poisson regression is generally used to analyze the resonse variable that is a discrete data. Poisson regression has assumtion which must be met, that is condition equidisersion. But in fact this assumtion is often violated, that is the value of the variance is greater or less than the mean value. The condition when value of the variance is greater than the mean value is called overdisersion. One method that can be used for overdisersion data is Generalized Poisson regression. In this research, it was found that the Generalized Poisson regression method was better than Poisson regression method. Keywords: Poisson Regression, Overdisersion, Generalized Poisson regression. 1. Pendahuluan Analisis regresi Poisson meruakan metode regresi yang digunakan untuk menganalisis data yang variabel resonnya berua data diskret. Pada regresi Poisson terdaat asumsi yang harus dienuhi, yaitu nilai varians dan rata-rata dari variabel reson tersebut sama atau equidisersi (Myers et al. [3]). Namun dalam kenyataan di laangan sering terjadi elanggaran asumsi tersebut, yaitu nilai variansnya lebih besar dari nilai rata-rata yang dinamakan overdisersi atau nilai variansnya lebih kecil dari nilai rata-rata yang dinamakan underdisersi (Wang & Famoye [5]). Jika terjadi fenomena overdisersi ada data, maka regresi Poisson kurang akurat digunakan untuk analisis, karena berdamak ada nilai standard error menjadi under estimate (lebih kecil dari nilai sesungguhnya), sehingga kesimulan yang dieroleh menjadi tidak valid (McCullagh & Nelder []). Untuk mengatasi masalah overdisersi tersebut, salah satu metode yang daat digunakan adalah analisis regresi Generalized Poisson yang meruakan erluasan dari regresi Poisson. Tujuan enelitian ini adalah untuk mengetahui model regresi Poisson dan model regresi Generalized Poisson untuk data variabel reson yang mengalami 1 Mahasiswa Jurusan Matematika FMIPA Universitas Udayana,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana
I P. Yudanta Eka Putra, I P.E. Nila Kencana, I G.A.M. Srinadi Peneraan Regresi Generalized Poisson overdisersi, dan mengetahui metode analisis regresi yang lebih baik digunakan untuk data variabel reson mengalami overdiersi aabila dilihat dari nilai Pearson chi-square, AIC (Akaike s Information Criterion), BIC (Bayesian Information Criterion), Log likelihood dan Likelihood ratio. Kondisi overdisersi daat dilihat dari nilai taksiran disersi yaitu nilai Pearson chi-square/df dan Deviance/df nilai keduanya lebih besar dari 1, kemudian dilanjutkan dengan melakukan uji rasio disersi (α) (Setyawan [4]) untuk memertegas nilai taksiran disersi. Metode yang daat digunakan menganalisis data yang mengalami overdisersi salah satunya adalah regresi Generalized Poisson, regresi Generalized Poisson meruakan erluasan dari regresi Poisson yang daat mengatasi keadaan overdisersi/underdisersi (Wang & Famoye [5]). Hubungan nilai rata-rata dan varians dalam regresi Generalized Poisson daat dikondisikan sebagai berikut, 1) Jika nilai varians sama dengan nilai rata-rata E Y i x i = Var Y i x i, maka nilai arameter disersi k = 0, sehingga fungsi densitas eluang Generalized Poisson, akan diturunkan ke regresi Poisson. ) Jika nilai varians lebih besar dari nilai rata-rata E Y i x i < Var Y i x i, maka nilai arameter diserse k > 0, sehingga daat dikatakan ada data terjadi overdisersi. 3) Jika nilai varians lebih kecil dari ada nilai rata-rata E Y i x i > Var Y i x i, maka nilai arameter disersi k < 0, sehingga ada data terjadi underdisersi. Pada enelitian ini dalam menentukan metode analisis terbaik antara regresi Poisson dengan regresi Generalized Poisson daat dilihat dari nilai Pearson chi-square/df, AIC, BIC, Log likelihood, dan Likelihood ratio, dengan kriteria nilai Pearson Chi-square yang mendekati df yang lebih baik, nilai AIC dan BIC yang memunyai nilai lebih kecil menunjukkan model yang lebih baik, dan nilai Log likelihood yang memunyai nilai lebih besar menunjukkan metode yang lebih baik Perbedaan antara metode regresi Poisson dan regresi Generalized Poisson secara teori disajikan ada Tabel 1. 50
e-jurnal Matematika Vol., No., Mei 013, 49-53 Tabel 1. Perbedaan Regresi Poisson dengan Regresi Generalized Poisson Kriteria Poisson Generalized Poisson Fungsi densitas f y i = e μ y iμ i i P Y i = y i y i! μ y i i (1 + kyi ) y i 1 = ex μ i 1 + ky i 1 + kμ i y i! 1 + kμ i Rata-rata dan ragam E y = Var y = μ E y = μ Var y = μ i (1 + kμ i ) Penduga Maximum likelihood Maximum Likelihood n y arameter μ i n y i=1 i ex i=1 μ i i ex β n 0 + β j x ji 1 + ky y i 1 i=1 y i! i n 1 + k ex β 0 + β j x y ji i! Uji signifikansi W = β j SE β j i=1 ex ex (β 0 + β j x ji ) 1 + ky i 1 + k ex (β 0 + β j x ji W = β j SE β j H 0 :β j =0 H 1 :β j 0 H 0 :β j =0 H 1 :β j 0 Parameter - K diserse Model y i = ex(x T i β) y i = ex(x T i β). Metode Penelitian ) Data yang digunakan ada enelitian ini adalah data sekunder yang dieroleh dari Dinas Pendidikan Pemuda dan Olahraga Provinsi Bali, berua variabel reson ada enelitian ini adalah jumlah siswa SMA/SMK yang tidak lulus UN tahun 01 tia kabuaten di Provinsi Bali. Variabel bebas ada enelitian ini adalah jumlah sekolah SMA/SMK negeri tia kabuaten di Provinsi Bali, jumlah ruang kelas SMA/SMK rusak tia kabuaten di Provinsi Bali, jumlah guru S untuk SMA/SMK tia kabuaten di Provinsi Bali, jumlah siswa SMA/SMK yang mengikuti UN tia kabuaten di Provinsi Bali. Adaun langkah-langkah analisis ada enelitian ini ialah mendeskrisikan data siswa SMA/SMK yang tidak lulus UN 01 di Provinsi Bali, selanjutnya mencari model regresi Poisson dari data dan memeriksa terjadinya overdisersi, kemudian melakukan analisis data menggunakan analisis regresi Generalized Poisson, setelah itu mencari metode analisis yang lebih baik antara analisis regresi Poisson dengan regresi Generalized Poisson aabila dilihat dari kriteria Pearson Chi-square, AIC, BIC, Likelihood ratio (Ismail & Jemain [1]), dan sebagai langkah terakhir adalah menginterretasi hasil erbandingan dari model regresi Poisson dan Generalized Poisson. 51
I P. Yudanta Eka Putra, I P.E. Nila Kencana, I G.A.M. Srinadi Peneraan Regresi Generalized Poisson 3. Hasil dan Pembahasan Deskrisi data siswa SMA/SMK tidak lulus UN 01 ada enelitian ini disajikan ada Tabel. Tabel. Deskrisi Data Penelitian X 1 X X 3 X 4 Y Mean 10,89 15,90 34,11 4983,00 4,11 Simangan Baku 4,57 91,90 13,75 51,00 5,4 Ragam/Mean 1,91 676,77 5,54 1.66,33 7,14 Nilai Minimum 7 1 17 171 0 Nilai Maksimum 903 58 10176 17 Model full regresi Poisson dari data yang dianalisis adalah sebagai beriku: μ = ex( 1,61 + 0,1619X 1 + 0X 0,099X 3 + 0,000X 4 ) Selanjutnya dilakukan emeriksaan overdisersi dengan menghitung nilai taksiran disersi seerti disajikan ada Tabel 3 berikut: Tabel 3. Taksiran Disersi kriteria df Nilai nilai/df Deviance 4 1,866 5,4666 Pearson Chi-square 4 19,331 4,8330 Namun untuk lebih jelasnya akan dilakukan uji lanjutan mengunakan uji statistika rasio diersi (a) dengan hiotesis uji sebagai berikut H 0 : a = 1 (ada data tidak terjadi overdisersi) H 1 : a > 1 (ada data terjadi overdisersi) dengan statistik uji nilai deviance yaitu 1,866 > χ 0.05,4 = 9,48773, yang berarti H 0 ditolak. Hal ini menunjukkan bahwa terjadi overdisersi ada regresi Poisson. Oleh karena itu, selanjutnya akan dianalisis dengan menggunakan metode regresi Generalized Poisson. Model full regresi Generalized Poisson dari data yang dianalisis adalah: μ = ex( 1,4116 + 0,345X 1 + 0,00059X 0,1548X 3 + 0,000573X 4 ) Untuk menentukan metode yang terbaik berikut disajikan Tabel Kriteria Model Tabel 4. Kriteria Model Kriteria Poisson Generalized Poisson Pearson Chi-square 19,331 4,64 AIC 53,853 5,30 BIC 54,8393 53,48 Log Likelihood -1,966-0,15 Berdasarkan Tabel 4, daat diketahui metode regresi Generalized Poisson lebih baik dari ada regresi Poisson. Namun untuk lebih mertegas berikut disajikan Tabel nilai Standard Error 5
e-jurnal Matematika Vol., No., Mei 013, 49-53 Variabel bebas Tabel 5. Nilai Standard Error Standar error regresi Poisson Standar error regresi Generalized Poisson Intercet 0,6900 1,338500 X1 0,08 0,900 X 0,0009 0,001571 X3 0,0509 0,180500 X4 0,000 0,000587 Berdasarkan nilai standard error yang disajikan ada tabel 5 terlihat nilai standard error ada regresi Generalized Poisson mengalami eningkatan atau under estimate yang terjadi ada regresi Poisson telah diatasi sehingga metode Generalized Poisson lebih baik. 4. Kesimulan Berdasarkan data ketidaklulusan siswa SMA/SMK dalam mengikuti UN 01 yang dieroleh dari Dinas Pendidikan Pemuda dan Olahraga Provinsi Bali yang telah dianalisis menggunakan software SAS 9., model regresi Poisson yang dieroleh untuk data tersebut adalah μ = ex( 1,61 + 0,1619X 1 + 0X 0,099X 3 + 0,000X 4 ) Sedangkan model regresi Generalized Poisson yang dieroleh adalah μ = ex( 1,4116 + 0,345X 1 + 0,00059X 0,1548X 3 + 0,000573X 4 ) Dilihat dari kriteria model terbaik yaitu nilai Pearson Chi-square, AIC, BIC, Log Likelihood, dan Likelihood Ratio maka daat disimulkan metode regresi Generalized Poisson lebih baik untuk menganalisis. Daftar Pustaka [1] Ismail, Noriszura & Abdul Aziz Jemain. 005. Generalized Poisson Regression: An Alternative For Risk Classification. Jurnal Teknologi, 43, 1, 39-50. htt://www.jurnalteknologi.utm. diakses tanggal 1 Oktober 01. [] McCullagh, P. & Nelder, J.A. 1989. Generalized Linier Models, second edition. London: Chaman & Hall. [3] Myers, R.H., Montgomery, D.C., Vining, G.G., & Robinson, T.J. 010. Generalized Linier Models with Alications in Engineering and the Sciences. Canada : A John Wiley & Sons, Inc., Publication. [4] Setyawan, Aji. 01. Perbandingan antara Regresi Poisson, Binomial Negatif dan Zero-Inflated Poisson ada Data Overdisersi. [Skrisi]. htt://www.reository.ib.ac.id ada tanggal 1 Maret 013. [5] Wang, W. & Famoye, F. 1997. Modeling household fertility decision with generalized Poisson regression. Journal of Poulation Economics, 10, 3, 73-83. htt://www.jstor.org diakses ada tanggal 7 Januari 013. 53