SEMINAR NASIONAL MAEMAIKA DAN PENDIDIKAN MAEMAIKA UNY 05 Pendeatan Hurdle Posson Pada Excess Zero Data S - 7 Def Yust Fadah, Resa Septan Pontoh Departemen Statsta FMIPA Unverstas Padadaran def.yust@unpad.ac.d Abstra Model HurdlePosson dgunaan untu menelasan hubungan antara varabel respon yang berupa count data dengan varabel predtor yang berupa ontnu, dsrt atau campuran antara eduanya. Pada beberapa asus tertentu, varabel respon meml nla nol yang berlebh sehngga menyebaban teradnya overdspers. Oleh arena tu, untu mengatas overdspers dapat dgunaan pendeatan hurdle posson. Model Hurdlepossonmerupaan ombnas antara model logt dan truncated posson. Penasran parameter dapat dlauan secara terpsah sehngga nterpretas lebh mudah. Kaan peneltan n adalah memodelan umlah asus dfter d Provns Jawa Barat yang merupaan provns dengan penderta dfter terbanya elma d Indonesa. Berdasaran hasl pemodelan hurdle dapat detahu fator-fator yang berpengaruh secara sgnfan terhadap dfter. Jawa Barat. Dharapan dengan detahu fator-fator yang berpengaruh dapat dasan sebaga masuan epada pemerntah untu menean umlah penderta dfter d Jawa Barat. Kata unc:dfter, excess zeros, hurdle posson I. PENDAHULUAN Pada asus tertentu, varabel peneltan mengandung excess zeros data. Excess zeros data menghaslan nla nol yang cuup banya. Penggunaan metode analss regres lner las dengan metode Ordnary Least Square (OLS) pada excess zeros data aan menmbulan bas dalam data []. Hal n dsebaban observas yang bernla nol tda dsertaan dalam persamaan regres, sehngga tda aan ddapatan hasl yang optmal. Estmas yang dhaslan menad tda onssten [].Namun deman dalam asus tertentu terdapat seumlah fenomena dmana varabel respon berbentu dsrt, sehngga analss dengan regres lner ganda atau regres las tda lag memberan hasl yang tepat dan mengabatan esalahan dalam penaran esmpulan. Salah satu model regres yang dapat dgunaan untu menelasan hubungan antara varabel respon yang berupa count data dengan varabel predtor yang berupal ontnu, dsrt atau campuran antara eduanya adalah regres posson.aan tetap pada beberapa asus tertentu terdapat nla nol yang berlebh pada varabel respon sehngga menyebaban teradnya overdspers. Untu mengatas masalah overdspers maa dgunaan pendeatan model hurdle. Pendeatan model hurdle aan daplasan pada asus penyat dfter. Penyat dfter merupaan salah satu penyat menupaan salah satu penyat menular yang oleh bater Corynebacterum dphtherae. Dfter menyerang sstem pernapasan bagan atas ana-ana usa -0 tahun [3]. Geala penyat n adalah sat tenggoroan, demam, sult bernapas dan menelan, mengeluaran lendr dar mulut dan hdung, dan sangat lemah. Kuman dfter dsebaran melalu caran dar mulut atau hdung orang yang ternfes, ar-ar atau handu yang terontamnas, dan dar susu yang terontamnas penderta. Dfter dapat dcegah dengan munsas DP (Dfter Pertuss etanus). Penderta dfter d Provns Jawa Barat menempat poss elma besar d Indonesa [4]. Berdasaran referens [4], banya penderta dfter d Jawa Barat mengalam penngatan yang dlaporan d tahun sebelumnya tda dtemuan penderta dfter. Dharapan dengan peneltan n dapat menad pror rset mengena asus dfter d Jawa Barat. II. MEODE PENELIIAN A. Model Hurdle Salah satu pendeatan yang dapat dgunaan untu mengatas overdspers adalah model Hurdle. Overdpers terad eta varans lebh besar dar rata-rata. Salah satu penyebab terad overdspers adalah banyanya nla nol pada varabel respon [5]. Pada model hurdle dlauan dua ens pemodelan. 3
ISBN. 978-60-73403-0-5 Pemodelan pertama memodelan observas yang bernla nol dengan menggunaan model logst. Fungs hubung model logst adalah logt sesua dengan (). z logt () Pemodelan edua memodelan observas yang bernla postf dengan menggunaan truncated posson. Fungs hubung yang dgunaan adalah log yang dtunuan pada () log () ( ) x `Msalan varabel respon y dengan,,..., n. Dmana z dan x vector ovarat pada varabel predtor. Sementara adalah parameter dar model logt dan adalah parameter oefsen regres untu model truncated. Berdasaran () dan () maa fungs peluang model hurdle secara umum adalah exp( z ) (3) P Y y ) ( (exp( x )) y [ C] {(exp( x )) ] y! Fungs peluang pada model hurdle merupaan gabungan antara peluang pada model logt dan model truncated posson [6]. Penasran parameter model hurdle menggunaan metode Maxmum Lelhood Estmaton (MLE). Nla masmum fungs lelhood dapat dperoleh dengan cara menurunan fungs lelhoodnya terhadap parameter yang dcar yang emudan dsama denganan nol. Fungs yang dhaslan tda lnear sehngga dselesaan dengan algortma Fsher Scorng. Fungs lelhood model hurdle adalah exp( z ) (exp( x )) y L(, ) 0 y exp( ) 0 z exp( z ) {(exp( x )) ] y! (4) B. Penguan Parameter Model Hurdle Persamaan yang mengandung beberapa varabel predtor dan berpengaruh terhadap varabel respon dapat dlauan penguan dengan lelhood rato test []. Lelhood ratotest dgunaan untu mengu estmas parameter secara serenta, sedangan u wald dgunaan untu penguan secara ndvdu. U Serenta U serenta dgunaan untu mengu parameter secara bersama-sama. Hpotess yang dgunaan adalah sebaga berut : H 0 0 H mnmal ada salah satu yang tda sama dengan 0 Statst U yang dgunaan adalah 3
SEMINAR NASIONAL MAEMAIKA DAN PENDIDIKAN MAEMAIKA UNY 05 L( ˆ) G ln L( ˆ ) Dmana L (ˆ ) = nla masmum lelhood tanpa varabel predtor tertentu L (ˆ ) = nla masmum lelhood dengan varabel predtor tertentu H 0 dtola a G (, ), arena Dmana adalah banyanya varabel predtor model atau a atau lebh yang berpengaruh pada model. U Parsal G secara asymptotcally mengu dstrbus ch-square. (5) yang berart ada salah satu U Parsal dgunaan untu untu penguan ndvdu yang menunuan apaah suatu varabel bebas sgnfan atau laya untu masu model. Penguan parameter parsal untu masng-masng bagan logt dan runcated Posson dgunaan untu mengu masng-masng parameter Penguan yang dgunaan adalah Wald test [6]. Hpotess model logt H : 0 0 H : 0, dmana,,, Statst u Wald yang dgunaan adalah Hpotess model truncated Posson H : 0 0 H : 0, dmana,,, Statst u Wald yang dgunaan adalah W ˆ SE( ˆ ) W ˆ (6) SE( ˆ ) (7) Z / Berdasaran (6) dan (7) H 0 dtola a parameter berpengaruh. Sampel besar mengut sebaran normal, maa rtera penguan dbandngan dengan tabel normal Z. W, atau a yang berart bahwa C. Data Peneltan Data yang dgunaan pada peneltan n adalah data seunder yang dperoleh dar Dnas Kesehatan Provns Jawa Barat tahun 0. Varabel peneltan yang dgunaan terdr dar varabel respon (Y) yatu umlah asusdfter d abupaten/ota Provns Jawa Barat dan beberapa varabel predtor yang dduga berpengaruh antara lan persentase balta gz buru (X ), umlah caupan Imunsas DP+HB (X ), umlah caupan Imunsas DP3+HB3 (X 3 ), persentase Rumah Sehat (X 4 ), rata-rata epadatan penghun rumah (X 5 ) dan persentase eluarga dengan sumber ar mnum terlndung (X 6) D. Langah Peneltan Langah-langah yang dlauan pada peneltan n adalah melauan analss desrptf varabel peneltan. Kemudan melauan penasran parameter model hurdle. Setelah dperoleh parameter model hurdle maa langah berutnya adalah melauan penguan parameter model hurdle secara serenta dan parsal. Berdasaran hasl penguan parameter hurdle maa dapat dlauan analss dan menympulan fator-fator yang berpengaruh terhadap penyat dfter. 33
ISBN. 978-60-73403-0-5 III. HASIL DAN PEMBAHASAN Pada bagan n duraan tentang desrps asus penyat dfter d Jawa Barat. Selan tu uga duraan persebaran asus penyat dfter beserta faor-fator yang mempengaruhnya dengan menggunaan model hurdle. A. Desrps Varabel Peneltan Jumlah asus penyat dfter d Jawa Barat sebanya 3 asus yang tersebar pada 6 abupaten/ota. erdapat 6 abupaten/ota yang tda dtemuan asus dfter. Sementara tu umlah asus penyat dfter palng banya d Kabupaten Karawang dan Kabupaten Beas sebanya 7 asus. Persebaran asus dfter d Jawa Barat tahun 0 dsaan pada Gambar. Sumber : Dolah dar data Dnas Kesehatan 0 GAMBAR. KASUS PENYAKI DIFERI DI JAWA BARA B. Pemodelan Penyat Dfter Hasl penasran parameter dar model hurdle terdr dar model logt dan model truncated posson. Penguan secara serenta modelhurdle dapat dlhat dar nla ch-square htung dbandngan dengan tabel ch-square. Nla ch-square htung adalah 3,87 yang lebh besar dar =.59. Hal n berart bahwa mnmal ada satu parameter yang berpengaruh secara sgnfan terhadap model. Penasran model logt dsaan pada abel. ABEL. ESIMASI PARAMEER MODEL LOGI Parameter Estmate Std. Error z value Pr(> z ) -7,7784 5,354 -,486 0,37 0 0,833,4088 0,0 0,84 0,070 0,7665 0,7 0,787-0,675 0,784-0,4 0,83 3 4 0,000 0,04 0,03 0,98,449,05,0367 0,06* 5 0,005 0,0344 0,07 0,943 6 Berdasaran tabel dapat detahu bahawa varabel predtor yang sgnfan dengan tngat esalahan 5% pada model logt adalah rata-rata epadatan penghun rumah (X 5 ). Model logt dapat dataan sebaga ndator apaah suatu abupaten/ota d Provns Jawa Barat meml ecenderungan dtemuan eadan dfter atau tda. Persamaan model logt berdasaran tabel adalah 34
SEMINAR NASIONAL MAEMAIKA DAN PENDIDIKAN MAEMAIKA UNY 05 logt 7,7784, 449 X - 5 (8) Dar hasl (8), hal n berart bahwa seman padat penghun rumah maa ecenderungan suatu abupaten/ota d Provns Jawa Barat dtemuan asus dfter seman tngg. Setap penambahan satu penghun rumah maa cenderung aan dtemuan asus dfter d abupaten/ota sebesar exp (,449) =,58 al. Hasl penasran parameter dar model truncated posson dsaan dar tabel. Berdasaran tabel dapat detahu bahwa varabel predtor yang sgnfan pada taraf esalahan 5% adalah rata-rata epadatan penghun rumah (X 5 ) dan persentase eluarga dengan sumber ar mnum terlndung (X 6 ). ABEL. ESIMASI PARAMEER MODEL RUNCAED POISSON Parameter Estmate Std. Error z value Pr(> z ) (Intercept) -,68359 3,558-0,474 0,6354 x,6939,378 0,85 0,394 x 0,569 0,445 0,595 0,557 x3-0,869 0,455-0,634 0,56 x4-0,04633 0,03448 -,344 0,79 x5,03476 0,8583,386 0,07 x6 0,0305 0,009,568 0,00 Persamaan model truncated posson adalah exp(,68359,03476 X 5 0,0305 X ) 6 Berdasaran (9), hal n berart bahwa seman padat penghun rumah dan seman tngg persentase sumber ar mnum terlndung maa ecenderungan suatu abupaten/ota d Provns Jawa Barat dtemuan asus dfter seman tngg. Setap penambahan satu penghun rumah maa aan menngatan rata-rata terad asus dfter d abupaten/ota adalah exp (,03476) = 7,6504. Selan tu setap penambahan satu persen sember ar mnum terlndung maa aan menngatan rata-rata terad asus dfter adalah exp (0,0305) =,0354. IV. SIMPULAN DAN SARAN Berdasaran hasl pemodelan dperoleh varabel yang berpengaruh terhadap umlah asus dfter adalah rata-rata epadatan penghun rumah pada model logt sedangan rata-rata epadatan penghun rumah dan persentase eluarga dengan sumber ar mnum terlndung pada model hurdle. Peneltan n belum memperhatan adanya penclan (outler) dalam pemodelan. Perlu dlauan pemodelan Hurdle Posson yang mempertmbangan adanya penclan dengan metode robust. DAFAR PUSAKA []W.H.Greene, Econometrcs Analyss, 6thedton, New Jersey: Prentce Hall, 008. [] J.S.Long, Regresson Models for Categorcal and Lmted Dependent Varables, Calforna: Sage Publcatons Inc, 997. [3] Kemenes. Laporan Rset Kesehatan Dasar, Jaarta: BPPK Kemenes RI, 03. [4] Dnas Kesehatan Provns Jawa Barat. Profl Kesehatan Provns Jawa Barat ahun 0, Bandung: Dnas Kesehatan Provns Jawa Barat,0. 35
ISBN. 978-60-73403-0-5 [5] C.J.W. Zorn, Evaluatng Zero Inflated and Hurdle Posson Specfcatons, Oho State Unversty: Mdwest Poltcal Scence Assosaton, 996. [6] E.CantonandA.Zedn, A Robust Verson of the Hurdle Model, Journal of Statstcal Plannng and Inference, Vol.4(3), pp:4-3, 00. 36