Vol. 4, No.1, 19-25, Jul 2007 Suatu Tjaua Tetag Geeralzed Estmatg Equato Muhammad Abdy Abstrak Geeralzed Estmatg Equato (GEE) yag pertama kal dperkealka oleh Lag da Zeger pada tahu 1986 telah medapat perhata yag luas dar beberapa tahu terakhr da beberapa perluasa dar metode tersebut telah dkembagka. Pada tulsa aka dsajka metode GEE da beberapa perluasaya, da pada baga terakhr dar tulsa aka dberka cotoh data yag aka daalss dega megguaka metode GEE. Kata kuc: geeralzed estmatg equato, logtudal, regres. 1. Pedahulua Tujua utama dar aalss dalam sebaga besar model aalss regres adalah megetahu atau memerksa pegaruh kovarat-kovarat tertetu terhadap varabel respo. Berbaga metode telah terseda utuk megestmas parameter-parameter dalam model regres dega varabel respo yag berdstrbus ormal da kotu. Aka tetap, dalam aplkas serg djumpa varabel respo yag tdak ormal da kategork sehgga aka memerluka metode pedugaa yag la utuk megestmas parameter-parameterya. Geeralzed Lear Model (GLM) yag dperkealka oleh Nelder da Wedderbur pada tahu 1972 merupaka salah satu model regres utuk megaalss varabel respo yag dskrt maupu kotu da tdak perlu berdstrbus ormal tetap termasuk dalam dstrbus keluarga ekspoesal. Hubuga atara varabel respo da kovarat dyataka dega suatu fugs yag dsebut fugs lk. GLM megasumska bahwa pegamata adalah depede da tdak mempertmbagka adaya korelas datara outcome dar buah pegamata. Pada pegumpula data yag bersfat logtudal, yatu data cross-sectoal yag dukur atau damat secara berulag dalam uruta waktu, aka meyebabka terjadya terkorelas datara outcome-outcome. Metode pedugaa yag selama dguaka tdak aka vald lag karea metode-metode tersebut megasumska bahwa pegukura outcomeoutcome tersebut adalah depede. Utuk megatas adaya terkorelas datara outcomeoutcome tersebut, maka GLM dperluas atau dkembagka lag sehgga mucul model-model margal (margal models) da model-model pegaruh acak (radom effect models). Dalam model margal, perhata utama aalssya adalah memodelka ekspektas margal varabel respo. Korelas datara varabel outcome dmodelka secara terpsah da dpadag atau daggap sebaga parameter peggagu (usace parameters). Model margal pertama kal dperkealka oleh Zeger, Lag da Self (1985), Lag da Zeger (1986) da Zeger da Lag (1986). Dalam artkel-artkel tersebut, peulsya memberka defs secara rc tetag pedekata tersebut da memberka beberapa cotoh aplkas. Pedekata tersebut dstlahka dega Geeralzed Estmatg Equato (GEE). Sampa sekarag GEE juga sudah megalam perkembaga yag pesat da sudah terjad beberapa modfkas utuk Jurusa Matematka FMIPA Uverstas Neger Makassar Emal: muh.abdy@um.ac.d, abdy02@yahoo.com
20 megakomodr berbaga macam permasalaha dalam data. Pemakaa metode GEE sudah sagat meluas dataraya dalam bdag peelta kesehata da geetka. GEE 1 GEE merupaka perluasa dar GLM utuk megakomodr data yag berkorelas. Metode GEE memodelka suatu fugs yag dketahu dar ekspektas margal varabel respo sebaga fugs lear dar satu atau lebh varabel predktor. Dalam metode, kta tdak mespesfkaska secara peuh dstrbus bersama dar varabel-varabel respos, tetap haya mespesfkaska fugs lk, hubuga atara mea da varas respo serta struktur kovaras dar pegamata dalam subjek. GEE orde satu merupaka GEE yag belum megalam modfkas. Msalka y t adalah suatu predktor respo dar kelompok dega T pegamata utuk kelompok ke-, =1,2,,. Utuk setap y t, beberapa kovarat x t terseda, dmaa eleme pertama dar x t adalah 1, yag merupaka tersep. Data dapat dyataka dega predktor y da matrks X = (x 1, x 2,, x T ). Pasaga (y, X ) dasumska berdstrbus detk depede. Msalka E(y t X ) = E(y t x t ) = x t, dmaa adalah suatu predktor parameter berukura (p1) yag tdak dketahu. Selajutya dasumska bahwa matrks varas bersyarat dar y dberka X adalah dketahu, yatu kov(y X ) = V, maka estmator model regres lear multvarate dapat dperoleh melalu persamaa estmas: () = 1 X V-1 (y - ) = 0, (1) dmaa X da y masg-masg berasal dar matrks X da predktor y, V matrks dagoal dar V, berasal dar predktor = (). Estmator tersebut d atas tdak bas da berdstrbus ormal asmptotk. Matrks kovarasya merupaka vers dar matrk formas Fsher. Jka cov(y X ) = V, maka estmator tersebut mash tak bas. Matrks varasya berbetuk: V ( ˆ ) = (X V -1 X) -1 (X V -1 V -1 X)( X V -1 X) -1 (2) Suatu estmator dar (2) dapat dperoleh dega meggat dega: =(y - ˆ )( y - ˆ ), dmaa ˆ = x βˆ. Matrks kovara V yag fx dapat dgat dega V =V () yag bergatug pada suatu parameter assosas. Estmator βˆ dperoleh dega prosedur dua tahap; yatu, tahap pertama adalah medapatka parameter assosas ˆ utuk da tahap kedua adalah medapatka βˆ utuk yag destmas. Pedekata dapat dguaka utuk memodelka ketergatuga d dalam kelompok pada model-model lear. Aka tetap, model lear tdak dapat meaga semua persoala-persoala dalam aplkas. Utuk pegamata depede, GLM mempuya fleksbltas dalam memodelka struktur mea da varas. Dalam GLM tersebut, struktur mea, adalah E(y t X t ) = t = g( x t ), dmaa g adalah suatu fugs respos o-lear yag mooto. Ivers dar fugs g, yatu g -1 damaka fugs lk. Suatu sfat petg dar GLM adalah relas fugsoal datara mea da vara, yatu: v t = V(y t X t ) = h( t ), dmaa h dsebut fugs varas. Betuk dar dstrbus varabel respo aka meetuka betuk dar fugs lk da fugs varas dar GLM. Utuk pegamata depede, predktor parameter destmas dega megguaka metode kemugka maksmum. Persamaa kemugkaya berbetuk : 1-1 1 u() = DV ( y μ ) D`V -1 (y-) = 0 (3) =1
21 μ Dmaa D = β adalah matrks dagoal turua pertama da V = dag(v t ) adalah matrks dagoal dar varas. Persamaa (3) basa juga dsebut dega Idepedece Estmatg Equato (IEE). Solus dar (3) haya ada utuk model lear dega varabel respos berdstrbus ormal. Jka varabel respoya tdak berdstrbus ormal, maka harus dselesaka secara teratf. Estmator βˆ utuk (3) kosste da berdstrbus ormal asymptotk dega matrks kovaras kov( βˆ ) = (DV -1 D) -1 (Mc. Cullagh da Nelder J.A. 1983) Utuk pegamata yag berkorelas, matrks varas tdak dapat mempuya suatu betuk dagoal. Utuk data berkorelas, Zeger dkk. (1985) megusulka pegguaa estmator varas yag kekar (robust): 1 1 V ( βˆ ) ˆ ˆ 1 ˆ ˆ ˆ 1 ˆ 1 ˆ ˆ ˆ ˆ = DV D DV V D DV D (4) =1 1 1 Dalam persamaa tersebut d atas, ˆ merupaka matrks dagoal dar Ωˆ ( y μˆ )( y μ ˆ ) Estmas tersebut d atas tdak aka efse karea betuk dagoal V. Suatu pedekata yag dusulka oleh Lag da Zeger (1986) da Zeger da Lag (1986) memberka suatu estmas yag lebh efse dega megkombaska prosedur GLM da FGLS. Prosedurya adalah sebaga berkut: Padag suatu model utuk ekspektas da varas dega megguaka pedekata GLM. Dalam kasus, V tdak perlu berbetuk matrks dagoal tetap matrks kovaras sebakya medekat matrks kovaras yag sebearya. Utuk estmator R ˆ dar matrks korelas y dberka X, maka estmator utuk V berbetuk: ˆ ˆ1/ 2 ˆ ˆ1/ 2 V A R A (5) 1/ 2 dmaa A ˆ adalah vers dar akar kuadrat matrks dagoal yag destmas dar varas V t. R ˆ merupaka matrks TT deft postf yag meggambarka struktur assosas. Matrks R basa dstlahka dega matrks korelas kerja. Matrks destmas dega megguaka metode mome. Jka R ˆ merupaka matrks dettas, maka V pada persamaa (5) merupaka matrks dagoal yag aka sama dega V dalam persamaa (3). Dega matrks korelas kerja R ˆ da matrks dagoal A ˆ, Geeralzed Estmatg Equato (GEE) mempuya betuk: 1 1 ( ) ( ( )) 1 μ β D Vˆ y μ β 0 (6) Jka destmas megguaka persamaa (6), maka βˆ aka kosste jka t = E(y t X t ) = E(y t X ) dspesfkaska dega tepat. Demka juga estmator βˆ aka berdstrbus ormal asymptotk (Lag da Zeger, 1986). Varas dapat destmas secara kosste dega estmator kekar (4) da V destmas dega megguaka (5). Jka V dspesfkaska dega tepat, yatu ˆ = V, maka estmator βˆ aka efse. GEE 2 Dalam baga aka dbahas persamaa estmas yag memberka suatu estmator kosste dar mea. Persamaa estmas tersebut dsebut GEE 2. GEE 2 dpaka utuk estmas secara bersamaa dar mea da assosas (korelas). GEE 2 mempuya betuk:
22 0 1 V (y ) 0 y 1 0 (7) 1 0 (z ) 0 V z Dar persamaa (7) tersebut terlhat bahwa matrks turua pertama da matrks kovaras kerja merupaka matrks yag berbetuk dagoal. Dega demka persamaa (7) dapat dsederhaaka mejad: 1 1 V ( y ) kov( y, z ) y 1 kov( z, y ) V ( z ) z 0 (8) Dmaa merupaka suatu fugs dar parameter assosas, jka 0. Aka tetap asums tdak selalu dapat dlakuka. Lag pula sagat sult utuk megterpretas suatu vektor mea yag memasukka. Dalam kebayaka aplkas, la mea haya ddefska sebaga suatu fugs, da tdak bergatug pada. Betuk 0 dalam (8) megakbatka korelas merupaka suatu fugs dar. Dalam aplkas basaya dasumska 0. Sejauh kta haya medefska persamaa estmas dega megguaka korelas sebaga ukura assosas, padahal persamaa estmas dapat juga ddefska dega megguaka matrks kovaras, yatu: s tt = (y t - t ) (y t - t ) da tt = E(s tt ) = kov(y t, y t ) dguaka sebaga peggat dar z tt da tt. Turua pertama da matrks varas kerja harus dubah yag sesua. Sstem persamaa tersebut aka memeuh yag berkut: Jka da dspesfkaska dega tepat, sebaga fugs dar da, maka ˆα da βˆ dapat destmas secara kosste da estmator tersebut berdstrbus ormal asmptotk. Sstem persamaa dega matrks kovaras sagat jarag dguaka. Keutuga megguaka struktur kovaras utuk memodelka korelas adalah persamaa estmas dapat dperoleh dega suatu pedekata kemugka maksmum semu (KMS). Dega metode KMS, persamaa estmas dapat juga ddeskrpska dega megguaka mome kedua. Hubuga datara mome kedua da log odd rato dapat ddeskrpska dega mudah (Brshop, Keberg da Hollad, 1975). Jka persamaa (8) dguaka secara bersama-sama dega log odd raso da mea serta struktur kovara dspesfkaska dega bear, maka estmator kosste ˆα da βˆ ada da berdstrbus ormal asmptotk. Apabla terdapat kekelrua dalam mespesfkaska maka dapat meyebabka suatu estmas yag tdak kosste dar, karea da destmas secara smulta. Model orthogoal utuk parameter da da log odd rato utuk struktur assosas dapat dguaka utuk metrasformaska prosedur estmas ˆα da βˆ secara smulta ke dalam suatu prosedur dua tahap. Estmator βˆ aka kosste meskpu tdak dspesfkaska dega bear. Pedekata dsebut alterate logstc regresso, dmaa logt-lk dguaka
23 sebaga fugs lk. Utuk lebh detal tetag alterate logstc regresso, lhat Carey, Zeger da Dggle, 1993. Cotoh Data Berkut dberka data dar suatu hasl peelta tetag pegaruh polus udara terhadap aak-aak (Dggle, P. J, dkk. 1995). Peelt memerksa 25 aak da dcatat apakah aak-aak tesebut memperlhatka gejala wheezg. Tabel 1. d kota 8 th 9 th 10 th 11 th merokok gejala merokok gejala merokok gejala merokok gejala 1 A 0 1 0 1 0 1 0 0 2 A 2 1 2 1 2 1 1 0 3 A 2 1 2 0 1 0 0 0 4 B 0 0 1 1 1 1 0 0 5 A 0 0 1 0 1 0 1 0 6 B 0 1 0 0 0 0 0 1 7 A 1 1 1 1 0 1 0 0 8 B 1 0 1 0 1 0 2 0 9 B 2 1 2 0 1 1 1 0 10 A 0 0 0 0 0 0 1 0 11 A 1 1 0 0 0 0 0 1 12 B 0 0 0 0 0 0 0 0 13 A 2 1 2 1 1 0 0 1 14 B 0 1 0 1 0 0 0 0 15 A 2 0 0 0 0 0 2 1 16 B 1 0 1 0 0 0 1 0 17 B 0 0 0 1 0 1 1 1 18 A 1 1 2 1 0 0 1 0 19 A 2 1 1 0 0 1 0 0 20 B 0 0 0 1 0 1 0 0 21 A 1 0 1 0 1 0 2 1 22 B 0 1 0 1 0 0 0 0 23 B 1 1 1 0 0 1 0 0 24 A 1 0 1 1 1 1 2 1 25 B 0 1 0 0 0 0 0 0 Keteraga: A = kota yag mempuya bayak pabrk baja B = kota yag berbukt-bukt da bayak pepohoa yag tumbuh Pemerksaa dlakuka empat kal, yatu pada saat aak-aak berumur 8 tahu, 9 tahu, 10 tahu, da 11 tahu. Respoya adalah gejala wheezg pada aak-aak yag berla 1 jka ada gejala da 0 jka tdak ada gejala. Varabel predktorya adalah kota tempat tggal aak (dua kategor kota), tgkat keaktfa merokok dalam keluarga ( berla 0, 1, da 2), da varabel umur aak. Dataya sepert dalam Tabel 1 da sebaga hasl aalss sepert dalam Tabel 2. Data yag dhaslka dalam peelta merupaka data logtudal, da aka dolah dega
24 pedekata metode GEE 1 dega megguaka SAS (proc. GENMOD). Dar Tabel 2, terlhat bahwa kota tempat tggal bukalah suatu faktor peyebab gejala wheezg pada aak-aak. Aka tetap kebasaa merokok dalam keluarga mempuya pegaruh yag cukup sgfka, demka juga umur aak mempegaruh adaya gejala wheezg. Tabel. 2. Aalyss of GEE Parameter Estmates Emprcal Stadard Error Estmates Parameter Estmate Stadard 95% cofdece Z pr > z error Lmts Itercept 2.2615 2.0243-1.7060 6.2290 1.12 0.26396 A 0.0418 0.5435-1.0234 1.1070 0.80 0.9387 B 0.0000 0.0000 0.0000 0.0000.. Umur -0.3201 0.1884-0.6894 0.0492-1.70 0.0893 Merokok 0.6506 0.2821 0.0978 1.2035 2.31 0.0211 2. Kesmpula Pada baga, aka dberka beberapa rekomedas utuk pegguaa metode GEE. Utuk pegguaa prakts, beberapa rekomedas dperluka utuk memutuska apakah metode kemugka maksmum utuk dstrbus multvarate ataukah metode GEE yag seharusya dguaka. Secara umum, metode kemugka maksmum haya dguaka jka dstrbus legkap y dega syarat X dspesfkaska dega bear. GEE 1 meghaslka estmator yag tdak kosste utuk mea, jka tdak dspesfkaska dega bear. Pegguaa estmator kekar utuk varas harus dguaka jka ada kemugka terjad kesalaha spesfkas struktur assosas. Jka pemerksaa assosas merupaka tujua utama dar aalss, maka GEE 2 dapat dguaka karea estmas dar struktur mea-ya kosste meskpu assosas tdak dspesfkaska dega bear. Daftar Pustaka [1]. M. Abdy, 2003, GEE: Suatu Metode Estmas Parameter Model Regres utuk Data Logtudal Makalah Semar Nasoal Statstka ITS Pascasarjaa UGM. [2]. Y.M.M. Bshop, S.E. Feberg da P.W. Hollad, 1975, Dscrete Multvarate Aalyss: Theory ad Practce, MIT Press, Cambrdge. [3]. V. Cerey, S.L. Zeger ad P.Dggle, 1983, Modelg Multvarate Bary Data wth Alteratg Logstc regresso, Bometrka 80 : 517 526. [4] P.J.Dggle, K.Y.Lag da S.L. Zeger, 1995, Aalyss of Logtudal Data, Oxford Uversty Press, Oxford. [5] K.Y. Lag da S.L. Zeger, 1986, Logtudal Data Aalyss Usg GLM, Bometrka 73 : 13 22.
25 [6] P. Mc Cullagh da J.A. Nelder,1983, Quas Lkelhood Fucto, The Aals of Statstcs, 11 : 59 67. [7] J. Nelder da R.W.M. Wedderbur, 1972, Geeralzed Lear Models, Joural Royal Statstcs Socety A, 135 : 370 384. [8] S.L. Zeger da K.Y. Lag, 1986, Logtudal Data Aalyss for Dscrete ad Cotuous Outcomes, Bometrcs 42 : 121 130.