Paradgma, Vol. 13 No. 2 Agustus 2009 hlm. 189 194 MODEL REGRESI SEMIPARAMERIK SPLINE UNUK DAA LONGIUDINAL PADA KASUS KADAR CD4 PENDERIA HIV Lls Laome 1) 1) Jurusan Matemata FMIPA Unverstas Haluoleo Kendar 93232 ABSRAK Pemodelan data longtudnal telah dlauan dengan regres semparametr splne. Selanjutnya daplasan untu menduga pola hubungan CD4 awal (X) dengan adar CD4 pasen HIV (Y) dan watu pemersaan (t) dengan adar CD4 pasen HIV (Y), sehngga dperoleh model terba dengan melhat MSE terecl dan R 2 terbesar. Kata unc: data longtudnal, regres semparametr, splne ABSRAC he modelng of longtudnal data have been done wth splne semparametrc regresson. hen applcaton for estmatng CD4 number and pre-cd4 for a subject wth lnear parametrc pattern, and checng tme wth nonparametrc pattern, so that t s obtaned the best model wth the lowest MSE and the bggest R 2. Keywords: longtudnal data, semparametrc regresson, splne Dterma: 20 Maret 2009 Dsetuju untu dpublasan: 21 Agustus 2009 1. Pendahuluan Regres semparametr adalah gabungan antara regres parametr dan regres nonparametr. Peneltan tentang regres semparametr telah banya dlauan. Srnad telah menelt estmator splne pada model semparametr [1]. Mulanah menelt pendeatan ernel dalam regres semparametr dan pemlhan bandwdth optmal [2]. Ampa menelt model lner parsal pada hlangnya data omponen parametr [3]. Namun peneltan-peneltan tersebut hanya pada data cross secton atau data yang damat pada suatu watu tertentu. Untu asus husus, regres semparametr dapat dgunaan pada data longtudnal. Analss tentang pemodelan data longtudnal sudah banya daj oleh penelt. Brumbac dan Rce menggunaan smoothng splne dalam mengestmas fungs nonparametr pada data progesteron [4]. Namun peneltan tersebut hanya terbatas pada regres nonparametr. Kuswanto menggunaan model Gamma-Fralty untu memodelan data longtudnal [5]. Kemudan Zeger dan Dggle menelt model campuran
Model Regres Semparametr Splne untu Data Longtudnal pada Kasus Kadar CD4 Penderta HIV 102 semparametr untu data longtudnal menggunaan smoothng ernel, dalam rsetnya membahas tentang HIV berdasaran adar CD4 dalam darah [6]. Penggunaan estmator ernel dalam model semparametr pada data longtudnal, tda sesua untu data yang mempunya pola data yang rumt. Sehngga sult untu memperoleh estmas omponen nonparametr yang sesua. Zhang et al. menggunaan estmator splne untu mengestmas model semparametr [7]. Dalam paper n, dbahas penggunaan regres semparametr splne untu data longtudnal pada asus adar CD4. 2. Data Longtudnal Data longtudnal adalah data pengamatan berulang pada unt espermen, berbeda dengan data cross secton yatu data dar masng-masng ndvdu damat dalam seal watu [5]. Ada beberapa euntungan dar stud mengena data longtudnal dbandngan dengan data cross secton. Pertama, stud longtudnal lebh powerful dar stud cross secton untu sejumlah subje yang tetap. Dengan ata lan, untu memperoleh euatan uj statst yang sama, stud longtudnal membutuhan subje yang lebh sedt. Kedua, dengan jumlah subje yang sama, hasl penguuran error menghaslan penasr efe perlauan yang lebh efsen dar data cross secton. Ketga, data longtudnal mampu menyedaan nformas tentang perubahan ndvdu, sedangan data cross secton tda [5]. 3. Model Regres Semparametr untu Data Longtudnal Regres semparametr untu data longtudnal dapat dtuls dengan : y X β f ( t ), 1, 2,..., n ; j 1, 2,..., n (1) j j j j dmana terdapat n subje dengan subje e- mempunya n observas.menurut watu. y j, = 1,...,n, j = 1,...,n merupaan respon untu subje e- pada watu t j. β = (,,..., ) adalah vetor p 1 pada oefsen regres ovarat 1 2 p X, dengan j X β j dasumsan tda mempunya ntersep, f ( t ) adalah fungs yang terdeferensabel dua al j dengan panjang perode sama dengan dan adalah random error yang salng bebas j dengan mean 0 dan varans 2 R.
Paradgma, Vol. 13 No. 2 Agustus 2009 hlm. 101 106 103 a. Estmas parametr Secara umum bentu regres parametr lnear dgambaran sebaga berut [8] : y X, 1, 2,..., n (2) 0 1 atau dalam bentu matr dapat dtuls dengan : Y = Xβ + ε, dmana ε ~ N(0, 2 ) Estmas oefsen regres β dapat menggunaan metode uadrat terecl. Metode estmas n dlauan dengan memnmuman ε ε terhadap β. Untu ε ε ( Y Xβ) ( Y Xβ) dengan nol sehngga dperoleh estmator :, dengan menurunan ε ε tehadap β dan menyamaan ˆ -1 β = (X X) X Y (3) b. Estmas nonparametr Untu n pengamatan yang ndependen, ( t, y ), 1, 2,..., n, maa model regres secara umum dapat dtuls dengan : y f ( t ), 1, 2,..., n (4) dmana y adalah varabel respon e -, f ( t ) adalah fungs regres dan adalah error random yang dasumsan ndependen dan dent dengan mean 0 dan varans 2. Menurut Euban fungs regres f ( t ) dapat destmas menggunaan regres nonparametr [8]. Pendeatan nonparametr dgunaan untu mengestmas urva regres arena model tda dtentuan terlebh dahulu sepert pada regres parametr. Salah satu pendeatan nonparametr yang bsa dlauan adalah dengan fungs splne. dalam bentu : dengan Secara umum, fungs splne berorde adalah sembarang fungs yang dapat dtuls h j j 1 (5) S( t) t ( t )
Model Regres Semparametr Splne untu Data Longtudnal pada Kasus Kadar CD4 Penderta HIV 104 ( t ) j ( t ), t j 0, t j j dan adalah onstanta real dan,,..., adalah tt-tt not. 1 2 h 4. Aplas Pada peneltan n, dfousan untu melhat hubungan antara CD4 awal (X) dan watu pemersaan adar CD4 setelah terap (t) terhadap persentase adar CD4 setelah terfes HIV (Y), dmana CD4 awal merupaan varabel penjelas omponen parametr dan watu pemersaan merupaan varabel penjelas omponen nonparametr. Langah yang dlauan adalah memlh tt-tt not optmum pada pemodelan data secara parsal, sehngga dperoleh model parsal awal. Kemudan dar tt-tt nots optmum tersebut dbuat model smultan, sehngga dperoleh model semparametr berut : yˆ 0, 6 x x x... 0,1x 39,8 t j 2 j 3 j 52,3( t 0, 5) 13, 2( t 2, 4) 15,8( t 4, 96) 22,1t 17,3( t 1,5) 2 j 2 j (6)... 29, 9 t 99, 9 ( t 1, 5) 119, 5( t 2) 48, 4( t 2, 33) 1 dengan nla MSE dan R 2 masng-masng sebesar 7,096 dan 94,97 %. Pada data n terdapat orelas ddalam pengamatan berulang pada setap subje. Indas adanya orelas dapat terlhat pada varabel respon yang berpengaruh terhadap watu. Adanya asus orelas menunjuan bahwa model semparametr smultan (6) selayanya dsempurnaan dengan mengutan suatu bobot. Langah yang dlauan adalah menentuan bobot. Msal bobot yang dberan adalah W dan W*, sehngga dar edua bobot tersebut dperoleh model masng-masng sebaga berut : yˆ 0,43 x 0,91 x 1,17 x... 10,53 x 275,17 t + j 2 j 3 j 2 2 2 292,25 t 295,23( t 0, 5) 12,37 ( t 4, 22) (7) 22,1t 17, 3( t 2, 4)... 263,11t + 269,06 ( t 1, 4) 2 j 2 j
Paradgma, Vol. 13 No. 2 Agustus 2009 hlm. 101 106 105 yˆ 0,77 x 0,93 x 1,08 x... 0, 92x j 2 j 3 j 2 3 23,94 t 24,23 t 5,04 t 7,13 ( t 2, 2) 19, 39 t 14, 59( t 1, 6) 3 1 2 j 2 j (8)... 2,39 t + 7, 29( t 4,1) 1 Berdasaran model (7), nla MSE dan R 2 sebesar 1,72 dan 99,15%, sedangan pada model (8) nla MSE dan R 2 adalah sebesar 23,72 dan 94,92%. Berdasaran etga model smultan (6), (7), dan (8) terlhat bahwa model (7) mempunya nla MSE terecl dan nla R 2 yang lebh ba. Ahrnya dperoleh model parsal, msalan tga model parsal yatu untu pasen 1, pasen 6, dan pasen 43 masng-masng adalah : yˆ 0,43 x 275,17 t 292,25 t 295,23( t 0, 5) 2 2 = 2 12,37 ( t 4, 22), j 1, 2,...,12 (9) 2 2 y ˆ = 0,48 x +31,4 t +25,13 t 9, 39 ( t 2, 3), 6 j 6 j 6 j 6 j 6 j j 1, 2,...,11 (10) 1 y ˆ 0,59 x 4, 97 t +6,04 ( t 3, 7), 43 j 43 j 43 j 43 j j 1, 2,...,12 (11) Berdasaran etga model parsal (9), (10), dan (11), dapat dlhat bahwa untu etga pasen tersebut mempunya pola data yang berbeda. Khususnya pada pola perubahan adar CD4, untu pasen 1 pada model (9) terlhat pada watu 0,5 tahun dan 4,22 tahun mengalam perubahan pola. Sedangan untu pasen 6 pada model (10) terlhat pada watu 2,3 tahun. Dan untu pasen 43 pada model (11) terlhat pada watu 3,7 tahun. 5. Kesmpulan Pemodelan data longtudnal dengan regres semparametr splne telah dlauan pada asus menduga pola hubungan antara CD4 awal (X) dengan adar CD4 pasen HIV (Y) dan watu pemersaan (t) dengan adar CD4 pasen HIV (Y). Model yang dperoleh mempunya nla MSE terecl dan R 2 yang terbesar. Berdasaran model yang dperoleh menunjuan pola perubahan adar CD4 setap pasen berbeda-beda. Pasen 1 mengalam perubahan adar CD4 pada watu 0,5 tahun dan 4,22 tahun; pasen 6 mengalam
Model Regres Semparametr Splne untu Data Longtudnal pada Kasus Kadar CD4 Penderta HIV 106 perubahan adar CD4 pada watu 2,3 tahun; dan pasen 43 mengalam perubahan adar CD4 pada watu 3,7 tahun. DAFAR PUSAKA [1] Srnad, I.A.M. 2002. Estmator Splne pada Model Semparametr, ess. Surabaya : Insttut enolog Sepuluh Nopember. [2] Mulanah. 2006. Pendeatan Kernel dalam Regres Semparametr dan Pemlhan Bandwth Optmal, ess. Surabaya : Insttut enolog Sepuluh Nopember. [3] Ampa, A.. 2006. Model Lner Parsal pada Hlangnya Data Komponen Parametr, ess. Surabaya : Insttut enolog Nopember. [4] Brumbac, B. dan Rce, J.A. 1998. Smoothng Splne Models for the Analyss of Nested and Crossed Sampels of Curves. Journal of Amercan Statstcal Assocaton, 93 (443), 961-994. [5] Kuswanto, H. 2005. Model Gamma-Fralty untu Data Longtudnal dan Penggunaan Korelas Seral dengan Metode Composte Lelhood, ess. Surabaya : Insttut enolog Sepuluh Nopember. [6] Zeger dan Dggle. 1994. Semparametrc Models for Longtudnal Data wth Applcaton to CD4 Cell Numbers n HIV Seroconverters. Journal of the Amercan Statstcal Assocaton, 50 (3), 689-699. [7] Zhang, D., Ln, X., Raz, J. Dan Sower, M.F. 1998. Semparametrc Stochastc Mxed Models for Longtudnal Data. Journal of the Amercan Statstcal Assocaton, 93 (442), 710-719. [8] Euban, R.L. 1998. Splne Smoothng and Nonparametrc Regresson. New Yor : Marcel Deer.