BOBOT OPTIMAL PADA REGRESI SEMIPARAMETRIK SPLINE Jerry Dw Trjoyo Puromo Jurusa Statstka Isttut Tekolog Sepuluh Nopember Surabaya Emal: jerrypuromo@yahoo.com ABSTRAK Regres semparametrk sple adalah metode regres yag meggabugka pedekata parametrk, da oparametrk. Regres semparametrk sple mempuya kelebha dapat meduga parameter pada kompoe parametrk da estmas kurva regres pada baga oparametrkya. Pada kasus dmaa vara dar model regres semparametrk kosta, model sple orgal dapat dterapka utuk medapatka model pedugaa yag bak terhadap data dega megguaka metode Pealzed Least Square(PLS). Namu pada suatu kasus dmaa vara dar resdual tdak kosta (kasus heterokedaststas), metode sle orgal kurag tepat dguaka, karea aka meghaslka model pedugaa yag kurag tepat. Model sple dega bobot adalah model yag lebh tepat dguaka utuk kasus heterokedststas tersebut. Permasalaha utama pada metode sple terbobot adalah bagamaa meetuka bobot yag optmal, sehgga aka ddapatka model yag palg sesua utuk kasus heterokedaststas. Bayak metode yag dapat dterapka utuk medapatka bobot yag optmal, dataraya adalah metode tral error, dega megambl persamaa pada varabel-varabel regres semparmetrk, terutama pada baga oparametrk sebaga fugs yag aka dguaka dalam metode tral error. Kata Kuc: Regres Semparametrk, Pealzed Least Square, Sple Orgal, Heterokedaststas I. PENDAHULUAN Estmas kurva regres umumya dlakuka dega pedekata parametrk yag mula dperkealka oleh Laplace sejak abad XVIII da juga Boscovch pada tahu 757. Dalam regres parametrk dasumska bahwa betuk kurva regres f dketahu. Pembuata asums tersebut berdasarka pada teor, pegalama masa lalu atau tersedaya sumber-sumber la yag dapat member pegetahua atau formas yag terperc. Estmas dapat juga dlakuka berdasarka pedekata yag tdak terkat dega asums betuk kurva regres tertetu, yag memberka fleksbltas yag lebh besar dar kurva regres. Metode pedekata sepert damaka pedekata oparametrk yag mula dkeal sejak abad XIX. Ada beberapa tekk utuk megestmas dalam regres oparametrk, atara la hstogram, estmator Kerel, Sple, da la-la. Masalah yag serg mucul dalam regres adalah tdak semua varabel pejelas dapat ddekat dega pedekata parametrk, karea tdak adaya formas tetag betuk hubuga varabel pejelas tersebut dega varabel respoya, sehgga harus dguaka pedekata oparametrk. Dega meggabugka dua pedekata tersebut dalam suatu pedekata regres aka ddapatka suatu model semparametrk. Estmas model semparametrk ekuvale dega
megestmas parameter-parameter pada kompoe parametrk da estmas kurva pada kompoe oparametrk. Dalam peelta Dewaya (4) terdapat eam varabel predktor, yatu jumlah gaggua jes beda (X ), jumlah gaggua jes alam (X ), jumlah gaggua jes ut pembagkt (X 3 ), jumlah gaggua jes peralata (X 4 ), jumlah pekerjaa oleh phak PT PLN (X 5 ), jumlah gaggua jes sebab la (X 6 ), serta varabel respo, jumlah eerg lstrk yag hlag d Surabaya Utara. Dalam peelta ada kecederuga vara yag tdak homoge. Hal terlhat dar vsualsas data atara varabel-varabel predktor tersebut dega varabel respo. Adaya kecederuga adaya vara yag tdak homoge meyebabka hasl yag dperoleh kurag dapat mejelaska hubuga atara varabel respo da predktor d atas. Karea tu dguaka pembobot utuk megatas ketdaksamaa vara, karea sple orgal yag dguaka kurag dapat mejelaska adaya ketdaksamaa vara. Model semparametrk pertama kal dperkealka oleh Wahba (985), Egle, Grager, Rce, da Wess, (986), Gree, Jeso, Seheult (985), da Heckma (986). Model drumuska sebaga: y = x f(t )ε, =,,, () γ dega x =(x,,x p ) da t, =,,, merupaka varabel-varabel predktor. Vektor γ =(γ,,γ p ) R p tdak dketahu da f dasumska merupaka aggota ruag Sobolev W m [, ] = {f f (k), k =, (m),, m- kotu pada [,], da f () t dt < }. Resdual ε berdstrbus depede [ ] dega mea ol da varas σ. Estmator f dperoleh dar memmumka Pealzed Least Square (PLS): l λ (f)=r(f) λj(f), f W m [, ] () Fugsoal l λ (f) memuat tga kompoe, yatu kompoe lkelhood R(f), fugsoal pealt J(f) da parameter peghalus λ. Estmator tpe PLS dkembagka oleh Heckma (986), Eubak (986), Wahba (99), da Che da Shau (994) utuk estmator sple parsal orgal, dega megambl kesamaakesamaa: ( ) R(f)= y x γ f ( t ) = (3) [ ] (m) J(f)= f () t dt (4) Betuk estmator γ λ da f λ dperoleh dega memmumka PLS: l λ ( ) () f = y x f ( t ) = ( m ) λ [ f () t ] dt (5) Pada ss la, Sh da L (994) megembagka model semparametrk utuk estmator sple parsal tpe-orm L. Estmator γ λ da f λ dperoleh dega memmumka Pealzed Leats Square (PLS) da meggat persamaa (3):
R(f) = y x γ f ( t ) (6) = λ Lebh lajut He da Sh (986) megusulka pegguaa estmator sple parsal tpe-m (meda) utuk pedekata mea respo regres semparametrk. Estmator dperoleh dega memmumka PLS da meggat persamaa (3) : ( ) R(f) = ρ y x γ f ( t ) ρ fugs koveks. (7) = λ Beberapa macam tpe sple yag dkembagka para peelt d atas, dkembagka model sple parsal terbobot utuk megatas ketdaksamaa varas, dkareaka model sple parsal kurag sesua utuk meaga ketdaksamaa varas regres semparametrk. Model dkembagka oleh Budatara (999) serta Subaar da Budatara (999). Betuk estmator dperoleh dega memmumka Pealzed Least Square Terbobot (PLST): l λ ( ) () f = w y x f ( t ) = ( ) [ ()] utuk setap f aggota ruag sobolev [ ] m λ f t dt (8) W m,. Betuk estmator sple parsal terbobot dpegaruh oleh parameter peghalus λ. Utuk λ, estmator sple parsal terbobot merupaka estmator polomal (Budatara, 999). Estmator kompoe parametrk merupaka estmator yag kosste da berdstrbus ormal asmtotk (Subaar da Budatara, 999). II. METODE Estmas kurva regres umumya dlakuka dega tga pedekata, yatu pedekata parametrk, dega asums betuk kurva regres dketahu, pedekata oparametrk, dega asums pedekata kurva regres tdak dketahu, serta pedekata semparametrk yag merupaka gabuga atara pedekata parametrk da oparametrk.. Sple Dalam Regres Noparametrk Fugs sple berorde (m-) dega ttk-ttk kot S, S,...,S k adalah sebarag fugs yag dapat dsajka dalam betuk [5]: k h k α δ j j (8) = j= St () = t ( t S) k ( j), t S t S j dega ( t S ) k j =, t < S j j=,,..., k α da δ adalah kostata real da S, S,...,S k adalah ttk-ttk kot. 3
. Pemlha Parameter Peghalus Beberapa metode pemlha parameter peghalus yag bayak dkembagka adalah Cross Valdato (CV) da Gross Cross Valdato (GCV)(Crave da Wahba (979)), Wahba (985), L (986), Koh dkk (99), Shao (993), Veter da Syma (995). Pada model regres sple terbobot, krtera GCV ddefska sebaga: GCV ( λ) = MSE( λ) ( ( tr[ I A( λ) ] ) ( y j fλ j ) w j j= ( tr( I A( λ) )) = = W / ( I A( λ) ) ( I A( λ) ) y [ tr ] Nla λ yag optmal berkata dega la GCV (λ) yag mmum..3 Estmas Bobot Pada dasarya ada bermacam-macam cara utuk medapatka estmas bobot. Dataraya adalah dega cara coba-coba (tral error). Sstem tral error adalah medapatka bobot dega megguaka fugs predktorya (Motgomery da Peck, 98). Bobot yag optmal ddapatka dega cara memasukka bobot-bobot yag mugk kedalam persamaa (8), sedemka hgga ddapatka model yag memlk la GCV terkecl, da koefse determas (R ) terbesar. III. DISKUSI Dalam peelta Dewaya (4), terdapat eam varabel yag mempegaruh jumlah eerg lstrk yag hlag d PT PLN Dstrbus Jawa Tmur Wlayah Surabaya Utara. Varabelvarabel tersebut adalah jumlah gaggua jes beda (x ), jumlah gaggua jes alam (x ), jumlah gaggua jes ut pembagkt (x 3 ), jumlah gaggua jes peralata (x 4 ), jumlah pekerjaa oleh phak PT PLN (x 5 ), jumlah gaggua jes sebab la (x 6 ). Dalam peelta Dewaya (4) ada kecederuga vara yag tdak homoge, yatu pada varabel x da varabel x. Hal terlhat dar vsualsas data atara varabel-varabel predktor tersebut dega varabel respo (Gambar da 3). Dar vsualsas terlhat semak besar la varabel predktor, varas yag terbetuk juga semak besar. I merupaka deteks awal bahwa varabel-varabel predktor tersebut tdak homoge. Sela dega megguaka vsualsas plot data, utuk megetahu apakah vara resdual sudah homoge atau belum dapat dlakuka juga dega uj Glejser (Bowerma, 99). Peguja dlakuka dega meregreska la absolut resdual dega varabel predktor yag dmasukka ke dalam model. Gambar memperlhatka hubuga atara jumlah eerg lstrk yag hlag d PT PLN dega gaggua jes beda (x ) memperlhatka adaya perubaha pola perlaku data dar satu terval ke terval yag la. Perubaha pola perlaku data dtada dega ttk kot. Pada model sple orgal, perubaha pola perlaku dataya terlhat d dua ttk, yatu 9 da 4. (Gambar ), dega hubuga atara jumlah eerg lstrk yag hlag da gaggua jes ut pembagkt dapat djelaska dega model sple lear. Sedagka hubuga atara jumlah eerg lstrk yag hlag d PT PLN dega gaggua jes ut pembagkt (x ) adalah lear, karea semak besar gaggua yag dakbatka jes ut pembagkt, maka eerg lstrk yag hlag juga aka semak besar (Gambar 4). Model sple parsal orgal utuk data adalah: 4
y y = γ γ x γ ( x 9) γ 3 ( x 4.) γ 4 x ε Nla GCV mmum utuk model sple orgal sebesar 689.8, dega la koefse determas, R sebesar 65.95%. 7 y 6 5 4 3 4 6 5 x Gambar. Plot atara y da x 5 5 5 Gambar. Plot atara y da x da estmas sple orgal x y = 85,49 4,93934 x3 S = 94,8883 R-Sq = 45,7 % R-Sq(adj) = 44,4 % y 7 7 6 6 5 5 4 4 3 3 x3 3 y 5 x3 Gambar 3. Plot atara y da x Gambar 4. Plot y da x da regres lear Gambar 5. Plot tga dmes atara y, x, da x 3. Dagostk Resdual Model Sple Parsal Orgal Gambar da 3 d atas memperlhatka dkas adaya heterokedaststas. Idkas adaya heterokedaststas juga terlhat pada plot atara resdual da taksra dar respo ( ŷ ) (Gambar 6). 5
resdu 5 5 5-5 - -5-3 4 5 6 7 yhat Gambar 6. Plot atara resdual da ŷ Probablty,999,99,95,8,5,,5,, - resdu Average: -, Kolmogorov-Smrov Normalty Test StDev: 74,83 D:,9 D-:,97 D :,9 N: 43 Approxmate P-Value:,9 Gambar 7. Uj ormaltas sple orgal Gambar 6 memperlhatka bahwa plot atara resdual da ŷ tdak radom (horzotal bad) melaka membetuk corog. I merupaka dkas adaya heterokedaststas. Utuk medeteks adaya heterokedaststas, dlakuka peguja dega uj Glejser. H : σ = σ =... = σ43 H : palg sedkt ada satu σ yag tdak sama Tolak H jka la F ht > F tab. Utuk data peelta ddapatka la F ht = 3.9 da F tab =.6, yag berart H dtolak. Jad vara resdual tdak kosta. Berkata dega feres statstk, terutama uj hpotess, perlu dlakuka uj dstrbus ormal resdual. H : Data meyebar megkut dstrbus ormal. H : Data meyebar tdak megkut dstrbus ormal. Gambar 7 memperlhatka bahwa la p-value =.9 > α =.5. I berart gagal tolak H. Jad data meyebar megkut dstrbus ormal. 3. Uj Sgfkas Model Sple Parsal Orgal Berdasarka aalss dagostk resdual, tdak terdapat peympaga dar dstrbus ormal, sehgga dapat dteruska utuk uj hpotess koefse regres. Pertama dlakuka uj seretak dega hpotess: H : γ = γ = γ = γ 3 = γ 4 = H : palg sedkt ada satu γ Tabel Aalss varas model sple parsal orgal dega ttk kot 9, 4. SK db JK KT Fht FTabel Regres 4 4489.5 57.4 8.478.68988 Resdual 38 343 689.87 Total 4 67964.5 Berdasarka aalss model semparametrk (Tabel ) dega α =.5 dperoleh kesmpula bahwa tdak semua koefse regres berla ol, sehgga model sgfka. Selajutya dlakuka uj dvdu terhadap koefse-koefse regres dega hpotess sebaga berkut: H : γ =, H : γ H : γ =, H : γ H : γ =, H : γ H : γ 3 =, H : γ 3 H : γ 4 =, H : γ 4 6
Tabel. Estmas model sple parsal orgal Koefse Estmas St Dev t-htug γ γ γ γ 3 γ 4.98989 3.4946-54.73364 5.66 4.794 5.3778 6.933 7.35968 7.4368.6996449.4335 3.8557-3.597.869 6.75949 Nla t-tabel :.4394 Dar Tabel 4.3 d atas terlhat bahwa haya γ saja yag tdak sgfka terhadap model, sehgga γ tdak dmasukka ke dalam model. Tabel 3 Estmas model semparametrk terbak model sple parsal orgal Koefse Estmas St Dev t-htug γ γ γ 3 γ 4 3.45999-55.4935 5.495 4.736345 3.663 4.777 6.4485.67386 6.46978-3.866 3.5493 7.54577 Dar Tabel 3 d atas dapat dlhat bahwa model sple parsal orgal terbak adalah: ŷ = 3.45999x 55.4935 ( x ) 9 5.495 ( x ) 4. 4.736345x Nla koefse determas utuk model sebesar 66.39% Pada data terdapat kasus heterokedaststas, yag berart sple orgal kurag mampu mejelaska adaya heterokedaststas. Idkas adaya heterokedaststas juga terlhat pada Gambar 8. Adaya heterokedaststas meujukka bahwa sple parsal orgal kurag mampu mejelaska adaya heterokedaststas, sehgga model sple dega bobot layak dpertmbagka sebaga suatu model pedekata. Gambar 8 Plot tga dmes atara ŷ (merah) da y (hjau) utuk sple orgal Gambar 9. Plot tga dmes atara ŷ (merah) da y (hjau) utuk sple terbobot 3.3 Sple Parsal Terbobot Setelah dperlhatka adaya heterokedaststas, maka model sple parsal terbobot dterapka utuk data peelta. Dlakuka peetua bobot dega sstem coba-coba (tral error) megguaka fugs dar predktorya (Motgomery da Peck, 98). Metode medapatka bobot dega cara coba-coba megguaka fugs dar predktor sampa ddapatka bobot yag palg sesua. Dega metode dplh kot optmum, yatu kot yag meghaslka GCV mmum. Dalam peelta dambl bobot sama dega /t. Dega bobot ddapatka ttk kot optmal 9 da 3,8. Estmas model sple parsal terbobot dberka oleh: ŷ = γ γ x γ ( x S) γ 3 ( x S) γ 4 x Setelah tu dlakuka uj dstrbus ormal dega hpotess: 7
H : Data meyebar megkut dstrbus ormal. H : Data meyebar tdak megkut dstrbus ormal. Dar Gambar terlhat bahwa p-value > α =.5, sehgga gagal tolak H. Jad data meyebar megkut dstrbus ormal. Normal Probablty Plot Probablty,999,99,95,8,5,,5,, - - resdual Average: -,644 Kolmogorov-Smrov Normalty Test StDev: 78,7 D:,3 D-:,77 D :,3 N: 43 Approxmate P-Value:,6 Gambar Plot Keormalaa resdual dega tral error 3.4 Uj Sgfkas Model Sple Parsal Terbobot Dega Tral Error Berdasarka dagostk resdual, tdak terdapat peympaga dar dstrbus ormal, selajutya dlakuka uj hpotess seretak. H : γ = γ = γ = γ 3 = γ 4 = H : palg sedkt ada satu γ Tabel 4. Aalss varas model sple parsal terbobot dega ttk kot 9 da 3.8 SK db JK KT Fht FTabel Regres 4 47839.98 96 9.65687.68988 Resdual 38 3.66 68.4384 Total 4 796.64 Dega megguaka α =.5 dperoleh kesmpula bahwa tdak semua koefse regres berla ol. Selajutya dlakuka uj dvdu terhadap koefse-koefse regres dega hpotess sebaga berkut: H : γ =, H : γ H : γ =, H : γ H : γ =, H : γ H : γ 3 =, H : γ 3 H : γ 4 =, H : γ 4 Tabel 5 Estmas model sple parsal terbobot dega tral error dega ttk kot 9 da 3.8 Koefse Estmas St Dev t-htug γ γ γ γ 3 γ 4 3.54586 7.674-66.4793 55.46 3.3847 7.6568 4.3598 4.8655 4.34539.4356.868 6.6973-4.685558 3.8667.849 Nla t-tabel :.4394 Dar Tabel 5 d atas terlhat bahwa haya γ saja yag tdak sgfka terhadap model, sehgga γ tdak dmasukka ke dalam model. 8
Tabel 6 Estmas model sple parsal terbobot dega tral error dega ttk kot 9 da 3.8 Koefse Estmas St Dev t-htug γ γ γ 3 8.38-66.8637 55.866 γ 4 3.36638 Nla t-tabel 95% :.69.6939.86 3.35736.9387.76859-5.655549 4.897.69 Dar Tabel 6 d atas dapat dlhat bahwa model sple parsal terbobot dega megguaka metode tral error adalah: ŷ = 8.x 66.86 ( x 3.8) 55.86 ( x 3.8) 3.37x Nla koefse determas utuk model sebesar 7.6%. IV. KESIMPULAN Sple parsal orgal kurag sesua utuk permasalaha ketdaksamaa vara (heterokedaststas). Model sple dega bobot layak dpertmbagka sebaga suatu model pedekata, karea memberka hasl yag lebh dbadgka sple parsal orgal. Salah satu metode utuk medapatka bobot adalah dega tral error. Model sple terbobot dega metode tral error dega megambl bobot /t adalah: yˆ = 8, x 66,86( x 3,8) 55,86( x 3,8) 3,37x Nla koefse determas utuk model adalah 7,6%. Model lebh bak dbadgka model sple orgal yag memlk koefse determas 65,95%, dsampg la dar ŷ utuk sple terbobot yag laya medekat la y dbadgka la ŷ utuk sple orgal(gambar 8 da 9). DAFTAR PUSTAKA Bowerma, L.(99). Lear Statstcal Models: A Appled Approach, 8 th edto. PWS-Ket Publshg Compay, Bosto. Crave da Wahba, G.(979). Smoothg Nosy Data Wth Sple Fucto: Estmatg The Correct Degree of Smoothg by The Method of Geeralzed Cross Valdato, Numer. Math.,3, 377-43. Dewaya, I.(4). Peerapa Model Noparametrk Dega Metode Sple Pada Jumlah Eerg Lstrk Yag Hlag d PT PLN Dstrbus Jawa Tmur Wlayah Surabaya Utara, Tugas Akhr, ITS, Surabaya. Budatara, I.N.(999). Estmator Sple Terbobot Dalam Regres Semparametrk, Majalah Ilmu Pegetahua da Tekolog,, 3-9. Che, H. da Shau, J.J.H.(994). Data Drve Effcet Estmators for a Partally Lear Model. The Aals of Statstcs,, -37. 9
Egle, R.L, Grager, C., Rce, J. da Wess, A.(986).Semparametrc Estmates of Relato Betwee Weather ad Electrcty Sales, Joural of The Amerca Statstcal Assocato, 8, 3-3. Eubak, R.L. (986). A Note o Smoothess Prors ad Nolear Regresso., Joural of the Amerca Statstcal Assocato, 8, 54-57. Gree, P., Jeso, C.,Seheult, A.(985). Aalyss of Feld Expermets by Least Square Smoothg, Joural of The Royal Statstcal Socety, Ser. B, 47, 99-34. Heckma, N.(986). Sple Smoothg a Partly Lear Models, Joural of The Royal Statstcal Socety, ser B, 48, 44-48. He,X. da Sh,P.(996). Bvarate Tesor Product B-Sple a Partly Lear Models, Joural of Multvarate Aalyss, 58, 6-8. Koh, R. dkk.(99). The Performace of Cross Valdato ad Maxmum Lkelhood Estmators of Sple Smoothg Parameters, Joural of The Amerca Statstcal Assocato,86, 4-5. L, K.C.(986). Asymtotc Optmalty of C l ad Geeralzed Cross Valdato Rdge Regresso Wth Applcato to Sple Smoothg, A.Statst., 4, -. Motgomery, D.C da Peck, E.A (98). Itroducto to Lear Regresso Aalyss, New York: Joh Wley ad Sos. Shao, J. (993). Lear Model Selecto by Cross Valdato. Joural of The Amerca Statstcal Assocato, 88, 486-494. Sh, P., da L, G. (994). O the Rate Covergece of Mmum L -Norm Estmates a partly Lear Model, Commucato Statstcs, Theory ad Methods, 3, 75-96. Subaar da Budatara, I.N. (999). Weghted Sple Estmator a Partally Lear Models, Proceedg of the SEAMS-GMU Iteratoal Coferece 999 o Mathematcs ad Its Applcatos, 6-7. Veter, J.H. ad Syma, J.L.J.(995). A ote o The Geeralzed Cross Valdato Crtero Lear Model Selecto, Bometrka, 8, 5-9. Wahba, G.(985). A Comparso of GCV ad GML for Choosg the Smoothg Parameter the Geeralzed Sple Smoothg Problem, Joural the Aals of Statstcs, 3, 378-4. (99). Sple Models for Observasoal Data, SIAM, Pesylvaa.