KONSISTENSI KOEFISIEN DETERINASI SEBAGAI UKURAN KESESUAIAN ODEL PADA REGRESI ROBUST Harm Sugart (harm@ut.ac.d) Ad egawar Jurusa Statstka FIPA Uverstas Terbuka ABSTRACT I statstcs, the coeffcet of determato ca be used to assess the sutablty of a model wth the data. If there are outlers the data, the coeffcet of determato obtaed by the method s ot cosstet. The purpose of ths study was to compare the coeffcet of determato of regresso les obtaed by the, the ad the LS methods as a measure of the sutablty model. The result showed that whe the data cotas o-outler, the LS method s as cosstet as the ad the methods cocerg the coeffcet of determatos. Whe the data cota outlers, the LS method s more cosstet tha the ad the methods. Ths result was based o real data wth 9.% outlers. Keywords: LS estmator, estmator, outler data, robust regresso, The Cosstecy of Coeffcet of Determato ABSTRAK Dalam statstk, koefse determas dapat dguaka utuk mela kesesuaa model dega data. Jka ada outler pada data, koefse determas yag dperoleh dega metode tdak kosste. Tujua dar peelta adalah utuk membadgka koefse determas dar gars regres yag dperoleh melalu metode, da metode LS sebaga ukura model kesesuaa. Hasl peelta meujukka bahwa ketka data tdak megadug-outler, metode LS adalah kosste, serupa dega metode da metode terkat dega koefse determas. Ketka data megadug outler, metode LS lebh kosste darpada metode da metode. Hasl berdasarka ujcoba pada data yata dega outler 9,%. Kata kuc: data outler, kosstes koefse determas, LS estmator, estmator, regres robust Sebelum melakuka feres parameter model regres, daggap perlu utuk megetahu apakah model yag dperoleh sudah sesua dega data yag ada. Ketdaksesuaa model regres yag dbagu dapat juga dsebabka karea data tdak memeuh asums, msalya data megadug pecla (outler), yatu pegamata dega ssaa yag cukup besar. Peolaka begtu saja suatu pecla bukalah prosedur yag bjaksaa, karea adakalaya pegamata pecla memberka formas yag cukup berart, msalya karea pecla mucul dar kombas keadaa yag tdak basa yag mugk saja sagat petg da perlu dseldk lebh lajut. Pegamata pecla dapat merupaka pegamata yag berpegaruh, artya pegamata yag
Jural atematka, Sas, da Tekolog, Volume 3 Nomor, September, 65-7 dapat mempegaruh hasl pedugaa koefse regres, sehgga tdaka membuag pegamata yag berpegaruh aka megubah secara berart persamaa regres serta kesmpulaya (Draper & Smth, 98). eurut yers (99), keberadaa pegamata yag berpegaruh dapat dperksa dega melhat perbedaa dugaa peubah tak bebas terbakuka (DFFITS) yag drumuska sebaga: ( DFFITS) yˆ yˆ, dega ˆ s h yˆ y la pedugaa y,, la pedugaa y tapa pegamata ke-, s dugaa smpaga baku tapa pegamata ke- da h usur ke- dar dagoal matrks top. Jka p meyataka bayakya parameter da meyataka bayakya pegamata, maka suatu pegamata aka merupaka pegamata berpegaruh dalam persamaa regres apabla mempuya la DFFITS ( p ). Ada beberapa ukura yag dapat dperguaka utuk megetahu apakah model yag dperoleh sudah sesua dega data, dataraya adalah koefse determas, basaya dyataka dega R yag meujukka propors varas varabel depede yag djelaska oleh varas varabel depede. Sela memberka peaksr parameter,,,..., p yag bersfat tak bas lear terbak dar model regres y x x... pxp,,,...,, metode (ordary least square) memberka ukura R JKR JKS JKT JKT y ˆ y ( y y) R yag sagat dperluka dalam pemodela, yak: dega JKR meyataka jumlah kuadrat regres, JKS meyataka jumlah kuadrat ssaa, da JKT meyataka jumlah kuadrat total. Koefse determas berla R. Apabla terdapat asums yag tdak dpeuh, khususya jka dalam data terdapat pecla, maka patut dcoba metode yag bersfat tdak sestf terhadap pelaggara asums-asums, yak regres robust. Beberapa metode pedugaa/peaksra koefse gars regres yag bersfat robust telah dkembagka, dataraya adalah metode pedugaa parameter regres berdasarka pada peduga (maxmum lkelhood estmators) da peduga LS (least meda of square estmators). eurut Staudte da Sheather (99), jka hubuga lear atara satu peubah respos dega peubah-peubah bebasya dmodelka sebaga: y x dega x meyataka bars ke- dar matrks racaga X, meyataka parameter model da meyataka suku galat. Nla y ˆ da ssaa ( e ) masg-masg ddefska sebaga yˆ x da e ˆ y y y x. Peduga utuk model dega p parameter ( ˆ ) dperoleh dega cara memmumka fugs koveks x, e yak: m x, m ˆ e x, y x persamaa: ˆ atau mecar peyelesaa dar x x, y x, dega x, e x, e utuk berbaga fugs koveks x, e yag dapat dturuka da memeuh x,. Peduga ˆ yag dperoleh buka merupaka skala varat, yatu jka ssaaya e ˆ y x dgadaka dega suatu 66
Sugart, Kosstes Koefse Determas kostata aka dperoleh peyelesaa yag tdak sama sepert sebelumya. Skala varat dapat e dperoleh dega megguaka la sebaga peggat e da adalah faktor skala yag juga perlu dduga, sehgga persamaa yag ada mejad: e ˆ y x,, ˆ x x x x x y x w dega fugs pembobot e ˆ x, y x w w x, yag berla atara da. Secara umum fugs pembobot e y ˆ x ( x ) e drumuska sebaga w w x, dega adalah fluece e ( x ) fucto, ( x ) adalah suatu fugs yag tdak dketahu da tergatug pada x melalu la leverage. Nla pembobot w merupaka kombas la leverage da studetzed resdual melalu DFFITS yag dperoleh dega memlh fugs Huber yag berbetuk: e c, jka c e e e ( ), jka c e c, jka c da meetuka la ( h ( ) ) x serta ˆ s ( ). Fugs Huber da fugs pembobot Huber h w masg-masg dapat dgambar sepert Gambar da Gambar. Secara sgkat la pembobot y ˆ / x e p w dyataka dalam betuk: w x,, m w x,. Dega DFFITS y ˆ x w x dapat dtulska dalam betuk matrks demka persamaa XWX XWY yag dkeal sebaga persamaa ormal kuadrat terkecl tertmbag dega W adalah matrks dagoal yag bers pembobot. Solus persamaa ormal tersebut aka memberka dugaa utuk yatu ˆ X WX X WY da peduga- utuk dperoleh dega cara melakuka teras sampa dperoleh suatu hasl yag koverge. Cara basa dkeal sebaga metode kuadrat terkecl tertmbag secara teratf (teratvely reweghted least square). 67
Jural atematka, Sas, da Tekolog, Volume 3 Nomor, September, 65-7 e/ w(e/ c - c - c c e/ - c c e/ Gambar. Fugs Huber Berdasarka pembobot w da ˆ dega persamaa: X DX X DX X DX p Gambar. Fugs Pembobot Huber, matrks varas-kovaras utuk ˆ yak dapat ddekat dega D meyataka matrks e dagoal yag eleme-eleme dagoalya adalah da D meyataka matrks v( x ) dagoal dega eleme-eleme dagoalya w e (Staudte & Sheather,99). aroa, dkk (6) megusulka koefse determas dapat dhtug dega rumus y ˆ x ˆ sebaga berkut: R dega ˆ merupaka peaksr utuk E( y ) yak y ˆ ˆ y solus dar m, serta ˆ da ˆ masg-masg adalah peaksr utuk da ˆ yag dperoleh berdasarka fugs. etode la yag bersfat robust utuk peaksra koefse gars regres adalah metode LS (least meda square). etode mempuya keutuga utuk megurag pegaruh dar ssaa. eurut Rousseeuw da Leroy (3), peduga LS dperoleh dega mecar model regres yag memmumka meda dar h kuadrat ssaa ( e ) atau ddefska sebaga ˆ arg m meda e e y x ;,,...,. dega LS Ukura sebara dar galat dapat dtaksr dega cara meetuka dulu la awal 5,486 ( ˆ s meda e LS ). Faktor, 486 dguaka karea ( p) (,75) meda z merupaka peaksr kosste utuk jka z berdstrbus N,. Selajutya (,75) la awal s dguaka utuk meetuka pembobot jka e s, 5 w jka e s,5 w utuk setap pegamata, yatu: 68
Sugart, Kosstes Koefse Determas sebaga: Berdasarka pembobot ˆ w e w p w, maka la akhr taksra utuk regres LS ddefska da koefse determas utuk metode LS adalah: ˆ med e med y x LS RLS mad( y ) Rousseeuw da Leroy (3) med y med y j j Pada peelta pedahulua dperoleh hasl bahwa utuk data yag tdak megadug pecla, metode regres robust dega peduga LS kurag efse dbadg metode, sedagka utuk data yag megadug pecla, metode regres robust dega peduga LS lebh efse dbadg metode (Sugart & egawar, ). Jka koefse determas utuk model dhtug berdasarka metode, metode, da metode LS maka dharapka dperoleh formas yag lebh detl tetag hubuga yag ada d atara varabel depede da varabel depede dalam model regres. Dega kata la peetua koefse determas dharapka dapat dguaka sebaga dkator utuk megetahu apakah model yag dperoleh sudah sesua dega data. Tulsa bertujua megkaj kosstes koefse determas sebaga ukura kesesuaa model gars regres yag dperoleh dega metode, metode, da metode LS utuk data yag megadug pecla maupu tdak. ETODE Ada dua jes data yag dguaka dalam kaja, yatu data smulas berupa data bagkta yag dperoleh dega batua program INITAB vers 3., serta data terapa berupa la Tugas Tutoral Ole (Tuto), Nla Partspas Tuto, da la Uja Akhr Semester (UAS) mata kulah etode Statstk I masa uja 8.-.. Adapu lagkah-lagkah yag dlakuka adalah: () membagktka sebayak 4 pasag data sebaga peubah bebas ( x, x ) da data galat ( ) dega ~ NIID(, ), () meetuka peubah tak bebas ( y) dega asums la,, tertetu utuk model y x x, (3) medapatka pegamata pecla dega meggat sejumlah tertetu pegamata y dega la ekstrm sedemka sehgga dperoleh pegamata pecla yag berpegaruh, (4) mecar peaksr,, LS utuk koefse gars regres utuk data smulas dega atau tapa pecla, (5) meetuka koefse determas R, R, da R LS utuk data smulas dega atau tapa pecla, (6) mecar peaksr,, LS utuk koefse gars regres utuk data terapa, da (7) meetuka koefse determas R, R, da R utuk data terapa. LS HASIL DAN PEBAHASAN Sebayak empat puluh galat berdstrbus Normal dega mea da varas dbagktka secara radom dega paket program INITAB. Jka asumska, smulas memberka empat puluh pasag data ( y, x, x ). Peaksr koefse gars regres ( ˆ) da koefse determas ( R ) utuk data smulas tapa pecla dapat dlhat pada Tabel. 69
Jural atematka, Sas, da Tekolog, Volume 3 Nomor, September, 65-7 Tabel. Peaksr Koefse Gars Regres da Koefse Determas utuk Data Tapa Pecla Koefse LS,5,56,7*,973*,97*,969*,3*,9*,969* R,96,994,98 Sgfka pada 5% Pada data tapa pecla, ketga metode memberka la koefse determas yag tdak jauh berbeda, yatu metode memberka koefse determas R,96 artya 96,% varabltas dalam y dapat djelaska oleh x da x. etode memberka koefse determas R,994 artya 99,4% varabltas dalam y dapat djelaska oleh x da x serta metode LS memberka koefse determas R,98 artya 98,% varabltas dalam y dapat djelaska oleh x da x. Hal meujukka bahwa metode, metode, da metode LS meyataka model regres lear sesua utuk data, sehgga feres tetag koefse gars regres dapat dlakuka. Peaksr koefse gars regres da koefse determas utuk data smulas yag megadug 5% pecla dapat dlhat pada Tabel. etode memberka koefse determas R,66, metode memberka koefse determas R,846 da metode LS memberka koefse determas R LS,983. Nla koefse determas yag dperoleh dega metode da metode mejad lebh kecl, sedagka la koefse determas yag dperoleh dega metode LS tdak berubah. Hal meujukka bahwa metode LS mash kosste dalam memberka la koefse determas dbadg metode da metode. Pada Tabel juga dapat dlhat adaya perubaha sgfkas koefse utuk metode, yak mejad sgfka pada data dega 5% pecla. Tabel. Peaksr Koefse Gars Regres da Koefse Determas utuk Data dega 5% Pecla Koefse LS,659,5*,994*,85*,95*,95*,969*,94*,7* R,66,846,983 Sgfka pada 5% Peaksr koefse gars regres da koefse determas utuk data smulas dega % pecla dapat dlhat pada Tabel 3. etode memberka koefse determas R, 445, metode memberka koefse determas determas R,979. LS R,588 da metode LS memberka koefse 7
Sugart, Kosstes Koefse Determas Tabel 3. Peaksr Koefse Gars Regres da Koefse Determas utuk Data dega % Pecla Koefse LS 4,5*,7*,37*,774*,86*,866*,89*,956*,885* R,445,663,979 Sgfka pada 5% Jka dlhat dar kosstes la koefse determas utuk masg-masg metode meujukka bahwa R LS lebh kosste dbadg R da R. Hal meujukka bahwa pada data tapa pecla, data megadug 5% pecla, da data megadug % pecla, ukura koefse determas yag dberka oleh metode LS lebh kosste dbadg metode da metode. Demka juga dega sgfkas koefse regres, metode LS lebh kosste dbadg metode da metode. Hasl sedkt berbeda dega hasl kaja sebelumya yag meujukka bahwa metode LS kurag efse dbadg metode utuk data yag tdak megadug pecla, tetap metode LS lebh efse dbadg metode dalam meaksr koefse gars regres utuk data yag megadug pecla (Sugart & egawar, ). Koefse determas utuk data terapa dapat dlhat pada Tabel 4, metode memberka koefse determas R,4 artya 4,% varabltas dalam la UAS dapat djelaska oleh la Tugas, Tugas, Tugas 3, da la partspas mahasswa. etode memberka koefse determas R,879 da metode LS memberka koefse determas R,79. LS Tabel 4. Peaksr Koefse Gars Regres da Koefse Determas utuk Data Terapa Koefse LS Kostata 35,5 * 35,34* 9,678* Tugas,9 -,,64 Tugas,5,4 -,48 Tugas 3,3 -,54 -,79* Partspas -,57,,6* R,4,879,79 Sgfka pada 5% Berdasarka hasl smulas, metode LS daggap lebh kosste memberka ukura koefse determa dbadg metode da metode, sehgga peaksr koefse gars regres yag dperoleh dega metode LS meujukka bahwa la Tugas 3 da Partspas cukup sgfka mempuya pegaruh lear terhadap la UAS mahasswa. Namu, karea peaksr koefse gars regres utuk la Tugas 3 berla egatf ( ˆ 3,79), mater Tugas 3 perlu dtjau kembal. Demka juga utuk Tugas da Tugas, karea peaksr koefse gars regres yag dperoleh tdak cukup sgfka mempuya pegaruh lear terhadap la UAS mahasswa 7
Jural atematka, Sas, da Tekolog, Volume 3 Nomor, September, 65-7 maka mater Tugas da Tugas perlu revs sehgga pembera mater Tugas, Tugas, Tugas 3, da partspas mahasswa mempuya pegaruh lear yag sgfka dalam megkatka la UAS mahasswa. KESIPULAN Secara umum dapat dsmpulka bahwa metode, metode, da metode LS memberka la koefse determas yag hampr sama pada data yag tdak megadug pecla. Pada data yag megadug pecla, metode LS memberka la koefse determas yag tdak jauh berbeda dega data yag tdak megadug pecla, tetap metode da metode memberka la koefse determas yag jauh lebh kecl. Dega kata la, metode LS lebh kosste dbadg metode da metode dalam memberka la koefse determas. Pada data terapa yag megadug pecla, metode LS lebh kosste dbadg metode da metode dalam memberka la koefse determas. REFERENSI Draper, N.R. & Smth, H. (98). Appled regresso aalyss ( d ed). New York: Wley. aroa, R.A., art, R.D., & Yoha, V.J. (6). Robust statstcs: Theory ad ethods. Chchester, West Sussex, UK: Wley. yers, R.H. (99). Classcal ad moder regresso wth applcatos ( d ed). Bosto: PWS- Ket. Rousseeuw,P.J. & Leroy,A.. (3). Robust regresso ad outler detecto. New York: Wley. Staudte, R.G. & Sheather, S.J. (99). Robust estmato ad testg. New York: Wley. Sugart, H. & egawar, A. (). Tgkat efses peaksr terhadap peaksr LS dalam meaksr koefse gars regres. Jural atematka, Sas, da Tekolog, (), 9-98. 7