PENDETEKSIAN OUTLIER DENGAN METODE REGRESI RIDGE Sr Har Jurusa Matemata, Faultas Sas da Teolog Uverstas Islam Neger Maulaa Mal Ibram Malag e-mal: srar@aoo.co.d Abstra Dalam aalss regres ler bergada adaa satu atau leb egamata ecla outler aa membula dlema bag ara eelt. Keutusa utu meglaga ecla tersebut arus dladas alasa ag uat, area adag-adag ecla daat membera formas etg ag derlua. Masala outler daat datas dega berbaga metode, dataraa metode regres rdge rdge regresso. Utu megetau eeara regres rdge erlu melat la-la R, PRESS, serta leverage, utu metode regres rdge dega berbaga la tetaa bas ag dl. Kata uc: outler, PRESS, regres rdge, R, Leverage. Pedaulua Pada aalss regres bergada serg dtemu satu atau leb egamata tda sesua dega model ag dguaa ada sebaga besar egamata laa. Hal daat terad area esalaa dalam ecatata egamata-egamata tersebut, esalaa alat uur, atau area etdacocoa model ag dguaa. Pegamata semacam tu dsebut ecla outler. Pecla bsa dlaga bla ada eelasa tetag asus ecla ag meuua stuas usus ag tercau dalam model. Pecla dalam data regres bergada daat beregaru ada asl aalss statst. Pegamata ecla mug megasla resdual ag besar da serg beregaru terada fugs regres ag daslaa. Utu tu erlu dlaua detfas terada ecla gua melat esalaa samel observas. Waler da Brc, 988.. Kaa Pustaa Pedetesa Pecla Outler Sergal model regres dbetu dar data ag baa megadug euraga, dataraa adala adaa ecla atu egamata dega resdual ag besar. Pecla serg meebaba esalaa dalam emla model, da basaa dlaga. Keataaa, beberaa ecla daat member formas ag berart, msala ecla tmbul dar ombas eadaa ag tda basa ag mug etg da erlu dseld leb laut. Ole area tu adaa ecla dalam data erlu dseld secara sesama, baragal daat detau ada alasa dbal egala tu. Pecla daat dsebaba ole esalaa dalam data atau status fs ag gal dar obe ag daalss. Kesalaa dalam data berua gaggua, emaga strume, esalaa oerator, atau esalaa ecetaa Retags, 00. Pedetesa ecla terada la-la varabel, daat megguaa matr to ag ddefsa sebaga H -. Usur e- ada dagoal utama matr to dsebut leverage. Usur daat derole dar -. Nla dagoal terleta atara 0 da da umlaa sama dega, atu baa arameter regres d dalam fugs regres termasu suu terse Neter, Wasserma, da Kuter, 990. 7
Sr Har Nla leverage ag besar meuua ecla dar la-la varabel utu egamata e-. Hal dsebaba, bawa adala uura ara atara la utu egamata e- dega rata-rata la utu semua egamata. Segga, la ag besar meuua egamata e- berada au dar usat semua egamata varabel. Suatu la dagga besar aabla laa leb besar dar / da daat berotes sebaga egamata ag beregaru. Regres Rdge Rdge Regresso Regres rdge meruaa sala satu metode ag daura utu memer-ba masala multoleartas dega cara memodfas metode uadrat terecl, segga dasla eduga oefse regres la ag bas Neter, et al., 990. Modfas metode uadrat terecl tersebut dlaua dega cara meamba tetaa bas,, ag relatf ecl ada dagoal matrs, segga eduga oefse regres degaru ole besara tetaa bas,. Pada umuma la bersar atara 0 da. Utu meetua eduga rdge, dmula dar asums model ler secara umum, atu : β + ε. dmaa : adala vetor egamata ada varabel reso ag beruura adala matr ag beruura + dar varabel bebas β adala vetor beruura + dar oefse regres ε adala vetor beruura dar error Dalam regres rdge varabel bebas da varabel ta bebas dtrasformasa dalam betu varabel bau Z da, dmaa trasformas varabel bebas da ta bebas e betu varabel bau derole dar Z da Selauta ZZ. s s da Z s. 8 Volume No. November 009 s s s. Semetara tu rumus dar orelas r. Segga ersamaa ormal uadrat terecl b s s aa berbetu r br, dega r adala matr orelas varabel da r adala vetor orelas atara da masg-masg varabel. Abat dar trasformas matr e Z da vetor e, maa aa meada ersamaa ormal regres rdge berbetu : r +I ˆb r. Peduga oefse regres rdge mead : ˆb r + I - r. dmaa : ˆb adala vetor oefse regres rdge r adala matr orelas varabel ag beruura r adala vetor orelas atara varabel da beruura adala tetaa bas I adala matr dettas beruura. Masala ag dada dalam regres rdge adala eetua la dar. Prosedur ag cuu ba utu meetua la adala dega megguaa la statst C -Mallows, atu C. Statst C -Mallows adala suatu rtera ag berata dega rata-rata uadrat error mea square error dar la esesuaa model. Nla ag terl adala ag memmuma la C Mers, 990. Nla C daat drumusa sebaga berut : JKR C - + + tr[h ].3 ˆ dmaa : JKR adala umla uadrat resdual dar regres rdge adala baa egamata
Pedetesa Outler dega Metode Regres Rdge H [ZZZ+I - Z] dega I adala matr dettas tr [H ] adala teras dar matr H ˆ adala eduga vara metode uadrat terecl Acua la ag dguaa utu meml la adala dega melat la VIF Mers, 990. Nla VIF utu oefse regres rdge ˆb ddefsa sebaga dagoal dar matr r +I - r r +I -. Rumusa ddaat dega seragaa roses sebaga berut : Ja d metode uadrat terecl detau la oefse eduga bˆ da varabˆ : bˆ - dega bˆ Vara bˆ - Dalam regres rdge arga ˆb da vara ˆb detau sebaga : ˆb +I - +I - b Vara ˆb +I - - +I - +I - +I - Segga VIF meruaa dagoal matr +I - +I -. Bla dbaua, maa VIF dar regres rdge adala dagoal dar matr r +I - r r + I -. Leverage dalam Regres Rdge Keta te bas dguaa ada regres rdge, utu megurag efe dar multoleartas, maa rumus ecla d dalam data tersebut daat dmodfas. Seert ala d dalam metode regres uadrat terecl, maa ecla dalam regres rdge daat duur dega la leverage. Utu tu la ada regres uadrat terecl beruba sebaga fugs dar, gua medaata la ada regres rdge Retags,00. Dega memaa eduga., maa la-la vetor dugaa adala : ˆ Z b ZZZ+I - Z Ole area tu, matr H utu regres rdge mead HZZZ+I - Z, da usur e- ada dagoal utama matr H adala z ZZ+I - z. Matr H berera sama seert matr H ada metode uadrat terecl. Segga, la dugaa e- daat dtuls dalam betu eleme H sebaga berut Waler da Brc, 988: ˆ Usur dagoal matr to rdge daat dterretasa sama sebaga leverage ada dagoal matr to ada metode uadrat terecl. Lcteste da Vellema 983 dalam Waler da Brc 988 megugaa beberaa fata etg dar sfat usur dagoal matr H. Pertama, utu >0, maa la < dega,,,. Dega dema, utu seta egamata, la leverage regres rdge leb ecl dar leverage regres uadrat terecl. Kedua, leverage meuru secara mooto seala dega eaa. Ketga, lau eurua leverage tergatug ada oss bars tertetu dar Z seaag sumbu utama. Arta, leverage dar bars ag terleta d sumbu utama ag beradaa dega aar araterst besar aa berurag leb sedt dar ada leverage dar bars ag terleta d sumbu utama ag beradaa dega aar araterst ecl. Volume No. November 009 9
Sr Har 3. Pembaasa Peurua Rumus dar Regres Rdge Ja ˆβ adala eduga dar vetor β, maa umla uadrat resdual daat dtuls Hoerl da Keard, 970 sebaga berut : φ Y- ˆβ Y- ˆβ Y- βˆ Y- βˆ + βˆ - ˆβ βˆ - ˆβ φ m + φ ˆβ dmaa βˆ adala eduga uadrat terecl dar β. Utu φ teta, maa dl la ˆβ da dbuat memmuma ˆβ ˆβ dega edala βˆ - ˆβ βˆ - ˆβ φ 0, segga masala Lagrage Hoerl da Keard, 970 mead : F ˆβ ˆβ + [ ˆβ - βˆ ˆβ - βˆ -φ 0 ] F ˆβ + [ ˆβ - βˆ ] 0 ˆβ ˆβ [+ ] - βˆ ] ˆβ [I+ ] - βˆ Jad eduga regres rdge adala : ˆβ [ + I] - Y Adau sfat-sfat Regres Rdge sebaga berut Marquardt, 970:. Peduga ˆβ adala trasformas ler dar βˆ, da trasformas aa tergatug ada da. ˆβ [I+ ] - Y, teta Y βˆ Maa, ˆβ [+I] - βˆ Z βˆ E ˆβ Z βˆ Segga ˆβ adala eduga bas dar βˆ. Vara ˆβ adala : V ˆβ [I+ ] - [I+ ] - V ˆβ var [I+ ] - Y [I+ ] - I[I+ ] - V ˆβ [I+ ] - [I+ ] - 3. MSE Mea Square Error dar ˆβ : EL Tr[V ˆβ ]+ βˆ Z -IZ -I βˆ Vara + bas EL E[ ˆβ - βˆ ˆβ - βˆ ] λ + λ + β +I - β V ˆβ + β +I - β 4. Ja 0, da msal ˆβ memeu ersamaa ˆβ [ + I] - Y, maa ˆβ memmuma umla uadrat resdual : Φ ˆ β Y ˆ β Y ˆ β. 5. Ja ˆβ adala solus dar [I+ ] ˆβ Y utu la ag dbera, maa ˆβ adala fugs mooto turu otu dar, sedema gga ada saat, ˆβ 0. 0 Volume No. November 009
Pedetesa Outler dega Metode Regres Rdge 6. Ja β β terbatas, maa ada tetaa >0 sedema gga MSE dar ˆβ urag dar MSE eduga uadrat terecl 7. Dalam ersamaa +I ˆβ Y, g Y adala vetor grade dar Φ β. Msal γ adala sudut atara ˆβ da g, maa γ adala fugs mooto turu otu dar, sedema gga, γ 0. Pemla la tetaa bas meruaa sesuatu ag tda dsaa dalam regres rdge. Utu tu erlu druut dar maa asal la tetaa bas tersebut. Utu melat ˆβ dar sudut adag MSE, maa Hoerl da Keard 970 megesresa al tersebut e dalam betu EL, dmaa : EL λ + β +I - β λ + γ + γ Eleme edua, atu γ, adala ara uadrat dar Z β e β. Eleme γ aa berla ol, a 0, segga γ daat dadag sebaga bas uadrat. Eleme ertama, atu γ, meruaa total vara dar dugaa arameter. Total vara dar semua ˆβ adala umla dagoal eleme Z - Z. Total vara turu serg dega eaa, semetara bas uadrat a serg dega eaa. Total vara γ adala otu, meruaa fugs mooto turu dar. dγ 3 λ λ +. d λ - + 3 λ Bas uadrat γ adala otu, meruaa fugs mooto a dar. dγ d α λ + α 4 λ + α λ + α α 3 λ + λ + α λ + 3 λ dγ dγ λ α λ + 0 3 3 d d λ + + λ λ α λ 0 α Sedaga utu rumusa C ag dguaa sebaga alteratf emla la tetaa bas daat dturua sebaga berut Mers, 990: Varˆ + [ Basˆ ] Varˆ tr[ A ] Volume No. November 009
Sr Har Basˆ JKR tr I A Basˆ JKR tr I A JKR tr I A Jad eduga dar Varˆ + [ Basˆ ] dbera ole : [ ˆ E ] C E [ E E ˆ ] + V ˆ Varˆ ˆ + [ Bas ] C JKR tr A + tr I A JKR + tr A Bla H I + da tr A tr H + JKR C + [ tr H + ] ˆ JKR C + + tr H ˆ Idetfas Pecla Leverage adala eleme-eleme dagoal dar matr roes least squares ag dsebut matr to, H -, ag meelasa edugaa atau la-la dugaa, area : ˆ b H. Eleme-eleme dagoal H meruaa ara atara da. Ole area H adala matr roes, maa da smetrs da demote H H. Eleme-eleme dar matr to ag dusata adala : /. Hal bermlas, bawa /. Jumla aar araterst dar matr roes tda ol sama dega ra dar matr. Dalam al rah ra da trace H, atau area ra eu, maa. Uura rata-rata eleme dagoal adala /. Data ag dga adala ag au dar egamata beregaru, dmaa masg-masg egamata memua deat dega rata-rata /. Utu tu erlu beberaa rtera utu memutusa aa la cuu besar atau cuu au dar rata-rataa. Ja varabel-varabel bebas ddstrbusa secara deede, maa daat dcar dstrbus esa dar fugs-fugs tertetu dar. Belsle, Ku, da Welsc 980 megambl teor dstrbus utu mecar batas rts dar la leverage sebaga berut : Statst Λ Wls utu dua gru, dmaa gru terdr dar tt tuggal : det Λ det Volume No. November 009
Pedetesa Outler dega Metode Regres Rdge Volume No. November 009 3 det det - - Λ Λ F -,- Segga daat dtuls : F -,- Utu besar leb dar 0 da - besar leb dar 50, maa ada tabel F la-laa urag dar segga la / meruaa batas ag cuu bagus. Selauta, egamata e- adala tt leverage eta meleb /. Peurua Rumus PRESS Rumus PRESS umuma adala, ˆ. Rumus bsa dtuls sebaga berut Mers, 990 : e,- - b - e,- + ˆ e 4. Kesmula Masala ecla daat datas dega berbaga metode, dataraa metode regres rdge rdge regresso. Hal dtau dar eteata model, dmaa metode regres rdge membera asl ag relatf leb ba dbadga dega metode uadrat terecl. + ˆ
Sr Har Daftar Pustaa Belsle, D.A., Ku, E., da Welsc, R.E, 980, Regresso Dagostcs. Jo Wle. New Yor. Hoerl, A.E da Keard, R.W., 970, Rdge Regresso: Based Estmato for Noortogoal Problems. Tecometrcs, Vol., o.. Marquardt, D.W., 970, Geeralzed Iverses, Rdge Regresso, Based LearEstmato, ad Noler Estmato. Tecometrcs, Vol., o. 3. Maso, R.L. da Gust, R.F., 985, Outler-Iduced Colleartes. Tecometrcs, Vol., o. 4. Mers, R.H, 990, Classcal ad Moder Regresso wt Alcatos. d Edto. PWS-KENT, Bosto. Neter, J., Wasserma, W. da Kuter, M.H., 990, Aled Lear Statstcal Models, Regresso, Aalss of Varace & Eermetal Desg, Rcard D. Irw Ic. Illos. Toa Coma. LTD, Too. Retas, E., 00, Stud Perbadga Metode Regres Rdge dega Kuadrat Treecl Parsal Pada Strutur Eoom da Tgat Kesra Pedudu Idoesa. Tda Dublasa, Tess Program Master, ITS, Surabaa. Waler, E. da Brc, J.B., 988. Ifluece Measure Rdge Regresso. Tecometrcs, 5: -7. 4 Volume No. November 009