BAB II Kaja Lteratur 4 BAB II KAJIAN LITERATUR. Jarak Mahalaobs Megut artkel tetag jarak Mahalaobs dar htt://e.wkeda.org ada 8 Maret 008, jarak Mahalaobs adalah ukura jarak yag derkealka oleh Prasata Chadra Mahalaobs ada tahu 936, seorag lmuwa Ida. Jarak Mahalaobs ddasarka ada korelas atar varabel-varabel, khususya vers matrks kovaras. Dega demka, jarak berbeda dega jarak Eucldes. Jarak Eucldes atara dua vektor xy R, drumuska sebaga berkut. d ( x, y) ( x y ) + ( x y ) +.. + ( x y ) Euc Sedagka kuadrat jarak Mahalaobs atara dua vektor acak x da y, yag berdstrbus sama dega matrks kovaras, adalah d x y x y x y (, ) ( ) ( ) t M Jka matrks kovarasya adalah matrks dettas, maka jarak Mahalaobsya aka sama dega jarak Eucld, berkut embuktaya : d x y x y x y (, ) ( ) ( ) t M ( x yi ) ( x y) t ( x yix ) ( y) t ( x y)( x y) t
BAB II Kaja Lteratur 5 ( x y ) + ( x y ) +... + ( x y ) d (, ) Euc x y Da jka matrks kovarasya adalah matrks dagoal maka jarak Mahalaobs aka berua jarak Eucld yag terormalsaska. Msalka, σ 0 0 0 0 0 σ 0 0 0 0 0. 0 0 0 0 0. 0 0 0 0 0 σ Maka, d x y x y x y (, ) ( ) ( ) t M σ 0 0 0 0 0 σ 0 0 0 ( x y) 0 0. 0 0 ( x y ) 0 0 0. 0 0 0 0 0 σ t 0 0 0 0 σ 0 0 0 0 σ ( x y) ( x y ) 0 0. 0 0 0 0 0. 0 0 0 0 0 σ t ( x y ) ( x y ) ( x y) + +... + σ σ σ
BAB II Kaja Lteratur 6 ( x y ) σ Jarak mahalaobs juga daat dalkaska utuk masalah Qualtry cotrol (lhat d buku Itroducto to Statstcal Qualty Cotrol ) da masalah regresso dagostc (lhat d buku A Itroducto to Comutatoal Statstcs ). Begtu luasya egguaa jarak Mahalaobs daat djuma dalam lteratur tetag statstk multvarat. Dalam skrs jarak Mahalaobs aka dguaka utuk medeteks/memsahka data yag meruaka outler dar kelomok data yag buka outler. Dalam raktek, dtaksr berdasarka samel. Begtu ula dega mea oulas µ. Msalka S da X matrks kovaras da vekor rata-rata dar samel yag berukura da berdtrbus -varat. Jarak Mahalaobs atara dua aggota samel x da y adalah d x y x y S x y t S (, ) ( ) ( ) Khususya, jka y X, maka d x X x X S x X. Jarak Mahalaobs t M (, ) ( ) ( ) tdak robust karea X da S tdak robust. Megut dar buku karaga Rosseeuw da Leroy, berjudul Detecto outler ad robust regresso, eaksr arameter oulas dkataka robust jka la eaksr tersebut tdak degaruh oleh ada atau tdakya gaggua/outler. Jarak Mahalaobs yag robust, msalya, adalah jarak Mahalaobs yag dberka oleh FMCD atau MVV (lhat desertas Dah Er Herwdat da Mama A Djauhar tahu 005, A New Crtero Robust Estmator For Locato Ad Covarave Matrx, Ad Its Alcato For Outler Labelg ). Rumusa () adalah rumusa jarak mahalaobs, aakah rumusa daat dkataka sebaga jarak? Utuk mejawabya erlu dlakuka egeceka dega cara megecek aakah sfat sfat suatu jarak deuh oleh formula jarak mahalaobs.
BAB II Kaja Lteratur 7 Suatu formula dkataka jarak jka memeuh: xyk,, R, berlaku :. d( x, y) 0 da d( x, y) 0 x y. d( x, y) d( y, x) 3. d( x, y) d( x, k) + d( k, y) Aka dtujukka bahwa rumusa () meruaka jarak :. Sfat omer dar defs jarak deuh oleh rumusa () karea matrks kovaras adalah matrks sem deft ostf maka versya juga ast sem deft ostf sehgga jarak mahlaobs klask ast o egatve.. Sfat omer deuh oleh rumusa jarak mahalaobs berkut ejelasaya : d x y x y x y t (, ) ( ) * *( ) t ( y x) * *( ( y x) ) t ( ) * *( y x y x) d( y, x) 3. Sfat omer 3 (ketaksamaa segtga) deuh oleh rumusa jarak mahalaobs. Tada ketaksamaa bas mejad sama dega jka vector x, k da y collear (segars) Jad terbukt bahwa jarak mahalaobs adalah rumusa jarak.
BAB II Kaja Lteratur 8. Algortma metode jarak Mahalaobs klask x, x,.., x dega Dketahu hmua data A { } x R berdstrbus ormal (0, ) N I, berkut algortma metode jarak Mahalaobs klask jka dteraka ada data A. Htug vector rata-rata dar data, x ( a, a,..., a ) dega a j adalah eleme matrks data A bars ke da kolom ke j a j a j utuk Htug vector x x da trasosya yatu ( x utuk la,,, t x) dega x R Setelah tu htug matrks kovaras S dar hmua data A. I bsa dhtug dega megguaka rogram Matlab 7 yatu dega cara megetkka staks Scov(A) ke edtor m-fle. Kemuda htug la kuadrat jarak Mahalaobs utuk masg masg vector data yatu : d ( x, x) ( x x)* S *( x x) t utuk,,..., S Selajutya lot la kuadrat jarak Mahalaobs utuk dar sama d atas terhada deksya sedr yatu,,, Dar lot kuadrat jarak Mahalaobs bsa terlhat data ke beraa yag atut dcurga sebaga outler. Dar kaja lteratur daat dsmulka bahwa metode edeteksa outler berdasarka jarak Mahalaobs haya efektf utuk kehadra buah outler da dstrbus kuadrat jarak Mahalaobs bersfat eksak.
BAB II Kaja Lteratur 9.3 Dstrbus Kuadrat Jarak Mahalaobs Pada metode yag dlot adalah la kuadrat jarak Mahalaobs utuk seta data. Utuk meetuka data maa yag mejad outler, kta erlu meetuka terlebh dahulu ttk krts (cut-off) berdasarka dstrbus kuadrat jarak Mahalaobs. Johaa Hard da Davd M. Rocke dalam artkelya yag terbt ada Joural of Comutatoal ad Grahcal Statstcs, volume 4 halama 98 946 x, x,.., x utuk tahu 005, megataka bahwa jka dberka data { } x R berdstrbus ormal multvarat, maka ( ) d (, ) S x x ~ ( ) Beta(, ). Dega kata la, kuadrat jarak Mahalaobs klask memuya dstrbus eksak d ( x, x ) ~ S ( ) ( ) Beta(, ) Dar s kta eroleh mea da varasya, d S ( x, x) E da d S ( x, x) ( ) var ( + ) Bukt. Jka dberka X varabel acak berdstrbus Beta dega arameter α da β maka E[ X] α α + β αβ ( α + β + )( α + β) da var[ X ] (lhat d buku Itroducto to Mathematcal Statstcs 6 th edto karaga Hogg ad Crag) sehgga : ds ( x, x) / E ( ) / + ( )/
BAB II Kaja Lteratur 0 / ( )/ ds ( x, x) ( ) E ( ) d S ( x, x) E ( ) ds ( x, x) ( /)( )/ var ( ) ( / + ( )/+ )( / + ( )/) ( )/4 (( + ) / )(( ) / ) ( ) ( + )( ) ds ( x, x) ( ) ( ) ( + ) ( ) var ds ( x, x) ( ) var ( ) ( ) ( + ) d S ( x, x) ( ) var ( ) ( + ) Kuadrat jarak Mahalaobs klask juga daat ddekat oleh dstrbus chsquare dega arameter.
BAB II Kaja Lteratur.4 Ttk krts (cut-off) Berdasarka dstrbus kuadrat jarak Mahalaobs d atas, maka ttk krts (cut-off) ada eguja kehadra outler daat dtetuka. Msalka kesalaha te I yag dgka adalah α. Jad, α adalah robabltas bahwa data yag buka outler terdeteks sebaga outler. Maka ttk krtsya adalah, ( ) ( ) cut _ off * Beta( α,, ) d maa ( ) Beta( α,, ) adalah kuatl ke (-α ) dar dstrbus beta ( ) dega arameter da, adalah bayakya data, da adalah bayakya varable. Utuk α 5%, maka ( ) ( ) cut _ off * Beta(0.95,, ).