6 BAB LANDASAN TEORI.1 Regres Lner Analss regres dgunakan untuk mengetahu hubungan antara varabel terkat (Y) dengan satu atau lebh varabel bebas (X). Menurut Har et al (009) regres lnear sederhana dapat efektf dengan ukuran sampel sebanyak 0 observas. Menurut Nawar (010), model regres lner untuk satu varabel bebas yatu model regres lner sederhana, dnyatakan dalam persamaan berkut: YY = ββ 0 + ββ 1 XX + εε.1 Keterangan: = 1,,..., Y X = varabel terkat = varabel bebas ββ 0, ββ 1 = parameter regres εε = ssaan/galat Nla ββ 0 dan ββ 1 adalah parameter regres yang tdak dketahu nlanya dan akan dcar nla estmasnya. Model penduga regres lner sederhana untuk persamaan.1 adalah sebaga berkut: YY = ββ 0 + ββ 1XX. Keterangan: YY = nla YY yang destmas ββ 0, ββ 1 = penduga parameter
7. Metode Kuadrat Terkecl Metode kuadrat terkecl merupakan salah satu penduga parameter (nla ββ 0, ββ 1) model regres lner sederhana. Menurut Sembrng (1995), metode kuadrat terkecl merupakan metode yang memnmumkan jumlah kuadrat ssa (selsh antara data yang sebenarnya dengan data dugaan dar model regres yang terbentuk). Dar persamaan regres lner sederhana.1, nla resdu (ssaan) ke- pada model yatu: εε = YY YY.3 εε = YY ( ββ 0 + ββ 1XX ).4 Prnsp dasar metode kuadrat terkecl adalah memnmumkan jumlah kuadrat ssaan yang dnyatakan sebaga berkut: Mnmum =1 εε.5 =1 εε = YY YY =1 = YY ( ββ 0 + ββ 1XX ) =1 =1 εε = YY ββ 0 ββ 1XX =1.6 Keterangan: YY YY = data sebenarnya = data dugaan ββ 0, ββ 1 = penduga parameter εε = ssaan kuadrat Andakan =1 εε dnotaskan dengan PP, PP merupakan fungs dar nla ββ 0 dan ββ 1 sehngga nla-nla PP dapat dtentukan dengan menurunkan persamaan (.6) terhadap ββ 0 dan ββ 1 kemudan menyamakan tap turunaya dengan nol, dperolehlah nla sebaga berkut: PP = =1 εε = YY ββ 0 ββ 1XX =1 PP = =1 YY ββ 0 =1 YY ββ 1 =1 YY XX + (ββ 0 + ββ 1XX ) =1
8 = 0 ββ =1 YY 0 + =1 ββ 0 + ββ 1XX = 0 0 = ββ =1 YY + =1 ββ 0 + ββ 1XX = 0 0 =1 YY = ββ 0 + ββ 1 XX dan =1.7 = 0 0 ββ =1 YY XX + =1 ββ 0 + ββ 1XX XX = 0 1 = ββ =1 YY XX + =1 ββ 0 + ββ 1XX XX = 0 1 =1 YY XX = ββ 0 =1 XX + ββ 1 XX =1.8 Dar persamaan.7 maka akan dcar nla ββ 0 sebaga berkut: =1 YY = ββ 0 + ββ 1 =1 XX ββ 0 = =1 YY ββ 1 =1 XX ββ 0 = YY ββ 1XX.9 Selanjutnya, dar persamaan.8, akan dcar nla ββ 1 sebaga berkut: =1 YY XX = ββ 0 =1 XX + ββ 1 XX = YY =1 ββ 1 =1 XX =1 = YY =1 =1 XX ββ 1 =1 XX =1 YY XX YY =1 =1 XX maka dperolehlah ββ 1 yatu: ββ 1 = YY XX =1 YY =1 =1 XX XX =1 1 XX =1 XX + ββ 1 XX = ββ 1 =1 XX =1 + ββ 1 =1 XX + ββ 1 =1 XX = ββ 1 1 ( XX =1 ) + XX =1.10 =1.3 Rataan Kuadrat Ssa (Mean Square Error) Menurut Sembrng (1995), salah satu untuk menentukan kecocokan model dengan rataan kuadrat ssa ss, jka semakn kecl rataan kuadrat ssanya maka
9 semakn bak modelnya. Ukuran n memperhtungkan banyaknya parameter dalam model melalu pembagan dengan derajat kebebasaya. Untuk menentukan rataan kuadrat ssa dnyatakan dalam rumus sebaga berkut: ss = JJJJJJ JJJJJJ JJJJJJ = pp pp.11 Keterangan: JKS = Jumlah Kuadrat Ssa JKT = Jumlah Kuadrat Total = (YY YY ) JKR = Jumlah Kuadrat Regres = (YY YY ) pp YY YY YY = Banyaknya sampel = Banyaknya parameter = Data sebenarnya = Data dugaan = Rataan data sebenarnya.4 Penclan.4.1 Pengertan Penclan Menurut Sembrng (1995), secara umum penclan alah data yang tdak mengkut pola umum model..4. Dampak Penclan Menurut Soemartn (007), keberadaan data penclan akan mengganggu dalam proses analss data dan harus dhndar dalam banyak hal. Salah satu penyebab tdak terpenuh asums kenormalan galat adalah penclan (Gujarat, 1991). Dalam kataya dengan analss regres, penclan dapat menyebabkan hal-hal berkut: 1. Resdual yang besar dar model yang terbentuk. Varans pada data tersebut menjad lebh besar 3. Taksran nterval memlk rentang yang lebar
10.4.3 Pendeteksan Penclan Menurut Soemartn (007) beberapa metode dan nla yang dapat dgunakan untuk mendeteks ada atau tdak adanya penclan alah sebaga berkut: 1. Metode Grafk Metode grafk merupakan salah satu cara pendeteksan penclan yang mudah dpaham karena menamplkan data secara grafs (gambar) tanpa melbatkan perhtungan yang rumt. Namun, kelemahan metode n yatu yang menentukan data tersebut sebaga penclan atau tdak tergantung pada kebjakan (judgement) penelt, karena metode n hanya mengandalkan vsualsas gambar. Pendeteksan penclan dengan metode grafk d antaranya alah: a. Dagram Pencar (Scatter Plot) Metode n dlakukan dengan cara memplot data dengan observas ke- ( = 1,,, ). Selan tu, setelah dperoleh model regres maka dapat dlakukan dengan cara memplot antara resdual (ee) dengan nla predks Y (YY ). Jka terdapat satu atau beberapa data yang terletak jauh dar pola kumpulan data keseluruhan maka hal n mengndkaskan adanya penclan. b. Boxplot Metode boxplot merupakan metode yang palng umum yatu dengan menggunakan nla kuartl dan jangkauan. Jangkauan (IQR, Interquartle Range) ddefnskan sebaga selsh kuartl 1 terhadap kuartl 3, atau IQR = QQ 33 QQ 11. Pendeteksan penclan dapat dtentukan jka nla yang kurang dar 1,5IQR terhadap kuartl 1 dan nla yang lebh dar 1,5IQR terhadap kuartl 3.
11 Gambar.1 Skema Identfkas Data Penclan dengan IQR atau Box Plot. Leverage Values, DFFITS, Cook s Dstance, dan DfBETA(s) Cara mendeteks penclan dapat juga dengan menentukan nla Leverage, DFFITS, Cook s Dstance, dan DfBETA(s). Defns dar masng-masng nla tersebut alah sebaga berkut: a. Leverage Values; menamplkan nla leverage (pengaruh) terpusat. b. DFFITS atau Standardzed DfFIT; menamplkan nla perubahan dalam harga yang dpredks blamana case tertentu dkeluarkan dan sudah dstandarkan. c. Cook s Dstance; menamplkan nla jarak Cook. d. DfBETA(s); menamplkan nla perubahan koefsen regres sebaga hasl perubahan yang dsebabkan oleh pengeluaran case tertentu. Dgunakan untuk mendeteks penclan pada varabel bebas.
1 Ketentuan dalam pendeteksan penclan dengan nla-nla tersebut adalah: JJJJJJJJ ( 11) aa. LLLLLLLLLLLLLLLL > bb. DDDDDDDDDDDD > ssssssss pp PPPPPPPPPPPPPPPP(OOOOOOOOOOOOOO) cc. CCCCCCkk ss DD > FF(00. 55; pp, pp) dd. DDDDDDDDDDDD(ss) > ssssssss() Gambar. Krtera Pengamblan Keputusan Adanya Penclan atau Tdak Keterangan: n = jumlah observas (sampel). p = jumlah parameter..5 Regres Robust Menurut Drafer dan Smth (1981), penolakan begtu saja suatu penclan bukanlah prosedur yang bjaksana, adakalanya penclan memberkan nformas yang tdak bsa dberkan oleh ttk data laya. Metode kuadrat terkecl (MKT) merupakan metode yang bak untuk menduga ββ pada model regres lner. Tetap jka dalam peneltan dketahu terdapat pengamatan yang merupakan penclan, maka penggunaan MKT akan menghaslkan kesmpulan yang tdak sempurna. Sebaga alternatf dgunakan regres robust. Secara umum robust memlk art kekar. Regres robust merupakan alat yang pentng untuk menganalss data yang terkontamnas oleh penclan dan memberkan hasl yang lebh fleksbel. Regres robust tetap menggunakan seluruh data, tetap dengan memberkan bobot yang kecl untuk data penclan (Soemartn, 007: 1). Regres robust dgunakan untuk mendeteks penclan dan memberkan hasl terhadap adanya penclan (Chen, 00).
13.5.1 Regres Robust Penduga-S Penduga-S (Scale) pertama kal dperkenalkan oleh Rousseeuw dan Yoha (1984) d mana metode n merupakan keluarga hgh breakdown pont yatu ukuran umum propors dar data penclan yang dapat dtangan sebelum pengamatan tersebut mempengaruh model predks. Dsebut penduga-s karena mengestmas berdasarkan skala. Skala yang dgunakan adalah smpangan baku ssaan. Pendugaan koefsen regres pada model regres lner dengan MKT dlandas pada peubah εε = YY YY pada persamaan: =1 xx ee = 0.1 Bentuk yang lebh umum dar pendugaan parameter pada model regres adalah pemecahan terhadap: =1 ψψ(uu )xx = 0.13 D mana uu = ee cccc Dengan S ddefnskan sebaga:.14 SS mm = mmmmmmmmmmmm ee, = 1,,...,.15 D mana ee adalah ssaan yang dperoleh dar MKT. Penyelesaan koefsen regres pada persamaan.13 dsebut dengan penduga-m dan dapat dselesakan dengan MKT terbobot berkut: β = (X WX) -1 X WY d mana W (matrks dagonal ) = dagonal utama [ww 1, ww,, ww ], ww merupakan pembobot pengamatan ke- (Myers, 1990). Jka ww = ψψ(uu ) uu maka persamaan.13 menjad: ww uu xx = 0 =1.16
14 Tahapan teras dalam penaksran koefsen regres (Wnahju, 010) adalah: 1. Dhtung penaksr β, dnotaskan b menggunakan least square, sehngga ddapatkan y ˆ, 0 dan ε,0 = y y ˆ, 0, ( = 1,,... n) yang dperlakukan sebaga nla awal (y adalah hasl ekspermen). ψ ( ε,0). Dar nla-nla resdual n dhtung ˆ σ 0, dan pembobot awal w,0 =. ( ε ) Nla ψ(ε ) dhtung sesua fungs Huber, dan ε,0 = ε,0 / ˆ σ 0. 3. Dsusun matrk pembobot berupa matrk dagonal dengan elemen w 1,0, w,0,..., w n,0, dnama W 0. 4. Dhtung penaksr koefsen regres: b Robust ke 1 = (X T W 0 X) -1 X T W 0 Y 5. Dengan menggunakan b Robust ke 1 dhtung pula y yˆ, 1 atau ε. 1. 6. Selanjutnya langkah sampa dengan 5 dulang sampa ddapatkan ε n konvergen. Nla ε. m yang konvergen adalah selsh antara bb mm+1 dan bb mm = 1 mendekat 0; mm = banyak teras. n = 1 n = 1 n = 1,0. m Persamaan.15 menunjukkan bahwa penduga-m hanya menggunakan medan pada pembentukan nla pembobot. Kelemahan medan adalah kurangnya pertmbangan pada pola sebaran data dan bukan merupakan fungs dar keseluruhan data. Rousseeuw dan Yoha (1984) memperkenalkan penduga-s yang merupakan pengembangan dar penduga-m. Penduga-S menggunakan smpangan baku ssaan untuk mengatas kelemahan dar medan. Menurut Salban dan Yoha (006) penduga-s (ββ SS) dnyatakan dalam bentuk rumus sebaga berkut: ββ SS = mn atau =1 ρρ ee SS ss ββ SS = mn ρρ yy XX ββ jj =1.17 SS ss ββ sehngga, Penyelesaan persamaan.17 adalah dengan cara menurunkaya terhadap
15 ββ SS = XX =1 ψψ ee SS ss = 0.18 ψψ dsebut fungs pengaruh yang merupakan turunan dar ρρ, sedangkan SS ss ddefnskan sebaga: =1 ( 1) SS ss = (ee MM ) ee MM =1.19 D mana ee MM adalah ssaan yang dperoleh melalu penduga-m. Persamaan.18 dapat dselesakan melalu MKT terbobot secara teras yang dsebut Iteratvely Reweghted Least Squares (Iteras kuadrat terkecl terbobot kembal). Ssaan awal yang dgunakan pada penduga-s adalah ssaan yang dperoleh dar penduga-m. Selanjutnya dkatakan bahwa Iteras kuadrat terkecl terbobot kembal merupakan proses pendugaan melalu metode kuadrat terkecl terbobot dlanjutkan dengan menghtung ssaan dan pembobot ww(uu ) yang baru dan dlakukan pendugaan secara berulang-ulang sampa konvergen. Kekonvergen tercapa jka perubahan jumlah mutlak ssaan, =1 εε :mm dar teras terakhr ke teras berkutnya kurang dar 0,01 (Salban dan Yoha, 006). Fungs ρρ pada persamaan.17 dsebut fungs krtera ρρ dsarankan memaka fungs obyektf berkut (Tukey, 1977, dalam Chen, 00): ρρ(u ) = c [1 1 ( u c ) 3 ] c 6, uu c 6, uu > c dengan fungs pengaruh: ΨΨ(uu ) = ρρ (uu ) = uu (1 ( u c ) ), uu c 0, uu > c Oleh karena ww = ΨΨ(uu ) (uu ), sehngga:.0 ww = [1 (u c ) ], uu c 0, uu > c.1 Rousseeuw dan Leroy (1987) menyarankan nla cc = 1,547 agar mendapatkan nla breakdown pont 50%. Fungs pengaruh atau penmbang n dsebut fungs Tukey atau bsquare weght atau bweght. Selanjutnya dterangkan juga bahwa secara umum de dalam bweght adalah bahwa ssaan yang kecl mendapatkan
16 bobot yang besar. Secara rngkas, fungs obyektf dan pembobot dar estmator Least Square, Huber, dan Tukey Bsquare dapat dlhat pada Tabel.1. Tabel.1 Fungs Objektf, Fungs Influence dan Fungs Pembobot untuk Least Square, Huber, dan Tukey Bsquare Metode Least Huber Tukey Bsquare Square Fungs ( e ) /, untuk e r 3 ρ LS ( e ) = ( e ) ( ) k e 1 1 untuk 6 r ρ H ( e ) = ρ B ( e ) = objektf r e r /, untuk e > r r / 6 untuk e > r e r Fungs nfluence Fungs Pembobot ψ ( e ) LS ( e ) = e w LS w ( e ) ( e ) = 1 e untuk e r ψ = H r untuk e > r ( ) ( ) e e 1 untuk e r r ψ B e = 0 untuk e > r r untuk e < r H 1 untuk e r = r / e untuk e > r Sumber: Fox (00), Montgomery (199) w B 1 ( ) ( ) r e = e 0 untuk untuk e e > r r Langkah-langkah menentukan regres robust penduga-s (Salban dan Yoha, 006) adalah sebaga berkut: a. Ddapatkan vektor penduga awal bb 1, bb,, bb pp dar model regres dengan MKT ddapatkan galat ee 0. b. Dar ssaan awal dhtung SS MM sesua persamaan (.15) untuk mendapatkan uu berdasarkan persamaan (.14). c. Menghtung nla ww sesua persamaan (.1). d. Dengan menggunakan MKT terbobot ddapatkan penduga kuadrat terkecl terbobot: β = (X WX) -1 X WY e. Menjadkan ssaan langkah (d) sebaga ssaan awal pada langkah (b), sehngga ddapatkan nla SS MM dan pembobot ww yang baru. f. Iteras dulang sampa ddapatkan kekonvergenan sehngga dperoleh bb MM 0, bb MM MM 1,, bb pp yang merupakan penduga-m sehngga ddapatkan ssaan ee MM.
17 g. Dar ssaan yang dperoleh pada langkah (f), dhtung robust SS ss sesua persamaan(.19) untuk mendapatkan nla uu sesua persamaan (.14). h. Menghtung nla ww sesua persamaan (.1).. Dgunakan MKT terbobot untuk mendapatkan penduga kuadrat terkecl terbobot: β = (X WX) -1 X WY j. Menjadkan ssaan yang dperoleh pada langkah () sebaga ssaan pada langkah (g), sehngga ddapatkan nla SS ss dan pembobot ww yang baru. k. Iteras ulang sampa ddapatkan kekonvergenan sehngga dperoleh bb SS 0, bb SS SS 1,, bb pp yang merupakan penduga-s..5. Regres Robust Penduga Least Trmmed Squares (LTS) Least Trmmed Squares (LTS) merupakan metode penduga regres robust yang menggunakan konsep pengepasan metode kuadrat terkecl (ordnary least squares) untuk memnmumkan jumlah kuadrat ssaan (Akbar dan Maftukhah, 007). Menurut Rousseeuw dan Leroy (1987), penduga LTS (ββ ) dnyatakan dalam bentuk rumus sebaga berkut: h ββ LLLLLL = mn =1 (rr ) :. Keterangan: (rr ) 1: (rr ) : (rr ) : = ssaan kuadrat yang durutkan h = + pp+1 = +pp+1 n = banyaknya sampel p = banyaknya parameter Jumlah h menunjukkan sejumlah subset data dengan kuadrat fungs obyektf terkecl. Nla h pada persamaan akan membangun breakdown pont yang besar sebandng dengan 50%. Kuadrat ssa pada persamaan (.) berasal dar persamaan estmas regres lner menggunakan konsep metode kuadrat terkecl dengan banyaknya ssaan kuadrat (ee ) : yang akan dolah adalah sebanyak h resdual.