Bab. MODEL REGRESI LINEAR SEDERHANA Oleh Bambag Juada
Pegerta Model & Tujua Pemodela Perumusa masalah Model Model: Abstraks realtas dlm pers matematka Model ekoometrka: model statstk yg mecakup error Y = f(1,,..., p) + error (.1) data aktual = dugaa + ssaa (smpaga) data = komp. sstematk + komp. o-sstematk dugaa Y = f(1,,..., p) (.) dharapka usur-usur ketdak-teratura la Y dapat djelaska oleh la-la dar peubah 1,,..., da p berdasarka model dugaa dalam persamaa (.). Oleh karea tu, kompoe ssaa dusahaka mejad relatf kecl dbadgka kompoe dugaaya.
Deskrps kompoe error : 1. Kesalaha pegukura da proxy dar peubah respos Y maupu peubah pejelas 1,,..., da p.. Asums betuk fugs f yag salah. Mugk ada betuk fugs laya yag lebh cocok, lear maupu o-lear. 3. Omtted varables. Peubah (varable varable) ) yag seharusya dmasukka ke dalam model, dkeluarka karea alasa-alasa tertetu (msalya peyederhaaa, atau data sult dperoleh da la-la). la). 4. Pegaruh faktor-faktor la yag belum terpkrka atau tdak dapat dramalka (upredctable effects).
Model Regres Lear Sederhaa Hubuga atar Peubah dlm Fugs Lear dlm Parameter Gars Lurus yg Palg Cocok dg Data Model Populas: tersep Y Slope Error Acak Peubah Respos (depedet) Y 0 1 akbat; sult atau mahal dukur Peubah Pejelas (Idepedet) peyebab; mudah atau murah dukur Model Regres Cotoh: Y b b 0 1 e
Model Regres Lear Populas Y Y b b e 0 1 Nla Pegamata e = Error Acak m b b Y/ 0 1 Dugaa Nla Pegamata
Persamaa Regres Lear Sederhaa (Telada) Ig megkaj hubuga atara luas lata toko (hasl pertaa) dega total pejuala tahuaya. Data cotoh utk 7 toko telah dperoleh. Tetuka persamaa gars lurus yg palg cocok dg data tsb Store Aual Square Sales Feet ($000) 1 1,76 3,681 1,54 3,395 3,816 6,653 4 5,555 9,543 5 1,9 3,318 6,08 5,563 7 1,313 3,760
Dagram Pecar (Scatter Dagram) 1000 Pe ejuala ($000) 10000 8000 6000 4000 000 0 0 1000 000 3000 4000 5000 6000 Luas Lata (Square Feet ) Maa peubah da maa peubah Y? Megapa?
Model Regres Lear Cotoh Y Y 1 Y b b 0 1 b b 0 Y = Nla dugaa Y utk pegamata ke- = Nla utk pegamata ke- e Y b 0 = Dugaa bag koef tersep populas 0 ; rata-rata Y jka =0 b 1 = Dugaa bag koef slope populas 1 ; rata-rata perbedaa Y jka berbeda 1 ut
e Metode (Jumlah) Kuadrat (Ssaa) Terkecl: MKT atau Ordary Least Squares Mecar dugaa koefse yg meghaslka jumlah kuadrat smpaga atara data aktual dg data dugaa MINIMUM ˆ Y Yˆ, da mmumka q = =1 e shg a Y Y Y Y Y 1 1 1 1 b 1 1 1 b
Persamaa Gars Lurus Terbak Y b 0 b 1 1636.415 1.487 Predctor Coef SE Coef T P Costat 1636.4 451.5 3.6 0.015 1.4866 0.1650 9.01 0.000 S = 611.75 R-Sq = 94.% R-Sq(adj) = 93.0% Aalyss of Varace Source DF SS MS F P Regresso 1 30380456 30380456 81.18 0.000 Resdual Error 5 187100 37440 Total 6 351656
Grafk Gars Lurus Terbak 1000 ($000) Pejuala 10000 8000 6000 4000 000 0 0 1000 000 3000 4000 5000 6000 Luas Lata (Square Feet )
Iterpretas Koefse Y = 1636.415 +1.487 Iterpretas Nla slope 1.487 ( umumya ): utk keaka 1 ut dlm, dduga Y aka megkat 1.487ut. Iterpretas palg tepat dlm kasus : Rata perbedaa total pejuala atara toko yg luasya berbeda 1 square feet adalah $1487 per th Implkas dar dugaa slope (dg asums tertetu): Jka ukura lata toko ak 1 square feet, model tsb mempredks bahwa total pejuala yg dharapka aka megkat $1487 per th.
Asums Model Regres Lear Keormala & Kebebasa Nla-la Y Meyebar Normal utk masg- masg la ; dg E(Y )=b 0 +b 1 da Var(Y ) = utk semua. () Sebara Peluag Error adalah Normal, Bebas da Idetk dega E(e )=0 da var(e )= utuk semua. () Peubah da e bebas Homoskedaststas (Ragam Kosta) Ssaa (Error Error) ) bebas
Ragam Error Sektar Gars Regres f(e) Nla-la y meyebar ormal d sektar gars regres. Utk masg-masg la x, sebara atau ragam dsektar gars regres adalah sama. Y 1 Gars Regres
Dugaa Galat baku (Stadard Error) S ˆ y / x JKS 1 ( Y Yˆ ) Smpaga Baku pegamata-pegamata dsektar gars regres Jka asums tetag peubah acak I dpeuh maka masg-masg dugaa koefse aka meyebar ormal dg E(b 0 )=b 0 da E(b 1 )=b 1 serta dugaa ragam: b 0 1 1 S b 1 1 b ~ N( ; ) b S Y ( / ) b
Telada: Toko Hasl Pertaa Data utk 7 Toko: Aual Toko Square Sales Feet ($000) 1 1,76 3,681 1,54 3,395 3,816 6,653 4 5,555 9,543 5 1,9 3,318 6,08 5,563 7 1,313 3,760 Model Regres yg dperoleh: Y = 1636.415 +1.487 Slope model adalah 1.487. Apakah ada hubuga lear atara ukura luas toko dg total pejuala tahuaya? Apakah total pejuala dpt dpredks dar ukura luas lata tokoya?
Iferesa megea Slope: Uj-t 0 1 Uj-t utk Slope Populas Y Ada Hubuga Lear atara dg Y? Hpotess Nol da Alteratf H 0 : b 1 = 0 ( tdak dpt mejelaska Y) H 1 : b 1 0 ( dapat mejelaska Y) Statstk Uj: t b 1 S b 1 1 da db = - dmaa S b 1 1 S Y ( / )
Iferesa ttg Slope: Cotoh Uj-t a.05 H 0 : b 1 = 0 H 1 : b 1 0 db 7 - = 5 Nla-la krts : Tolak H 0 Tolak H 0.05 -.5706.05 0.5706 t Statstk Uj-t : t S tat P-value I te rce p t 3.644333 0.0151488 V a ra b le 9.009944 0.00081 Keputusa: Tolak H 0 Kesmpula: Terbukt ada hubuga. Mak luas ukura Toko, mak tgg pejualaya
Selag Kepercayaa Slope b 1 ± t - S b1 Output Excel masalah Produce Stores Low er 95% Upper 95% I te rce p t 475.81096 797.01853 V a ra b le 1.0649037 1.91077694 95% yak la slope atara 1.06 s/d 1.911. (Selag Kepercayaa tdk mecakup la 0) Kesmpula: Ada hubuga lear yg yata atara pejuala tahua dg ukura toko.
Taraf Nyata, a da Daerah Peolaka H 0 : 1 k H 1 : 1 < k H 0 : 1 k H 1 : 1 > k H 0 : 1 k H 1 : 1 k b 1 ~ N( I ; ) b 1 Daerah Peolaka (ttk krts) 1 b 1 a 0 t 0 t 0 t a a/
() e ~ N(0; ) Asums Model Regres Lear: Peubah acak ε meyebar Normal, bebas da detk utk =1,..,. () fxed varable 0 e Bebas: Cov(ε t, ε s )= E(ε t ε s )=0 utuk t s. Homoskedaststas: Var(ε )= E(ε )=. Dugaa Koefse dega OLS bersfat TAK BIAS dg RAGAM MINIMUM (Best Lear Ubased Estmator), da meyebar Normal. Dugaa Rata Y utk tertetu meyebar Normal ^ μ Y/ ~ N( 0 + 1 ; ) μ Y ^ μ Y/ Dugaa Idvdu Y utk ttt sama dg dugaa ^ rataya, juga Y/ ~ N( 0 + 1 ; ) meyebar Normal, dg Y ragam lebh besar 0 + 1 ^ Y/ 1
Dugaa Selag Nla-Nla Ramala Selag kepercayaa bag m Y, Rataa Y utk tertetu Stadard error dugaa Ŷ la t dar tabel dg db=- t S yx Selag bervaras sesua jarakya terhadap rataa,. 1 ( 1 ( ) )
Dugaa Selag Nla-Nla Ramala Selag Kepercayaa bag Dugaa Respos dvdu Y utk tertetu Tambaha 1 membuat selagya lebh lebar dar SK bag rataa Y, µ Y Ŷ t S yx 1 1 ( 1 ( ) )
Dugaa Selag utk Nla-la yag Berbeda Y Selag Kepercayaa utk dvdu Y Selag Kepercayaa utk rataa Y _ tertetu
Data for 7 Toko: Toko Aual Square Sales Feet ($000) 1 1,76 3,681 1,54 3,395 3,816 6,653 4 5,555 9,543 5 1,9 3,318 6,08 5,563 7 1,313 3,760 Dugalah pejuala tahua utk suatu toko berukura 000 square feet. Model Regres yg dperoleh: Y = 1636.415 +1.487 Y = 1636.415 +1.487 (000) Dugaa Pejuala = 4610.45 ($000) Seberapa besar kemugka kesalaha dar dugaa?? Tk Keyaka bhw la sebearya berada dlm selag dugaa Selag kepercayaa (1-)100% bag la sebearya
Dugaa Selag Ramala Rataa Y Dugaa Selag Kepercayaa bag m Y Tetuka SK 95% bag rata-rata pejuala tahua utk toko berukura,000 square feet Dugaa Sales Y = 1636.415 +1.487 = 4610.45 ($000) = 350.9 S Y = 611.75 t - = t 5 =.5706 Ŷ t S yx 1 ( 1 ( ) ) = 4610.45 ± 980.97 SK bag rataa Y
Dugaa Selag Ramala Idvdu Y Selag kepercayaa utk dugaa Idvdu Y Tetuka SK 95% bag pejuala tahua utk suatu toko berukura,000 square feet Ramala Sales Y = 1636.415 +1.487 = 4610.45 ($000) = 350.9 S Y = 611.75 t - = t 5 =.5706 Ŷ t S yx 1 1 ( 1 ( ) ) = 4610.45 ± 1853.45 SK bag dvdu Y
ANOVA: Aalss Ragam Apakah Keragama Y dapat djelaska oleh (peubah dlm) Model? Y = b 0 + b 1 + e Y = (Y - b 1 ) + b 1 + e (Y Y) = b 1 ( ) + e (Y Y) = { b 1 ( ) + e } (Y Y) = { b 1 ( ) + e } (Y Y) = b 1 ( ) + e JKT = JKR + JKS
Ukura Keragama: Jumlah Kuadrat Y _ JKT = (Y - Y) JKS =(Y - Y ) _ JKR = (Y - Y) _ Y
JKT = Jumlah Kuadrat Total megukur keragama la-la Y sektar rataa Y JKR = Jumlah Kuadrat Regres Mejelaska keragama yg dpt daggap berasal dar hubuga atara dg Y (model regres) JKS = Jumlah Kuadrat Ssa (error) Keragama yg dpt daggap berasal dar faktor-faktor sela hubuga atara dg Y Tabel ANOVA db JK Regres 1 30380456.1 Ssa 5 1871199.595 Total 6 351655.71 JKR JKS JKT
Tabel Aalss Ragam (ANOVA) Utuk Regres Ler Sederhaa _ JKR = (Y - Y) JKS =(Y - Y ) _ JKT = (Y - Y) Sumber Keragama Derajat Bebas Jumlah Kuadrat (JK) Kuadrat Tegah (KT) F-htug Regres 1 JKR= KTR=JKR/1 KTR/KTG ( 1) b S x Galat - JKS= y x ( 1)( S b S ) KTS=JKG/(-) Total -1 JKT= ( 1) S y
Koefse Determas: JKR r = = JKT Jumlah Kuadrat Regres Jumlah Kuadrat Total Megukur propors keragama yg djelaska oleh (peubah bebas dlm) model regres Serg secara formal sbg ukura goodess-of-ft utk membadgka valdtas bbrp spesfkas model 94% keragama total pejuala tahua dpt djelaska oleh keragama ukura toko yg dukur dg square footage S e = 611.75 R-Sq = 94.% R-Sq(adj) = 93.0% Aalyss of Varace Source DF SS MS F P Regresso 1 30380456 30380456 81.18 0.000 Resdual Error 5 187100 37440 Total 6 351656
Koefse Determas (r ) da Korelas (r) Y r = 1, r = +1 Y r = 1, r = -1 Y ^ = b 0 + b 1 ^ Y = b 0 + b 1 Y r =.8, r = +0.9 r = 0, r = 0 Y Y^ = b 0 + b 1 Y^ = b 0 + b 1
Iferesa megea Model: Uj-F Y 0 1 Hpotess Statstk H 0 : b 1 = 0 (model tdk dpt mejelaska keragama Y) H 1 : b 1 0 (model dapat mejelaska keragama Y) Statstk Uj: Apakah Model dpt mejelaska keragama Y? a = 0.05 F = KTR/KTS ~ F (p, -1-p) p: Jumlah peubah bebas 0 6.61 Aalyss of Varace Source DF SS MS F P Regresso 1 30380456 30380456 81.18 0.000 Resdual Error 5 187100 37440 Total 6 351656 F (1,5)
Aalss Ssaa (Resdual) Tujua Megkaj Leartas Evaluas pelaggara asums Aalss Ssaa dg Grafk Plot ssaa Vs. la-la atau Y (e, ) atau (e, ) atau (e /s e, ) Studetzed resduals: : = e /s e Memugkka mempertmbagka besara ssaa (ssaa-baku spt Normal baku)
Aalss Ssaa utk Leartas e Not Lear e Lear
Aalss Ssaa utk Homoskedaststas SR Heteroskedaststas Homoscedastcty SR Megguaka Stadardzed Resduals (SR)
Aalss Ssaa utk Kebebasa e SR Tdak Bebas SR Bebas
Aalss Ssaa: Output Komputer Resdual Plots for Y Normal Probablty Plot of the Resduals Resduals Versus the Ftted Values Percet 99 90 50 10 1-3.0-1.5 0.0 1.5 Stadardzed Resdual 3.0 Stadardzed Resdual 1 0-1 - 4000 6000 8000 Ftted Value 10000 Hstogram of the Resduals Resduals Versus the Order of the Data Frequecy.0 1.5 1.0 0.5 0.0-1.5-1.0-0.5 0.0 0.5 1.0 Stadardzed Resdual 1.5 Stadardzed Resdual 1 0-1 - 1 3 4 5 Observato Order 6 7
Statstk Durb-Watso Dguaka utk data tme seres gua medeteks autokorelas (Ssaa dlm suatu perode berhubuga dg ssaa dlm perode la) Megukur Pelaggara asums kebebasa e D (e e 1 e ) 1 Seharusya medekat. Jka tdak, kaj model utk autokorelas.
Tpe Model Regres Hubuga Lear Postf Hubuga Tdak Lear Hubuga Lear Negatf Tdak Ada Hubuga