Analss Regres Pokok Bahasan : Dagnosa Model Melalu Pemerksaan Ssaan dan Identfkas Pengamatan Berpengaruh Itasa & Y Angran Dep. Statstka FMIPA-IPB
Ssaan Ssaan adalah menympangnya nla amatan y terhadap dugaan nla harapannya E [Y x] E [Y x ] y b0 b Ssaan untuk suatu amatan ke-: Ssaan baku Itasa & Y Angran Dep. Statstka FMIPA-IPB r Kurang tepat sebab ragam (e ) = s (-h ) y s yˆ e y yˆ s r e y x y Bsa dgunakan untuk memerksa kebenaran menyebar N(0,) x e x x, n h ( h ) x s k
Informas-nformas yang Ddapat Melalu Ssaan Bsa melhat pola sebaran peubah acak Y Melalu ssaan, kta dapat mengetahu apakah asums-asums yang dsyaratkan pada pendugaan dengan MKT dpenuh atau tdak Melalu ssaan, kta juga dapat menguj parameter regres, sehngga kta perlu mengetahu sebaran ssaan Melalu ssaan, kta juga bsa melhat apakah model yang kta plh pas atau tdak Melalu ssaan, kta juga bsa melhat apakah sebuah pengamatan merupakan penclan atau bukan Melalu ssaan, kta juga bsa melhat apakah sebuah pengamatan merupakan pengamatan berpengaruh atau bukan Itasa & Y Angran Dep. Statstka FMIPA-IPB
Contoh: menghtung ssaan Berkut adalah set (5 pengamatan) data berpasangan x dan y yang ddapat dar sebuah percobaan. Dar data n ngn dketahu model matematka hubungan antara x dan Y. 3 4 5 6 7 8 9 0 3 Y 0.98.3.5 8.4 9.7 8.73 6.36 8.5 7.8 9.4 8.4.9.88 X 0 0 3 0 3 0 0 4 5 6 7 8 9 0 3 4 5 Y 9.57 0.94 9.58 0 8. 6.83 8.88 7.7 8.47 8.86 0.4.08 X 9 3 0 3 0 0 0 Itasa & Y Angran Dep. Statstka FMIPA-IPB
Contoh: menghtung ssaan (lanjutan) 3 Scatterplot of Y vs X Dar tebaran x terhadap Y dgunakan persamaan gars regres lner sederhana ordo satu : Y β0 β x ε Y 0 9 8 Dengan Mntab ddapatkan dugaan persamaannya : = 3.56 + 0.90 X Ŷ 7 6 0 4 6 X 8 0 4 Untuk setap amatan dhtung nla dugaannya, kemudan htung ssaannya Itasa & Y Angran Dep. Statstka FMIPA-IPB
Contoh: menghtung ssaan (lanjutan) Y duga = 3.56 + 0.90 X ssaan ke = amatan ke- dugaan pd ttk x ke- 3 4 5 6 7 8 9 0 3 y 0.98.3.5 8.40 9.7 8.73 6.36 8.50 7.8 9.4 8.4.9.88 y_duga 9.35 9.35 0. 9.35 9.64 9.93 6.75 0. 9.64 9.35 9.35 9.64 9.64 ssaan.63.78.9-0.95-0.37 -.0-0.39 -.7 -.8-0. -..55.4 4 5 6 7 8 9 0 3 4 5 y 9.57 0.94 9.58 0.09 8. 6.83 8.88 7.68 8.47 8.86 0.36.08 y_duga 9.06 0. 9.35 9.93 9.93 6.75 0. 9.35 9.64 9.35 9.35 9.93 ssaan 0.5 0.7 0.3 0.6 -.8 0.08 -.34 -.67 -.7-0.49.0.5 Itasa & Y Angran Dep. Statstka FMIPA-IPB
Plot Ssaan untuk: Melhat Ketdakpasan Model Plot SISAAN vs Y duga ssaan 40 30 0 0 0-0 Plot ssaan vs y_duga Plot ssaan terhadap y_duga mash berpola (kuadratk) Ssaan mash mengandung komponen kuadratk -0-30 -40 0 50 00 y_duga 50 00 Model belum pas model harus dtambah dg komponen kuadratk Itasa & Y Angran Dep. Statstka FMIPA-IPB
Plot Ssaan untuk : Pemerksaan Asums MKT Plot SISAAN vs Y duga ssaan 3 0 - - 7.0 7.5 Plot Ssaan vs y_duga 8.0 8.5 9.0 y_duga 9.5 0.0 0.5 Pada tebaran ssaan terhadap nla dugaan Y dapat dlhat : - Ssaan d sektar nla nol / tdak nla harapan - Lebar pta ssaan sama atau tdak untuk semua nla dugaan kehomogenan ragam - Tebaran berpola atau tdak ketdakpasan model ssaan bebas atau tdak Konds Gauss-Markov Itasa & Y Angran Dep. Statstka FMIPA-IPB.. 3. E[ ] 0 E[ ] E[ ] 0, j terpenuh tdak terpenuh j terpenuh
Pola Tebaran Ssaan terhadap Ŷ Pola tebaran ssaan yang tdak memenuh asums MKT: Itasa & Y Angran Dep. Statstka FMIPA-IPB Pola tebaran ssaan memenuh asums MKT: berpusat d NOL, lebar pta sama, tdak berpola Ragam tdak homogen (perlu analss kuadrat terkecl terbobot; atau transformas thdp Y) Penympangan terhadap persamaan regres bersfat sstemats; atau karena tdk dsertakannya kedalam model 0 Model tdak pas (perlu suku-suku lan dalam model atau transformas thdp Y)
Transformas untuk : Menghomogenkan Ragam Transformas terhadap peubah respon Y Anggap : jka b a b 4 Y* Y b 3 Y* Y b Y* ln Y b Y* Y Setelah respon Y dtransformas, lakukan analss regres sepert basa, ssaan harus dperksa lag, jka mash belum memenuh asums, model dubah, kemungknan ada suku nonlner yg belum masuk model, atau lakukan pendugaan dg MKT terbobot. Itasa & Y Angran Dep. Statstka FMIPA-IPB
Contoh Transformas untuk Menghomogenkan Ragam Plot Ssaan vs Y duga data asl Plot Ssaan vs Ŷ data transformas Y*= Y Resduals Versus the Ftted Values (response s Y) Resduals Versus the Ftted Values (response s akar Y) 0,0 5 0,5 Resdual 0 Resdual 0,0-0,5-5 -,0-0 5 0 5 Ftted Value 0 5 -,5,5 3,0 3,5 4,0 Ftted Value 4,5 5,0 Itasa & Y Angran Dep. Statstka FMIPA-IPB
Plot Ssaan untuk: Pemerksaan Bentuk Sebaran 4 H s t o g r a m S s a a n N o r m a l Tebaran ssaan dan hstogram d sampng untuk melhat : BENTUK SEBARAN SISAAN, smetr atau tdak 3 Frekuens 0-3 - - 0 S s a a n 3 HASIL DIAGNOSA : Sebaran ssaan agak menjulur ke kanan Itasa & Y Angran Dep. Statstka FMIPA-IPB
Plot Ssaan untuk: Pemerksaan Sebaran Normal Peluang normal 99 95 90 80 70 60 50 40 30 0 0 5-4 -3 Probablty Plot of Ssaan Normal - 95% CI - - 0 Ssaan 3 4 5 Plot ssaan terhadap peluang Normal untuk : Mencocokkan apakah sebaran ssaan merupakan sebaran Normal atau tdak. Ya jka pola tebaran membentuk gars lurus Hasl Dagnosa : Ttk mash d dalam selang 95% bsa danggap lurus menyebar Normal Itasa & Y Angran Dep. Statstka FMIPA-IPB
Plot Ssaan untuk: Pemerksaan Kebebasan Ssaan Scatterplot of RESI vs urutan Plot ssaan terhadap urutan untuk : RESI 0 Memerksa apakah ssaan bebas satu dengan lannya atau tdak. Bebas jka tdk membentuk pola. - - 0 4 6 urutan 8 0 Hasl Dagnosa : Tebaran tdak membentuk pola Ssaan salng bebas Itasa & Y Angran Dep. Statstka FMIPA-IPB
Pola Tebaran Ssaan terhadap Urutan Waktu Pengaruh waktu jangka panjang tdak mempengaruh data. Pola tebaran ssaan yang mengnformaskan bahwa pengaruh waktu belum dperhtungkan Ragam tdak homogen (perlu analss kuadrat terkecl terbobot) Suatu suku lner dalam waktu harus dtambahkan ke dalam model Suku lner dan kuadratk dalam waktu perlu dtambahkan ke dalam model Itasa & Y Angran Dep. Statstka FMIPA-IPB
Plot Ssaan untuk: Pemerksaan Pengaruh Waktu Scatterplot of RESI vs urutan Plot ssaan terhadap urutan waktu yg jaraknya sama. RESI 0 Perhatkan : lebar pta sama/tdak berpola/tdak - - 0 4 6 urutan 8 0 Hasl Dagnosa : Lebar pta sama homogen Tebaran tdak membentuk pola tdak perlu dtambahkan pengaruh waktu ke dalam model Itasa & Y Angran Dep. Statstka FMIPA-IPB
Ssaan Terstandardkan (Ssaan Baku) SISAAN BAKU : r y s yˆ e y yˆ s Bsa dgunakan untuk memerksa kebenaran menyebar N(0,) Ssaan akan memlk ragam yg relatf besar jka x d sektar x Pd sebaran Normal Baku peluang nla r terletak antara -,96 s.d,96 adalah 95%. r > patut dcurga ragam(e )= s, kurang tepat ragam(e ) = s (- h ) r e x x, n h ( h ) x x s k e = ssaan amatan ke- n = banyaknya pengamatan s = dugaan bag ragam Y KT ssaan h = unsur dagonal ke- matrks H = X(X X) - X Itasa & Y Angran Dep. Statstka FMIPA-IPB
Ssaan Terstandarkan (Ssaan Baku) (lanjutan) Plot Ssaan e vs Dugaan Y Plot Ssaan Baku r vs Dugaan Y Resduals Versus the Ftted Values (response s ln(y)) Scatterplot of SRES vs FITS,0 0,5 0 Resdual 0,0 SRES - -0,5 - -,0-3,0,,4,6,8,0 Ftted Value,,4,6,8-4,0,,4,6,8 FITS,0,,4,6,8 Pola tebaran plot ssaan e dan r tdak berbeda. pemerksaan ssaan dg pola tebaran, keduanya dapat dgunakan NILAINYA BERBEDA, untuk uj statstk gunakan r Itasa & Y Angran Dep. Statstka FMIPA-IPB
Nla PRESS PRESS = Predcton Sum of Squares, adalah prosedur yang merupakan kombnas dar: semua kemungknan regres, analss ssaan, dan teknk valdas. PRESS y yˆ, y yˆ e,-, : nla respon pada x=x (data lengkap) : nla ramalan y pd x=x yg dramal melalu dugaan persamaan regres dar data tanpa amatan ke- Model bak jka memlk PRESS yg kecl = n e h PRESS R PRED y y R pred adalah statstk uj lannya yg berhub dg PRESS. Model vald jka R pred besar. Itasa & Y Angran Dep. Statstka FMIPA-IPB
PROSEDUR PRESS Nla PRESS (lanjutan) Ms. p adalah banyaknya parameter dalam suatu pers regres, n adalah banyaknya amatan Langkah-langkahnya:. Sshkan amatan ke-, amatan ke- tdak dgunakan, data tnggal n-.. Dugalah semua kemungknan model regres thdp n- data tersebut. (jka p= banyaknya kemungknan model hanya ) 3. Ramal y dengan model yang ddapat pd no.. (lakukan untuk semua kemungknan model hanya jka p=) 4. Htung perbedaan y yg dsshkan tad dengan hasl no.3. 5. Ulang langkah -4 dengan menyshkan amatan ke-, ke-3,..., ke-n. Ddapat y yˆ p y yˆ, 3 3 p,..., yn 6. Untuk setap model regres yang mungkn htung : PRESS yˆ np y yˆ p n y yˆ p 7. Plh model yang relatf memlk nla PRESS terkecl, dan melbatkan peubah penjelas sedkt. Itasa & Y Angran Dep. Statstka FMIPA-IPB
Nla PRESS (lanjutan) Y X Dugaan Gars Regres Itasa & Y Angran Dep. Statstka FMIPA-IPB Contoh Proses PRESS, untuk n= dan p= ramalan Y tnp amatan ke- e,- e,- kuadrat 7,46 0 Y tnp = 3,0 + 0,505 X tnp 8,06-0,6 0,36 6,77 8 Y tnp = 3,05 + 0,497 X tnp 7,06-0,56 0,06553,74 3 Y tnp 3 = 4,0 + 0,345 X tnp 3 8,495 4,45 8,0003 7, 9 Y tnp 4 = 3,04 + 0,500 X tnp 4 7,54-0,43 0,8490 7,8 Y tnp 5 =,95 + 0,54 X tnp 5 8,604-0,794 0,63043 8,84 4 Y tnp 6 =,46 + 0,577 X tnp 6 0,538 -,698,8830 6,08 6 Y tnp 7 =,97 + 0,50 X tnp 7 5,98 0,098 0,00960 5,39 4 Y tnp 8 =,7 + 0,56 X tnp 8 4,84 0,566 0,3035 8,5 Y tnp 9 =,84 + 0,58 X tnp 9 9,76 -,06,0567 6,4 7 Y tnp 0 = 3,03 + 0,498 X tnp0 6,56-0,096 0,009 5,73 5 Y tnp =,88 + 0,5 X tnp 5,435 0,95 0,08703 Total = PRESS = 3,69
Nla PRESS (lanjutan) Output Mntab untuk data contoh tsb The regresson equaton s Y = 3,00 + 0,500 X Predctor Coef SE Coef T P Constant 3,00,4,67 0,06 X 0,4997 0,79 4,4 0,00 S =,363 R-Sq = 66,6% R-Sq(adj) = 6,9% PRESS = 3,60 R-Sq(pred) = 4,70% Analyss of Varance Source DF SS MS F P Regresson 7,470 7,470 7,97 0,00 Resdual Error 9 3,756,58 Total 0 4,6 Hasl PRESS melalu proses = hasl Mntab Untuk p= hanya ada model Amatan ke-3 memberkan smpangan ramalan terbesar Amatan ke-3 dapat dpandang sebaga amatan berpengaruh Dugaan parameter regres tanpa amatan ke-3 sangat berbeda dg lannya dugaan yg n relatf yg benar/bak Keluarkan amatan ke-3 dar analss. Cek nla PRESS-nya. Cek nla R nya Itasa & Y Angran Dep. Statstka FMIPA-IPB
Nla PRESS (lanjutan) Output Mntab data lengkap The regresson equaton s Y = 3,00 + 0,500 X Predctor Coef SE Coef T P Constant 3,00,4,67 0,06 X 0,4997 0,79 4,4 0,00 S =,363 R-Sq = 66,6% PRESS = 3,60 R-Sq(pred) = 4,70% Analyss of Varance Source DF SS MS F P Regresson 7,470 7,470 7,97 0,00 Resdual Error 9 3,756,58 Total 0 4,6 Output Mntab data tanpa amatan ke-3 The regresson equaton s Y tnp 3 = 4,0 + 0,345 X tnp 3 Predctor Coef SE Coef T P Constant 4,0069 0,00 8,78 0,000 X tnp 3 0,345334 0,00037 454,74 0,000 S = 0,00308655 R-Sq = 00,0 PRESS = 0,00074853 R-Sq(pred) = 00,00% Analyss of Varance Source DF SS MS F P Regresson 0,6 0,6 664,34 0,000 Resdual Error 5 0,000 0,000 Total 6 0,6 Menyshkan amatan ke-3 mempengaruh dugaan parameter, menurunkan nla PRESS Dar ss model, persamaan tanpa amatan ke-3 yg terbak. R-Sq(pred)=00,00% model sangat vald kesalahan mempredks=0 Itasa & Y Angran Dep. Statstka FMIPA-IPB
Nla PRESS (lanjutan) Dugaan gars regres dg data lengkap PRESS = 3,60 R-Sq(pred) = 4,70% Dugaan gars regres tanpa amatan ke-3 PRESS = 0,00074853 R-Sq(pred) = 00,0% Ftted Lne Plot Y = 3,00 + 0,4997 X Ftted Lne Plot Y tnp 3 = 4,006 + 0,3453 X tnp 3 3 9 0 8 Y 9 8 Y tnp 3 7 7 6 6 5 4 5,0 7,5 X 0,0,5 5,0 5 5,0 7,5 0,0 X tnp 3,5 5,0 Semakn kecl nla PRESS-nya model semakn vald semakn bak untuk meramal Setap model regres thdp set data memlk nla PRESS Itasa & Y Angran Dep. Statstka FMIPA-IPB