Analss Regres Pokok Bahasan : Dagnosa Model Melalu Pemerksaan Ssaan dan Identfkas Pengamatan Berpengaruh
Ssaan Ssaan adalah menympangnya nla amatan y terhadap dugaan nla harapannya ) E [Y x ] E [Y x] = y = b0 + b Ssaan untuk suatu amatan ke-: Ssaan baku r ) = Kurang tepat sebab ragam (e ) = s (-h ) ( y yˆ ) s e ( y yˆ ) s r = ) e = y x ) y Bsa dgunakan untuk memerksa kebenaran ε menyebar N(0,) e + =, h = n n s ( h ) σ ( x x) ( xk x) k =
Contoh: menghtung ssaan Berkut adalah set (5 pengamatan) data berpasangan x dan y yang ddapat dar sebuah percobaan. Dar data n ngn dketahu model matematka hubungan antara x dan Y. 3 4 5 6 7 8 9 0 3 Y 0.98.3.5 8.4 9.7 8.73 6.36 8.5 7.8 9.4 8.4.9.88 X 0 0 3 0 3 0 0 4 5 6 7 8 9 0 3 4 5 Y 9.57 0.94 9.58 0 8. 6.83 8.88 7.7 8.47 8.86 0.4.08 X 9 3 0 3 0 0 0
Contoh: menghtung ssaan (lanjutan) 3 Scatterplot of Y vs X Dar tebaran x terhadap Y dgunakan persamaan gars regres lner sederhana ordo satu : Y = β0 + β x + ε Y 0 9 8 Dengan Mntab ddapatkan dugaan persamaannya : = 3.56 + 0.90 X Ŷ 7 6 0 4 6 X 8 0 4 Untuk setap amatan dhtung nla dugaannya, kemudan htung ssaannya
Contoh: menghtung ssaan (lanjutan) Y duga = 3.56 + 0.90 X ssaan ke = amatan ke- dugaan pd ttk x ke- 3 4 5 6 7 8 9 0 3 y 0.98.3.5 8.40 9.7 8.73 6.36 8.50 7.8 9.4 8.4.9.88 y_duga 9.35 9.35 0. 9.35 9.64 9.93 6.75 0. 9.64 9.35 9.35 9.64 9.64 ssaan.63.78.9-0.95-0.37 -.0-0.39 -.7 -.8-0. -..55.4 4 5 6 7 8 9 0 3 4 5 y 9.57 0.94 9.58 0.09 8. 6.83 8.88 7.68 8.47 8.86 0.36.08 y_duga 9.06 0. 9.35 9.93 9.93 6.75 0. 9.35 9.64 9.35 9.35 9.93 ssaan 0.5 0.7 0.3 0.6 -.8 0.08 -.34 -.67 -.7-0.49.0.5
Informas-nformas yang Ddapat Melalu Ssaan Bsa melhat pola sebaran peubah acak Y Melalu ssaan, kta dapat mengetahu apakah asums-asums yang dsyaratkan pada pendugaan dengan MKT dpenuh atau tdak Melalu ssaan, kta juga dapat menguj parameter regres, sehngga kta perlu mengetahu sebaran ssaan Melalu ssaan, kta juga bsa melhat apakah model yang kta plh pas atau tdak Melalu ssaan, kta juga bsa melhat apakah sebuah pengamatan merupakan penclan atau bukan Melalu ssaan, kta juga bsa melhat apakah sebuah pengamatan merupakan pengamatan berpengaruh atau bukan
Pemerksaan Pola Sebaran Peubah Respon Y MODEL REGRESI Y = β 0 + β x + ε ε Acaknya Y dsebabkan karena acaknya eror Bentuk sebaran Y = bentuk sebaran eror E [ Y x ] Acak Fx Acak Memerksa bentuk sebaran Y = memerksa bentuk sebaran eror
Plot Ssaan untuk: Pemerksaan Bentuk Sebaran 4 Hstogram Ssaan Norm al Tebaran ssaan dan hstogram d sampng untuk melhat : BENTUK SEBARAN SISAAN, smetr atau tdak 3 Frekuens 0-3 - - 0 Ssaan 3 HASIL DIAGNOSA : Sebaran ssaan agak menjulur ke kanan
Plot Ssaan untuk: Pemerksaan Sebaran Normal Peluang normal 99 95 90 80 70 60 50 40 30 0 0 5 Probablty Plot of Ssaan Normal - 95% CI Plot ssaan terhadap peluang Normal untuk : Mencocokkan apakah sebaran ssaan merupakan sebaran Normal atau tdak. Ya jka pola tebaran membentuk gars lurus Hasl Dagnosa : bsa danggap lurus menyebar Normal -4-3 - - 0 Ssaan 3 4 5
Plot Ssaan untuk: Melhat Ketdakpasan Model Plot SISAAN vs Y duga ssaan 40 30 0 0 0-0 Plot ssaan vs y_duga Plot ssaan terhadap y_duga mash berpola (kuadratk) Ssaan mash mengandung komponen kuadratk -0-30 -40 0 50 00 y_duga 50 00 Model belum pas model harus dtambah dg komponen kuadratk
Plot Ssaan untuk : Pemerksaan Asums MKT Plot SISAAN vs Y duga ssaan 3 0 - - 7.0 7.5 Plot Ssaan vs y_duga 8.0 8.5 9.0 y_duga 9.5 0.0 0.5 Pada tebaran ssaan terhadap nla dugaan Y dapat dlhat : - Ssaan d sektar nla nol / tdak nla harapan - Lebar pta ssaan sama atau tdak untuk semua nla dugaan kehomogenan ragam - Tebaran berpola atau tdak ketdakpasan model ssaan bebas atau tdak Konds Gauss-Markov.. 3. E[ ε ] = 0 E[ ε ] = σ E[ ε ε ] = 0, j terpenuh tdak terpenuh j terpenuh
Pola Tebaran Ssaan terhadap Ŷ Pola tebaran ssaan yang tdak memenuh asums MKT: Pola tebaran ssaan memenuh asums MKT: berpusat d NOL, lebar pta sama, tdak berpola Ragam tdak homogen (perlu analss kuadrat terkecl terbobot; atau transformas thdp Y) Penympangan terhadap persamaan regres bersfat sstemats; atau karena tdk dsertakannya kedalam model β 0 Model tdak pas (perlu suku-suku lan dalam model atau transformas thdp Y)
Transformas untuk : Menghomogenkan Ragam Transformas terhadap peubah respon Y Anggap : jka σ b = aμ b = 4 Y* = Y b = 3 Y* = Y b = Y* = ln Y b = Y* = Y Setelah respon Y dtransformas, lakukan analss regres sepert basa, ssaan harus dperksa lag, jka mash belum memenuh asums, model dubah, kemungknan ada suku nonlner yg belum masuk model, atau lakukan pendugaan dg MKT terbobot.
Contoh Transformas untuk Menghomogenkan Ragam Plot Ssaan vs Y duga data asl Plot Ssaan vs Yˆ data transformas Y*= Y Resduals Versus the Ftted Values (response s Y) Resduals Versus the Ftted Values (response s akar Y) 0,0 5 0,5 Resdual 0 Resdual 0,0-0,5-5 -,0-0 5 0 5 Ftted Value 0 5 -,5,5 3,0 3,5 4,0 Ftted Value 4,5 5,0
Plot Ssaan untuk: Pemerksaan Kebebasan Ssaan Scatterplot of RESI vs urutan Plot ssaan terhadap urutan untuk : RESI 0 Memerksa apakah ssaan bebas satu dengan lannya atau tdak. Bebas jka tdk membentuk pola. - - 0 4 6 urutan 8 0 Hasl Dagnosa : Tebaran tdak membentuk pola Ssaan salng bebas
Pola Tebaran Ssaan terhadap Urutan Waktu Pengaruh waktu jangka panjang tdak mempengaruh data. Pola tebaran ssaan yang mengnformaskan bahwa pengaruh waktu belum dperhtungkan Ragam tdak homogen (perlu analss kuadrat terkecl terbobot) Suatu suku lner dalam waktu harus dtambahkan ke dalam model Suku lner dan kuadratk dalam waktu perlu dtambahkan ke dalam model
Plot Ssaan untuk: Pemerksaan Pengaruh Waktu Scatterplot of RESI vs urutan Plot ssaan terhadap urutan waktu yg jaraknya sama. RESI 0 Perhatkan : lebar pta sama/tdak berpola/tdak - - 0 4 6 urutan 8 0 Hasl Dagnosa : Lebar pta sama homogen Tebaran tdak membentuk pola tdak perlu dtambahkan pengaruh waktu ke dalam model
Ssaan Terstandardkan (Ssaan Terbakukan) SISAAN TERBAKUKAN : r = ( y yˆ ) s e ( y yˆ ) s = Bsa dgunakan untuk memerksa kebenaran ε menyebar N(0,) σ Ssaan akan memlk ragam yg relatf besar jka x d sektar x Pd sebaran Normal Baku peluang nla r terletak antara -,96 s.d,96 adalah 95%. r > patut dcurga ragam(e )= s, kurang tepat ragam(e ) = s (- h ) r ( x x ) ( x ) e + =, h = n s ( h ) x k e = ssaan amatan ke- n = banyaknya pengamatan s = dugaan bag ragam Y KT ssaan h = unsur dagonal ke- matrks H = X(X X) - X
Ssaan Terstandarkan (Ssaan Baku) (lanjutan) Plot Ssaan e vs Dugaan Y Plot Ssaan Baku r vs Dugaan Y Resduals Versus the Ftted Values (response s ln(y)) Scatterplot of SRES vs FITS,0 0,5 0 Resdual 0,0 SRES - -0,5 - -,0-3,0,,4,6,8,0 Ftted Value,,4,6,8-4,0,,4,6,8 FITS,0,,4,6,8 Pola tebaran plot ssaan e dan r tdak berbeda. pemerksaan ssaan thdp pola tebaran, keduanya dapat dgunakan
Nla PRESS PRESS = Predcton Sum of Squares, adalah prosedur yang merupakan kombnas dar: semua kemungknan regres, analss ssaan, dan teknk valdas. Dgunakan untuk mengukur valdtas model. PRESS y yˆ, = ( y ) yˆ, ( e ),- = : nla respon pada x=x (data lengkap) : nla ramalan y pd x=x yg dramal melalu dugaan persamaan regres dar data tanpa amatan ke- Model vald jka memlk PRESS yg kecl = n = e h PRESS R PRED= y ( y) R pred adalah statstk lannya yg berhub dg PRESS. Model vald jka R pred besar.
PROSEDUR PRESS Nla PRESS (lanjutan) Ms. k adalah banyaknya peubah dalam suatu persamaan regres, n adalah banyaknya amatan Langkah-langkahnya:. Sshkan amatan ke-, amatan ke- tdak dgunakan, data tnggal n-.. Dugalah semua kemungknan model regres thdp n- data tersebut. (jka k= banyaknya kemungknan model hanya ) 3. Ramal y dengan model yang ddapat pd no.. (lakukan untuk semua kemungknan model hanya jka k=) 4. Htung perbedaan y yg dsshkan tad dengan hasl no.3. 5. Ulang langkah -4 dengan menyshkan amatan ke-, ke-3,..., ke-n. Ddapat y yˆ k y yˆ, 3 3k,..., yn 6. Untuk setap model regres yang mungkn htung : PRESS= yˆ nk n = y yˆ k ( ) ˆ y y k 7. Plh model yang relatf memlk nla PRESS terkecl, dan melbatkan peubah penjelas sedkt.
Nla PRESS (lanjutan) Y X Contoh Proses PRESS, untuk n= dan k= Dugaan Gars Regres dg Data tanpa amatan ke- ramalan Y tnp amatan ke- e,- e,- kuadrat 7,46 0 Y tnp = 3,0 + 0,505 X tnp 8,06-0,6 0,36 6,77 8 Y tnp = 3,05 + 0,497 X tnp 7,06-0,56 0,06553,74 3 Y tnp 3 = 4,0 + 0,345 X tnp 3 8,495 4,45 8,0003 7, 9 Y tnp 4 = 3,04 + 0,500 X tnp 4 7,54-0,43 0,8490 7,8 Y tnp 5 =,95 + 0,54 X tnp 5 8,604-0,794 0,63043 8,84 4 Y tnp 6 =,46 + 0,577 X tnp 6 0,538 -,698,8830 6,08 6 Y tnp 7 =,97 + 0,50 X tnp 7 5,98 0,098 0,00960 5,39 4 Y tnp 8 =,7 + 0,56 X tnp 8 4,84 0,566 0,3035 8,5 Y tnp 9 =,84 + 0,58 X tnp 9 9,76 -,06,0567 6,4 7 Y tnp 0 = 3,03 + 0,498 X tnp0 6,56-0,096 0,009 5,73 5 Y tnp =,88 + 0,5 X tnp 5,435 0,95 0,08703 Total = PRESS = 3,69
Nla PRESS (lanjutan) Output Mntab untuk data contoh tsb The regresson equaton s Y = 3,00 + 0,500 X Predctor Coef SE Coef T P Constant 3,00,4,67 0,06 X 0,4997 0,79 4,4 0,00 S =,363 R-Sq = 66,6% R-Sq(adj) = 6,9% PRESS = 3,60 R-Sq(pred) = 4,70% Analyss of Varance Source DF SS MS F P Regresson 7,470 7,470 7,97 0,00 Resdual Error 9 3,756,58 Total 0 4,6 Hasl PRESS melalu proses = hasl Mntab Untuk k= hanya ada model Amatan ke-3 memberkan smpangan ramalan terbesar Amatan ke-3 dapat dpandang sebaga amatan berpengaruh Dugaan parameter regres tanpa amatan ke-3 sangat berbeda dg lannya dugaan yg n relatf yg benar/bak Keluarkan amatan ke-3 dar analss. Cek nla PRESS-nya. Cek nla R nya
Nla PRESS (lanjutan) Output Mntab data lengkap The regresson equaton s Y = 3,00 + 0,500 X Predctor Coef SE Coef T P Constant 3,00,4,67 0,06 X 0,4997 0,79 4,4 0,00 S =,363 R-Sq = 66,6% PRESS = 3,60 R-Sq(pred) = 4,70% Analyss of Varance Source DF SS MS F P Regresson 7,470 7,470 7,97 0,00 Resdual Error 9 3,756,58 Total 0 4,6 Output Mntab data tanpa amatan ke-3 The regresson equaton s Y tnp 3 = 4,0 + 0,345 X tnp 3 Predctor Coef SE Coef T P Constant 4,0069 0,00 8,78 0,000 X tnp 3 0,345334 0,00037 454,74 0,000 S = 0,00308655 R-Sq = 00,0 PRESS = 0,00074853 R-Sq(pred) = 00,00% Analyss of Varance Source DF SS MS F P Regresson 0,6 0,6 664,34 0,000 Resdual Error 5 0,000 0,000 Total 6 0,6 Menyshkan amatan ke-3 mempengaruh dugaan parameter, menurunkan nla PRESS Dar ss model, persamaan tanpa amatan ke-3 yg terbak. R-Sq(pred)=00,00% model sangat vald PELUANG salah mempredks = 0
Nla PRESS (lanjutan) Dugaan gars regres dg data lengkap PRESS = 3,60 R-Sq(pred) = 4,70% Dugaan gars regres tanpa amatan ke-3 PRESS = 0,00074853 R-Sq(pred) = 00,0% Ftted Lne Plot Y = 3,00 + 0,4997 X Ftted Lne Plot Y tnp 3 = 4,006 + 0,3453 X tnp 3 3 9 0 8 Y 9 8 Y tnp 3 7 7 6 6 5 4 5,0 7,5 X 0,0,5 5,0 5 5,0 7,5 0,0 X tnp 3,5 5,0 Semakn kecl nla PRESS-nya model semakn vald semakn bak untuk mempredks. Setap model regres thdp set data memlk nla PRESS
Penclan Penclan adalah pengamatan yang nla mutlak ssaannya jauh lebh besar darpada ssaan-ssaan lannya Bsa jad terletak pada tga atau empat smpangan baku atau lebh jauh lag dar rata-rata ssaannya. Keberadaan penclan harus dperksa dengan seksama, apakah penclan tu merupakan kesalahan dalam pencatatan amatan atau penclan tersebut muncul dar kombnas keadaan yang tdak basa yang mungkn saja sangat pentng dan perlu dseldk lebh jauh.
Penclan (lanjutan) Plot antara Ssaan e vs dugaan Y Plot antara Ssaan r vs dugaan Y 3 Scatterplot of Ssaan baku- vs dugaan-y 3 Scatterplot of ssaan vs dugaan-y Ssaan baku- ssaan 0 0 - - 5 6 7 8 dugaan-y 9 0 5 6 7 8 dugaan-y 9 0 Dugaan persamaan regres Y = 3.00 + 0.500 X dgn R-Sq = 66.6% Pola tebaran ssaan thdp e dan r sama Ada ssaan yang nlanya sangat besar potens sebaga penclan
Penclan (lanjutan) MENDETEKSI PENCILAN Htung nla dengan h r = = n s + e ( h ) n ( x x ) ( x k x ) = Jka nla r >, amatan tsb dapat dkatakan sebaga penclan Y X r 7.46 0-0.4608 6.77 8-0.9633.74 3.99999 7. 9-0.33085 7.8-0.59695 8.84 4 -.3497 6.08 6 0.0704 5.39 4 0.3807 8.5-0.7558 6.4 7-0.06974 5.73 5 0.88
Penclan (lanjutan) DATA LENGKAP DATA TANPA PENCILAN Scatterplot of Y-3 vs X-3 Scatterplot of Y tnp pclan vs X tnp pclan 3 3 Y-3 0 9 8 Y tnp pclan 0 9 8 7 6 7 6 5 5,0 7,5 0,0 X-3,5 5,0 5 5,0 7,5 0,0 X tnp pclan,5 5,0 Y = 3.00 + 0.500 X Predctor Coef SE Coef T P Constant 3.00.4.67 0.06 X 0.4997 0.79 4.4 0.00 S =.363 R-Sq = 66.6% Y = 4.0 + 0.345 X Predctor Coef SE Coef P Constant 4.00565 0.009 0.000 X 0.345390 0.0003 0.000 S = 0.0030868 R-Sq = 00.0%
Penclan (lanjutan) Plot ssaan baku (r ) vs dugaan Y Data Lengkap Data Tanpa Penclan Scatterplot of ssaan vs dugaan-y Scatterplot of s baku tnp pcl vs dugaan tnppcl.0 3.5.0 ssaan s baku tnp pcl 0.5 0.0 0-0.5 -.0 - -.5 5 6 7 8 dugaan-y 9 0 5 6 7 dugaan tnppcl 8 9 Tebaran berpola, karena () ada penclan, atau () model tdak pas Tebaran tdak berpola, menyebar d sektar nla nol, lebar pta relatf sama Mengeluarkan data penclan dar analss: mampu memperbak pola tebaran ssaan yang tadnya berpola (gars lurus) harus dlakukan dengan kehat-hatan yang tngg.
Amatan Berpengaruh AMATAN BERPENGARUH : berkatan dengan besarnya perubahan yang terjad pada dugaan parameter regres jka pengamatan tersebut dsshkan X,,,,3,3,3,4,4,4,5,5,5,6,6,6 4,0 Y,,39 0,78,0,46 3,67,56,74,88 5,5,4,00 3,56 3,09 0,78 4,9 3,33 3,0 5,00 6 Scatterplot of Y vs X Unusual Observatons Y 4 0 8 6 Obs X Y Ft SE Ft Resdual St Resd 0,40 5,47,895 0,44,5,9 R 5,50 0,776 3,345 0,43 -,569 -,50 R 9 4,00 5,000 4,576,009 0,44,34 X 4 0,0,5,0,5 X 3,0 3,5 4,0 R denotes an observaton wth a large standardzed resdual. X denotes an observaton whose X value gves t large nfluence.
OUTPUT MINITAB The regresson equaton s Y = - 3,39 + 4,49 X S =,05749 R-Sq = 88,8% R-Sq(adj) = 88,% Analyss of Varance Source DF SS MS F P Regresson 50,0 50,0 34, 0,000 Resdual Error 7 9,0, Total 8 69, Unusual Observatons Obs X Y Ft SE Ft Resdual St Resd 0,40 5,47,895 0,44,5,9 R 5,50 0,776 3,345 0,43 -,569 -,50 R 9 4,00 5,000 4,576,009 0,44,34 X R denotes an observaton wth a large standardzed resdual. X denotes an observaton whose X value gves t large nfluence. Amatan Berpengaruh (lanjutan) Hasl analss regres dar data tersebut menunjukkan bahwa ada 3 amatan yg aneh, yatu amatan ke 0,5, dan 9. Amatan 0 dan 5 berpotens sebaga penclan. Amatan 9 berpotens sebaga amatan berpengaruh Bandngkan dg data tanpa amatan 9. Apakah perubahan dugaan parameter regres cukup nyata?
Amatan Berpengaruh (lanjutan) Penyshan pengamatan berpengaruh mengubah secara berart dugaan persamaan regres Analss Regres thdp Data Lengkap An Regres thdp Data Tanpa Amatan 9 The regresson equaton s Y = - 3,39 + 4,49 X S =,05749 R-Sq = 88,8% R-Sq(adj) = 88,% Analyss of Varance Source DF SS MS F P Regresson 50,0 50,0 34, 0,000 Resdual Error 7 9,0, Total 8 69, Unusual Observatons Obs X Y Ft SE Ft Resd St Resd 0,40 5,47,895 0,44,5,9 R 5,50 0,776 3,345 0,43 -,569 -,50 R 9 4,00 5,000 4,576,009 0,44,34 X The regresson equaton s Y = -,6 +,88 X S =,03065 R-Sq = 5,4% R-Sq(adj) = 0,8% Analyss of Varance Source DF SS MS F P Regresson 5,797 5,797 5,46 0,033 Resdual Error 6 6,996,06 Total 7,793 Unusual Observatons Obs X Y Ft SE Ft Resd St Resd 0,40 5,47,764 0,56,383,39 R 5,50 0,776 3,05 0,38 -,76 -,3 R
Amatan Berpengaruh (lanjutan) Dugaan Gars Regres Data Lengkap Dugaan Grs Regres Data Tnp Amatan 9 6 Ftted Lne Plot Y = - 3,394 + 4,493 X 6 Ftted Lne Plot Y tnp amatan 9 = -,65 +,878 X tnp amatan 9 4 4 Y 0 8 6 4 0,0,5,0,5 X 3,0 3,5 4,0 Y tnp amatan 9 0 8 6 4,0,5,0,5 X tnp amatan 9 3,0 3,5 4,0 Penyshan AMATAN BERPENGARUH menyebabkan perubahan dugaan kemrngan gars. BERBAHAYA, apabla pemanfaatan hasl analss regres bertumpu pada pemaknaan parameter
Pengaruh ttk data ke- dukur dengan jarak : D = s Keterangan: e h ( h ) h p Amatan Berpengaruh s = dugaan bag ragam Y =KT ssaan h = unsur dagonal ke- matrks H = X(X X) - X Nla D dbandngkan dengan F (p,n-p; -α). Dengan n = banyaknya pengamatan dan p = banyaknya parameter D > F (p,n-p;-α). menandakan bahwa amatan ke- berpengaruh. (lanjutan) Statstk Uj untuk Mendeteks Amatan Berpengaruh
X () Y () e () r () D (),,0,00 0,30,39 0,30 0,9 0,09 0,78-0,3-0,3-0,09,,0 0,0 0,0 0,0,,46 0,46 0,45 0,, 3,67,68,64 0,45,3,56 0, 0, 0,03,3,74-0,7-0,69-0,7,3,88-0,56-0,55-0,3,4 5,5,5,9 0,59,4,4-0,49-0,47-0,,4,00-0,90-0,87-0,,5 3,56 0, 0, 0,05,5 3,09-0,6-0,5-0,06,5 0,78 -,57 -,50-0,7,6 4,9 0,50 0,49 0,,6 3,33-0,47-0,45-0,,6 3,0-0,70-0,68-0,6 4 5,00 0,4,34 4,40 Amatan Berpengaruh CONTOH PENGGUNAAN D (lanjutan) Dugaan persamaan regres DATA LENGKAP : Y = - 3,39 + 4,49 X Banyaknya parameter = p = Banyaknya pengamatan = 9 n = 9 Pengamatan ke -9 memlk nla D 9 = 4,40 Dengan α = 5% Nla tabel F (p,n-p; -α) = F (,7; 0,95) = 3,59 D 9 > F (,7; 0,95) Dengan α = 5%, amatan ke 9 (terakhr) merupakan amatan berpengaruh.
Amatan Berpengaruh (lanjutan)