REGRESI LINIER SEDERHANA Model fungsi : Y = f (X) LAHIR = F (WUS) LAHIR, yaitu data jumlah kelahiran setahun lalu di sejumlah Kecamatan di Jateng WUS, yaitu data jumlah wanita usia subur di sejumlah Kecamatan di Jateng Dependent Variable: LAHIR Date: 10/17/12 Time: 22:39 Sample: 1 21 Included observations: 21 C -128.2673 124.0071-1.034354 0.3140 WUS 0.050203 0.007701 6.518797 0.0000 R-squared 0.691030 Mean dependent var 650.2857 Adjusted R-squared 0.674769 S.D. dependent var 268.1692 S.E. of regression 152.9343 Akaike info criterion 12.98829 Sum squared resid 444389.3 Schwarz criterion 13.08777 Log likelihood -134.3770 F-statistic 42.49471 Durbin-Watson stat 2.437122 Prob(F-statistic) 0.000003 HASIL INI TIDAK SIGNIFIKAN DALAM HAL KONSTANTA, SEHINGGA DIPERBAIKI MODELNYA MENJADI MODEL REGRESI TANPA KONSTANTA Dependent Variable: LAHIR Date: 10/17/12 Time: 22:45 Sample: 1 21 Included observations: 21 WUS 0.042531 0.002076 20.48508 0.0000 R-squared 0.673632 Mean dependent var 650.2857 Adjusted R-squared 0.673632 S.D. dependent var 268.1692 S.E. of regression 153.2013 Akaike info criterion 12.94783 Sum squared resid 469412.8 Schwarz criterion 12.99757 Log likelihood -134.9522 Durbin-Watson stat 2.364382 1
REGRESI LINIER BERGANDA MODEL FUNGSI ADALAH : Dependent Variable: KWH Date: 10/17/12 Time: 22:17 Sample: 1 58 Included observations: 58 Y = f (X1, X2, X3...Xn) Y = KWH, pemakaian listrik dalam triwulan 1 tahun 2003 X1 = LUAS, yaitu luas wilayah desa X2 = PENDUDUK, banyaknya orang tinggal di desa X3 = KEPALA KELUARGA, banyaknya keluarga di desa X4 = JTM, jaringan tegangan menengah X5 = JTR, jaringan tegangan rendah X6 = PELANGGAN, banyaknya pengguna listrik X7 = DAYA, yaitu besarnya kekuatan listrik yang digunakan HASIL MENUNJUKKAN BAHWA BANYAK VARIABEL INDEPENDEN YANG TIDAK BERPENGARUH NYATA TERHADAP VARIABEL DEPENDEN. MODEL DAPAT DIPERBAIKI DENGAN CARA BACKWARD ANALYSIS, SEHINGGA DIPEROLEH HANYA VARIABEL INDEPENDEN YANG BERPENGARUH NYATA SAJA YANG MASUK DALAM FUNGSI. Dependent Variable: KWH Date: 10/17/12 Time: 23:12 Sample: 1 58 Included observations: 58 C -414.0713 6043.637-0.068514 0.9457 LUAS 0.114815 0.516969 0.222092 0.8251 PELANGGAN 15.34951 15.87184 0.967091 0.3382 PENDUDUK 0.306840 1.854892 0.165422 0.8693 KEPALA_KELUARGA 1.957205 1.735093 1.128012 0.2647 JTR -0.156272 0.282735-0.552716 0.5829 JTM -0.184593 0.955581-0.193173 0.8476 DAYA 393.6333 18.13101 21.71050 0.0000 R-squared 0.982831 Mean dependent var 155426.7 Adjusted R-squared 0.980428 S.D. dependent var 128553.2 S.E. of regression 17984.63 Akaike info criterion 22.55986 Sum squared resid 1.62E+10 Schwarz criterion 22.84406 Log likelihood -646.2361 F-statistic 408.9014 Durbin-Watson stat 2.142101 Prob(F-statistic) 0.000000 DAYA 417.6971 4.755119 87.84157 0.0000 R-squared 0.981760 Mean dependent var 155426.7 Adjusted R-squared 0.981760 S.D. dependent var 128553.2 S.E. of regression 17361.93 Akaike info criterion 22.37904 Sum squared resid 1.72E+10 Schwarz criterion 22.41456 Log likelihood -647.9921 Durbin-Watson stat 2.008668 2
UJI DIAGNOSTIC PLOT REGRESI HISTOGRAM DAN NILAI STATISTIK DESKRIPTIF RESIDUAL DARI OBYEK MODEL REGRESI FORECAST. TERLIHAT BAHWA RESIDUAL TIDAK TERDISTRIBUSI NORMAL (PERIKSA NILAI JARQUE-BERA), SEHINGGA MODEL HARUS MENTRANSFORMASIKAN VARIABEL DEPENDEN, MISALNYA DENGAN METODA TRANSFORMASI BOX-COX. CATATAN : dengan melihat hasil uji diagnostic di atas, terlihat bahwa ada autokorelasi dalam residu, sehingga untuk peramalan yang baik, perlu dipertimbangkan untuk mengeluarkan 2 data yang outlier, yang dapat dilihat dari gambar scatter seperti di bawah ini. Selain itu, pertimbangan lain adalah dengan mentransformasikan data variabel dependen, melalui Metoda Transformasi Box-Cox agar data sebarannya menjadi normal. Gambar diagnostic plot dari regresi (periksa, ada outlier pada scatter) 3
UJI ASUMSI KLASIK : UJI AUTOKORELASI RESIDUAL DATA DARI AUTOCORRELATION.WF1 (Bab 5 buku rujukan pertama). MODEL :Y = F (X) Y adalah indeks kompensasi riil per jam Amerika Serikat, 1959-1998, dg tahun dasar 1992 X adalah output per jam dari sektor bisnis Amerika Serikat,1959-1998, dg tahun dasar 1992. Dependent Variable: Y Date: 10/18/12 Time: 06:15 Sample: 1959 1998 Included observations: 40 C 29.51925 1.942347 15.19773 0.0000 X 0.713659 0.024105 29.60658 0.0000 R-squared 0.958449 Mean dependent var 85.64500 Adjusted R-squared 0.957356 S.D. dependent var 12.95632 S.E. of regression 2.675533 Akaike info criterion 4.854881 Sum squared resid 272.0220 Schwarz criterion 4.939325 Log likelihood -95.09761 F-statistic 876.5495 Durbin-Watson stat 0.122904 Prob(F-statistic) 0.000000 HASIL ANALISIS : D-W MENUNJUKKAN NILAI 0.122904. Sehingga dl = 1.442 dan du=1.544. (untuk n=40 dan k=1). Kesimpulannya terdapat Autokorelasi serial, pada order 1. Oki, harus diuji dengan Breusch Godfrey LM (BGLM). Breusch-Godfrey Serial Correlation LM Test: F-statistic 48.70865 Probability 0.000000 Obs*R-squared 32.27057 Probability 0.000000 Test Equation: Dependent Variable: RESID Date: 10/18/12 Time: 06:32 Presample missing value lagged residuals set to zero. C 0.274567 0.926831 0.296242 0.7688 X -0.004240 0.011683-0.362966 0.7188 RESID(-1) 1.001553 0.174512 5.739175 0.0000 RESID(-2) -0.090229 0.246372-0.366233 0.7164 RESID(-3) -0.012490 0.190092-0.065707 0.9480 R-squared 0.806764 Mean dependent var -5.76E-15 Adjusted R-squared 0.784680 S.D. dependent var 2.641008 S.E. of regression 1.225495 Akaike info criterion 3.361036 Sum squared resid 52.56437 Schwarz criterion 3.572146 Log likelihood -62.22072 F-statistic 36.53149 Durbin-Watson stat 1.531582 Prob(F-statistic) 0.000000 HASIL: TERNYATA HANYA NYATA PADA AUTOCORRELATION LAG-1 SEHINGGA PERLU DILAKUKAN UJI SERUPA UNTUK LAG-1 4
Uji BGLM dengan Residu Lag-1 Breusch-Godfrey Serial Correlation LM Test: F-statistic 152.8566 Probability 0.000000 Obs*R-squared 32.20464 Probability 0.000000 Test Equation: Dependent Variable: RESID Date: 10/18/12 Time: 06:30 Presample missing value lagged residuals set to zero. C 0.374039 0.869499 0.430178 0.6696 X -0.005712 0.010794-0.529151 0.5999 RESID(-1) 0.916866 0.074159 12.36352 0.0000 R-squared 0.805116 Mean dependent var -5.76E-15 Adjusted R-squared 0.794582 S.D. dependent var 2.641008 S.E. of regression 1.196986 Akaike info criterion 3.269530 Sum squared resid 53.01273 Schwarz criterion 3.396196 Log likelihood -62.39060 F-statistic 76.42828 Durbin-Watson stat 1.378264 Prob(F-statistic) 0.000000 HASIL : TERDAPAT AUTOKORELASI KARENA OBS*R-SQUARED SANGAT NYATA PROBABILITASNYA, yaitu Obs*R-squared= 32.20464, dengan p sangat kecil. Dengan demikian, Ho ditolak, artinya terdapat autokorelasi order-1 pada residual. Bagaimana mengatasinya? (1) Uji korelasi serial dengan berbagai lag, misalnya lag-1 s/d lag-5. Lag yang optimal adalah yang nilai AIC (Akaike Information Criterion) dan/atau BIC (Bayesian Schwarz Information Criterion) terkecil. [ternyata setelah diuji, AIC dan BIC terkecil pada lag-1). (2) Gunakan metoda Weighted Least Square (WLS) dengan Two Step Durbin-Watson, dengan mengestimasi p = 1-(d/2). Model regresi baru adalah model dengan nilai Y t =Y t py t-1 dan X t =X t -px t-1 yang akan terbebas dari masalah autokorelasi residual. [Untuk data di atas, d Durbin-Watson adalah 0.122904, sehingga p=0.938548. dengan demikian model yang diestimasi adalah: Y t -0.938548Y t-1 = a+b(x t -0.938548X t-1. 5
HASILNYA ADALAH : Dependent Variable: Y-0.938548*Y(-1) Date: 10/18/12 Time: 09:42 Sample(adjusted): 1960 1998 Included observations: 39 after adjusting endpoints C 3.156657 0.629957 5.010908 0.0000 X-0.938548*X(-1) 0.510573 0.095892 5.324477 0.0000 R-squared 0.433818 Mean dependent var 6.427273 Adjusted R-squared 0.418516 S.D. dependent var 1.144490 S.E. of regression 0.872732 Akaike info criterion 2.615544 Sum squared resid 28.18145 Schwarz criterion 2.700854 Log likelihood -49.00310 F-statistic 28.35005 Durbin-Watson stat 1.601589 Prob(F-statistic) 0.000005 SELANJUTNYA, PERIKSA SERIAL KORELASI RESIDU DENGAN SERIAL CORRELATION LM TEST PADA RESIDUAL ORDER 1. DIPEROLEH OUTPUT: Breusch-Godfrey Serial Correlation LM Test: F-statistic 0.688094 Probability 0.412280 Obs*R-squared 0.731454 Probability 0.392412 Test Equation: Dependent Variable: RESID Date: 10/18/12 Time: 09:44 Presample missing value lagged residuals set to zero. C -0.181729 0.669489-0.271445 0.7876 X-0.938548*X(-1) 0.029750 0.102760 0.289507 0.7739 RESID(-1) 0.160261 0.193199 0.829514 0.4123 R-squared 0.018755 Mean dependent var 1.59E-16 Adjusted R-squared -0.035758 S.D. dependent var 0.861172 S.E. of regression 0.876434 Akaike info criterion 2.647892 Sum squared resid 27.65290 Schwarz criterion 2.775859 Log likelihood -48.63390 F-statistic 0.344047 Durbin-Watson stat 1.814177 Prob(F-statistic) 0.711201 DARI OUTPUT DI ATAS, DAPAT DILIHAT BAHWA AUTOKORELASI RESIDU TELAH DAPAT DIHILANGKAN DAN KOMPONEN KONSTANTA DAN VARIABEL X MERUPAKAN VARIABEL YANG SIGNIFIKAN. JADI PERSAMAAN REGRESI FORECASTNYA ADALAH : Y t -0.938548Y t-1 = 3.156657 + 0.510573 (X t -0.938548X t-1. ) 6
UJI ASUMSI KLASIK : UJI HETEROSKEDASTISITAS DATA DARI SUMBER : HETEROSKEDASTISITAS.WF1. (BUKU RUJUKAN BAB 5). FUNGSI : MPG = f (SP, HP, WT), dimana : MPG = rata-rata mil per galon SP = kecepatan tertinggi, dalam mil per jam HP = horse power, WT = berat kendaraan. Dependent Variable: MPG Date: 10/18/12 Time: 09:56 Sample: 1 81 Included observations: 81 C 189.9597 22.52879 8.431865 0.0000 SP -1.271697 0.233117-5.455179 0.0000 HP 0.390433 0.076246 5.120719 0.0000 WT -1.903273 0.185516-10.25936 0.0000 R-squared 0.882864 Mean dependent var 33.83457 Adjusted R-squared 0.878301 S.D. dependent var 10.05541 S.E. of regression 3.507873 Akaike info criterion 5.396019 Sum squared resid 947.4985 Schwarz criterion 5.514263 Log likelihood -214.5388 F-statistic 193.4526 Durbin-Watson stat 1.023742 Prob(F-statistic) 0.000000 UJI HETEROSKEDASTISITAS DENGAN UJI WHITE. White Heteroskedasticity Test: F-statistic 8.686636 Probability 0.000000 Obs*R-squared 33.47376 Probability 0.000008 Test Equation: Dependent Variable: RESID^2 Date: 10/18/12 Time: 09:58 Sample: 1 81 Included observations: 81 C 2339.156 504.9905 4.632078 0.0000 SP -33.18490 7.960441-4.168726 0.0001 SP^2 0.098336 0.030483 3.225893 0.0019 HP 6.406445 1.620861 3.952496 0.0002 HP^2-0.009948 0.002856-3.482819 0.0008 WT -18.35650 4.080770-4.498294 0.0000 WT^2 0.123796 0.049459 2.502985 0.0145 R-squared 0.413256 Mean dependent var 11.69751 Adjusted R-squared 0.365683 S.D. dependent var 23.75653 S.E. of regression 18.92066 Akaike info criterion 8.800841 Sum squared resid 26491.36 Schwarz criterion 9.007769 Log likelihood -349.4341 F-statistic 8.686636 Durbin-Watson stat 1.901058 Prob(F-statistic) 0.000000 HASIL UJI WHITE, TERNYATA ADA HETEROSKEDASTISITAS (Obs*R-squared = 33.47376). 7
BAGAIMANA MENGATASI HETEROSKEDASTISITAS? GUNAKAN GLS (Generalized Least Square), yaitu White HC (WHITE Heteroscedasticity Consistent Coefficient Covariance, dengan melakukan koreksi terhadap standard error dari koefisien regresi. Dependent Variable: MPG Date: 10/18/12 Time: 10:04 Sample: 1 81 Included observations: 81 White Heteroskedasticity-Consistent Standard Errors & Covariance C 189.9597 33.90605 5.602531 0.0000 SP -1.271697 0.336039-3.784375 0.0003 HP 0.390433 0.108781 3.589180 0.0006 WT -1.903273 0.285077-6.676352 0.0000 R-squared 0.882864 Mean dependent var 33.83457 Adjusted R-squared 0.878301 S.D. dependent var 10.05541 S.E. of regression 3.507873 Akaike info criterion 5.396019 Sum squared resid 947.4985 Schwarz criterion 5.514263 Log likelihood -214.5388 F-statistic 193.4526 Durbin-Watson stat 1.023742 Prob(F-statistic) 0.000000 HASIL : BANDINGKAN HASIL GLS INI DENGAN METODA OLS. DALAM GLS INI, SEMUA KOEFISIEN REGRESI SIGNIFIKAN. SE DAN MSE TURUN DRASTIS, SEHINGGA DAPAT DIKATAKAN HETEROSKEDASTIS TIDAK ADA LAGI (HOMOSKEDASTIS). 8
UJI ASUMSI KLASIK : UJI MULTIKOLINEARITAS DATA MULTIKOLINEARITAS.WF1 (DARI BUKU RUJUKAN PERTAMA). Y = jumlah populasi pekerja(ribuan) X1 = GNP price deflator X2= GNP dalam jutaan dolar X3= jumlah orang yang tidak bekerja X4= jumlah tentara X5= jumlah populasi berumur 14 tahun ke atas X6= TIME= indeks tahun, sama dengan 1 untuk 1947, 2 untuk 1948 dst... 16 untuk 1962. Dependent Variable: Y Date: 10/18/12 Time: 10:10 Sample: 1947 1962 Included observations: 16 C 77.27012 22.50671 3.433204 0.0075 X1 0.001506 0.008491 0.177376 0.8631 X2-0.035819 0.033491-1.069516 0.3127 X3-0.002020 0.000488-4.136427 0.0025 X4-0.001033 0.000214-4.821985 0.0009 X5-0.051104 0.226073-0.226051 0.8262 TIME 1.829151 0.455478 4.015890 0.0030 R-squared 0.995479 Mean dependent var 65.31700 Adjusted R-squared 0.992465 S.D. dependent var 3.511968 S.E. of regression 0.304854 Akaike info criterion 0.761669 Sum squared resid 0.836424 Schwarz criterion 1.099676 Log likelihood 0.906650 F-statistic 330.2853 Durbin-Watson stat 2.559488 Prob(F-statistic) 0.000000 HASIL MENUNJUKKAN BAHWA BANYAK VARIABEL X YANG TIDAK SIGNIFIKAN, DENGAN R- SQUARED YANG SANGAT TINGGI. SELANJUTNYA KITA LIHAT KORELASI SPEARMAN ANTAR VARIABEL X, SBB: X1 X2 X3 X4 X5 X1 X2 X3 X4 X5 TIME 1.000000 0.991149 0.995273 0.668257 0.417245 0.993953 0.991149 1.000000 0.991589 0.620633 0.464744 0.979163 0.995273 0.991589 1.000000 0.604261 0.446437 0.991090 0.668257 0.620633 0.604261 1.000000-0.177421 0.686552 0.417245 0.464744 0.446437-0.177421 1.000000 0.364416 0.993953 0.979163 0.991090 0.686552 0.364416 1.000000 TIMEHASIL :KORELASI SANGAT KUAT DIANTARA VARIABEL INDEPENDEN. BAGAIMANA MENGATASI MULTIKOLINEARITAS? DAPAT DILAKUKAN DENGAN : (1) MEMBUANG VARIABEL INDEPENDEN, MISALNYA DENGAN BACKWARD REGRESSION. (2) TRANSFORMASIKAN VARIABEL INDEPENDEN. (3) KONSTRUKSIKAN MODEL LAINNYA. 9