MODEL AUTOREGRESSIVE (AR) ATAU MODEL UNIVARIATE Data yang digunakan adalah data M2Trend.wf1 (buku rujukan pertama, bab-8). Model analisisnya adalah Xt = M2 diregresikan dengan t = waktu. Model yang akan dicoba adalah Trend Linier, Trend Kuadratik, dan Trend Kubik. Trend Linier : X t = b 0 + b 1 t + e t Trend Kuadratik : X t = b 0 + b 1 t +b 2 t 2 +e t Trend Kubik : X t = b 0 + b 1 t +b 2 t 2 + b 3 t 3 +e t 1
Dependent Variable: M2 MODEL LINIER Date: 10/18/12 Time: 10:54 Sample: 1993:01 2008:09 Included observations: 189 C -36797.80 11117.95-3.309765 0.0011 WAKTU 8013.311 101.4855 78.96016 0.0000 R-squared 0.970880 Mean dependent var 724466.8 Adjusted R-squared 0.970724 S.D. dependent var 444883.5 S.E. of regression 76120.21 Akaike info criterion 25.32854 Sum squared resid 1.08E+12 Schwarz criterion 25.36285 Log likelihood -2391.547 F-statistic 6234.707 Durbin-Watson stat 0.051615 Prob(F-statistic) 0.000000 Dependent Variable: M2 MODEL KUADRATIK Date: 12/23/10 Time: 05:32 Sample: 1993:01 2008:09 Included observations: 189 C 75572.27 12745.07 5.929529 0.0000 WAKTU 4483.361 309.7248 14.47531 0.0000 WAKTU^2 18.57868 1.578891 11.76692 0.0000 R-squared 0.983307 Mean dependent var 724466.8 Adjusted R-squared 0.983127 S.D. dependent var 444883.5 S.E. of regression 57788.30 Akaike info criterion 24.78271 Sum squared resid 6.21E+11 Schwarz criterion 24.83416 Log likelihood -2338.966 F-statistic 5478.096 Durbin-Watson stat 0.087088 Prob(F-statistic) 0.000000 Dependent Variable: M2 MODEL KUBIK Date: 12/23/10 Time: 05:33 Sample: 1993:01 2008:09 Included observations: 189 WAKTU 8617.511 365.7979 23.55812 0.0000 WAKTU^2-33.09805 5.981060-5.533809 0.0000 WAKTU^3 0.176765 0.023341 7.573134 0.0000 R-squared 0.984829 Mean dependent var 724466.8 Adjusted R-squared 0.984666 S.D. dependent var 444883.5 S.E. of regression 55090.25 Akaike info criterion 24.68708 Sum squared resid 5.64E+11 Schwarz criterion 24.73854 Log likelihood -2329.929 Durbin-Watson stat 0.095759 2
3
MODEL EXPONENTIAL SMOOTHING Model penghalusan eksponensial ini pada dasarnya bertujuan untuk mem-forecast suatu data runtun waktu dengan membentuk data baru hasil smoothing yang tidak mengandung komponen irregular (komponen yang tidak beraturan) yang ada di dalam data. Misalnya dari data spain.wf1 (buku rujukan bab 8) berisi data bulanan tentang jumlah kunjungan wisatawan ke negara Spanyol selama periode Januari 1970 sampai bulan Maret 1989. Pertama-tama, jika kita periksa grafik sebaran datanya seperti di bawah ini, menunjukkan bahwa data tersebut mengandung dua hal, yaitu (a) komponen musiman, dan (b) komponen trend. Oleh karena itu, peramalan yang sekiranya sesuai dengan sebaran data tersebut adalah model penghalusan dengan mempertimbangkan aspek musiman maupun trend tersebut. Model yang sesuai adalah model Holt-Winter, dapat dipilih Holt-Winter Additif maupun Holt-Winter Multiplicative. Model yang dipilih adalah model yang mempunyai SSE Residual (Sum of Square Error Residual) yang paling kecil nilainya. 4
Date: 10/18/12 Time: 16:59 Sample: 1970:01 1989:03 Included observations: 231 Method: HOLT-WINTERS ADDITIVE SEASONAL Original Series: SPAIN Forecast Series: SPAINSMADD Parameters: Alpha 0.5600 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 2.69E+13 Root Mean Squared Error 341015.2 End of Period Levels: Mean 4277311. Trend 11699.71 Seasonals: 1988:04-713537.8 1988:05-485300.4 1988:06 261626.6 1988:07 3313852. 1988:08 4253533. 1988:09 859221.1 1988:10-673417.6 1988:11-1449761. 1988:12-1049598. 1989:01-1503747. 1989:02-1575685. 1989:03-1237186. Date: 10/18/12 Time: 17:01 Sample: 1970:01 1989:03 Included observations: 231 Method: HOLT-WINTERS MULTIPLICATIVE SEASONAL Original Series: SPAIN Forecast Series: SPAINSM Parameters: Alpha 0.6100 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 2.52E+13 Root Mean Squared Error 330067.5 End of Period Levels: Mean 5133597. Trend 11699.71 Seasonals: 1988:04 0.772240 1988:05 0.843371 1988:06 1.090634 1988:07 2.068877 1988:08 2.361291 1988:09 1.266770 1988:10 0.779191 1988:11 0.548115 1988:12 0.665324 1989:01 0.511930 1989:02 0.486676 1989:03 0.605582 HASILNYA, dengan melihat nilai SSE Residual, maka Metoda HW-Multiplicative Seasonal lebih sesuai untuk forecasting. Nilai-nilai alpha, beta dan gamma pada hasil menunjukkan bahwa Eviews menetapkan nilai yang optimal untuk masing-masing parameter tersebut. 5
Membaca hasil : (1) Model HW-Additif : X t = b 1 + b 2 t + S t + e t Dimana b1 adalah konstanta, atau komponen tetap dari series b2 adalah komponen trend linier S adalah komponen atau indeks musiman e adalah komponen irregular atau random error Hasil perhitungan Eviews di atas adalah : Nilai b 1 adalah nilai pada Mean, yaitu 4277311. Nilai b 2 adalah nilai pada Trend, yaitu 11699.71 Sehingga forecasting trendnya adalah Tt = 4277311.+ 11699.71 t, sementara komponen musimannya adalah selisih rata-rata relatif setiap bulan terhadap nilai rata-rata yang diberikan oleh persamaan trend. Contohnya, untuk bulan ke-empat, diperoleh perbedaan sebesar -713537.8 dibanding rata-rata yang ditunjukkan oleh trend. (2) Model HW-Multiplicative : X t = (b 1 + b 2 ) t.s t + e t Nilai b 1 adalah nilai pada Mean, yaitu 5133597. Nilai b 2 adalah nilai pada Trend, yaitu 11699.71 Interpretasi dari komponen musiman adalah : bahwa output yang ditampilkan menyatakan persentase rata-rata relatif setiap bulan terhadap nilai rata-rata yang diberikan oleh persamaan trend. Contoh, untuk bulan ke-4, nilainya hanya 77.2240 persen dari nilai rata-rata yang ditunjukkan oleh persamaan trend. Dpl, untuk bulan ke-4, nilainya berada pada (100-77.2240) persen, atau sama dengan 22.776 persen di bawah nilai rata-rata trend. 6
MODEL DEKOMPOSISI : SMOOTHING MOVING AVERAGE Telah kita ketahui, bahwa data runtun waktu seringkali didekomposisikan ke dalam empat komponen utama, yaitu : Trend, yang ditandai dengan adanya bentuk penurunan atau kenaikan data dalam perubahan waktu Musiman (seasonal), yang ditandai dengan adanya fluktuasi berulang (dan beraturan) dalam suatu kurun waktu tertentu Siklikal (cyclical), seperti musiman, akan tetapi biasanya waktunya lebih panjang dibandingkan dengan musiman Irregular atau tidak beraturan, ditandai dengan data yang polanya acak. Dalam kenyataannya, seringkali dekomposisi hanya dilakukan untuk komponen trend, musiman dan irregular saja. Jika suatu data dibuang komponen trend-nya, maka data itu disebut detrended. Jika yang dibuang adalah komponen musimannya, maka data itu disebut seasonal decomposition/adjustment (dekomposisi musiman). Dalam seasonal adjustment, dihitung indeks musiman yang menggambarkan variasi musiman dari data, dan menggunakan indeks tersebut untuk melakukan proses deseasonalize (seasonal adjustment) dari data, dengan membuang variasi musiman dari data. Ada banyak metoda untuk melakukan dekomposisi data runtun waktu ke dalam kelompok trend, musiman dan irregular, untuk membangkitkan data baru hasil penghapusan komponen di atas. Misalnya metoda Cencus X11, Cencus X12, TRAMO, SEATS dan lainnya. Akan tetapi, hanya akan dibahas metoda Smoothing Moving Average (SMA). Ada 2 jenis SMA, yaitu: (1) Ratio to Moving Average-Multiplicative, atau metoda perkalian terhadap rasio ratarata bergerak (2) Difference from Moving Average-Additive, atau penjumlahan terhadap selisih ratarata bergerak. Dengan menggunakan data spain.wf1 (dari buku rujukan bab 9) dapat dianalisis dengan SMA di atas melalui EViews, baik dengan Ratio to Moving Average-Multiplicative maupun dengan Difference from Moving Average-Additive. Hasilnya ada di bawah ini. Dari analisis tersebut, nilai faktor skala musiman dapat diinterpretasikan bahwa data Xt pada periode ke-j bernilai sj, dimana j = 1, 2,..., 12. Nilai-nilai skala tersebut dapat lebih besar (positif) atau sebaliknya lebih kecil (negatif) dibandingkan dengan data hasil penghapusan nilai musiman. Sementara itu, nilai hasil penghapusan musiman akan diperoleh dengan nama spainsa. Jika spain (nilai murni data) dan spainsa (nilai seasonal adjustment) disandingkan, akan diperoleh grafik plot seperti gambar dibawah. 7
Date: 10/18/12 Time: 19:53 Sample: 1970:01 1990:03 Included observations: 231 RATIO TO MOVING AVERAGE Original Series: SPAIN Adjusted Series: SPAINSA Scaling Factors: 1 0.594104 2 0.563139 3 0.689676 4 0.894627 5 0.966269 6 1.246731 7 2.376233 8 2.716069 9 1.459378 10 0.888186 11 0.629766 12 0.763280 Date: 10/18/12 Time: 19:55 Sample: 1970:01 1990:03 Included observations: 231 DIFFERENCE FROM MOVING AVERAGE Original Series: SPAIN Adjusted Series: SPAINSA Scaling Factors: 1-1513510. 2-1596436. 3-1272544. 4-715367.3 5-498704.7 6 258424.5 7 3316645. 8 4260754. 9 870605.7 10-679196.3 11-1407135. 12-1023535. 8
MODEL ARIMA (BOX-JENKINS METHOD) Model ARIMA pada dasarnya merupakan model yang sangat populer dalam analisis forecasting, karena menggabungkan antara AR (autoregressive) dan MA (Moving Average) secara terintegrasi, I (integrated), sehingga dinamakan model Autoregressive integrated Moving Average. Model dasarnya adalah : Autoregressive (AR) : Y t d = a 1 (Y t-1 d) + e t, dimana d adalah rata-rata (mean) dari Y dan e adalah error term. Persamaan ini adalah AR ordo 1.ini memberi arti bahwa nilai Y dipengaruhi oleh nilai itu pada satu periode sebelumnya. Untuk persamaan AR ordo 2, maka persamaannya adalah Y t d = a 1 (Y t-1 d) + a 2 (Y t-2 d) + e t. Persamaan terakhir ini menunjukkan bahwa nilai Y dipengaruhi oleh nilai Y itu pada dua periode sebelumnya. Dan seterusnya...dimana Y t adalah ordo ke-p dari autoregressive, atau ditulis dengan AR (p). Moving Average (MA) : Y t = u + b 0 U t + b 1 U t-1, dimana u adalah konstanta (disebut white noise stochastic error term). Dalam persamaan tersebut, Y periode ke t dipengaruhi oleh suatu konstanta, ditambah dengan rata-rata bergerak (MA) saat t dan periode t-1 dari error term. Persamaan tersebut disebut dengan First Order Moving Average, atau MA Ordo 1. Untuk MA Ordo 2, dapat dituliskan : Y t = u + b 0 U t + b 1 U t-1 + b 2 U t-2. Persamaan umumnya adalah : Y t = u + b 0 U t + b 1 U t-1 + b 2 U t-2 +...+ b q U t-q. Sehingga Yt adalah merupakan Moving Average ordo ke-q, atau ditulis MA(q). ARMA atau Autoregressive Moving Averages adalah nilai Y yang bisa saja mempunyai karakter dari persamaan AR maupun MA, sehingga disebut ARMA. Jika Y mengikuti proses ARMA (1), maka persamaannya adalah : Y t = u + a 1 Y t-1 + b 0 U t + b 1 U t-1. Dimana u adalah constant term. Secara umum, ARMA ditulis dengan ARMA (p,q), yaitu ARMA dengan AR ordo p dan MA ordo q. ARIMA (Autoregressive Integreted Moving Average). Pada kenyataannya, data time series sering nilai rataan (mean) dan variansnya tidak stasioner. Data yang demikian disebut data yang terintegrasi. Integrasi data bisa pada ordo-1, ordo 2 dan seterusnya. Misalnya data time series terintegrasi pada ordo-1 (ditulis I(1)), dapat saja pada first-difference-nya stasioner, atau I(0). Secara umum, jika terdapat data time series I(d), maka setelah didiferensiasikan pada d periode akan diperoleh data time series yang stasioner, atau I(0). Oleh karena itu, jika kita harus membedakan sebuah data time series d periode untuk membuat stasioner dan mengaplikasikan ARMA (p,q) pada persamaan tersebut, maka sebenarnya kita telah mengaplikasikan ARIMA (p,d,q), dimana p adalah jumlah Autoregressive, d adalah jumlah data time series yang harus dideferensiasikan sebelum data tersebut stasioner, dan q adalah jumlah Moving Average. 9
LANGKAH-LANGKAH ARIMA (1) Uji stasioneritas data, yang digunakan untuk melihat apakah data mengandung akar unit (unit root) atau tidak. Unit root adalah suatu komponen trend yang bersifat random-walk. (2) Menentukan Ordo dari AR-MA (3) Menentukan Model Terbaik (4) Peramalan atau Forecasting. Kita ambil contoh data wpi.wf1 (dari buku rujukan, bab 10). 1. Plot Data. Plot data yang dibuat di bawah ini menunjukkan bahwa data memiliki bentuk trend, sehingga bersifat non-stasioner dalam nilai tengah (mean). 2. Uji stasioneritas data : dilakukan dengan menguji akar unit dengan Uji Augmented Dickey-Fuller (ADF) yang menguji apakah ada akar unit atau tidak. Atau dapat digunakan Plot ACF/PACF (Autocorrelation Function/Partial-ACF). Hasil Uji ADF menunjukkan bahwa statistik uji ADF yang kurang negatif dengan probabilitas tidak nyata dibandingkan daerah kritis menunjukkan adanya akar unit, sehingga data tidak stasioner. Plot ACF/PACF juga menunjukkan bahwa plot ACF meluruh menuju angka nol, berarti data tidak stasioner. 10
Null Hypothesis: WPI has a unit root Exogenous: Constant, Linear Trend Lag Length: 3 (Fixed) t-statistic Prob.* Augmented Dickey-Fuller test statistic -2.310920 0.4245 Test critical values: 1% level -4.036310 5% level -3.447699 10% level -3.148946 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(WPI) Date: 10/18/12 Time: 21:20 Sample(adjusted): 1961:1 1990:4 Included observations: 120 after adjusting endpoints WPI(-1) -0.019003 0.008223-2.310920 0.0226 D(WPI(-1)) 0.452244 0.093444 4.839716 0.0000 D(WPI(-2)) 0.060685 0.102211 0.593725 0.5539 D(WPI(-3)) 0.227646 0.096039 2.370363 0.0194 C 0.239232 0.164189 1.457055 0.1479 @TREND(1960:1) 0.018437 0.007134 2.584508 0.0110 R-squared 0.487254 Mean dependent var 0.712500 Adjusted R-squared 0.464765 S.D. dependent var 0.985829 S.E. of regression 0.721230 Akaike info criterion 2.232990 Sum squared resid 59.29974 Schwarz criterion 2.372365 Log likelihood -127.9794 F-statistic 21.66645 Durbin-Watson stat 1.971057 Prob(F-statistic) 0.000000 11
Date: 10/18/12 Time: 21:24 Sample: 1960:1 1992:4 Included observations: 124 Autocorrelation Partial Correlation AC PAC Q-Stat Prob. ********. ******** 1 0.982 0.982 122.48 0.000. *******.. 2 0.964 0.004 241.59 0.000. *******.. 3 0.947-0.011 357.33 0.000. *******.. 4 0.928-0.041 469.45 0.000. *******.. 5 0.909-0.015 577.94 0.000. *******.. 6 0.889-0.030 682.67 0.000. *******.. 7 0.869-0.040 783.42 0.000. *******.. 8 0.848-0.007 880.27 0.000. ******.. 9 0.828 0.004 973.39 0.000. ******.. 10 0.807-0.020 1062.7 0.000. ******.. 11 0.787-0.007 1148.4 0.000. ******.. 12 0.767-0.004 1230.4 0.000. ******.. 13 0.746-0.018 1308.8 0.000. ******.. 14 0.726-0.023 1383.6 0.000. *****.. 15 0.705-0.014 1454.9 0.000. *****.. 16 0.684-0.004 1522.6 0.000. *****.. 17 0.664-0.011 1587.0 0.000. *****.. 18 0.643-0.022 1647.9 0.000. *****.. 19 0.622-0.030 1705.4 0.000. *****.. 20 0.599-0.051 1759.3 0.000. ****.. 21 0.575-0.049 1809.4 0.000. ****.. 22 0.551-0.019 1855.9 0.000. ****.. 23 0.526-0.034 1898.7 0.000. ****.. 24 0.501-0.025 1937.9 0.000. ****.. 25 0.475-0.028 1973.5 0.000. ***.. 26 0.449-0.031 2005.6 0.000. ***.. 27 0.422-0.033 2034.2 0.000. ***.. 28 0.395-0.029 2059.6 0.000. ***.. 29 0.368-0.021 2081.8 0.000. ***.. 30 0.340-0.027 2101.0 0.000. **.. 31 0.313-0.021 2117.5 0.000. **.. 32 0.285-0.029 2131.3 0.000. **.. 33 0.257-0.032 2142.6 0.000. **.. 34 0.228-0.034 2151.6 0.000. **.. 35 0.200-0.032 2158.6 0.000. *.. 36 0.171-0.037 2163.8 0.000 3. TRANSFORMASI DATA DAN IDENTIFIKASI MODEL Karena data mempunyai komponen trend, maka harus ditransformasikan dengan tujuan membuang komponen trend. Caranya dengan diferencing terhadap data. (dari beberapa kali diferencing, ternyata yang paling baik adalah dengan lebih dulu mentransformasikan data ke nilai logaritmis, kemudian didiferencing ordo-1). Plot datanya seperti di bawah, stasioner. 12
4. ALTERNATIF MODEL dengan data Logaritmis ordo-1. Model 1 : AR(1) Model 2 : AR(2) Model 3 : AR (4) Model 4 : ARMA (1,1) Model 5 : ARMA (1,2) Model 6 : ARMA (2,2) Dependent Variable: DLOGWPI MODEL 1 Date: 10/18/12 Time: 21:56 Sample(adjusted): 1960:3 1990:4 Included observations: 122 after adjusting endpoints Convergence achieved after 2 iterations AR(1) 0.762673 0.060359 12.63572 0.0000 R-squared 0.321243 Mean dependent var 0.010884 Adjusted R-squared 0.321243 S.D. dependent var 0.014420 S.E. of regression 0.011880 Akaike info criterion -6.019769 Sum squared resid 0.017077 Schwarz criterion -5.996785 Log likelihood 368.2059 Durbin-Watson stat 2.460522 Inverted AR Roots.76 13
Dependent Variable: DLOGWPI MODEL 2 Date: 10/18/12 Time: 21:57 Sample(adjusted): 1960:4 1990:4 Included observations: 121 after adjusting endpoints Convergence achieved after 3 iterations AR(1) 0.522604 0.087506 5.972201 0.0000 AR(2) 0.321093 0.087858 3.654686 0.0004 R-squared 0.385997 Mean dependent var 0.011000 Adjusted R-squared 0.380838 S.D. dependent var 0.014422 S.E. of regression 0.011348 Akaike info criterion -6.103178 Sum squared resid 0.015324 Schwarz criterion -6.056967 Log likelihood 371.2423 Durbin-Watson stat 2.069713 Inverted AR Roots.89 -.36 Dependent Variable: DLOGWPI MODEL 3 Date: 10/18/12 Time: 21:59 Sample(adjusted): 1961:2 1990:4 Included observations: 119 after adjusting endpoints Convergence achieved after 3 iterations AR(1) 0.445201 0.088919 5.006830 0.0000 AR(2) 0.197000 0.094828 2.077449 0.0400 AR(4) 0.257333 0.083990 3.063864 0.0027 R-squared 0.428452 Mean dependent var 0.011158 Adjusted R-squared 0.418598 S.D. dependent var 0.014490 S.E. of regression 0.011048 Akaike info criterion -6.148199 Sum squared resid 0.014159 Schwarz criterion -6.078137 Log likelihood 368.8179 Durbin-Watson stat 1.932774 Dependent Variable: DLOGWPI MODEL 4 Date: 10/18/12 Time: 22:00 Sample(adjusted): 1960:3 1990:4 Included observations: 122 after adjusting endpoints Convergence achieved after 7 iterations Backcast: 1960:2 AR(1) 0.952465 0.034832 27.34422 0.0000 MA(1) -0.528463 0.093137-5.674026 0.0000 R-squared 0.418510 Mean dependent var 0.010884 Adjusted R-squared 0.413664 S.D. dependent var 0.014420 S.E. of regression 0.011042 Akaike info criterion -6.158044 Sum squared resid 0.014630 Schwarz criterion -6.112077 Log likelihood 377.6407 Durbin-Watson stat 1.951841 14
Dependent Variable: DLOGWPI MODEL 5 Date: 10/18/12 Time: 22:01 Sample(adjusted): 1960:3 1990:4 Included observations: 122 after adjusting endpoints Convergence achieved after 9 iterations Backcast: 1960:1 1960:2 AR(1) 0.953931 0.036229 26.33040 0.0000 MA(1) -0.521185 0.099659-5.229706 0.0000 MA(2) -0.015687 0.097816-0.160371 0.8729 R-squared 0.418642 Mean dependent var 0.010884 Adjusted R-squared 0.408872 S.D. dependent var 0.014420 S.E. of regression 0.011087 Akaike info criterion -6.141879 Sum squared resid 0.014627 Schwarz criterion -6.072928 Log likelihood 377.6546 Durbin-Watson stat 1.968701 Inverted AR Roots.95 Inverted MA Roots.55 -.03 Dependent Variable: DLOGWPI MODEL 6 Date: 10/18/12 Time: 22:03 Sample(adjusted): 1960:4 1990:4 Included observations: 121 after adjusting endpoints Convergence achieved after 36 iterations Backcast: 1960:2 1960:3 AR(1) -0.035015 0.047516-0.736919 0.4626 AR(2) 0.937037 0.047909 19.55889 0.0000 MA(1) 0.471853 0.103161 4.573949 0.0000 MA(2) -0.491014 0.101924-4.817464 0.0000 R-squared 0.435722 Mean dependent var 0.011000 Adjusted R-squared 0.421253 S.D. dependent var 0.014422 S.E. of regression 0.010971 Akaike info criterion -6.154572 Sum squared resid 0.014083 Schwarz criterion -6.062149 Log likelihood 376.3516 Durbin-Watson stat 1.895350 Inverted AR Roots.95 -.99 Inverted MA Roots.50 -.98 5. MENENTUKAN MODEL TERBAIK Tugas anda untuk menentukan, dari ke-6 model dugaan tersebut, model mana yang terbaik sebagai peramalan? 15