Penerapan Model ARIMA (Bagian II) Dr. Kusman Sadik, M.Si Departemen Statistika IPB, 2016 1
a. Lakukan proses pembedaan (differencing) sebanyak dua kali pada data asal. b. Lakukan pendugaan parameter pada model AR(1) berdasarkan data yang yang sudah di-differencing pada poin a di atas. 2
Analisis Sisaan Sisaan = Nilai Aktual Nilai Prediksi Apabila model ARIMA(p, d, q) benar dan dugaan parameter sangat dekat ke nilai yang sebenarnya maka sisaan akan memiliki sifat seperti yang diasumsikan pada e t, yaitu: menyebar bebas dan identik e t ~ N(0, 2 e ) 3
Pemeriksaan asumsi tersebut dapat dilakukan secara deskriptif maupun analitik. Secara deskriptif dapat dilakukan sebagai berikut: Kebebasan / independent : plot êt dengan t Kenormalan / normality : plot êt dengan normal score 4
Uji Ljung-Box-Pierce (modified Box-Pierce) Secara analitik, uji ini dapat digunakan untuk memeriksa asumsi kebebasan antar e t (independence) berdasarkan autokorelasi pada e t. H 0 : antar e t tidak berkorelasi (bebas) H 1 : antar e t berkorelasi Apabila H 0 diterima maka dapat dikatakan bahwa model ARIMA yang digunakan adalah layak. 5
H 0 : antar e t tidak berkorelasi (bebas) H 1 : antar e t berkorelasi K Q* = n( n 2) k 1 2 ˆ e( k ) r n k n = banyaknya data sisaan, ê t ˆ e ( k ) r = autokorelasi êt dengan ˆ et k Tolak H 0 jika Q* > 2 (db = K p q) 6
Overfitting Diagnostik model dapat pula dilakukan melalui overfitting. Misalnya : Jika teridentifikasi AR(2) mungkin bisa dilakukan overfitting dengan AR(3). Pada kasus tersebut, AR(2) dipilih jika : Penduga parameter tambahan ( 3 ) tidak nyata / tidak signifikan. Penduga parameter 1 dan 2 tidak mengalami perubahan secara signifikan antara AR(2) dengan AR(3). 7
Zt Studi Kasus : Tentukan model terbaik untuk data bulanan penjualan suatu produk (Z t ) sebagai berikut: 10 0-10 Index 10 20 30 40 Zt : Data Asal 8
Zt(lag1) 2 1 0-1 -2-3 Index 10 20 30 40 Zt(lag1) : Data Zt setelah differencing ordo-1 9
Zt(lag2) 3 2 1 0-1 -2 Index 10 20 30 40 Zt(lag2) : Data Zt setelah differencing ordo-2 10
Autocorrelation Autocorrelation Function for Zt (with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 2 3 4 5 6 Lag 7 8 9 10 11 Ada indikasi tidak stasioner. Mengapa? 11
Autocorrelation Autocorrelation Function for Zt(lag1) (with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 2 3 4 5 6 Lag 7 8 9 10 11 Ada indikasi tidak stasioner. Mengapa? 12
Autocorrelation Autocorrelation Function for Zt(lag2) (with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 2 3 4 5 6 Lag 7 8 9 10 11 Ada indikasi sudah stasioner. Mengapa? 13
Partial Autocorrelation Partial Autocorrelation Function for Zt(lag2) (with 5% significance limits for the partial autocorrelations) 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 2 3 4 5 6 Lag 7 8 9 10 11 14
Partial Autocorrelation Autocorrelation Autocorrelation Function for Zt(lag2) (with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 2 3 4 5 6 Lag 7 8 9 10 11 1.0 0.8 Partial Autocorrelation Function for Zt(lag2) (with 5% significance limits for the partial autocorrelations) 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 2 3 4 5 6 Lag 7 8 9 10 11 Kandidat Model : ARIMA(0,2,1)dan ARIMA(1,2,0) 15
ARIMA(0,2,1) Relative change in each estimate less than 0.0010 Final Estimates of Parameters Type Coef SE Coef T P MA 1-0.4393 0.1371-3.20 0.003 Constant -0.0995 0.1581-0.63 0.533 Differencing: 2 regular differences Number of observations: Original series 47, after differencing 45 Residuals: SS = 48.3592 (backforecasts excluded) MSE = 1.1246 DF = 43 Modified Box-Pierce (Ljung-Box) Chi-Square statistic Lag 12 24 36 Chi-Square 7.6 12.3 24.4 DF 10 22 34 P-Value 0.667 0.952 0.887 16
ARIMA(1,2,0) Final Estimates of Parameters Type Coef SE Coef T P AR 1 0.5958 0.1225 4.86 0.000 Constant -0.06673 0.06299-1.06 0.295 Differencing: 2 regular differences Number of observations: Original series 47, after differencing 45 Residuals: SS = 45.9799 (backforecasts excluded) MS = 1.0693 DF = 43 Modified Box-Pierce (Ljung-Box) Chi-Square statistic Lag 12 24 36 Chi-Square 6.0 11.8 22.5 DF 10 22 34 P-Value 0.816 0.962 0.935 17
Pemilihan Model Terbaik Berdasarkan hasil di atas, uji Ljung-Box: ARIMA(0, 2, 1) p-value : 0.667 (Terima H 0, galat tidak berkorelasi) ARIMA(1, 2, 0) p-value : 0.816 (Terima H0) (Terima H 0, galat tidak berkorelasi) 18
Berarti model ARIMA(0, 2, 1) dan ARIMA(1, 2, 0) sama-sama layak (memenuhi asumsi kebebasan antar galat). Selanjutnya untuk menentukan model terbaik dapat ditentukan berdasarkan nilai MSE-nya yang terkecil, yaitu: ARIMA(0, 2, 1) MSE : 1.1246 ARIMA(1, 2, 0) MSE : 1.0693 Sehingga model terbaik berdasarkan nilai MSE terkecil adalah ARIMA(1, 2, 0). Model terbaik yang diperoleh dapat digunakan untuk melakukan peramalan. 19
Misalkan diketahui data penjualan produk Zt tersebut untuk 6 bulan terakhir sebagai berikut (dalam milyar rupiah): 12.5, 14.2, 19.6, 21.9, 26.4, dan 30.1. a. Berdasarkan hasil Minitab di atas, uraikan persamaan modelnya secara lengkap untuk model terbaik yang diperoleh. b. Berdasarkan persamaan model pada poin (a) di atas, tentukan ramalan penjualan produk Zt untuk bulan ke-7 dan ke-8 berdasarkan data 6 bulan terakhir tersebut. 20
1. Melalui Minitab, bangkitkan data (n = 225) berupa model ARIMA(0, 2, 1) dengan = 1.5 dan θ = 0.85 serta e t ~ Normal(0,1). Gunakan 200 data terakhir sebagai data Y t dan selanjutnya lakukan proses berikut: a. Berdasarkan ACF dan PACF untuk data Y t tersebut, identifikasilah kandidat model yang sesuai. b. Berdasarkan kandidat model tersebut, tentukan model terbaik berdasarkan uji Box-Pierce dan nilai MSE-nya. c. Bandingkan penduga parameter yang diperoleh untuk model terbaik pada poin (b) tersebut dengan nilai parameter yang sesungguhnya. Apa kesimpulan Anda? 21
2. Melalui Minitab, bangkitkan data (n = 225) berupa model ARIMA(1, 1, 0) dengan = 1.0 dan Φ = - 0.95 serta e t ~ Normal(0,1). Gunakan 200 data terakhir sebagai data Y t dan selanjutnya lakukan proses berikut: a. Berdasarkan ACF dan PACF untuk data Y t tersebut, identifikasilah kandidat model yang sesuai. b. Berdasarkan kandidat model tersebut, tentukan model terbaik berdasarkan uji Box-Pierce dan nilai MSE-nya. c. Bandingkan penduga parameter yang diperoleh untuk model terbaik pada poin (b) tersebut dengan nilai parameter yang sesungguhnya. Apa kesimpulan Anda? 22
23
1. Misalnya diketahui data ekspor sawit (juta ton) dalam tujuh bulan terakhir, yaitu Xt: 20.4, 21.7, 25.3, 26.7, 28.1, 30.2, dan 33.1. Selanjutnya data Yt = Xt + 0.m. (a). Misalkan pada data Yt tersebut Anda menggunakan model ARIMA(2, 1, 0) dengan konstanta. Tentukan penduga parameternya yaitu ˆ, ˆ 1, ˆ 2 dengan metode momen. (b). Tentukan penduga bagi sisaan, ê t (c). Lakukan uji Ljung-Box-Pierce (modified Box-Pierce), apa kesimpulannya. (d). Gunakan Minitab dan SAS, bandingkan hasilnya dengan jawaban Anda pada poin (a), (b), dan (c) di atas. ** Data X t dan Y t dilampirkan 24
2. Melalui Minitab, bangkitkan data (n = 225) berupa model ARIMA(1, 1, 1) dengan = 0.75, Φ = (0.8 + 0.0m) dan θ = (- 0.9 + 0.0m) serta e t ~ Normal(0,1). Gunakan 200 data terakhir sebagai data Y t, selanjutnya lakukan proses berikut: a. Berdasarkan ACF dan PACF untuk data Y t tersebut, identifikasilah kandidat model yang sesuai. b. Berdasarkan kandidat model tersebut, tentukan model terbaik berdasarkan uji Box-Pierce dan nilai MSE-nya. c. Bandingkan penduga parameter yang diperoleh untuk model terbaik pada poin (b) tersebut dengan nilai parameter yang sesungguhnya. Apa kesimpulan Anda? ** Data X t dan Y t dilampirkan 25
3. Pada Tabel 7.1 disajikan data bulanan ekspor karet Indonesia ke Jepang dalam ribuan ton (X t ) untuk 50 bulan terakhir. Selanjutnya data Y t = X t + 2m. a. Dengan menggunakan Minitab dan SAS, melalui ACF dan PACF lakukan identifikasi untuk memperoleh kandidat model ARIMA yang sesuai untuk data Y t. b. Berdasarkan kandidat model tersebut, tentukan model terbaik untuk data Y t tersebut. c. Uraikan persamaan modelnya secara lengkap untuk model terbaik yang diperoleh pada poin (b) di atas. d. Berdasarkan model terbaik yang diperoleh, tentukan ramalan Y t untuk bulan ke: 51, 52, dan 53. 26
Tabel 7.1 : Data bulanan ekspor karet Indonesia ke Jepang (dalam ribu ton) t Xt 1 293.1 2 339.3 3 386.1 4 434.7 5 482.9 6 532.2 7 581.5 8 631.4 9 681.5 10 732.4 11 783.7 12 834.2 13 885.0 14 935.7 15 985.2 16 1035.1 17 1085.8 18 1137.0 19 1188.0 20 1237.9 21 1288.1 22 1340.9 23 1392.5 24 1444.7 25 1496.1 t Xt 26 1545.7 27 1594.4 28 1644.2 29 1693.6 30 1741.2 31 1787.4 32 1836.1 33 1886.0 34 1936.1 35 1985.0 36 2034.3 37 2082.7 38 2132.0 39 2182.9 40 2232.7 41 2282.6 42 2332.6 43 2382.1 44 2430.9 45 2480.1 46 2528.2 47 2577.1 48 2627.1 49 2678.5 50 2731.1 27
Cryer, J.D. and Chan, K.S. 2008. Time Series Analysis with Application in R. Springer. Montgomery, D.C., et.al. 2008. Forecasting Time Series Analysis 2nd. John Wiley. Wei, William, W.S. 1990. Time Series Analysis, Univariate and Multivariate Methods. Adison-Wesley Publishing Company Inc, Canada. Abraham, B. and Ledolter, J. 2005. Statistical Methods for Forecasting. John Wiley. 28
Bisa di-download di http://www.stat.ipb.ac.id/en/index.php?page=dr-kusman-sadik 29
30