Penerapan Model ARIMA (Bagian I) Dr. Kusman Sadik, M.Si Departemen Statistika IPB, 016 1
Ada tiga tahapan iterasi dalam pemodelan data deret waktu, yaitu: 1. Penentuan model tentatif (spesifikasi model) berdasarkan data contoh untuk mengidentifikasi nilai p, d, dan q.. Pendugaan parameter model ARIMA(p, d, q) yang diidentifikasi, yaitu penduga nilai,, dan σ e. 3. Analisis diagnostik untuk melihat kelayakan model.
Prosedur iterasi ini sering disebut Metode Box- Jenkins. Untuk model ARIMA(p, d, q), spesifikasi dilakukan untuk menentukan nilai p, d, dan q. Alat yang digunakan pada tahap identifikasi ini adalah fungsi autokorelasi. Fungsi autokorelasi ini diduga dari data contoh atau disebut fungsi autokorelasi contoh (sample of autocorrelation function atau SACF atau ACF saja). Disamping itu ada pula fungsi autokorelasi parsial (sample of partial autocorrelation function atau SPACF atau PACF saja) 3
4 a. ACF,... 1,, ) ( ) )( ( 1 1 k Y Y Y Y Y Y r n t t k n t k t t k n Y Y n t t 1 r k merupakan penduga bagi k
a. PACF PACF : kk = Corr(Y t, Y t-k Y t-1, Y t-,, Y t-k+1 ) Berdasarkan persamaan Yule-Walker: j = k1 j-1 + k j- +... + kk j-k j = 1,,..., k; Catatan: j = -j dan 0 = 1 k ACF; kk PACF ˆ kk penduga bagi kk 5
6 Contoh: Misal diketahui data : 4,, 5, 1. Tentukan ACF (r 1, r ) dan PACF (φ 11, φ ) Melalui persamaan..., 1,, ) ( ) )( ( 1 1 k Y Y Y Y Y Y r n t t k n t k t t k Dapat diperoleh penduga ACF : r 1 = -0.7 dan r = 0.4
Berdasarkan persamaan Yule-Walker dapat diperoleh penduga PACF kk : j = k1 j-1 + k j- +... + kk j-k Untuk k =1 j = 1 1 = 11 0 1 = 11 (1) r 1 = φ 11 = -0.7 Untuk k = j = 1, 1 = 1 0 + 1 1 = 1 + 1 = 1 1 + 0 = 1 1 + 7
1 = 1 0 + 1 1 = 1 + 1 = 1 1 + 0 = 1 1 + ( 1 ) = 1 1 + ( 1 )... Pers(1) = 1 1 +.. Pers() Berdasarkan Pers(1) dan Pers() diperoleh: ( 1 ) - = ( 1 ) - = {( 1 ) - }/{( 1 ) - 1} φ = {(r 1 ) - r }/{(r 1 ) - 1} = 0.09/(-0.51) = -0.176 8
Pengidentifikasian Model Model MA: Misal MA(1) : Y t = e t - e t-1 ACF : k 1 0 ; ; k k 1 1 1.0 1.0 0.8 0.8 k 0.6 0.4 r k 0.6 0.4 0. 0.0 1 3 4 5 ACF k 0. 0.0 1 3 4 5 6 Sample of ACF k 9
Karena r k berasal dari data contoh maka diperlukan galat baku bagi r k yaitu S rk. Sebagai nilai pendekatan : S rk = 1 / n, dimana n adalah banyaknya data. Sehingga hipotesis H 0 : k = 0 ditolak jika r k > S rk atau r k > / n. Misalnya, jika r 1 > / n dan r k < / n untuk k =, 3,, maka model tentatifnya adalah MA(1). 10
Model AR : Misalkan AR(1) : Y t = Y t-1 + e t ACF : k = k ; k = 1,, Untuk model AR, ACF merupakan fungsi eksponensial sehingga ACF tidak dapat digunakan untuk menentukan nilai p dalam AR(p). PACF : untuk k = 1 1 = 11 untuk k = 1 = 1 + 1... (1) = 1 1 +... () 11
Berdasarkan persamaan (1) dan () = 0. Demikian juga 33 = 44 =... = 0. Sehingga PACF AR(1): kk 0 1 ; ; k k 1 1 Dengan demikian PACF dapat digunakan sebagai penentu nilai p dalam model AR(p). kk 1.0 0.8 0.6 0.4 ˆ kk 1.0 0.8 0.6 0.4 0. 0. 0.0 1 3 4 5 PACF 0.0 1 3 4 5 6 Sample of PACF Hipotesis H 0 : kk = 0 ditolak jika ˆ n. kk / 1
Pengidentifikasian nilai p dan q 1.0 0.8 0.6 0.4 0. tails off 0.0 1 3 4 5 6 7 8 9 Sample of ACF 1.0 0.8 cuts off after lag q 0.6 0.4 0. 0.0 1 3 4 5 6 7 8 9 Sample of ACF 13
14
Contoh (1) 15
Contoh () 16
Contoh (3) d = 1 d = 1 17
Pendugaan Parameter Model Apabila nilai p, d, dan q sudah dapat diidentifikasi, maka selanjutnya dilakukan pendugaan terhadap parameter model, yaitu 1,,..., p untuk model AR(p) dan 1,,..., q untuk model MA(q) berdasarkan data terobservasi Y 1, Y,..., Y n. Metode pendugaan parameter : Metode momen, Metode kuadrat terkecil (least-square), Metode kemungkinan maksimum (maximum likelihood). 18
1. Metode Momen Metode ini didasarkan pada persamaan momen contoh dan momen teoritis, kemudian memecahkan persamaan-persamaan tersebut untuk mendapatkan penduga bagi parameter model. Misalnya, menduga rataan populasi (teoritis) dengan rataan contoh Y. Model AR a. AR(1) : Y t = Y t-1 + e t k = k ; k = 1,, 1 = ˆ ˆ1 r 1 = ˆ Jadi pada AR(1) penduga bagi parameter model,, adalah r 1 yang dapat dihitung dari data. 19
b. AR(1) : Y t = + Y t-1 + e t Bagaimana menduga? Perhatikan model : (Y t - Y)= (Y t-1 - Y) + e t (Y t - Y)= (Y t-1 - Y) + e t Y t = (1 - )Y + Y t-1 + e t Y t = + Y t-1 + e t Sehingga : = (1 - )Y 0
c. AR() : Y t = 1 Y t-1 + Y t- + e t Berdasarkan persamaan Yule-Walker : k = 1 k-1 + k- +... + p k-p maka diperoleh 1 = 1 + 1 dan = 1 1 + dengan metode momen diperoleh: r 1 = ˆ 1 + ˆ r 1 dan r = r 1 ˆ 1 + ˆ penyelesaian terhadap dua persamaan ini diperoleh: ˆ r1 (1 r ) 1 dan ˆ r r1 1 r1 1 r1 1
Model MA MA(1) : Y t = e t - e t-1 1 ˆ 1 r 1 ˆ 1 sehingga diperoleh : ˆ 1 1 r 1 4r 1 Sebagai catatan untuk persamaan ini, apabila r 1 > 0.5 maka metode momen gagal untuk menduga parameter. Untuk MA(), MA(3), dst, metode momen menjadi sangat kompleks, sehingga harus menggunakan metode pendugaan lainnya.
Model ARMA ARMA(1, 1) : Y t = Y t-1 - e t-1 + e t k ( 1)( ) k 1 1 sehingga penduga bagi adalah : 1 ˆ r r 1 Untuk menduga dapat digunakan persamaan pertama dengan cara mengganti 1 dengan r 1 dan dengan ˆ, yaitu r (1 ˆ ˆ)( ˆ ˆ) 1 ˆ ˆ 1 ˆ 3
Contoh Kasus (Latihan): Misalnya diketahui model AR() : Y t = + 1 Y t-1 + Y t- + e t. Berdasarkan data diketahui bahwa r 1 = 0.75, r = 0.61, dan Y = 4.5. Tentukan ˆ, ˆ 1, dan ˆ dengan metode momen. 4
. Metode Kuadrat Terkecil Metode ini dilakukan dengan cara meminimumkan komponen pada galat, yaitu n t 1 e t. AR(1) : Y t = Y t-1 + e t e t = Y t - Y t-1 n S() = t 1 e t n = ( Y t Y t t 1 ) 1 Penduga bagi parameter model,, dapat diperoleh dengan cara meminimumkan S(). 5
MA(1) : Y t = e t - e t-1 e t = Y t + e t-1 e t = Y t + ( Y t-1 + e t- ) e t = Y t + Y t-1 + Y t- + 3 Y t-3 +. n S() = t 1 e t Meminimumkan S() tidak dapat dilakukan secara analitik / kalkulus karena bersifat non-linear, sehingga harus diselesaikan secara numerik / iteratif, salah satunya melalui algoritma Gauss-Newton. 6
3. Metode Kemungkinan Maksimum Metode ini dilakukan dengan cara memaksimumkan fungsi kemungkinan (likelihood), berdasarkan fungsi sebaran galat (e t ). AR(1) : Y t = Y t-1 + e t, misal e t bsi ~ N(0, e ) 1 f(e 1, e,., e n ) = ( ) 1) n ( n / e.exp( ) et L(, 1 e ) = ( ) 1) n ( n / e.exp( ( ) ) Yt Yt e t 1 e t1 Penduga dan e dapat diperoleh dengan cara memaksimumkan fungsi kemungkinan L(, e ). 7
MA(1) : Y t = e t - e t-1 Fungsi kemungkinannya, L(, e ), bersifat non-linear sehingga pemaksimumannya harus dilakukan secara numerik / iteratif. Catatan : SAS dan Minitab menggunakan metode iterasi Gauss-Newton untuk menduga parameter AR(p), MA(q), dan ARIMA(p, d, q). 8
Zt Studi Kasus : Tentukan model terbaik untuk data bulanan penjualan suatu produk (Z t ) sebagai berikut: 10 0-10 Index 10 0 30 40 Zt : Data Asal 9
Zt(lag1) 1 0-1 - -3 Index 10 0 30 40 Zt(lag1) : Data Zt setelah differencing ordo-1 30
Zt(lag) 3 1 0-1 - Index 10 0 30 40 Zt(lag) : Data Zt setelah differencing ordo- 31
Autocorrelation Autocorrelation Function for Zt (with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 0.4 0. 0.0-0. -0.4-0.6-0.8-1.0 1 3 4 5 6 Lag 7 8 9 10 11 Ada indikasi tidak stasioner. Mengapa? 3
Autocorrelation Autocorrelation Function for Zt(lag1) (with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 0.4 0. 0.0-0. -0.4-0.6-0.8-1.0 1 3 4 5 6 Lag 7 8 9 10 11 Ada indikasi tidak stasioner. Mengapa? 33
Autocorrelation ACF Autocorrelation Function for Zt(lag) (with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 0.4 0. 0.0-0. -0.4-0.6-0.8-1.0 1 3 4 5 6 Lag 7 8 9 10 11 Ada indikasi sudah stasioner. Mengapa? 34
Partial Autocorrelation PACF Partial Autocorrelation Function for Zt(lag) (with 5% significance limits for the partial autocorrelations) 1.0 0.8 0.6 0.4 0. 0.0-0. -0.4-0.6-0.8-1.0 1 3 4 5 6 Lag 7 8 9 10 11 35
Partial Autocorrelation Autocorrelation Autocorrelation Function for Zt(lag) (with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 0.4 0. 0.0-0. -0.4-0.6-0.8-1.0 1 3 4 5 6 Lag 7 8 9 10 11 1.0 0.8 Partial Autocorrelation Function for Zt(lag) (with 5% significance limits for the partial autocorrelations) 0.6 0.4 0. 0.0-0. -0.4-0.6-0.8-1.0 1 3 4 5 6 Lag 7 8 9 10 11 Kandidat Model : ARIMA(0,,1)dan ARIMA(1,,0) 36
ARIMA(0,,1) ARIMA model for Yt Estimates at each iteration Iteration SSE Parameters 0 66.1073 0.100 0.031 1 57.5810-0.050-0.011 51.8387-0.00-0.048 3 48.8500-0.350-0.083 4 48.3704-0.435-0.099 5 48.3691-0.439-0.099 6 48.3691-0.439-0.099 Relative change in each estimate less than 0.0010 Final Estimates of Parameters Type Coef SE Coef T P MA 1-0.4393 0.1371-3.0 0.003 Constant -0.0995 0.1581-0.63 0.533 Differencing: regular differences Number of observations: Original series 47, after differencing 45 Residuals: SS = 48.359 (backforecasts excluded) MSE = 1.146 DF = 43 37
ARIMA(1,,0) ARIMA model for Yt Estimates at each iteration Iteration SSE Parameters 0 55.901 0.100 0.035 1 50.7183 0.50-0.0 47.597 0.400-0.056 3 46.1186 0.543-0.069 4 45.990 0.58-0.067 5 45.9806 0.59-0.067 6 45.9799 0.595-0.067 7 45.9799 0.596-0.067 8 45.9799 0.596-0.067 Relative change in each estimate less than 0.0010 Final Estimates of Parameters Type Coef SE Coef T P AR 1 0.5958 0.15 4.86 0.000 Constant -0.06673 0.0699-1.06 0.95 Differencing: regular differences Number of observations: Original series 47, after differencing 45 Residuals: SS = 45.9799 (backforecasts excluded) MSE = 1.0693 DF = 43 38
Pemilihan Model Terbaik Berdasarkan MSE Terkecil Berdasarkan hasil di atas: ARIMA(0,, 1) MSE : 1.146 ARIMA(1,, 0) MSE : 1.0693 Sehingga model terbaik berdasarkan nilai MSE terkecil adalah ARIMA(1,, 0). Model terbaik yang diperoleh dapat digunakan untuk melakukan peramalan. 39
1. Melalui Minitab, bangkitkan data y t, (n = 5), berupa model ARIMA(1,, 0) dengan = 0.5, Φ = 0.8 serta e t ~ Normal(0,1). Gunakan 00 data terakhir dan lakukan proses berikut: a. Berdasarkan ACF dan PACF untuk data y t tersebut, identifikasilah kandidat model yang sesuai. b. Berdasarkan kandidat model tersebut, tentukan model terbaik berdasarkan nilai MSE-nya. c. Bandingkan penduga parameter yang diperoleh untuk model terbaik pada poin (b) tersebut dengan nilai parameter yang sesungguhnya. Apa kesimpulan Anda? 40
. Melalui Minitab, bangkitkan data y t, (n = 5), berupa model ARIMA(1, 1, ) dengan = 1.0, Φ = 0.8, θ 1 = - 0.9, dan θ = 0.7 serta e t ~ Normal(0,1). Gunakan 00 data terakhir dan lakukan proses berikut: a. Berdasarkan ACF dan PACF untuk data y t tersebut, identifikasilah kandidat model yang sesuai. b. Berdasarkan kandidat model tersebut, tentukan model terbaik berdasarkan nilai MSE-nya. c. Bandingkan penduga parameter yang diperoleh untuk model terbaik pada poin (b) tersebut dengan nilai parameter yang sesungguhnya. Apa kesimpulan Anda? 41
Lihat Montgomery : Exercise 5.11, hlm. 90 4
Cryer, J.D. and Chan, K.S. 008. Time Series Analysis with Application in R. Springer. Montgomery, D.C., et.al. 008. Forecasting Time Series Analysis nd. John Wiley. Wei, William, W.S. 1990. Time Series Analysis, Univariate and Multivariate Methods. Adison-Wesley Publishing Company Inc, Canada. Abraham, B. and Ledolter, J. 005. Statistical Methods for Forecasting. John Wiley. 43
Bisa di-download di http://www.stat.ipb.ac.id/en/index.php?page=dr-kusman-sadik 44
45