Definisi Seasonal ARIMA adalah model ARIMA yang mengandung faktor musiman. Musiman berarti kecenderungan mengulangi pola tingkah gerak dalam periode musim, biasanya satu tahun untuk data bulanan. Karena itu, time series musiman mempunyai karakteristik yang ditunjukkan oleh adanya korelasi beruntun yang kuat pada jarak semusim (periode musim), yakni waktu yang berkaitan dengan banyak observasi pada per periode musim.
Notasi Notasi ARIMA dapat diperluas untuk mencakup aspek musiman yaitu: ARIMA (p,d,q) (P,D,Q) s Jumlah periode per musim Bagian nonmusiman Bagian musiman Keterangan: (p,q): komponen non-musiman model ARMA d: orde diferensi non-musimam P : nilai dari seasonal AR (SAR) D : nilai dari differencing seasonal Q : nilai dari moving average seasonal (SMA)
Identifikasi Identifikasi bagian non-musiman: Model ACF PACF AR(1) Menurun secara eksponensial Signifikan di lag 1 AR(p) Menurun secara eksponensial Signifikan sampai lag p MA(1) Signifikan di lag 1 Menurun secara ekponensial MA(q) Signifikan sampai lag q Menurun secara ekponensial ARMA(p,q) Signifikan keluar sampai lag q Signifikan keluar sampai lag p Menurun secara eksponensial (dies down) Dies down
Identifikasi bagian musiman: Model ACF PACF SAR(1) SAR(P) SMA(1) SMA(Q) SARMA (P,Q) Menurun secara exponensial pada level seasonal (lag 1s) Menurun secara exponensial pada level seasonal (lag 1s, 2s,, Ps) Signifikan pada lag 1s dan selanjutnya tidak signifikan Signifikan pada lag 1s, 2s,, Qs dan setelah lag Qs tidak signifikan Signifikan pada lag 1s, 2s,, Qs dan setelah lag Qs tidak signifikan Signifikan pada lag 1s dan selanjutnya tidak signifikan Signifikan pada lag 1s, 2s,, Ps dan setelah lag Ps tidak signifikan Menurun secara exponensial pada level seasonal (lag 1s) Menurun secara exponensial pada level seasonal (lag 1s, 2s,, Qs) Signifikan pada lag 1s, 2s,, Ps dan setelah lag Ps tidak signifikan
Diferensi Diferensi non-musiman: Jika data mengandung tren, maka data perlu didiferensi untuk menstasionerkannya. Seringkali (namun tidak selalu), diferensi data orde pertama cukup untuk menstasionerkan data. Diferensi musiman: Jika data mengandung musiman, maka data perlu didiferensi musiman. Jika data mengandung tren dan musiman, maka dilakukan diferensi nonmusiman dan diferensi musiman.
Contoh Identifikasi: Contoh data produksi beer di Australia: Data dengan panjang periode s = 4 Data mengalami diferensi non-musiman orde 1 (d = 1) dan diferensi musiman orde 1 (D = 1) Identifikasi non-musiman: Berdasarkan plot PACF yang signifikan sampai lag ke-2, diperoleh p = 2 Identifikasi musiman: Berdasar plot ACF yang signifikan secara musiman (kuartal) di lag 1x4, diperoleh Q = 1 Sehingga modelnya: ARIMA (2,1,0)(0,1,1) 4 Dapat dicoba juga model: ARIMA (2,1,0)(0,1,2) 4, ARIMA (2,1,1)(0,1,2) 4
Model AR(p) dan Seasonal AR(P) Model AR dan AR musiman (SAR): Musiman (AR) Non Musiman (SAR) Model AR(1): Model AR(1) 12 : Z Z a t 1 t 1 t Model AR(2): Model AR(2) 12 : Model AR(p) Model AR(P) s : Z Z a t 1 t 12 t Zt 1Z t 1 2Zt 2 at Z 1Z 12 1Z 24 a t t t t Zt 1Z t 1... pzt p a Z t t 1Zt s 2Zt 2 s...... Z a P t Ps t
Model MA(q) dan Seasonal MA(Q) Model MA dan MA musiman (SMA): Musiman (MA) Non Musiman (SMA) Model AR(1): Model AR(1) 12 : Z a a t t 1 t 1 Model AR(2): Model AR(2) 12 : Model AR(p) Model AR(P) s : Z a a t t 1 t 12 Zt at 1at 1 2at 2 Zt at 1at 12 1at 24 Zt at 1at 1... pa Z t q t at 1at s 2at 2 s...... a Q t Qs
Contoh: Diberikan data bulanan jumlah turis yang mengunjungi negara Spanyol selama Januari 1970 sampai Maret 1989 1970M01 820671 796113 1297542 1188844 1671536 2302318 1970M07 4204587 5270484 2496770 1538107 1101932 1163845 1971M01 983136 980217 1236050 1898694 1937907 2586122 1971M07 4689122 5223043 2853964 1753837 1254621 1360902 1972M01 1113857 1117236 1689481 1925956 2163178 2943452 1972M07 6237912 6774008 3367080 1902552 1414334 1797537 1973M01 1202174 1126462 1477043 2388930 2126606 3148788 1973M07 6637510 7236634 3655213 2177020 1538605 1753958 1974M01 1241184 1144593 1524258 2225725 1981724 2814555 1974M07 5521607 6464274 3205520 1589380 1180996 1451959 1975M01 1204519 1013728 1547030 1493496 2118609 2939469 1975M07 5950696 6697118 3265465 1396028 1043701 1452619 1976M01 1201802 1054301 1334284 1969020 2002472 2775668 1976M07 5561911 6159885 3060935 1959262 1338885 1595662 1977M01 1329367 1239682 1548567 2157524 2234009 2995528 1977M07 6423660 7037003 3421103 2266724 2134599 2002474 1978M01 1606495 1482481 2223206 2124732 2789463 3363263 1978M07 7017592 7968573 4242651 2747310 2050642 2354083 1979M01 2041841 1708735 2137271 2868814 2897433 3867278 1979M07 5878686 6746902 4029229 2514236 1837401 2374483 1980M01 1926865 1601051 1995573 2469649 2589818 3138548 1980M07 6365971 7918659 3930044 2249793 1671046 2132434 1981M01 1808070 1463234 1748698 2571631 2719622 3343539 1981M07 7100990 7877330 4562962 2770367 1870463 2323017 1982M01 1956456 1656160 2000723 2769373 2997200 3791947 1982M07 6953878 8029299 4665631 2875148 1910816 2357866 1983M01 1861374 1660730 2199483 2671888 2943001 3797188 1983M07 6645627 7674030 4590932 2972699 1939699 2306683 1984M01 1893032 1727653 2057087 3124812 3197066 3966746 1984M07 7365809 8277600 4765686 3129638 2028559 2413525 1985M01 1809238 3489028 2149235 2919590 3079927 4019152 1985M07 6837385 8002015 4696554 3385040 2073529 2875588 1986M01 1984935 1760252 2626673 2645591 3501433 4248450 1986M07 7403956 9102854 5253947 3279344 2398096 3183039 1987M01 2178426 2047278 2372760 3337538 3864519 4672446 1987M07 7911943 9376459 5368966 3602793 2411988 3394269 1988M01 2412604 2362577 2920339 3505098 4000187 4515161 1988M07 8735355 9684267 5818146 4243678 2624818 3356166 1989M01 2597707 2335168 3194855
Plot Data SARIMA 10,000,000 8,000,000 6,000,000 4,000,000 2,000,000 0 70 72 74 76 78 80 82 84 86 88 Dari plot data diatas terlihat data memiliki musiman dan trend.
Uji Stasioner: Nilai ADF Test Statisticnya lebih besar dari nilai critical value, sehingga data dapat dikatakan belum stasioner dalam mean.
Plot ACF dan PACF Dari plot disamping terlihat bahwa terdapat musiman pada Autokorelasi Karena data belum stasioner dalam mean maupun variansi maka dilakukan transformasi log dan diferencing orde satu. Transformasi dan diferensing dilakukan pada kedua situasi baik yang musiman atau non-musiman, kemudian dibandingkan mana yang lebih baik. Hasil dari transformasi dan diferensing yang non-musiman diberi nama dlogsarima sedangkan yang musiman dslogsarima
DLOGSARIMA 0.8 0.4 Plot data setelah ditransformasi dan didiferencing (non-musiman) 0.0-0.4-0.8-1.2 70 72 74 76 78 80 82 84 86 88 DSLOGSARIMA.8.6.4.2 Plot data setelah ditransformasi dan didiferencing (musiman).0 -.2 -.4 -.6 -.8 70 72 74 76 78 80 82 84 86 88
0.8 0.4 0.0-0.4-0.8-1.2 70 72 74 76 78 80 82 84 86 88 DLOGSARIMA DSLOGSARIMA Terlihat bahwa masih terdapat pola seasonal yang kuat pada obyek series dlogsarima, dengan variasi yang lebih besar dari dibanding dslogsarima. Karena itu, akan relatif lebih mudah untuk melakukan identifikasi model runtun waktu yang baik bagi data dslogsarima dibanding dlogsarima.
Plot ACF dan PACF Terlihat disini fungsi ACF dari dslogsarima menurun perlahan, mengindikasikan bahwa data nonstasioner dalam mean. Untuk itu dilakukan diferensi terhadap dslogsarima
Uji Stasioner: Setelah didiferensi, hasil diferensi orde 1 diuji: Nilai ADF Test Statistiknya lebih kecil dari nilai critical value 1%, sehingga data sudah stasioner dalam mean.
Identifikasi: Identifikasi Non-Musiman: Plot ACF: signifikan pada lag 1, menunjukkan proses MA nonmusiman (q = 1) Plot PACF: menurun (dies down) Identifikasi Musiman: Plot ACF: signifikan pada lag 12, menunjukkan adanya proses MA musiman (Q = 1). Plot PACF: signifikan pada lag 12, menunjukkan adanya proses AR musiman (P = 1) Sehingga modelnya: ARIMA (0,1,1)(1,1,1) 12 Model lainnya: ARIMA (0,1,1)(1,1,0) 12 ARIMA (0,1,1)(0,1,1) 12
Rangkuman Hasil Modeling SAR(12) -0.407999 (0.0000) MA(1) -0.738231 (0.0000) Model 1 Model 2 Model 3-0.726371 (0.0000) -0.531553 (0.0000) MA(12) -0.453018 (0.0000) SMA(12) -0.806210 (0.0000) MA(12) -0.453018 (0.0000) SSR 2.821980 2.333060 3.287744 AIC -1.433143-1.681088-1.338068 SBC/BIC -1.400833-1.650038-1.307017 Q(12) 8.8502 (0.546) Q(24) 48.485 (0.001) Q(36) 61.988 (0.002) 11.663 (0.308) 29.838 (0.122) 44.013 (0.117) 24.094 (0.007) 69.530 (0.000) 88.355 (0.000) Berdasrkan rangkuman hasil modeling di atas, dari uji t terhadap koefisian dari model dan dari uji diagnostik dapat disimpulkan bahwa model terbaik secara statistik adalah model 2 Pada model 1 dan 3 masih terdapat korelasi serial dalam residual dari model, sehingga model belum cukup baik menggambarkan data. Model 2 dapat dituliskan ARIMA(0, 1, 1)(0,1,1) 12
Peramalan 1 periode: Hasil fitting dan peramalan untuk data 1 bulan ke depan dengan menggunakan metode static 14,000,000 12,000,000 10,000,000 8,000,000 6,000,000 4,000,000 2,000,000 Forecast: SARIMAF Actual: SARIMA Forecast sample: 1970M01 1989M04 Adjusted sample: 1971M02 1989M04 Included observations: 218 Root Mean Squared Error 353121.1 Mean Absolute Error 218711.3 Mean Abs. Percent Error 7.104879 Theil Inequality Coefficient 0.045911 Bias Proportion 0.008252 Variance Proportion 0.082656 Covariance Proportion 0.909091 0 72 74 76 78 80 82 84 86 88 SARIMAF ± 2 S.E.
Peramalan n periode: Peramalan untuk 12 bulan ke depan: 16,000,000 14,000,000 12,000,000 10,000,000 8,000,000 6,000,000 4,000,000 2,000,000 0 1989Q2 1989Q3 1989Q4 1990Q1 SARIMAF2 ± 2 S.E.
Terima Kasih