Pengenalan Analisis Deret Waktu (Time Series Analysis) ) MA 208 Statistika Dasar 0 April 202 Utriweni Mukhaiyar
Ilustrasi Berikut adalah data rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang pada tahun 200 2004. Sumber : Modul Praktikum Mekanika Medium Kontinu Medan Gravitasi Tahun Jan Feb Mar Apr Mei Jun Jul Agust Sep Okt Nop Des 200 28.9 29.8.29 24.4.9 6.9.2 29.08 4.82.68 08.49 26.82 2002 299.8 24.88 266.64 8.2 22.22. 6.8 2.4 26.09 69.0 46.62 4. 200 42.2 0.8 00.2.4 84.96 69.9 2.28 4.9.86 2.2 4.2 46.02 2004 4.8 08.2 88 9 29 28 4 8 0 89.6 Apabila nilai curah hujan saat ini dianggap dipengaruhi oleh rata- rata curah hujan kemarin dst, maka data rata-rata curah hujan di atas dapat dikategorikan sebagai suatu deret waktu (time series). 2
Plot Data berdasarkan waktu 600 Rata-rata curah hujan bulanan 200-2004 di Stasiun Padaherang 00 nilai cu urah hujan 400 00 200 00 0 0 0 20 2 0 40 4 waktu (bulan ke-) @ UM
Proses Stokastik Proses stokastik adalah barisan peubah acak {Y t, t T } Setiap proses stokastik memuat ruang keadaan S dan indeks parametert S : semua nilai yang mungkin dari Y t S dantt dapat bernilai i diskrit it atau kontinu Contoh proses stokastik: a. Cuaca harian kota Bandung b. Banyaknya trombosit/hari pasien demam berdarah sejak ia terinfeksi c. Laju pertumbuhan populasi orang utan (% per tahun) d. Waktu antara mekarnya bunga bangkai yang ke-n n dengan bunga bangkai yang ke n+ Misal y t nilai dari Y t maka barisan nilai {y t, t T } disebut realisasi dari {Y t, t T } 4
Time Series Jika T : waktu, maka {Y t, t T } disebut time series Realisasinya disebut data TS Studi berkaitan dengan TS disebut analisis TS Permasalahan dalam analisis TS : Bagaimana menentukan model Y t sehingga model tersebut dapat digunakan untuk forecasting (prakiraan di waktu mendatang)?? Secara umum, model TS dapat ditulis Y t = f (.) + e t () Asumsi galat: e t ~ N (0, 2 ) dan tidak berkorelasi Jika f linier dalam parameter-parameternya maka persamaan () disebut model linier TS Koleksi semua model linier TS dinamakan model ARIMA(p,d,q) (Box-Jenkins, 96)
Contoh Time Series Tingkat Pengangguran di AS Produksi Tembakau di AS 4 Persen 6 8 Miliar pounds 00 0 000 00 2000 9 0 20 40 60 80 00 20 Kuartal 880 900 920 940 960 980 Tahun 20 0000 40000 6000 00 80000 Data Penjualan lynx pelts di Canada 8 2 4 6 Ukuran partikel setelah penyemprotan pengharum ruangan 0 6 80 860 80 880 890 900 Tahun 0 00 200 00 400 00 Menit
Manfaat dan Tujuan TS Memodelkan data TS sehingga dapat dilihat perilaku data lebih lanjut Melakukan prediksi ke depan atau prakiraan jangka pendek (short-time forecasting)
Beberapa Konsep Dasar dalam TS Kestasioneran TS {Y t, t T } stasioner jika untuk setiap t,. E[Y t] = (konstan) 2. kov(y t, Y t k ) = k (tidak tergantung t ) Secara visual, data TS {Y t, t T } stasioner jika data TS berfluktuasi di sekitar rataannya dengan variansi konstan 8
Beberapa Konsep Dasar dalam TS ACF, fungsi autokorelasi ACF (fungsi autokorelasi) : fungsi antara lag k dan k dengan, k = corr (Y t,y t k ). ACF sampel: 9 r k n t t k t k n 2 ( Yt Y) t ( Y Y)( Y Y) r k = 0 (secara signifikan) jika 96,96 r k 96,96 n n
Beberapa Konsep Dasar dalam TS PACF, fungsi parsial autokorelasi PACF (fs. autokorelasi parsial) : fungsi antara lag k dengan kk di mana kk = corr (Y t, Y t k ) setelah tlh pengaruh Y, Y 2,, Y k- ditiadakan. PACF dapat didefinisikan juga sebagai koefiesien suku terakhir dari regresi Y t dengan Y, Y 2,, Y k. Artinya, jika Y t = + Y t- + 2 Y t-2 + + k Y t-k maka PACF sampel untuk lag k = taksiran dari k. t ˆ ˆ atau kk k 0 = 0 (secara signifikan) jika, 96 kk, 96 ˆ kk ˆ n n
Contoh ACF dan PACF dengan SPSS number of blowfly 8000.0 Coefficient Upper Confidence Limit Lower Confidence Limit numb ber of blowfly 6000 4000 ACF 0. 0.0-0. 2000 -.0 2 4 6 8 9 0 Lag Number 2 4 6 9 9 2 2 2 2 2 9 9 4 4 4 4 4 9 9 6 6 6 6 6 9 9 8 number of blowfly Sequence number Dari menu SPSS, pilih Graphs Time Series Autocorrelations... pilih variabel yang akan dihitung ACF dan PACF-nya OK Partial ACF.0 0. 0.0-0. -.0 2 4 6 8 9 0 Lag Number 2 4 6 Coefficient Upper Confidence Limit Lower Confidence Limit
Model-model Time Series Untuk TS Stasioner. Autoregresi (AR) : regresi terhadap TS yg lalu & galat sekarang AR(): Y t = + Y t- +e t, di mana < < AR(2): Y t = + Y t- + 2 Y t-2 + e t, di mana < 2 <, 2 + <, 2 - < AR(p): Y t = + Y t- + 2 Y t-2 + + p Y t-p + e t 2. Moving Average (MA) : regresi terhadap galat yang lalu dan galat sekarang MA(): Y t = + e t e t -, di mana < < MA(2): Y t = + e t e t - 2 e t -2 di mana < 2 <, 2 + <, 2 - < 2 MA(q): Y t = + e t e t- 2 e t -2 - q e t q
Model-model Time Series Untuk TS Stasioner. Autoregresi-Moving Average (ARMA) regresi terhadap TS yang lalu dan semua galat ARMA(,): Y t = + Y t- +e t e t - ARMA(p,q): Z t = +( Y t- + + p Y t-p ) +(e t e t - q e t-q ) Catatan: AR(p) = ARMA(p,0), MA(q) = ARMA(0,q)
Model-model Time Series Untuk TS tidak Stasioner Misal TS {Y t } tidak stasioner. Buat TS baru yg stasioner, sebut {Z t } dengan cara diferensi, yaitu Z t = Y t Y t-, untuk setiap t. Maka ARMA(p,q) untuk {Z t } disebut ARIMA (p,,q) untuk {Z t } t Jika diferensi dilakukan d kali, ditulis ARIMA(p,d,q) d Catatan: ARMA(p,q) = ARIMA (p,0,q) 4
Metode Box Jenkins Tahap awal: Pemeriksaan kestasioneran: - Plot TS - Jika stasioner, lanjutkan ke tiga tahap iteratif. Jika tidak lakukan k transformasi atau diferensii Tiga tahap iteratif :. Identifikasi 2. Penaksiran parameter. Uji diagnostik (pemeriksaan asumsi sisa) Jika pada uji diagnostik, ada asumsi yang dilanggar ulangi lagi tahap iteratif
Identifikasi Model ACF PACF AR(p) Menurun secara eksponensial atau membentuk gelombang sinus teredam Cut off setelah lag p MA(q) Cut off setelah lag q Menurun secara eksponensial atau membentuk gelombang sinus teredam 6 Mengidentifikasi orde (p,q) model ARMA melalui kriteria Akaike (AIC) AIC n log + 2m, m = # parameter Hitung nilai AIC untuk setiap (p,q). Orde yang dipilih adalah (p,q) dengan nilai AIC yang paling kecil
Penaksiran Parameter Metode: - Kuadrat terkecil (untuk model AR) - Maksimum likelihoodlih - Melard (digunakan SPSS) Contoh penaksiran parameter melalui SPSS Dari menu, pilih Analyze Forecasting Create Models... Pilih nama TS sebagai Dependent variable Masukkan orde model ARIMA
Uji Diagnosis 8 Ingat asumsi galat: e t ~ N (0, 2 ) dan tidak berkorelasi Pengujian asumsi: Cara : Plot sisaan berfluktuasi di sekitar 0 E[e t ] = 0 nilai sisaan di sekitar,96 Var(e t ) = 2 plot ACF serta plot PACF-nya ˆ ˆ 2 r k dan ˆkk signifikan 0 sisaan tidak berkorelasi Cara 2: Uji Ljung-Box Uji H 0: korelasi antar sisaan = 0 dengan statistik Ljung-Box Q * n( n 2) Jika Q * > 2, dengan = h m dan m = # parameter, maka H 0 ditolak h k 2 rk n k
Contoh Hasil produksi bulanan perkebunan teh di lokasi PAL tahun 992-2009 (T = 26) Produksi teh "PAL" 992-2009 00000 20000 Produksi teh "PAL" 992-20092009 diferensi kali 0000 00000 produksi teh 200000 0000 00000 0000 produksi teh 0000 0-0000 0 0 00 0 200 0 0 0 00 0 200-00000 bulan ke- bulan ke- 9
Contoh Sari Numerik Data Data perkebunan teh PAL Mean 9.6 Standard Error 2488. Median 68 Mode #N/A Standard Deviation 6.9 Sample Variance.4E+09 Kurtosis 0.22246 Skewness 0.024 Range 2848 Minimumi 60 Maximum 246 Sum 2889942 Count 26 Data perkebunan teh PAL (diff kali) Mean 4.02 Standard Error 240.64 Median Mode 0 Standard Deviation 0.4 Sample Variance.2E+09 Kurtosis.809 Skewness 0.04 Range 269 Minimumi 86 Maximum 489 Sum 996 Count 2 20
Contoh Identifikasi ACF menurun seperti gelombang sinus teredam sedangkan PACF cut off setelah lag-. Model yang mungkin adalah AR() ACF cut off setelah lag- sedangkan PACF juga seperti cut off setelah lag-. Ada beberapa model yang mungkin, seperti ARIMA(,,) 2
Contoh Penaksiran dan Uji Diagnostik AR () Diperoleh AR() : Y 4, 420 0,Y e t t t ARIMA (,,) 22 Diperoleh ARIMA(,,) : Z 9, 20 0, 44Z 0,94e e t t t t
Contoh Kesimpulan Berdasarkan hasil Ljung-Box, dimana pada model AR() H 0 ditolak (sisaan berkorelasi) untuk semua % 0%, sedangkan ARIMA(,,) tidak ditolak untuk <,%. Oleh karena itu model ARIMA(,,), bisa dianggap lebih cocok (dengan sisaan yang tidak berkorelasi) sehingga dapat digunakan untuk melakukan short-time forecast dengan menggunakan persamaan : Z t 9, 20 0, 44Z t 0,94 e t e t Yt Yt 9, 20 0, 44( Yt Yt ) 0,94et Y 9, 20,44 Y 0,44 Y 0,94 e t t t t 2
Referensi Box, G. E. P. dan Jenkins, G. M. (96): Time Series Analysis: Forecasting & Control, Holden-Day Inc., San Fransisco Cryer, J. D. dan Chan, K. S. (2008): Time Series Analysis with Applications in R, Springer, New York. 24