KEMENTERIAN PEKERJAAN UMUM BADAN PENELITIAN DAN PENGEMBANGAN PUSAT PENELITIAN DAN PENGEMBANGAN SUMBER DAYA AIR PENDUGAAN DATA RUNTUT WAKTU MENGGUNAKAN METODE ARIMA
PENDAHULUAN Prediksi data runtut waktu. Pelaksanaan dan evaluasi menjadi terarah sesuai dengan kebutuhan sehingga prioritas dan pemilihan alternatif solusi sesuai dengan sumber daya yang tersedia. Salah satu cara untuk menduga data runtut waktu dapat digunakan metode stokastik yang dinamakan ARIMA (Autoregressive Integrated Moving Average).
ACF dan PACF Autocorrelation Function (ACF) Koefisien ini menunjukkan keeratan hubungan antara nilai variabel yang sama tetapi pada waktu yang berbeda Koefisien autokorelasi mengukur tingkat keeratan hubungan antara Xt dengan Xt-1. Sedangkan pengaruh dari timelag 1, 2, 3.... dan seterusnya sampai k-1 dianggap konstan Partial Autocorrelation Function (PACF) Koefisien autokorelasi parsial mengukur derajat hubungan antara nilai-nilai sekarang dengan nilai-nilai sebelumnya (untuk time lag tertentu), sedangkan pengaruh nilai variabel time lag yang lain dianggap konstan Koefisien autokorelasi parsial mengukur tingkat keeratan hubungan antara X t dan X t-k sedangkan pengaruh dari time lab 1,2,3,,k-1 dianggap konstan.
MODEL AR dan MA Fungsi Model Autoregresif (AR) Fungsi linear dari observasi deret stasioner sebelumnya (meregresikan terhadap dirinya sendiri pada periode yang berbeda) dengan kata lain model ini mengasumsikan bahwa data periode sekarang dipengaruhi oleh data pada periode sebelumnya. Model ini dapat dipilih apabila ACF menunjukkan pola dying down dan PACF menunjukkan pola yang cut off. Fungsi Moving Average (MA) Proses yang menyatakan hubungan ketergantungan antara nilai pengamatan Yt dengan nilai-nilai kesalahan yang berurutan dari periode t sampai t-q. Model ini dapat dipilih apabila ACF menunjukkan pola yang cutoff dan PACF menunjukkan pola dying down
Autoregressive (AR) Menunjukkan korelasi antara data Y t dengan lag sebelumnya Y t-1,y t-2,.., Y t-k. Biasanya dinotasikan dengan AR(p). P merupakan order dari lag model AR Identifikasi Cek correlogram residual : PACF (AR) t p i t i t y a y 1 1 0
Moving Average (MA) Menunjukkan adanya hubungan error term pada periode t ( t ) dengan error term periode sebelumnya ( t-i ) q t 0 i t i 0 y a Biasanya dinotasikan dengan MA(q). (q) adalah order dari lag model MA Identifikasi Cek correlogram residual : ACF (MA)
Autocorrelation CUT OFF Cut off adalah lag yang tidak signifikan terhadap garis batas signifikansi 1.0 0.8 0.6 Autocorrelation Function for Pembedaan musiman dan reguler (with 5% significance limits for the autocorrelations) 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 5 10 15 20 25 30 Lag 35 40 45 50 55 60
Partial Autocorrelation DYING DOWN Dying down adalah lag yang bergerak turun dengan bertambahnya lag (sinusoidal) Partial Autocorrelation Function for Pembedaan musiman dan reguler (with 5% significance limits for the partial autocorrelations) 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 5 10 15 20 25 30 Lag 35 40 45 50 55 60
Model ARIMA Musiman (1) Data runtut waktu yang diperoleh akan digunakan untuk menganalisis runtun waktunya sehingga pola dari data tersebut akan diperlukan dalam peramalan di masa mendatang Model ARIMA (Autoregressive Integrated Moving Average) yang merupakan model gabungan dari model autoregresif dan moving average yang telah melalui proses differencing sebanyak d kali agar menjadi stasioner.
Model ARIMA Musiman (2) ARIMA Multiplikative (Musiman) = (p,d,q)(p,d,q)s: Keterangan: p, d, q : Orde AR, Difference, MA non musiman P, D, Q : Orde AR, Difference, MA musiman Difference adalah teknik pengurangan (selisih) untuk menghilangkan nonstationer data dalam mean atau variance. s : Periode musiman s = 3 => Triwulan s = 4 => Kwartalan s = 6 => Semesteran s = 12 => Tahunan dst Macam-macam model ARIMA Multiplikative: 1. SAR (0 0 0)(1 0 0) 2. SMA (0 0 0)(0 0 1) 3. ARSMA (1 0 0)(0 0 1) 4. dll
CONTOH ESTIMASI MODEL Estimasi Model dengan melihat perilaku grafik ACF dan PACF. Misalkan model SAR (0 0 0)(1 0 0), - Model tersebut menunjukkan nilai d & D adalah nol, yang berarti data asli telah stasioner sehingga tidak diperlukan Difference baik terhadap data non musiman dan musimannya. - Nilai p nol dan P bernilai 1, yang berarti perilaku PACF menunjukkan tidak ada yang signifikan untuk data musiman, sedangkan pada data musimannya ada yang signifikan. - Nilai q & Q adalah 0, yang berarti perilaku ACF menunjukkan tidak ada yang signifikan untuk data musiman dan non musiman.
Model ARIMA Musiman (3) Langkah-langkah metode ARIMA : 1. Tahap Identifikasi Tahap identifikasi dilakukan tiga hal yaitu identifikasi terhadap pola data, kestasioneran data dan perilaku ACF dan PACF. 2. Estimasi Model. Pada tahap estimasi, penentuan nilai estimasi awal untuk parameter-parameter dari model tentatif berdasarkan pola ACF dan PACF. 3. Evaluasi Model. Melakukan uji diagnostik untuk menguji kedekatan model dengan data. Uji ini dilakukan dengan menguji nilai residual dan signifikansi. 4. Peramalan. Peramalan dilakukan menggunakan perangkat lunak MINITAB 14. Nilai hasil peramalan disediakan dari perangkat tersebut.
Diagram Alir ARIMA Data Inflow Membuat plot runtut waktu Membuat plot ACF Data sudah Stasioner? Melihat Plot ACF dan PACF data yang sudah stasioner dalam mean dan varians Tidak Varians: Transformasi Mean: Differencing Pendugaan Model & Pengujian Parameter dari Plot ACF dan PACF Check model dengan white noice Model yang sesuai lebih dari 1 Ya Pemilihat model terbaik. Terlihat dari P value dan SS serta MS Tidak Perolehan model ARIMA terbaik Peramalan dengan model yang dibentuk
IDENTIFIKASI MODEL (1) Identifikasi model dilakukan untuk mengetahui kestasioneran data aktual. Suatu data harus stasioner terhadap varian dan rataan agar dapat diolah dan menghasilkan prediksi yang baik menggunakan metode ARIMA. Berikut adalah ciri-ciri data yang tidak stasioner berserta contohnya: Gambar 1 Tidak stasioner dalam mean Gambar 2 Nilai ACF dari Gambar 1 Gambar 3 Nilai PACF dari Gambar 1
Gambar 4 Tidak stasioner dalam varians Gambar 5 Nilai ACF dari Gambar 4 Gambar 6 Nilai PACF dari Gambar 4
Gambar 7 Tidak stasioner dalam varians dan mean Gambar 8 Nilai ACF dari Gambar 7 Gambar 9 Nilai PACF dari Gambar 7
Partial Autocorrelation Pembedaan musiman dan reguler Autocorrelation 1.5 1.0 0.5 0.0-0.5-1.0 Trend Analysis Plot for Pembedaan musiman dan reguler Linear Trend Model Yt = -0.000490105 + 8.224064E-06*t 1 32 64 96 128 160 192 Index 224 256 288 320 Variable Actual Fits Accuracy Measures MAPE 100.148 MAD 0.242 MSD 0.095 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 Autocorrelation Function for Pembedaan musiman dan reguler (with 5% significance limits for the autocorrelations) 1 5 10 15 20 25 30 35 Lag 40 45 50 55 60 Gambar 10 Stasioner dalam varians dan mean Gambar 11 Nilai ACF dari Gambar 10 Partial Autocorrelation Function for Pembedaan musiman dan reguler (with 5% significance limits for the partial autocorrelations) 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 5 10 15 20 25 30 35 Lag 40 45 50 55 60 Gambar 12 Nilai PACF dari Gambar 10
IDENTIFIKASI MODEL (2) Apabila data yang digunakan belum stasioner maka jangan melanjutkan tahap estimasi, dikarenakan asumsi untuk mengerjakan model ARIMA adalah menggunakan data yang telah stasioner terhadap mean dan varian.
IDENTIFIKASI MODEL (3) Cara untuk menstasionerkan data aktual 1. Cara untuk menstasionerkan data secara mean dengan cara melakukan difference. 2. Sedangkan untuk menstasionerkan data secara varian dengan melakukan Transformasi. Syarat untuk dilakukan Transformasi adalah data tidak bernilai 0, sehingga data yang digunakan adalah data bulanan. Macam-macam transformasi yang dapat dilakukan adalah a. Transformasi Log b. Transformasi Square Root c. Transformasi Square d. Transformasi Arcsin e. Transformasi Cubic
ESTIMASI MODEL Cut off setelah lag 1 atau 2, koefisien korelasi tidak signifikan pada lag-lag musiman Cut off setelah lag musiman L, koefisien korelasi tidak signifikan pada lag-lag non musiman Cut off setelah lag musiman L, terdapat koefisien korelasi yang signifikan pada lag non musiman ke- 1 atau 2 Dying down Dying down Dying down Dying down Sumber: Gaynor and Kirpartik (1994) ACF PACF Model Dying down Dying down Dying down Cut off setelah lag 1 atau 2, koefisien korelasi tidak signifikan pada lag-lag musiman Cut off setelah lag musiman L, koefisien korelasi tidak signifikan pada lag-lag non musiman Cut off setelah lag musiman L, terdapat koefisien korelasi signifikan pada lag-lag non musiman ke-1 atau 2 Dying down Non Seasonal Moving Average (q=1 atau 2) Seasonal Moving Average (Q=1) Non Seasonal Seasonal Moving Average (q=1 atau 2, Q=1) Non Seasonal Autoregressive (p=1 atau 2) Seasonal Autoregressive (P=1) Non Seasonal Seasonal Autoregressive (p=1 atau 2, P=1) Mixed (Autoregressive Moving Average)
EVALUASI MODEL 1. Residual peramalan bersifat acak. Untuk memastikan apakah model sudah memenuhi syarat ini, dapat digunakan indikator Box- Ljung Statistic. Dari session diketahui bahwa nilai P-value untuk uji statistik ini lebih besar dari 0,05 yang menunjukkan bahwa residual sudah acak. 2. Model parsimonious (model relatif sudah dalam bentuk yang paling sederhana). 3. Parameter yang diestimasi berbeda nyata dengan nol. Ini dapat dilihat dari nilai P-value koefisien yang kurang dari 0,05. 4. Kondisi invertibilitas ataupun stasioneritas harus terpenuhi. Hal ini ditunjukkan oleh jumlah koefisien MA atau AR dimana masing-masingnya harus kurang dari satu. 5. Model harus memiliki MS & SS yang kecil. 6. Selain itu grafik ACF dan PACF dari residual menunjukkan pola cut off, yang berarti bahwa residual memang sudah acak.
Contoh output MINITAB