UNIVARIATE ARIMA ( Box Jenkin Methodology ) MODELLING WORKSHOP ANALISIS RESIKO UNTUK BISNIS Oleh : Maman Setiawan, SE, MT 28 29 September 2004 PROGRAM PENGEMBANGAN KOMPETENSI BISNIS DIVISI PENGKAJIAN DAN PENGEMBANGAN BISNIS PROGRAM MAGISTER MANAJEMEN UNIVERSITAS PADJADJARAN
KATA PENGANTAR Makalah ini disampaikan pada workshop Analisis Resiko untuk bisnis yang dilaksanakan oleh Divisi Pengkajian Bisnis, Program Magister Manajemen Universitas Padjadjaran pada tanggal 28-29 September 2004. Peserta yang mengikuti workshop ini terdiri dari dosen universitas negeri dan swasta, tenaga akademisi lainnya, dan praktisi bisnis. Makalah yang berjudul Univariate ARIMA (Box Jenkin Methodology) Modelling ini disampaikan pada Sessi I dan II Workshop tanggal 29 September 2004. Workshop ini bertujuan agar pelaku bisnis bisa memahami kondisi-kondisi bisnis saat ini dan ke depan sehingga bisa mengantisipasi berbagai resiko yang terjadi di kemudian hari. Akhir kata saya sampaikan terima kasih sebesar-besarnya atas kepercayaan yang diberikan panitia Workshop Analisis Resiko Bisnis Program MM Unpad kepada saya untuk menjadi pembicara dalam workshop ini selama dua hari lamanya. Semoga materi yang disampaikan ini bermanfaat bagi pengembangan dan aplikasi ilmu di dunia bisnis. Bandung, September 2004 Maman Setiawan
1. ARIMA Modelling Model ARIMA dan time series digunakan dalam berbagai disiplin ilmu seperti antropologi, bisnis, kriminologi, hingga ilmu hewan. Tujuan dari ARIMA ini ialah menemukan suatu model yang akurat yang mewakili pola masa lalu dan masa depan dari suatu data time seris. Y t = Pattern + e t Di mana polanya bisa random, seasonal, trend, cyclical, promotional, atau kombinasi pola-pola tersebut. Model ARIMA pada time series dibuat oleh Box dan Jenkins pada tahun 1970, menggunakan 3 proses iteratif (Box, Jenkins, dan Reinsel, 1994 ). Tahapan melakukan estimasi model dalam ARIMA : 1. Identifikasi model : Menentukan tingkat stasionaritas data, Menentukan Nilai AR, Menentukan nilai MA 2. Estimasi Parameter dari model yang dipilih 3. Diagnostic Checking ( Apakah Estimasi residualnya stasioner/white noise? ) Yes Langsung ke tahap 4 No Kembali ke langkah 1 4. Forecasting Gambar 1.1
2. Identifikasi Model Pada proses ini ialah menentukan nilai p,d, dan q di mana p ialah jumlah proses autoregresive (AR ), d ialah jumlah difference agar suatu data time series bisa stasioner, dan q ialah jumlah proses moving average (MA). ( AR I MA ) ( p d q ) Proses Autoregressive ( AR ) Model dengan proses autoregressive ini hanya melibatkan data aktual dengan data tahun sebelumnya tanpa memasukan variabel lain, sehingga model ini sering disebut model dengan data yang berbicara sendiri ( data speaks for themselves) Jika suatu data Profit t ( Y t ) dikatakan misalnya mengikuti first order autoregressive atau AR(1) jika nilai Profit pada waktu t tergantung pada nilai tahun sebelumnya dan nilai variabel gangguannya. Jika digambarkan dalam model : (Profit t ) = 1 (Profit t-1 ) + u t di mana ialah nilai rata-rata profit dan u t ialah variabel gangguan yang tidak berkorelasi dengan rata-rata nol dan varians yang konstan ( 2 ) ( artinya White Noise). Selain AR(p) suatu model dengan proses autoregressive ini bisa mengikuti proses AR(p) jika dalam kenyatannya setelah diidentifikasi mengikuti pth-order autoregressive. (Profit t ) = 1 (Profit t-1 ) + 2 (Profit t-2 ) + + p (Profit t-p ) + u t Proses Moving Average ( MA ) Proses AR tidak hanya mekanisme yang mengendalikan perubahan profit tetapi bisa juga dikendalikan oleh pergerakan rata-rata (moving average) dari variabel gangguan aktual dan variabel gangguan waktu sebelumnya. Jika kita gambarkan dalam suatu model ialah : Profit t = + 0 u t + 1 u t-1 Di mana : ialah konstanta da u t ialah variabel gangguan stokastik. Pada model di atas terlihat bahwa profit pada waktu t ialah sama dengan konstanta ditambah suatu
pergerakan rata-rata (moving average) dari variabel gangguan tahun sekarang ditambah variabel gangguan tahun sebelumnya. Proses MA juga bisa mengikuti proses MA(q) sehingga modelnya ialah : Profit t = + 0 u t + 1 u t-1 + + q u t-q Dari model di atas dapat disimpulkan bahwa proses moving average ialah suatu kombinasi linear sederhana dari variabel gangguannya yang benar-benar acak (purely random). Proses Autoregressive dan Moving Average ( ARMA ) Proses ARMA ialah kombinasi proses AR dan MA. Misalkan jika Profit mengikuti proses ARMA (1,1) maka bisa ditulis : Profit t = + 1 Y t-1 + 0 u t + 1 u t-1 Jika suatu model mengikuti proses ARMA (p,q), maka akan ada p variabel autoregressive dan q variabel moving average. Proses Autoregressive Integrated Moving Average (ARIMA ) Model time series dengan AR dan MA di atas mengasumsikan model memiliki (weak) stasioner artinya rata-rata dan varians-nya konstan sedangkan kovarians-nya tidak bervariasi antar waktu. Dalam kenyataanya data time series banyak yang tidak stasioner tetapi bisa terintegrasi dalam I(1) first difference, I(2) second difference, dan bisa sampai I(d), d-th difference sehingga data bisa stasioner, I(0). Oleh karena itu sebelum melakukan proses AR dan MA terlebih dahulu harus dilakukan proses pengujian stasionaritas sehingga pada d-difference berapa suatu data bisa stasioner. Pada akhirnya suatu data time series yang asli memiliki ARIMA (p,d,q) yaitu autoregressive moving average time series, di mana p ialah jumlah variabel autoregressive, d ialah jumlah differencing sehingga data bisa stasioner, dan q ialah jumlah variabel moving average. Untuk menentukan p, d, dan q biasanya menggunakan tabel ACF dan PACF dengan ketentuan sebagai berikut :
Process ACFs PACFs ARIMA (0,0,0) No significants lag No significants lag ARIMA (0,1,0) Linear decline at lag 1, with many lags significant Single significants peak at lag 1 ARIMA (1,0,0) Exponential decline, with first two or more lags significant Single significant peak at lag 1 ARIMA (1,0,0) Alternating exponential Single significant negative decline with a negative peak at lag 1 ACF(1) ARIMA (0,0,1) Single significant negative Exponential decline of peak at lag 1 negative values, with first two or three lags significant ARIMA (0,0,1) Single significant positive Alternating exponential peak at lag 1 decline atarting with a positive Tabel 1.1 Sebagai contoh buka data fad.sav pada SPSS. File Open data Fad.sav Untuk mencari p, d, q dengan memakai ACF dan PACF, buka grafik ACF dan PACF pada SPSS, maka pada menu SPSS : Pilih Graph Time series Autocorrelation sehingga muncil kotak dialog :
Pertama ialah menetukan tingkat stasionaritas. Karena d ( tingkat stasionaritas ) belum diketahui tidak ada yang diceklist pada kotak dialog autokorelasi : Klik OK lalu muncul : Dari grafik ACF bisa diketahui adanya penurunan yang terus menerus pada kurva ACF dan signifikan sehingga bisa dipastikan bahwa data stasioner pada first difference (d=1).
Dengan d=1 ini maka kita bisa tentukan p dan r dengan menggunakan grafik ACF dan PACF lagi tetapi dengan menggunakan first difference ( d=1 ) lalu klik OK
Dari gambar di atas bisa kita tentukan p dan r. Dari grafik ternyata bisa kita tentukan bahwa p = 0 dan r=1 artinya model mengandung MA(1). Dari hasil identifikasi maka bisa kita tentukan model ARIMA ( 0,1,1) untuk data demand di atas. Untuk estimasi ARIMA maka pada daftar menu : Klik Analyze Pilih Time Series Pilih ARIMA : sehingga muncul kotak dialog sebagai berikut :
Masukan variabel demand ke dalam variabel dependent kemudian isi Autoregressive (AR) dengan 0, Difference (d) dengan 1, dan moving average (MA) dengan 1, lalu klik OK. Sehingga muncul hasilnya pada worksheet SPSS sebagai berikut :
Nilai Fit_1 merupakan nilai forecasting-nya sedangkan nilai err_1 merupakan nilai kesalahan forecasting-nya. Untuk diagnostic checking maka gunakan kembali fasilitas menu Graph Time Series Autocorrelations
Dari gambar ACF maupun PACF terlihat bahwa tidak ada nilai koefisien autokorelasi yang keluar dari batas tingkat kepercayaan sehingga model stasioner dan sudah tidak lagi mengandung autokorelasi ( purely random error ). Dari kondisi ini kita tidak perlu lagi mencari model ARIMA yang lain ( Gujarati, 1996 ). Untuk melakukan forecasting dengan model ARIMA (0,1,1) untuk 20 minggu ke depan maka ulangi lagi cara pada estimasi model ARIMA untuk Identification yaitu : Klik Analyze pilih time series pilih ARIMA dengan p=0; d=1;q=1
Lalu Klik Save Pada kotak sebelah kanan Kotak dialog ARIMA : Save yaitu Predict case, checklist Predict through isi observation dengan menambahkan 20 pada observasi awal yaitu sebesar 120 observation (100 data aktual + 20 data forecasting) Klik Continue lalu pada kotak dialog ARIMA klik OK sehingga hasil akhir dengan forecasting 20 minggu ke depan ialah :
dari hasil di atas terlihat bahwa model ARIMA melakukan forecasting 20 minggu ke depan. Latihan Tentukan model ARIMA (p,d,q) serta hasil forecasting untuk 20 periode berikutnya pada data di bawah ini : 1. Data Revenue.sav 2. Data Price.sav
Daftar Pustaka 1. Berndt, Ernest R., The Practice of Econometrics : Classic and Contemporary, Addison-Wesley Publishing Company, 1991 2. Contreras, Javier, Espinola Rosario, Francisco J. Nogales, dan Antonio J.Conejo, ARIMA Models to Predict Next Day Electricity Prices, IEE Transactions on Power Systems, Vo. 18 No. 3, August 2003. 3. DeLurgio, Stephen A., Forecasting Principles and Applications, McGraw Hill International Editions, 1998 4. Fullerton, Thomas R., A Composite Approach to forecasting state government revenue:case Study of the Idaho sales Tax, International Journal of Forecasting, North Holland, 1989 5. Gujarati, Damodar, Basic Econometrics, fourth edition, 2003 6. McGuigan, James R., R. Charles Moer, dan Frederick H.D.H, Managerial Economics:Applications, Strategy, and Tactics, South-Western, ninth ediotn, 2002 7. Salvatore, Dominick, Managerial Economics in A Global Economics, McGraw- Hill, Inc.,second edition, 1999 8. Tsui, Albert, Uditha Balasooriya, Tilak Abeysinghe, Small sampel Regression:Regression or ARIMA Models, Journal of Economics, Department of Economics, National University of Singapore, May 2002.