MODEL GENERALIZED SEASONAL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE (GSARIMA) UNTUK PERAMALAN JUMLAH PENDERITA DEMAM BERDARAH DENGUE (DBD) DI KOTA SURABAYA GENERALIZED SEASONAL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE (GSARIMA) MODELS FOR FORECASTING THE NUMBER OF DENGUE HEMORRHAGIC FEVER (DHF) PATIENTS IN SURABAYA Asrirawan 1 *, Heri Kuswano 2, Suharono 3 Insiu Teknologi Sepuluh Nopember (ITS), Surabaya 1* enalmanovani@gmail.com dan Perumdos ITS jln. Teknik Geodesi Blok R 6, Surabaya Insiu Teknologi Sepuluh Nopember (ITS), Surabaya 2 Insiu Teknologi Sepuluh Nopember (ITS), Surabaya 3 ABSTRACT One of he main opics in he sudy of modeling ime series forecasing in he las hree decades is coun daa forecasing. The forecasing of coun daa based on sochasic model has no been applied and is normally Gaussian disribuion. One of sochasic models for coun daa forecasing, which has non-gaussian (negaive binomial) disribuion, is generalized auoregressive moving average (GARMA) models. GARMA models relae componens beween ARMA and predicor variable o a ransformaion of mean parameers of he daa disribuion using a link funcion bu hese models does no involve saionary and seasonal effecs. Generalized seasonal auoregressive inegraed moving average (GSARIMA) models are an exended version of GARMA involving saionary and seasonal effecs. The esimaion of GSARIMA models use an approach ieraively reweighed leas square (IRLS). This paper simulaes GSARIMA models and applies i o dengue hemorrhagic fever (DHF) in Surabaya. Morever, he comparison of he forecasing accuracy rae of hese models wih seasonal auoregressive inegraed moving average (SARIMA) models. Based on he analysis, he resuls of model and forecas using he model GSARIMA has no correc ou relaively beer han he SARIMA by using AIC and mean absolue relaive error (maref) value boh simulaion and DHF daa. Keywords: Dengue Hemorrhagic Fever, GSARIMA, IRLS, Negaive Binomial, SARIMA ABSTRAK Salah sau opik uama dalam kajian pemodelan peramalan dere waku (ime series) pada iga dekade erakhir ini adalah peramalan daa jumlahan (coun daa). Peramalan daa jumlahan berbasis model sokasik masih belum banyak dilakukan dan menggunakan disribusi Gaussian (normal). Salah sau model sokasik dan non- Gaussian (negaif binomial) unuk peramalan daa jumlahan adalah model generalized auoregressive moving average (GARMA). Model GARMA menghubungkan komponen ARMA dengan variabel predikor ke ransformasi parameer raa-raa dari disribusi daa dengan menggunakan fungsi link (link funcion) eapi idak melibakan efek sasioner dan musiman. Model generalized seasonal auoregressive inegraed moving average (GSARIMA) merupakan model pengembangan dari GARMA dengan melibakan efek
sasioner dan musiman (seasonal). Esimasi model GSARIMA menggunakan pendekaan ieraively reweighed leas square (IRLS). Model GSARIMA dierapkan pada daa simulasi dan kasus demam berdarah dengue (DBD) di koa Surabaya dan membandingkan ingka akurasi peramalan model ersebu dengan model seasonal auoregressive inegraed moving average (SARIMA). Berdasarkan analisis yang dilakukan, baik simulasi maupun daa DBD, hasil model dan peramalan dengan menggunakan model GSARIMA relaif lebih baik dibandingkan dengan model SARIMA dengan menggunakan nilai AIC dan Maref. Kaakunci: Demam Berdarah Dengue, GSARIMA, IRLS, binomial negaif, SARIMA 1 PENDAHULUAN Salah sau opik uama dalam kajian pemodelan peramalan dere waku (ime series) pada iga dekade erakhir ini adalah peramalan daa jumlahan (coun daa). Hal ini juga seperi yang elah diuraikan oleh Gooijer dan Hyndman [1] yang elah melakukan kajian lieraur berkaian dengan perkembangan peramalan dere waku dalam kurun waku 25 ahun, yaiu mulai 1982 sampai dengan 2005, berdasarkan 940 makalah pada jurnal-jurnal bidang peramalan. Gooijer dan Hyndman menyaakan bahwa kajian enang peramalan daa jumlahan yang berbasis model sokasik masih belum banyak dilakukan oleh para penelii bidang peramalan. Yu, Chen, dan Wen [3] mengemukakan bahwa ada dua pendekaan yang sering digunakan unuk memodelkan daa dere waku non-gaussian. Pendekaan perama adalah menggunakan kombinasi linier pada variabel acak disribusi non-gaussian (Gaver & Lewis, 1980; Li & Mcleod, 1987) dan pendekaan yang kedua adalah menransformasi daa dere waku Gaussian kedalam disribusi marginal yang lebih spesifik sehingga mampu digunakan unuk pendekaan non-gaussian [2]. Hal ini juga digunakan oleh Benjamin, Rigby, dan Sasinopoulos [3]. Benjamin e al. mengembangkan model sokasik unuk daa-daa yang mengikui disribusi non-gaussian seperi disribusi Poisson dan binomial negaif. Model ersebu adalah model generalized auoregressive moving average (GARMA). Model GARMA menghubungkan komponen ARMA dengan variabel predikor ke ransformasi parameer raa-raa dari disribusi daa dengan menggunakan fungsi link (link funcion). Fungsi link ini digunakan unuk memasikan bahwa disribusi daa eap dalam domain bilangan riil posiif, sehingga memiliki keepaan prediksi yang lebih akura. Model GARMA sanga fleksibel unuk memodelkan daa jumlahan dengan srukur auoregressive dan aau moving average. Akan eapi, hanya dapa diaplikasikan pada daa yang dianggap sasioner dan idak musiman. Benjamin e al. menggunakan pendekaan ieraively reweighed leas square (IRLS) unuk mengesimasi parameerparameer model GARMA [3].
Berdasarkan uraian di aas maka dalam peneliian ini akan dilakukan kajian enang esimasi model GSARIMA dengan menggunakan IRLS dan membandingkan ingka akurasi peramalan model GSARIMA dan SARIMA dengan predikor dan anpa predikor pada daa jumlah penderia Demam Berdarah Dengue (DBD) di koa Surabaya. 2 METODE PENELITIAN 2.4 Daa Simulasi dan DBD Model GSARIMA akan diaplikasikan pada daa jumlah penderia Demam Berdarah Dengue (DBD). Daa yang digunakan pada peneliian ini merupakan daa sekunder yang diperoleh di Dinas Kesehaan Propinsi Jawa Timur. Jumlah daa jumlahan yang digunakan adalah 420 yang diambil mulai bulan januari 1973 sampai bulan desember 2012. Unuk daa simulasi, ada dua simulasi yang dilakukan. Simulasi perama adalah simulasi perbandingan esimasi model GSARIMA dengan ransformasi ZQ1 dan ZQ2 [2]. Sedangkan pada simulasi kedua dilakukan perbandingan ingka akurasi peramalan model GSARIMA dan model ARIMA musiman. Program yang digunakan unuk esimasi baik simulasi maupun daa riil adalah R, SAS dan MATLAB. 2.1 Model Binomial Negaif Daa Jumlahan Regresi binomial negaif merupakan salah sau model regresi erapan dari GLM Disribusi binomial negaif memiliki keiga komponen yaiu komponen random, komponen sisemaik dan fungsi link [2]. Adapun benuk fungsi massa peluang binomial negaif adalah: dengan, dan. saa maka disribusi negaif binomial memiliki variansi. Disribusi binomial negaif akan mendekai suau disribusi Poisson yang mengasumsikan mean dan variansi sama yaiu. Konribusi variabel predikor dalam model regresi binomial negaif dinyaakan dalam benuk kombinasi linier anara parameer dengan parameer regresi yang akan diesimasi yaiu:
aau dalam mariks diuliskan dalam benuk dengan adalah vekor dari observasi, adalah mariks dari variabel bebas, adalah mariks dari koefisien regresi, dengan. Nilai ekspeasi dari variabel respon Y adalah diskri dan bernilai posiif. Maka, unuk menransformasikan nilai (bilangan riil) ke renang yang sesuai dengan renang pada respon diperlukan suau fungsi link yaiu: 2.2 Model GSARIMA Model GSARIMA dikembangkan berdasarkan model GARMA dengan melibakan efek musiman dan differencing. Diberikan adalah model daa dere waku. Misalkan dengan E y maka dan. Jika y akan mengikui disribusi Poisson. Adapun model GARMA p, q dapa diliha pada model (2):, -, - dimana adalah fungsi link, dan d. B merupakan operaor backshif dengan B y y d dan vekor adalah koefisien unuk vekor dengan x 0 merupakan inercep yang biasanya digunakan nilai x 0 1. Pada kasus GARMA, daa jumlahan dimodelkan dengan menggunakan sebuah fungsi link logarihmic aau ideniy [2]. Jika y mengikui disribusi Poisson dengan nilai mean sebagai beriku:, - Maka ada dua meode ransformasi sebagai beriku yang dapa digunakan: a. Transformasi ZQ1 yang mempunyai benuk: [ ] T dimana y max y, c,0 c 1. b. Transformasi ZQ2 yang mempunyai benuk: [ [ ]]
Sehingga model GSARIMA binomial negaif unuk ZQ1 diberikan persamaan 3: * + Sedangkan unuk ZQ2 adalah *, - + 2.3 Algorima IRLS Model GARMA menggunakan IRLS elah dilakukan oleh Benjamin e al. [1] berdasarkan proses yang dilakukan oleh Green [5]. Misalnya parameer yang akan diesimasi dinoasikan sebagai beriku. Keiga Parameer ersebu diesimasi menggunakan MLE sehingga log-likelihood unuk daa observasi, dan. Adapun fungsi log-likelihood model GARMA dapa diliha pada persamaan (4) Berdasarkan fungsi score persamaan (2.29). / yang diberikan sebagai beriku: dimana v y Var b'', Var D (McCullagh & Nelder, 1989). Kemudian langkah selanjunya adalah memaksimumkan fungsi log-likelihood dengan menggunakan algorima Fisher Scoring yaiu: ( ) ( ) dimana dan. / yang disebu dengan mariks informasi Fisher, dengan Adapun langkah-langkah algorima IRLS secara umum sebagai beriku: a. Diberikan kemudian hiung nilai:
. /. / dimana nilai dan dikonsruksi berdasarkan variabel dependen yang disesuaikan dengan persamaan beriku: unuk. b. Esimasi dengan meregresikan pada. / dengan bobo, ( ) c. Updae ke dan ulangi langkah a dan b sampai esimasi parameer konvergen. Unuk dihiung dengan proses rekursif semenara urunan dari. / dihiung dari proses rekursif parameer regresi, auoregressive dan moving average. * + * + 3 LAYOUT DAN SPESIFIKASI 3.1 Esimasi Parameer Model GSARIMA Seperi elah disebukan dibagian sebelumnya bahwa meode yang digunakan dalam esimasi parameer model GSARIMA binomial negaif adalah IRLS.
Secara umum algorima IRLS unuk menenukan nilai esimaor adalah sebagai beriku: a. Menginpu daa sekunder variabel dan b. Membenuk fungsi regresi binomial negaif c. Membenuk fungsi parial likelihood d. Membenuk fungsi e. Menenukan nilai awal parameer yang akan diaksir, unuk berdasarkan model ARIMA yang erbenuk. f. Menenukan urunan perama dari ( ) sehingga diperoleh ( ) g. Menenukan urunan parsial kedua ( ) erhadap parameer sehingga diperoleh marik Hessian ( ) h. Menenukan ekspekasi negaif dari mariks ( ) sehingga diperoleh mariks informasi fisher ( ) kemudian menenukan invers mariks ersebu. i. Menenukan nilai esimasi parameer dengan rumus sebagai beriku: dengan ( ) ( ) ( ) j. Menenukan ierasi updae ke sampai diperoleh esimasi parameer yang konvergen yaiu, dimana adalah vekor yang nilai enri-enrinya sanga kecil. k. Jika belum didapakan nilai yang konvergen maka diulangi pada langkah 5.
3.2 Simulasi Perbandingan Transformasi Fungsi Link ZQ1 dan ZQ2 Model daa yang dibangkikan adalah model Poisson AR (1) dengan menggunakan dua ransformasi ZQ1 dan ZQ2. Daa series yang dibangkikan sebesar N=1000 dengan sebesar 5. Sedangkan nilai c ada iga yaiu 0,1;0,5; dan 1 sera nilai parameer AR -0,5 dan 0,5. Adapun hasil perbandingan anara fungsi link ZQ1 dan ZQ2 dapa diliha pada able 4.1 di bawah: Tabel 1 Simulasi Perbandingan Esimasi Fungsi Link ZQ1 dan ZQ2 dengan Menggunakan Model Poisson AR (1) pada, ; Model c inercep Maref DIC Log-ZQ1 0,1 101,37 0,48 0,079 7431,5 Log-ZQ1 1,0 100,45 0,47 0,081 7491,7 Log-ZQ2 0,1 99,93 0,49 0,081 7453,4 Log-ZQ2 1,0 101,04 0,49 0,080 7463,5 Berdasarkan Tabel 1 dapa diliha bahwa keika nilai 100 dengan nilai c=0,1 maka ransformasi fungsi link ZQ1 memiliki nilai maref dan DIC yang relaif kecil dibandingkan dengan ransformasi fungsi link ZQ2. Teapi sebaliknya keika nilai c lebih besar (c=1,0) maka nilai ransformasi dari ZQ2 memiliki nilai maref dan DIC yang relaif kecil. Selain iu jika nilai c lebih besar maka dari kedua fungsi link ersebu relaif menaikkan nilai DIC. Sehingga diperoleh kesimpulan bahwa unuk pada saa inercep yang kecil maka fungsi link ZQ1 relaif lebih baik dibandingkan dengan ZQ2. 3.2 Simulasi Perbandingan Esimasi Parameer Model GSARIMA Pada bagian ini akan dilakukan simulasi esimasi parameer pada model GSARIMA yang mengikui disribusi binomial negaif. Model GSARIMA yang dibangkikan erdiri aas dua model yaiu model GSARIMA dengan GSARIMA. Tabel 4.5 Simulasi Perbandingan Tingka Akurasi Peramalan GSARIMA dengan SARIMA Model Binomial Negaif ARIMA Model GSARIMA Maref SARIMA 0,525 4,623 11 % 0,493 198,241 9 % 0,542 15,154 13 % 0,449 74,44 8 % Keerangan : *) jumlah observasi nol Keerangan*) Dari hasil simulasi esimasi daa bangkian dengan menggunakan disribusi Poisson AR (1) maka diperoleh hasil pada Tabel 4.5. PadaTabel 4.5 dapa diliha bahwa dari
Auocorrelaion Parial Auocorrelaion keempa simulasi daa yang dibangkikan ernyaa ingka akurasi peramalan model binomial negaif GSARIMA lebih baik dibandingkan dengan model ARIMA. Raa-raa nilai maref unuk keempa simulasi daa unuk model GSARIMA adalah sebesar 0,502 sedangkan raa-raa nilai maref unuk model SARIMA sebesar 73,11. 3.3 Aplikasi pada Daa Jumlah Penderia DBD di Koa Surabaya Tahap awal pemodelan GSARIMA pada kasus jumlah penderia DBD adalah mengidenifikasi orde musiman dan non musiman pada model ARIMA. Berdasarkan hasil analisis daa bahwa daa idak sasioner dalam raa-raa maupun dalam variansi shingga dilakukan ransformasi dan differencing pada lag 1 dan 12. Hasil differencing pada lag 1 dan 12 mengakibakan daa elah menunjukkan sasioner dalam mean. Hal ini dapa diunjukkan plo ACF dan PACF pada Gambar 1. Auocorrelaion Funcion for DiffLag12 (wih 5% significance limis for he auocorrelaions) Parial Auocorrelaion Funcion for DiffLag12 (wih 5% significance limis for he parial auocorrelaions) 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 5 10 15 20 25 30 35 Lag 40 45 50 55 60 65 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0 1 5 10 15 20 25 30 35 Lag 40 45 50 55 60 65 Gambar 1 Plo fungsi auokorelasi dan fungsi auokorelasi parsial seelah dilakukan differencing pada lag 12 Tabel 4.14 Perbandingan Kebaikan Model dan Peramalan GSARIMA dan ARIMA Model AIC Maref SARIMA (, -) 5198,985 0,954 GSARIMA (, -) 4832,300 0,351 Hasil perbandingan model menunjukkan bahwa model GSARIMA relaif lebih baik jika dibandingkan dengan model SARIMA. Selain iu juga bias dilha dari plo analisis residual dari kedua model perbandingan ersebu. Berdasarkan Gambar 4.7 erliha bahwa nilai residual absolue dari model GSARIMA (raw residual) relaif mendekai iik nol dibandingkan dengan model SARIMA.
Gambar 4.7 Plo Raw Residual Model GSARIMA dan Residual Model SARIMA. 4. PUSTAKA [1] Benjamin,M. A., Rigby R. A., dan Sasinopoulos, D. M. (1998) Fiing Non-Gaussian Time Series Models.COMPSTAT Proceedings in Compuaionel Saisics, eds. R. Payne dan P.Green, Heldelburg: Physica-Verlag, 191-196. [2] Benjamin,M. A., Rigby R. A., dan Sasinopoulos, D. M. (2003). Generalized Auoregressive Moving Average Models.Journal of he American Saisical Associaion, 98, 214-224. [3] Bowerman, B. L., dan O Connell, R. T. (2003). Forecasing and Time Series: An Applied Approach, 3 h eds. New Jersey: Prenice Hall. [4] Brie, J. T. O., (2009). Toward Malaria Predicion in Sri Lanka: Modelling Spaial and Temporal Variabiliy of Malaria Case Couns. Diserasi Dokor. Neherland: Universias Basel. [5] Brie, J. T. O., Amerasinghe, H. P., dan Vounasou, P. (2013). Generalized Seasonal Auoregressive Inegraed Moving Average Models for Coun Daa wih Applicaion o Malaria Time Series wih Low Case Numbers. Malaria Journal, PLoS ONE, 8(6): e65761.
[6] Croson, J. D. (1972). Forecasing and Sock Conrol for Inermien Demands. Operaional Research Quarerly, 23, 289 303. [7] Cryer, J. D. (1986). Time Series Analysis. Boson: PWS-KENT Publishing Company. [8] Enders, W. (2004). Applied Economeric Time Series, 2 nd eds. John Wiley & Sons, Inc., New York. [9] Garbhi, M., Quenel, P., dan Marrama, L. (2011). Time Series Analysis of Dengue Incidence in Guadeloupe, French Wes Indies: Forecasing Models Using Climae Variables as Predicors. BMC Infec Disease, 11, 166. [10] Gooijer, G. J., Hyndman, J. R. (2006). 25 Years of Time Series Forecasing. Inernaional Journal of Forecasing, 22, 443-473. [1] Alexander GJ, Resnick BG. 1985. Using linear and goal programming o immunize bond porfolios. Journal of Banking and Finance 9 (1): 35-54. [2] Bierwag GO, Khang C. 1979. An immunizaion sraegy is a minimax sraegy. Journal of Finance 34: 389-399. [3] Wiggins S. 1990. Inroducion o Applied Nonlinear Dynamical Sysem and Chaos. New York: Springer-Verlag.