SIDANG TUGAS AKHIR KAJIAN METODE BOOTSTRAP DALAM MEMBANGUN SELANG KEPERCAYAAN DENGAN MODEL ARMA (p,q) Disusun oleh : Ratna Evyka E.S.A NRP 1206.100.043 Pembimbing: Dra. Nuri Wahyuningsih, M.Kes Dra.Laksmi Prita W, M.Si JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2011
I PENDAHULUAN
Latar Belakang Data Estimasi Parameter Selang Kepercayaan Resampling Bootstrap Peramalan untuk periode yang akan datang
Rumusan Masalah 1. Bagaimana mendapatkan estimasi parameter dari selang kepercayaan berdasarkan metode Bootstrap. 2. Bagaimana mendapatkan peramalan jumlah laba penjualan baju koko di Dannis Collection untuk periode yang akan datang dengan menggunakan model ARMA (p,q).
Batasan Masalah 1. Data yang digunakan adalah data jumlah penjualan baju koko di Dannis Collection bulan Juli 2010 bulan Oktober 2010 2. Resampling diasumsikan berdistribusi normal. 3. Resampling dilakukan sebanyak 150 kali. 4. Software yang digunakan adalah Minitab dan SAS
Tujuan 1. Mendapatkan estimasi parameter dari selang kepercayaan berdasarkan metode Bootstrap. 2. Memperoleh data perkiraan jumlah penjualan baju koko di Dannis Collection periode yang akan datang dengan menggunakan model ARMA(p,q).
Manfaat Manfaat yang diharapkan dari penulisan Tugas Akhir ini adalah dapat memberikan kontribusi penelitian dalam bidang Riset Operasi dan Pengolahan Data khususnya penggunaan Metode Bootstrap serta memberikan informasi kepada pihak terkait terutama Dannis Collection tentang penjualan yang mungkin akan didapatkan untuk periode yang akan datang.
II TINJAUAN PUSTAKA
METODE RESAMPLING BOOTSTRAP Metode bootstrap adalah prosedur pengambilan sampel baru secara berulang sebanyak N sampel baru dari data asal berukuran n. dimana untuk sebuah sampel baru dilakukan pengambilan titik sampel dari data asal dengan cara satu persatu sampai n kali dengan pengembalian. Misalkan terdapat data asal berukuran n, yaitu maka dengan metode bootstrap akan diperoleh sampel-sampel baru berukuran n sebagai berikut (Efron, 1993): Sampel ke-1, Sampel ke-2,...... Sampel ke-n, Estimasi mean untuk bootstrap adalah:
Estimasi varian untuk bootstrap adalah: Standar error bootstrap adalah: Selang kepercayaan mean bootstrap dengan untuk mean adalah:
MAXIMUM LIKELIHOOD ESTIMATION (MLE) MLE dilakukan dengan memaksimumkan fungsi likelihood, pada dasarnya estimasi parameter dengan menggunakan MLE meliputi dua tahap, yaitu mengkontruksi fungsi Likelihood dan memperoleh fungsi Likelihood tersebut. Misalkan x variabel random dengan fungsi probabilitas merupakan himpunan parameter yang tidak diketahui dan saling independent maka pengkontruksian fungsi likelihood dapat dinyatakan dengan
SELANG KEPERCAYAAN Selang kepercayaan adalah sebuah interval yang berdasarkan observasi sampel dan terdapat probabilitas yang ditentukan. Interval mengandung nilai parameter sebenarnya yang tidak diketahui Derajat kemungkinan tersebut dinyatakan dengan tingkat kepercayaan (confidence level) misalnya 95% atau 99% Jika tingkat kepercayaannya tinggi dan menghasilkan interval yang sempit maka nilai parameter tersebut dapat dikatakan presisi. Probabilitas bahwa nilai variable acak berada dalam batas dan adalah Probabilitas selang kepercayaan dengan selang kepercayaan sebesar untuk adalah :
Time Series : pengamatan yang diambil berdasarkan urutan waktu dan antara pengamatan yang berdekatan saling berkorelasi. Pemeriksaan kestasioneran: 1. Stasioner dalam mean nampak pada plot time series data akan tampak berfluktuasi di sekitar garis yang sejajar sumbu waktu (t). Data yang tidak stasioner dalam mean perlu dilakukan pembedaan (differencing). 2. Stasioner dalam varian nampak pada plot time series simpangan data tidak terlalu besar atau variannya tidak dipengaruhi deret waktu. Data yang tidak stasioner dalam varian perlu dilakukan proses transformasi Box- Cox.
Uji Signifikan Parameter Hipotesis Statistik uji (parameter tidak signifikan) (parameter signifikan) H 0 ditolak jika Artinya parameter signifikan atau
Uji Residual Bersifat white noise Hipotesis (Residual bersifat white noise) (Residual tidak bersifat white noise) Statistik uji H 0 ditolak jika atau Artinya residual tidak bersifat white noise
Uji Residual Berdistribusi Normal Hipotesis (Residual berdistribusi normal) normal) Statistik uji (Residual tidak berdistribusi H 0 ditolak jika atau Artinya residual tidak berdistribusi normal
III METODOLOGI
Metodologi Mulai Studi literatur Mendapatkan estimasi parameter Menguji estimasi parameter menggunakan MLE Menguji estimasi parameter menggunakan Unbiassed Estimation Membangun Selang Kepercayaan Selesai Skema diagram penulisan
Mulai Penentuan banyak data Data >=30 Resampling Bootstrap Plot Box-Cox Uji kestasioneran(apakah stasioner terhadap varian) ya Plot data hasil resampling (ACF dan PACF) tidak Transformasi Penentuan Model Uji signifikansi dan diagnostic checking ya Penentuan model terbaik (seleksi model) tidak Peramalan dengan menggunakan model terbaik Selasai Gambar 3.1 Diagram Alir Penelitian
IV PEMBAHASAN
Maksimum Likelihood Estimation Mean dari sampel asli adalah : rata-rata total seluruh hasil resamplingnya adalah: Pengkontruksian fungsi likelihood dapat dinyatakan dengan (diasumsikan berdistribusi normal): Pengkontruksian MLE adalah:
MLE untuk mean: MLE untuk Varian
Unbiassed Estimator Pengujian unbiassed estimator pertama dilakukan untuk menguji apakah terdapat error pada saat
Setiap data dalam resampling Bootstrap bersifat independen maka: Sehingga dapat disimpulkan bahwa tidak terdapat error pada saat
Pengujian unbiassed estimator kedua dilakukan untuk menguji apakah terdapat error pada saat Karena maka:
Karena maka: Sehingga adalah estimator bias dari, untuk menjadikannya tak bias maka dapat dilakukan langkah-langkah sebagai berikut Jadi dapat disimpulkan bahwa adalah estimator unbiassed untuk dan biasanya dinotasikan dengan
Selang Kepercayaan Selang Kepercayaan nya adalah Sehingga selang kepercayaannya adalah
C1 StDev Peramalan data Penentuan suatu data stasioner atau tidak dalam mean dan varian, perlu dilakukan dengan plot time series dan box-cox, Bentuk plot time series dan box-cox nya sebagai berikut Time Series Plot of Resampling Box-Cox Plot of Resampling 2750 2500 340 330 Lower CL Upper CL Lambda (using 95,0% confidence) Estimate 2,28 2250 320 310 Lower CL 0,85 Upper CL 3,90 Rounded Value 2,00 2000 300 290 1750 280 270 1500 260 Limit 1 15 30 45 60 75 Index 90 105 120 135 150 250-5,0-2,5 0,0 Lambda 2,5 5,0 Time series plot Box Cox Plot Dari plot box-cox diperoleh maka belum stasioner dalam varian, sehingga untuk mengatasinya diperlukan transformasi dengan sehingga memperoleh plot time series dan plot box-cox sebagai berikut :
Autocorrelation Partial Autocorrelation Transformasi StDev Time Series Plot of Transformasi Box-Cox Plot of Transformasi 8000000 7000000 3000000 Lower CL Upper CL Lambda (using 95,0% confidence) Estimate 1,14 6000000 2500000 Lower CL 0,31 Upper CL 1,93 Rounded Value 1,00 5000000 4000000 3000000 2000000 1500000 2000000 1 15 30 45 60 75 Index 90 105 120 135 150 1000000-5,0-2,5 0,0 Lambda 2,5 5,0 Limit Time series Transformation Box Cox Transformation Berdasarkan plot diatas terlihat bahwa, sehingga data penjualan Dannis Collection telah stasioner dalam varian. Plot ACF dan plot PACF 1,0 Autocorrelation Function for Transformasi (with 5% significance limits for the autocorrelations) 0,2 Partial Autocorrelation Function for Transformasi (with 5% significance limits for the partial autocorrelations) 0,8 0,6 0,4 0,2 0,0 0,0-0,2-0,4-0,6-0,8-1,0 1 10 20 30 40 50 60 70 80 Lag Plot ACF 90 100 110 120 130 140-0,2 1 10 20 30 40 50 60 70 80 Lag 90 100 Plot PACF 110 120 130 140
Estimasi dan pengujian Parameter model sementara ARMA (44,0) Parameter Estimasi Standart T hitung P-value Error -0.25343 0.09651-2.63 0.0096 Diagnoctic Checking 5393182.8 74444.1 72.45 <.0001 maka model tersebut signifikan - Uji Residual White Noise ARMA(44,0) Lag (K) Q DF P-value 6 10,21 5 11,07 0,0696 12 19,58 11 19,68 0,0515 18 24,78 17 27,59 0,0997 24 33,26 23 35,17 0,0767 30 37,57 29 42,56 0,1322 P-value > 0,05 maka model tersebut white noise.
Percent - Uji Kenormalan 0,076912 0,072342 Karena maka ditolak artinya model tidak berdistribusi normal Probability Plot of (44,0) Normal 99,9 99 95 90 80 70 60 50 40 30 20 10 5 1 Mean 10138 StDev 1076385 N 150 KS 0,077 P-Value 0,037 0,1-4000000 -3000000-2000000 -1000000 0 RESIDUAL 1000000 2000000 3000000 4000000 Plot Kenormalan Residual ARMA (44,0) P-value < 0,05 berarti tidak berdistribusi normal.
Overfitting Overfitting dilakukan untuk melihat kemungkinan model-model yang lain memenuhi kecukupan model (signifikansi parameter, white noise, dan bedistribusi normal) Model ARMA Uji Signifikansi Uji Residual White Noise Uji Kenormalan Residual (10,10) Signifikan White Noise Berdistribusi Normal ([10,44],10) Signifikan Tidak White Noise Tidak Berdistribusi Normal (0,44) Signifikan Tidak White Nouse Tidak Berdistribusi Normal Dapat disimpulkan model ARMA (10,10) adalah model terbaik karena memenuhi kecukupan model
Hasil Peramalan Periode Hasil Peramalan Data Transformasi L95 U95 151 5118608.54 152 5442515.67 153 5313692.91 154 5302074.23 155 5812439.16 156 5175442.43 157 5542299.42 158 5431525.30 159 5354777.96 160 5410009.45 161 5174750.54 162 5432680.49 2262,434 1724,385 2695,128 2332,92 1815,877 2754,564 2305,145 1780,053 2731,08 2302,623 1776,786 2728,952 2410,9 1915,028 2820,912 2274,96 1740,786 2705,651 2354,209 1843,148 2772,617 2330,563 1812,849 2752,568 2314,039 1791,556 2738,591 2325,943 1806,905 2748,657 2274,808 1737,048 2707,797 2330,811 1809,769 2755,013
V PENUTUP
Kesimpulan Metode resampling Bootstrap yang dilakukan dengan menggunakan pengestimasian dengan dua metode yaitu Maximum Likelihood Estimation (MLE) dan Unbiassed Estimatior menghasilkan Maximum Likelihood Estimation Untuk mean : Untuk varian : Unbiassed Estimator Untuk mean : Untuk varian terdapat eror pada saat sebesar
Sehingga dari hasil pengestimasian secara MLE dan unbiassed estimation dibuat selang kepercayaan 100% dengan dan s yang merupakan rataan dan simpangan dari suatu populasi adalah : Rata-rata penjualan Dannis Collection untuk 12 bulan ke depan adalah 2319.
Saran Saran yang dapat diberikan pada penelitian selanjutnya adalah menggunakan parameter lain seperti ARIMA atau Regresi, sehingga hasilnya bisa dibandingkan untuk mengetahui keakuratan hasilnya.
DAFTAR PUSTAKA
Daftar Pustaka [1] Efron Bradley, 1994. The Bootstrap, The Bootstrap and The Other Resampling Plans, Department of Statistics Stanford University. [2] Makridakis, W. M. G. 1999. Metode dan Aplikasi Peramalan. Edisi kedua. Bina Rupa Aksara. Jakarta. [3] Salamah, M., Suhartono., dan Wulandari S. 2003. Analisis Time Series. Surabaya: Jurusan Statistik ITS. [4] Wei, W.W.S. 1990. Time Series Analysis : Univariate and Multivariate Methods. United State of America : Addison-Wesley Publishing Company. 52.