PENDUGA SELANG KEPERCAYAAN NILAI TENGAH DENGAN PENDEKATAN KLASIK, BAYES, DAN BOOTSTRAP Adji Achmad Rialdo Ferades, SSi, MSc ABSTRAK Pada suatu peelitia, terkadag diamati karakteristik dari sebuah populasi (misalya ilai tegah, ragam, media, maupu proporsi). Dega berbagai keterbatasa da kedala, tidak dimugkika megamati keseluruha dari eleme populasi. Lagkah alteratif yaitu dilakuka pedugaa populasi dega megguaka sampel yag diambil secara acak dari sebuah populasi. Pada peelitia ii dilakuka pedugaa selag ilai tegah satu populasi ( ). Terdapat tiga metode yag aka dikaji yaitu metode klasik, pedekata bayes, da pedekata bootstrap. Peelitia ii difokuska pada pedugaa ilai tegah megguaka ketiga pedekata da membadigka hasil yag diperoleh dari ketiga pedekata tersebut. Hasil pegujia megguaka sebuah data satu populasi diperoleh peduga ilai tegah populasi ketiga metode relatif sama, di maa metode Bootstrap meghasilka selag kepercayaa terkecil. Kata kuci: selag kepercayaa, klasik, bayes, da bootstrap I. PENDAHULUAN 1. Latar Belakag Keseluruha pegamata yag mejadi perhatia baik terhigga maupu takhigga meyusu apa yag disebut populasi. Pada suatu peelitia, terkadag diamati karakteristik dari sebuah populasi. Beberapa macam ukura statistik diguaka utuk megetahui karakteristik dari populasi, misalya ilai tegah, ragam, media, atau proporsi. Dalam iferesia statistik kita igi memperoleh kesimpula megeai populasi, meskipu kita tidak mugki atau tidak praktis utuk megamati keseluruha idividu yag meyusu populasi. Dega berbagai keterbatasa da kedala, tidak dimugkika megamati keseluruha dari eleme populasi. Lagkah alteratif yaitu dilakuka pedugaa populasi dega megguaka sampel yag diambil secara acak dari sebuah populasi. Salah satu sistem pedugaa parameter populasi berdasarka statistik sampel adalah dega selag kepercayaa (cofidece iterval) di maa sistem ii meghasilka dugaa parameter yag represetatif. Teori iferesia statistik mecakup semua metode yag diguaka dalam pearika kesimpula atau geeralisasi megeai suatu populasi. Kecederuga yag terjadi pada masa kii dalam hal pedugaa suatu parameter populasi adalah terdapatya perkembaga dari metode klasik yag medasarka kesimpulaya semata-mata pada iformasi yag diperoleh dari suatu cotoh acak yag ditarik dari populasi tersebut. Dua metode baru yag diagkat pada peelitia ii adalah metode Bayes da Bootstrap. Metode Bayes megguaka atau meggabugka pegetahua subyektif megeai sebara peluag parameter yag tidak diketahui dega iformasi yag diperoleh dari data sampel. Metode bootstrap megguaka pedekata klasik yag megguaka pegulaga sampel. Disajika pada Semiar Basic Sciece 5, 16 Februari 2008 1 Dose Program Studi Statistika, Fakultas MIPA, Uiversitas Brawijaya
2. Perumusa Masalah Berdasarka latar belakag di atas, permasalaha yag igi dikemukaka adalah Bagaimaa pegguaa pedugaa selag ilai tegah satu populasi dega megguaka metode klasik, pedekata bayesia, da pedekata bootstrap da perbadiga ketiga metode tersebut? 3. Tujua da Mafaat Tujua dari peelitia ii adalah megguaka pedugaa selag ilai tegah satu populasi dega megguaka metode klasik, pedekata bayesia, da pedekata boostrap da perbadiga ketiga metode. Mafaat dari peelitia ii adalah agar para peeliti dapat megguaka metode pedekata bayesia da pedekata bootstrap sebagai alteratif dalam pedugaa parameter, selai metode klasik yag saat ii populer. II. TINJAUAN PUSTAKA 1. Pedugaa Selag Kepercayaa dega Metode Klasik Populasi dari sebuah data diasumsika berdistribusi ormal dega X N(µ, 2 ) di maa ilai harapa dari X adalah dega ilai tegah µ da ragam 2. Parameter populasi µ da 2 tidak diketahui. Nilai tegah cotoh X da ragam s 2 adalah peduga dari ilai tegah da ragam populasi: 1 2 2 1 2 ˆ X X i da ˆ s X i X i 1 1 i 1 di maa Xi adalah peubah acak yag diambil secara acak dari suatu populasi. Nilai harapa dari rata-rata sampel adalah E( X ) = µ da stadar deviasi Se( X ) =. Utuk ukura sampel kecil ( < 30) maka populasi meyebar ormal (X N(µ, 2 )) da 2 tidak diketahui da diduga dega s 2, sehigga dapat ditulis: X µ t-1 s di maa t-1 diperoleh dari distribusi t dega derajat bebas sebesar -1, sehigga diperoleh selag kepercayaa utuk ilai tegah adalah: P( X t s 1 / 2, 1 < µ < X t s 1 / 2, 1 ) = 95% 2. Pedugaa Selag Kepercayaa dega Pedekata Bayes Pada pedekata klasik, pedugaa selag kepercayaa berasal dari teori pearika cotoh asimptotik, di maa utuk pedekata Bayes, pedugaa selag kepercayaa berasal dari distribusi posterior yag diperoleh dari bagkita data cotoh yag berasal dari data da beberapa kepekata distribusi prior dari parameter. Pada level pertama dari model diasumsika bahwa distribusi dari cotoh adalah ormal Level 1 (DATA): Xi N(µ, 2 ) Pada level kedua, dispesifikasika distribusi prior utuk μ Level 2 (PRIOR): µ N(μμ, 2 μ ) Pada level ketiga atau terakhir, dispesifikasi distribusi hiperprior utuk 2, μμ, 2 μ Level 3 (HYPERPRIOR): P( 2 ), P(μμ) ad P( 2 μ) 2
Pada pedekata bayes ii, aka dibagkitka sebuah cotoh utuk parameter yag tak teramati µ (1), µ (2),, µ (k) dari distribusi µ. Setiap pembagkita cotoh, dilakuka pedugaa distribusi posterior utuk µ da dihitug ilai tegah posterior. Peduga selag kepercayaa ilai tegah dega taraf kepercayaa 95% diperoleh dari persetil ke 2.5% da 97.5% dari simulasi. 3. Pedugaa Selag Kepercayaa dega Pedekata Bootstrap Pedekata bootstrap ii megguaka metode resamplig (pegambila cotoh berulag). Diasumsika bahwa distribusi dari data tidak diketahui. Padag x1,x2,...,x adalah cotoh acak dari F, yag merumaka distribusi yag tidak diketahui, di maa = (F) adalah parameter da ˆ T ( x,..., x ) adalah pedugaa utuk. Peduga ˆ T( x,...,x ) yag 1 diperoleh dari cotoh bootstrap ( x1,...,x ) diamaka replikasi bootstrap utuk ˆ. Algoritma yag diguaka utuk meghitug selag kepercayaa adalah sebagai berikut: x ( b ) x ( b ),...,x ( b ) dega pegulaga dari a) Bagkitka B cotoh bootstrap x1,x2,...,x, di maa adalah ukura cotoh, da b = 1,., B di maa B adalah pegulaga bootstrap. Dalam peelitia ii diguaka B sebesar 1000. b) Hitug replikasi bootstrap ˆ ( b ( b ) T( x ) ), b=1,, B B c) Dega metode pedugaa maximum likelihood diperoleh ˆ 1 ˆ ( b ) B b 1 d) Pedugaa selag kepercayaa 95% diperoleh dari persetil ke 2,5% da 97,5% utuk masig-masig batas bawah da batas atas selag III. METODE PENELITIAN Pada peelitia ii megguaka data skor permaia bowlig yag disajika secara legkap pada Tabel 1. Tabel 1: Data Skor Permaia Bowlig No Skor No Skor 1 93 12 72 2 119 13 118 3 110 14 73 4 72 15 102 5 99 16 122 6 85 17 70 7 53 18 81 8 70 19 130 9 66 20 97 10 142 21 89 11 63 22 27 Dega megguaka tiga metode yaitu klasik, bayes da bootstrap dilakuka pedugaa selag kepercayaa satu populasi. Software yag diguaka adalah SPLUS da Wibugs: 1 1 IV. HASIL DAN PEMBAHASAN 1. Pedugaa Selag Kepercayaa dega Metode Klasik Gambar 1 meujukka histogram da fugsi kepekata data. Dapat kita lihat bahwa data memiliki distribusi yag asimetrik. Peduga ilai tegah populasi sebesar 88,77 dega 3
stadar deviasi sebesar 5,90. Selag kepercayaa 95% utuk pedugaa ilai tegah populasi adalah [76,51; 101.05]. 0 2 4 6 0.0 0.002 0.004 0.006 0.008 0.010 0.012 0.014 20 40 60 80 100 120 140 160 data 0 50 100 150 data Gambar 1: Histogram da Fugsi Kepekata Data 2. Pedugaa Selag Kepercayaa dega Pedekata Bayes Pedekata Bayes ii megguaka software Wibugs. Pertama, didefiisika model data da taksira ilai awal. Berikutya, dilakuka simulasi dega iterasi sebesar 10000. Gambar 2 meujuka ilai tegah yag diperoleh pada setiap simulasi. Bagia terakhir, diguaka aalisis berdasarka iterasi ke 1001 sampai 10000. 120.0 100.0 80.0 60.0 40.0 mu 1000 2500 5000 7500 10000 iteratio Gambar 2: Trace plot utuk ilai tegah populasi (setelah pembuaga 1000 observasi pertama) Pedugaa fugsi kepekata utuk distribusi posterior utuk ilai tegah populasi disajika pada Gambar 3. Pedugaa selag kepercayaa ilai tegah populasi diperoleh dari ilai kuatil 2,5% da 97,5% dari hasil simulasi. 4
0.08 0.06 0.04 0.02 0.0 mu sample: 9001 40.0 60.0 80.0 100.0 Gambar 3: Fugsi kepekata pada Distribusi Posterior utuk ilai tegah populasi Peduga ilai tegah distribusi posterior adalah 88,58 da stadar deviasi adalah 6,18. Selag kepercayaa 95% utuk ilai tegah populasi adalah [76,46; 100,30]. 3. Pedugaa Selag Kepercayaa dega Pedekata Bootstrap Pedugaa megguaka Maximum Likelihood pada pedekata Bootstrap sebesar 88,78 dega stadar deviasi sebesar 5,75. Selag kepercayaa 95% utuk ilai tegah populasi adalah [77,50; 99,95]. Gambar 4 meujukka histogram da fugsi kepekata utuk ilai tegah cotoh berdasarka hasil 1000 pegulaga bootstrap. 0 200 400 600 800 1000 1200 1400 dx$y 0.0 0.02 0.04 0.06 70 80 90 100 110 theta.x 70 80 90 100 110 theta Gambar 4: Histogram da Fugsi Kepekata Nilai Tegah Sampel Berdasarka 1000 Pegulaga Bootstrap 5
4. Perbadiga Hasil Metode Klasik, Bayes da Bootstrap Hasil dari ketiga metode disajika legkap pada Tabel berikut ii: Tabel 1: Pedugaa Nilai Tegah, Stadar Deviasi da Selag Kepercayaa Metode Klasik, Bayes da Bootstrap Metode Nilai Tegah Stadar Deviasi Selag Kepercayaa Batas Bawah Batas Atas Lebar Klasik 88,77 5,90 76,51 101,05 24,54 Bayes 88,58 6,18 76,46 100,30 23,84 Bootstrap 88,78 5,74 77,50 99,95 22,45 Tabel 1 meujukka ilai tegah yag diperoleh dari ketiga pedekata hampir sama, terutama pada metode klasik da bootstrap. Demikia pula utuk stadar deviasi, di maa utuk metode Bayes memiliki stadar deviasi terbesar, da metode Bootstrap memiliki stadar deviasi terkecil. Demikia pula utuk selag kepercayaa, di maa utuk metode Bootstrap memiliki lebar selag kepercayaa terkecil. Perbedaa utama dari ketiga metode adalah: 1) pada metode klasik da bayes diperluka asumsi distribusi yag meladasi data, sedagka pada metode bootstrap tidak diasumsika data berdistribusi tertetu. 2) Metode klasik diperoleh dari multiplikasi dega ilai kritis. Hal ii meyebabka selag kepercayaa yag dihasilka adalah simetrik dega peduga ilai tegah. Sedagka utuk metode Bayes da Bootstrap, pedekata selag kepercayaa megguaka pedekata kuatil ke 2,5% da 97,5% yag aka meghasilka selag kepercayaa yag tidak simetris. V. PENUTUP Pedugaa selag kepercayaa dapat diguaka dega metode Klasik, Bayes da Bootstrap. Pada aplikasi dega megguaka data satu populasi diperoleh ketiga metode relatif hampir sama, di maa metode Bootstrap memiliki lebar selag kepercayaa yag palig kecil, megidikasika bahwa metode ii lebih teliti da direkomedasika utuk diguaka. DAFTAR PUSTAKA Dukic, V., da Hoga, J.W. A hierarchical bayesia approach to modelig embryo implatatio followig i vitro fertilizatio. http://biostatistics.oxfordjourals.org/cgi/reprit/3/3/361.pdf. Akses Desember 2007. Akses Desember 2007. Friedma, N., Goldszmidt, M., ad Wyer, A. Data aalysis with bayesia etworks: a bootstrap approach. Http://www.cs.huji.ac.il/~ir/Abstracts/FGW2.html. Akses Desember 2007. Matthew, J. B., Falciai, F., Ghahramai, Z., Ragel, C., da Wild, D.L.. A Bayesia approach to recostructig geetic regulatory etworks with hidde factors. Http://bioiformatics.oxfordjourals.org/cgi/cotet/full/21/3/349. Akses Desember 2007. Walpole, R.E. 1995. Pegatar Statistika. PT. Gramedia Pustaka Utama, Idoesia. 6
Lampira 1. Kode Splus da Wibugs Kode Splus utuk Metode Klasik data<c(93,119,110,72,99,85,53,70,66,142,63,72,118,73,102,122,70,81,130,97,89,27 ) par(mfrow=c(1,2)) hist(data,col=0,class=7) dx<-desity(data) data<-dx$x plot(data,dx$y,type="l") s.data<-sum(data) ssq.data<-sum(data^2) <-legth(data) # histogram of replicates # desity estimate # sum the data # sum of square the data # sample size ml.x<-s.data/ # maximum likelihood estimator for mea ml.sd<-sqrt((ssq.data-s.data^2/)/(-1)) # maximum likelihood estimator for stadard deviatio ml.se<-ml.sd/sqrt() df<--1 CIL<-ml.x-qt(0.975,df)ml.se CIU<-ml.x+qt(0.975,df)ml.se # stadard error # degree of freedom # lower limit CI # upper limit CI ml.x ml.se CIL CIU Kode Wibugs utuk Metode Bayes model { } for( i i 1 : N ) { data[i] ~ dorm(mu,tau.c) } tau.c ~ dgamma(0.001,0.001) mu ~ dorm(alpha,tau.alpha) alpha ~ dorm(0.0,1.0e-6) tau.alpha ~ dgamma(0.001,0.001) list(n=22, data=c(93,119,110,72,99,85,53,70,66,142,63,72,118,73,102,122,70,81,130,97,89, 27)) list(mu=10, alpha = 0, tau.c = 1, tau.alpha = 1) 7
Kode Splus utuk Metode Bootstrap data<-c(93,119,110,72,99,85,53,70,66,142,63,72,118,73,102,122,70,81,130,97, 89,27) B<-10000 theta.x<-c(1:b) for (i i 1:B) { data.boot<-sample(data,size=,replace=t) theta.x[i]<-mea(data.boot) } mu<-mea(theta.x) sd<-stdev(theta.x) CIL<-quatile(theta.x,probs=0.025) CIU<-quatile(theta.x,probs=0.975) mu sd CIL CIU par(mfrow=c(1,2)) hist(theta.x,col=0,class=) dx<-desity(theta.x) theta<-dx$x plot(theta,dx$y,type="l") # umber of bootstrap # vector to keep the theta # draw o-parametric bootstrap sample # calculate theta # mea of theta # stadard deviatio of theta # lower limit cofidece iterval # upper limit cofidece iterval # histogram of replicates # desity estimate 8