Penaksiran Mean Stratum pada Sampling Acak Stratifikasi dengan Menggunakan Metode Empirical Baes Sisca Agnessia Departemen Matematika, FMIPA UI, Kampus UI Depok 6 sisca.agnessia@ahoo.com Abstrak Dalam Penelitian ini akan dicari taksiran mean stratum pada sampling acak stratifikasi. Pada sampling acak stratifikasi, seringkali hana tersedia beberapa pengamatan pada masing-masing strata. Kecilna ukuran sampel akan menebabkan penaksir langsung dari mean stratum menjadi kurang tepat. Metode alternatif ang dapat digunakan untuk menaksir mean dari stratum adalah dengan menggunakan metode Empirical Baes. Metode Empirical Baes digunakan untuk mencari taksiran mean stratum pada sampling acak stratifikasi dengan cara menggabungkan informasi awal atau informasi ang telah tersedia sebelumna tentang parameter ang akan ditaksir dengan informasi dari data sampel. Informasi awal disebut juga informasi prior. Penggabungan dari informasi prior dan informasi dari data akan menghasilkan informasi posterior. Dalam metode Empirical Baes, informasi prior tidak tersedia sehingga informasi prior diestimasi dari data. Kata kunci : mean stratum, Empirical Baes, informasi prior, informasi posterior. Abstract In this research will find the estimated stratum mean in stratified random sampling. In the stratified random sampling, often onl available a few observations in each strata. The small sample size would cause a direct estimator of the mean stratum becomes less precise. Alternative methods that can be used to estimate the mean of the stratum is to use the Empirical Baes method. Empirical Baes methods used to find the estimated mean stratum in stratified random sampling b combining the initial information or information that has been available previousl on the parameters to be estimated with information from the data sample. Preliminar information also known as prior information. The incorporation of prior information and information from the data will result in posterior information. In the Empirical Baes method, prior information is not available so the information estimated from prior data. Kewords : stratum mean, Empirical Baes, prior information, posterior information.. PENDAHUUAN Dalam melakukan penelitian diperlukan datadata ang mendukung penelitian tersebut. Terdapat dua pilihan ang umum digunakan untuk mengumpulkan data. Pertama, penelitian dilakukan dengan mengumpulkan dan memeriksa setiap unit dalam populasi. Namun, seringkali tidak mungkin untuk meneliti setiap unit dalam populasi. Hal ini dikarenakan keterbatasan waktu, biaa, dan kendalakendala lainna. Dalam keadaan seperti ini dapat dilakukan cara lain untuk mengumpulkan data aitu dengan melakukan pengambilan sampel. Dengan melakukan pengambilan sampel dapat diteliti karakteristik atau ciri dari populasi. Populasi merupakan keseluruhan elemen-elemen ang merupakan objek penelitian dimana penelitian akan dilakukan. Berdasarkan ukuranna, populasi dapat dibagi menjadi dua macam, aitu populasi terbatas (finite population) dan populasi tidak terbatas (infinite population). Populasi terbatas adalah kumpulan dari jumlah terhingga objek atau elemen ang jumlahna dapat dihitung dan diketahui dengan pasti. Sedangkan, pada populasi tidak terbatas jumlah elemenna sangat besar dan tidak dapat diketahui dengan pasti. Sampel merupakan bagian dari populasi ang dipilih dengan metode tertentu, ang digunakan sebagai informasi untuk menggambarkan sifat atau ciri ang dimiliki populasi. Ada berbagai macam metode ang dapat digunakan dalam pengambilan sampel. Salah satuna adalah dengan teknik sampling acak stratifikasi (stratified random sampling). Sampling acak stratifikasi merupakan teknik pengambilan sampel ang digunakan pada populasi ang heterogen. Dalam sampling acak stratifikasi, populasi ang heterogen dikelompokkan ke dalam beberapa subpopulasi ang homogen ang disebut stratum, kemudian diambil sampel secara acak dari masing-masing stratum untuk diteliti. Secara umum, tujuan dari pengambilan sampel adalah untuk menaksir parameter populasi. Salah satu parameter ang ditaksir melalui sampel adalah mean populasi. Pada sampling acak stratifikasi, mean dari stratum dapat ditaksir. Pada sampling acak stratifikasi, seringkali hana tersedia beberapa pengamatan pada masing-masing strata. Kecilna ukuran sampel akan menebabkan penaksir langsung Penaksiran mean..., Sisca Agnessia, FMIPS-UI, 0
dari mean stratum menjadi kurang tepat dikarenakan standard error dari penaksir mean stratum ang besar. Metode alternatif ang dapat digunakan untuk menaksir mean dari stratum adalah dengan menggunakan metode Empirical Baes. Metode Baes merupakan metode ang menggabungkan informasi awal atau informasi ang telah tersedia sebelumna tentang parameter ang akan ditaksir dengan informasi dari data sampel. Informasi awal atau informasi ang telah tersedia sebelumna disebut juga informasi prior. Informasi prior diperoleh dari distribusi tentang parameter tersebut, aitu melalui pdf prior. Pada metode Empirical Baes, parameter dari distribusi prior tidak diketahui. Karena parameter distribusi prior tidak diketahui, maka parameter tersebut harus diestimasi. Pada metode Empirical Baes, parameter tersebut diestimasi dari data. Pada penelitian ini akan dibahas mengenai penaksiran mean stratum pada sampling acak stratifikasi dengan menggunakan metode Empirical Baes.. METODE PENEITIAN Metode penelitian ang digunakan dalam penelitian ini adalah studi pustaka ang terkait dengan penelitian. Berikut ini akan dijabarkan teori ang digunakan dalam penelitian ini. Metode Baes merupakan metode ang menggabungkan informasi awal atau informasi ang telah tersedia sebelumna tentang parameter ang akan ditaksir dengan informasi dari data sampel. Informasi awal atau informasi ang telah tersedia sebelumna disebut juga informasi prior. Informasi prior diperoleh dari distribusi tentang parameter tersebut, aitu melalui pdf prior. Penggabungan dari informasi prior dan informasi dari data akan menghasilkan informasi posterior. Dari informasi posterior akan diperoleh taksiran dari parameter ang diinginkan. Berikut ini akan digambarkan pendekatan Baesian untuk masalah penaksiran. Misalkan suatu variabel random X ang memiliki distribusi ang bergantung pada θ, dimana θ adalah elemen dari suatu himpunan Ω. Sebagai contoh, jika θ adalah mean dari distribusi normal dengan variansi diketahui, maka Ω adalah garis bilangan riil. Sebelumna didefinisikan bahwa θ suatu konstanta meskipun nilaina tidak diketahui. Sekarang diperkenalkan suatu variabel random Θ ang memiliki distribusi probabilitas di himpunan Ω. Misalkan x merupakan nilai ang mungkin dari variabel random X dan θ merupakan nilai ang mungkin untuk variabel random Θ. Didefinisikan bahwa pdf dari Θ adalah h(θ) dan h(θ) 0 saat θ bukan elemen dari Ω. Selanjutna didefinisikan pdf bersarat X diberikan Θ θ aitu f(x θ). Misalkan X, X, X n adalah sampel random ang independen dan berdistribusi identik dari distribusi bersarat X diberikan Θ θ, dengan demikian dapat dituliskan pdf bersama bersarat X, X, X n diberikan Θ θ sebagai berikut: f x,, x n θ f x θ f x θ f(x n θ) (.) persamaan (.) sering disebut juga sebagai fungsi likelihood. Pdf bersama bersarat X, X, X n diberikan Θ θ dapat dinatakan sebagai berikut f x, x,, x n θ g(x, x,, x n, θ) (θ) Sehingga, dari persamaan di atas diperoleh pdf bersama dari X, X,, X n dan Θ adalah g x, x,, x n, θ f x, x,, x n θ (θ) g(x, x,, x n, θ) f x θ f x n θ (θ) (.) jika Θ variabel random kontinu, maka joint marginal pdf dari X, X, X n adalah: g x, x,, x n g(x, x,, x n, θ)dθ (.3) Sedangkan pdf bersarat dari Θ diberikan X x,, X n x n adalah : k θ x, x,, x n g x, x,, x n, θ g x, x,, x n f x θ f x θ f x n θ (θ) g x, x,, x n (.) Hubungan persamaan (.) diatas merupakan bentuk dari formula Baes. Seringkali statistikawan menulis formula Baes k θ x,, x n proporsional ke g(x,, x n, θ), sehingga : k θ x, x,, x n f x θ f x n θ (θ) (.5) dimana h(θ) disebut pdf prior dari Θ dan pdf bersarat k(θ x) merupakan pdf posterior dari θ. Statistikawan sering menatakan formula baes seperti persamaan (.5) dikarenakan bagian penebut dari persamaan (.), aitu g x, x,, x n, merupakan fungsi ang tidak bergantung pada θ, sehingga dapat dihilangkan. Maka formula Baes k θ x, x,, x n dapat dinatakan proporsional ke g(x, x,, x n, θ) seperti pada persamaan (.5). Metode Empirical Baes merupakan suatu metode inferensi statistik dimana informasi prior diestimasi dari data. Berger (985) menjelaskan bahwa prosedur Empirical Baes adalah dimana diketahui hubungan antara koordinat vektor parameter, katakan θ (θ,, θ ) T, dan untuk mengetahui bentuk distribusi dari parameterparameter tersebut dapat digunakan informasi dari data. Pada parametric Empirical Baes, parameter ang ditaksir diasumsikan memiliki distribusi prior dari kelas parametrik, dimana hperparameter (parameter dari distribusi prior) tidak diketahui. Karena parameter distribusi prior tidak diketahui, maka parameter tersebut harus diestimasi. Pada metode Empirical Baes parameter distribusi prior tersebut akan diestimasi dari data, aitu dari distribusi marginal dari data. Untuk mendapatkan taksiran dari parameter distribusi prior tersebut biasana dapat Penaksiran mean..., Sisca Agnessia, FMIPS-UI, 0
digunakan metode maximum likelihood atau metode momen dari distribusi marginal data. 3. HASI DAN PEMBAHASAN Misalkan populasi distratifikasi dalam stratum masing-masing berukuran N, N,..., N. Misalkan ji menatakan karakteristik ang diamati ang berkaitan dengan unit ke-i dalam stratum ke-j (i,..., ; j,..., ). Sampel berukuran diambil pada stratum ke-j, dan tanpa mengurangi keumuman misalkan nilai sampel dinatakan oleh j,, j nj (j,..., ). Misalkan j ( j,, j nj ) dan j i ji. Permasalahanna adalah bagaimana menaksir mean populasi untuk stratum ke-j, aitu μ j, dimana μ j i ji. Untuk menaksir μ j, diasumsikan sebagai berikut: (i) ji mutuall independent. Untuk unit ang masuk ke dalam stratum ke-j, j,, j Nj berdistribusi normal dengan mean θ j dan variansi σ. (ii) θ,..., θ ~ iid N (m, τ ). Mean populasi untuk stratum ke-j, aitu μ j dapat dinatakan oleh μ j i ji + ji i + dimana i +,..., merupakan unit ang tidak tersampel. Dengan menggunakan prinsip ang sama seperti pada sampling acak sederhana maka μ j diestimasi oleh E μ j j j + E θ j j Nilai E θ j j merupakan nilai ekspektasi bersarat θ j diberikan j, dimana ini merupakan nilai mean dari distribusi bersarat θ j diberikan j, atau nilai mean dari distribusi posterior dari θ j. Oleh karena itu, sebelumna akan dicari terlebih dahulu mean dari distribusi posterior dari θ j. Dengan menggunakan formula Baes pada persamaan (.5), dapat diperoleh pdf posterior dari θ j sebagai berikut p θ j j f j θ j p θ j πσ n e σ ji θ i j πτ e θ j m τ exp σ ji θ i j. exp θ j m exp i ji + m σ τ θ j σ + τ θ j j σ + m τ + τ (3.) Misalkan a, b, dan c merupakan koefisien dari polinomial kuadrat dari θ j pada persamaan terakhir, dimana a σ + τ b j σ + m τ i ji σ c + m τ maka persamaan (3.) dapat ditulis sebagai p θ j j exp aθ j bθ j + c exp a θ j b a θ j + c a Dengan menggunakan teknik melengkapkan kuadrat, maka persamaan (3.) dapat ditulis sebagai p θ j j exp a θ j b a θ j + b a b a + c a exp a θ j b a Dapat dilihat bahwa distribusi posterior dari θ j adalah normal dengan mean v dan variansi w, dimana v j τ + mσ τ + σ dan w σ τ τ + σ Misalkan σ Misalkan τ, maka v + + + B j, maka v B j j + B j m j + + m Sehingga nilai mean dari distribusi posterior dari θ j adalah E θ j j B j j + B j m Dengan demikian penaksir Baes dari μ j diestimasi oleh E μ j j j + B j j + B j m (3.) Karena ada parameter-parameter dari penaksir ang tidak diketahui aitu dan m, maka pada analisis Empirical Baes, parameter dan m akan diestimasi dari data. Pertama, akan dicari taksiran dari. Karena σ τ, maka untuk menaksir akan dicari terlebih dahulu taksiran dari σ dan τ. Sebelumna didefinisikan mean square between (MSB) dan mean square within () sebagai berikut Penaksiran mean..., Sisca Agnessia, FMIPS-UI, 0
dimana MSB j ji j dan i j Untuk menaksir σ dan τ, akan digunakan emma dari Ghosh dan Meeden (997). emma berikut memberikan dua moment pertama dari MSB dan. emma. E σ V σ E MSB σ + τ, dimana V MSB σ j + n j σ j dimana σ j σ + τ, ( j ). σ j Berdasarkan emma, E σ dan V σ. Dengan mengasumsikan inf j, diperoleh V σ dan lim σ 0 Sehingga V() 0 ketika. Karena memiliki mean σ dan variansi dengan limit adalah 0, maka plim σ ang berarti konvergen dalam probabilitas ke σ. Jadi adalah penaksir ang tak bias dan konsisten untuk σ. Berdasarkan emma E MSB σ + τ dan V MSB σ j n j σ j Dengan asumsi sup j K < maka. σ j σ + Kτ. 3. Selanjutna σ j σ + τ K σ j σ + τ K V MSB σ + τ K Akan diperoleh σ + τ K lim 0 + σ j Jadi, V(MSB) 0 ketika. Dengan demikian MSB konvergen dalam probabilitas ke σ + τ. Jadi, MSB adalah penaksir ang konsisten untuk σ + τ. Diperoleh τ MSB Karena nilai dari variansi selalu positif, maka penaksir untuk τ adalah max 0, MSB Kemudian akan dicari taksiran untuk -. τ σ Jadi, penaksir untuk - adalah B j + MSB ( ) MSB ( ) max 0, MSB ( ) Setelah didapat penaksir untuk -, maka diestimasi oleh B + j +. Selanjutna, akan dicari taksiran untuk m. Untuk menaksir m, akan digunakan metode maksimum likelihood dari pdf marginal dari data. Secara marginal, j ~ N(m nj, σ I nj + τ nj nj ). Pdf bersama dari,, diberikan oleh,, σ j m nj exp σ exp j σ I nj + τ nj nj j m nj j m nj σ I nj τ nj nj σ + τ exp σ ji j i σ + τ j m nj j m Penaksiran mean..., Sisca Agnessia, FMIPS-UI, 0
ln,, σ ji j i σ + τ j m Kemudian dengan menggunakan metode maximum likelihood, maka akan dimaksimumkan fungsi loglikelihood diatas. ln,, m Diperoleh σ + τ j m j σ + τ m σ + τ m σ + τ m j σ + τ ( B j ) j ( B j ) 0 Dengan mensubstitusi m dan B j untuk m dan B j ke dalam persamaan (3.), maka penaksir Empirical Baes dari μ j i ji adalah μ j EB j + B j j + B j m Selanjutna akan dicari variansi dari μ j EB. Berdasarkan Ghosh dan Meeden (997), variansi dari μ j EB dapat dinatakan sebagai berikut V j θ j + V θ j j + V θ j j σ + σ τ + σ τ τ + σ τ + σ B j (τ + σ / ) Jadi, variansi dari μ j EB adalah. KESIMPUAN Dari pembahasan tugas akhir ini dapat disimpulkan bahwa a. Metode Empirical Baes dapat digunakan untuk menaksir mean stratum pada sampling acak stratifikasi. b. Metode Empirical Baes merupakan metode ang menggabungkan informasi dari data dengan informasi prior tentang parameter ang akan ditaksir. Informasi prior diperoleh dari distribusi tentang parameter tersebut, aitu melalui pdf prior. Pada metode Empirical Baes, parameter dari distribusi prior tidak diketahui sehingga parameter tersebut harus diestimasi. Pada metode Empirical Baes, parameter tersebut diestimasi dari data. c. Untuk menaksir informasi prior dapat digunakan metode maximum likelihood dari distribusi marginal data. d. Taksiran dari parameter ang diinginkan dapat diperoleh dari informasi posterior, dimana informasi posterior merupakan penggabungan dari informasi prior dan informasi dari data. DAFTAR ACUAN [] Casella, George. 985. An Introduction to Empirical Baes Data Analsis. Journal of the American Statistical Association, Vol. 39, No. [] Dell, JJ, D.V indle. 98. Baes Empirical Baes. Journal of the American Statistikal Association, Volume 76, Number 376, Theor and Methods Section, 833-8 [3] Ericson, W. A. 969. Subjective Baesian Models in Sampling Finite Populations. Journal of the Roal Statistical Societ. Vol. 3, No., 95-33 [] Ghosh, M., dan Meeden, G. 997. Baesian Methods for Finite Population Sampling. New York: Chapman & Hall. [5] Ghosh, M., dan Meeden, G. 986. Empirical Baes Estimation in Finite Population Sampling. Journal of the American Statistical Association, 8, 058-06. [6] Sarkar, S., dan Ghosh, M. 998. Empirical Baes Estimations of ocal Area Means. The Indian Journal of Statistics, 60, Series B, Pt. 3, 6-87. B j (τ + σ / ) Taksiran untuk V μ j j adalah B j (τ + σ / ) Penaksiran mean..., Sisca Agnessia, FMIPS-UI, 0