INFERENSI PARAMETER MEAN POPULASI NORMAL DENGAN METODE BAYESIAN OBYEKTIF Adi Setiawan Program Studi Matematika Industri dan Statistika, Fakultas Sains dan Matematika Universitas Kristen Satya Wacana Jl Diponegoro 5-6 Salatiga 5711, Indonesia adi_setia_3@yahoocom ABSTRAK Dalam statistika, seringkali dilakukan anggapan bahwa sampel diambil dari populasi yang berdistribusi normal Dalam makalah ini akan dijelaskan tentang bagaimana menggunakan metode Bayesian obyektif untuk mengestimasi mean populasi dalam kasus parameter variansi populasi diketahui atau tidak diketahui Studi simulasi dilakukan untuk memperjelas penggunaan metode tersebut Keywords: prior, posterior, deskrepansi intrinsik, statistik intrinsik PENDAHULUAN Dalam statistika, seringkali dilakukan anggapan bahwa sampel diambil dari populasi yang berdistribusi normal Pada makalah-makalah terdahulu telah dijelaskan bagaimana menggunakan metode Bayesian obyektif dalam melakukan estimasi titik, estimasi interval dan pengujian hipotesis ( Setiawan, 9a; Setiawan, 9b; Setiawan, 1b dan Setiawan, 11) Dalam makalah ini akan dijelaskan tentang bagaimana menggunakan metode Bayesian obyektif untuk mengestimasi mean populasi dalam kasus parameter variansi populasi diketahui atau tidak diketahui Studi simulasi dilakukan untuk memperjelas penggunaan metode tersebut DASAR TEORI Estimasi Titik Dalam pandangan Bayesian, hasil dari sembarang masalah inferensi yang dinyatakan dalam distribusi posterior merupakan gabungan dari informasi yang disediakan oleh data dan informasi prior relevan yang tersedia Akan tetapi apabila tidak tersedia informasi prior, akan dipilih fungsi prior yang relatif uninformative artinya fungsi prior yang memberikan pengaruh minimum pada inferensi fungsi posterior Secara lebih formal, misalkan bahwa mekanisme probabilitas yang membangkitkan data yang tersedia x dianggap sebagai p(x θ) untuk suatu θ Θ dan kuantitas yang menjadi perhatian adalah fungsi yang bernilai real φ(θ) dari θ Tanpa menghilangkan keumuman, hal itu juga dapat dijelaskan berikut ini Misalkan model probabilitas yang digunakan berbentuk { p ( x θ, λ) } dengan λ adalah parameter nuisance yang dipilih Dalam hal ini diperlukan untuk mengidentifikasi fungsi prior bersama π(φ,λ) yang akan mempunyai pengaruh minimal pada distribusi posterior marginal dengan kuantitas yang menjadi perhatian φ yaitu π ( φ x ) p( x φ, λ) π ( φ, λ) dλ Λ Reference prior digunakan sebagai prior yang dapat memberikan pengaruh minimal pada distribusi posterior Dalam kasus dimensi satu, reference prior merupakan prior Jeffry Dengan menggunakan prior ini maka penyelesaian masalah estimasi hanya tergantung pada model anggapan dan data pengamatan sehingga estimasi titik yang menggunakan metode ini dinamakan sebagai estimasi titik Bayesian obyektif (Bernardo dan Juarez, 3) M-1
Diskrepansi intrinsik (intrínsic discrepancy) δ(p 1, p ) antara dua fungsi densitas p 1 (x) dengan x X 1 dan p (x) dengan x X didefinisikan sebagai δ ( p 1, p) = min { K( p( x) p1( x) ), K( p1( x) p( x) )} dengan p1( x) K( p1 ( x) p( x)) = p1( x) log dx p ( x) X Untuk dua keluarga fungsi densitas M = { p x φ ), Χ ( φ), φ Φ} ( 1 1 x 1 dan M = { ( p x ψ ), x Χ ( ψ ), ψ Ψ } dapat didefinisikan diskrepansi intrinsik δ ( M, M ) = inf δ p ( x φ), p ( x ) ( ) * 1 1 ψ φ Φ, ψ Ψ sx Fungsi kerugian (loss function) dalam kasus ini adalah diskrepansi intrinsik Misalkan bahwa deskripsi yang sesuai dari tingkah laku probabilistik dari kuantitas random x diberikan oleh model { p ( x θ, λ), x Χ, θ Θ, λ Λ} Diskrepansi intrinsik antara p ( x θ, λ) dan keluarga densitas { p ( x θ, λ), λ Λ} adalah δ ( θ, λ; θ ) = inf δ ( θ, λ; θ, λ ) dengan * λ Λ { K( θ, λ θ, λ), K( θ, λ θ, )} δ ( θ, λ; θ, λ) = min λ Misalkan { p ( x θ, λ), x Χ, θ Θ, λ Λ} adalah model parametrik yang dapat digunakan untuk menggambarkan tingkah laku kuantitas random x Didefinisikan intrinsik statistik (intrinsic statistic) sebagai d θ x) = E [ δ* x] = δ *( θ, λ; θ ) π ( θ, λ x) dθ dλ ( π δ * δ * ΛΘ (1) dengan π δ *( θ, λ x) adalah posterior referensi untuk parameter dari model p( x θ, λ) bila δ ( θ, λ; θ ) adalah parameter yang menjadi perhatian * Estimator intrinsik (intrinsic estimator) atau estimasi titik Bayesian obyektif didefinisikan sebagai yaitu parameter θ yang meminimalkan statistik intrinsik Estimasi interval kredibel θ * = θ *( x) = arg min d( θ x) Interval kredibel intrinsik 1q% (q-credible region intrinsic) adalah himpunan bagian R* q = R* q ( x, Θ) Θ dari ruang parameter Θ sehingga memenuhi (i) π ( θ, θ x dθ = q R* q ) ~ θ Θ (ii) Untuk setiap θi R*q, θj R*q dan untuk setiap berlaku d(θ i x) d(θ j x) ~ M-
dengan d(θ i x) adalah harapan fungsi kerugian reference posterior sebagai proxy untuk nilai dari parameter yang diberikan pada persamaan (1) Terlihat bahwa pernyataan pada persamaan (1) mempunyai bentuk yang sulit sehingga perhitungannya tidaklah mudah namun dengan menggunakan integrasi numerik, hal itu dengan mudah dapat dilakukan Pengujian Hipotesis Apabila diinginkan untuk melakukan pengujian hipotesis H { θ = θ } maka statistik intrinsik pada persamaan (1) merupakan ukuran dari kekuatan bukti melawan penggunaan model M dengan M = { p( x θ, λ), λ Λ} Hal itu berarti H akan ditolak jika dan hanya jika d(θ x ) untuk suatu batas d* (Juarez, 4) Bernardo dan Rueda () mengusulkan untuk menggunakan aturan sebagai berikut : jika d* 1 maka tidak ada bukti untuk menolak H, jika d*,5 maka terdapat bukti lemah (mild) untuk menolak dan jika d* > 5 maka terdapat bukti kuat (strong) untuk menolak H Populasi Normal Kasus 1 Misalkan dimiliki sampel x 1, x,, x n sampel dari distribusi normal N( μ, σ ) dengan σ diketahui Misalkan juga x j j = x= 1 n adalah mean dari sampel Reference prior untuk parameter yang menjadi perhatian yaitu μ adalah π( μ ) = σ -1 sehingga reference posterior untuk parameter μ adalah N( μ x, σ / n) Dapat dibuktikan bahwa deskrepansi intrinsik antara distribusi normal N( μ 1, σ ) dan distribusi normal N( μ, σ ) adalah n ( μ1 μ ) 1 μ1 μ δ x{ μ1, μ σ ) = = σ σ / n sehingga diperoleh intrinsik statistik yaitu n 1 μ μ d( μ x1,, xn ) = N( μ x, σ / n) dμ () σ / n Hal itu berarti bahwa estimasi Bayesian obyektif untuk parameter μ adalah μ* yang meminimalkan intrinsik statistik yaitu ~ ( 1 μ * = μ * ( x1,, x ) = arg min d( μ x1,, n x n ~ Ω dengan d μ x,, ) merupakan persamaan () Estimasi interval kredibel untuk μ x n ditentukan sehingga syarat (i) dan (ii) di atas dipenuhi μ ~ ) M-3
Kasus Apabila dimiliki sampel x 1, x,, x n sampel dari distribusi normal N( μ, σ ) dengan σ tidak diketahui Misalkan n ( x j x) j = s = 1 n adalah variansi dari sampel Reference prior untuk parameter yang menjadi perhatian yaitu μ dengan σ sebagai parameter nuisance adalah π( μ, σ ) = π(μ) π(σ μ) = σ -1 sehingga reference posterior yang bersesuaian adalah 1/ π ( μ, σ x1, x,, xn ) = N( μ x, σ / n) Gamma [ σ ( n 1) /, ns / ] ( n+ 1) n σ exp ( s + ( x μ) ) σ Dapat dibuktikan bahwa deskrepansi intrinsik antara distribusi normal N( μ 1, σ ) dan distribusi normal N( μ, σ ) adalah n ( μ 1 μ ) δ x {( μ1, σ ),( μ, σ )} = ln 1 + σ sehingga diperoleh statistik intrinsik yaitu n ( μ μ ) d( μ x1,, xn ) = ln 1 π ( μ, σ x1,, xn ) dμ dσ + σ (3) Fungsi mempunyai sumbu simetri μ = x sehingga estimasi titik dengan menggunakan ^ metode Bayesian obyektif adalah μ = x Posterior referensi dari π μ, σ x, x,, x ) adalah distribusi student t yaitu St( μ μ = x, s/ n 1, n-1) Hal itu berarti ( 1 n τ = n 1( μ x) / s mempunyai distribusi t dengan derajat bebas n-1 Akibatnya interval kredibel (1-q)1% untuk mean μ adalah s s x t1 ( q / ); n 1, x + t1 ( q / ); n 1 n 1 n 1 dengan t 1 ( q / ); n 1 adalah kuantil ke-1-(q/) dari distribusi t dengan derajat bebas n-1 Hipotesis H : μ = μ akan ditolak didasarkan pada statistik intrinsik pada persamaan ( 3 ) mempunyai nilai cukup besar Berdasarkan saran Bernardo dan Rueda () maka statistik intrinsik yang lebih besar dari 5 menunjukkan bahwa terdapat bukti yang kuat untuk menolak H PERHITUNGAN STATISTIK INTRINSIK, STUDI SIMULASI DAN PEMBAHASAN Estimasi titik untuk parameter mean populasi berdasarkan mean sampel ditentukan dengan cara memilih nilai μ yang meminimalkan nilai statistik intrinsik Gambar 1 menunjukan nilai statistik intrinsik bila digunakan nilai μ antara -4 dan 4 dan n =1 Terlihat bahwa nilai statistik intrinsik akan mencapai minimum jika μ = x = sehingga μ = x = merupakan estimasi titik untuk mean populasi μ Estimasi interval kredibel 95 % juga dapat ditentukan berdasarkan nilai statistik intrinsik Batas bawah yaitu -1,96 dan batas atas 1,96 ditentukan sehingga nilai statistik intrinsik lebih kecil dari nilai statistik intrinsik 1971 M-4
4 6 8-4 - 4 mean populasi mu dan mean sampel xbar = Gambar 1 Nilai statistik intrinsik untuk setiap nilai μ yang diberikan dengan menggunakan persamaan (1) Gambar menyatakan nilai-nilai statistik intrinsik jika dimiliki mean sampel berturut-turut yaitu (a) -1, (b) -,5, (c),5 dan (d) 1 Terlihat bahwa nilai statistik akan mencapai minimum pada mean sampelnya Berdasarkan nilai statistik intrinsik ini juga dapat ditentukan interval kredibel untuk parameter μ Interval kredibel 95 % untuk parameter μ bertutut-turut adalah (a) (-1,6, -,38 ) (b) ( -1,1,,1) (c) (-,1, 1,1) dan (d) (, ) M-5
6 1 4 6 8-4 - 4 (a) mean populasi mu dan mean sampel xbar = -1-4 - 4 (b) mean populasi mu dan mean sampel xbar = -5 4 6 8 6 1-4 - 4 (c) mean populasi mu dan mean sampel xbar = 5-4 - 4 (d) mean populasi mu dan mean sampel xbar = 1 Gambar Nilai-nilai statistik intrinsik jika dimiliki mean sampel berturut-turut yaitu (a) -1, (b) -,5, (c),5 dan (d) 1 Misalkan dimiliki sampel x 1, x,, x n ukuran n = 5 dari populasi berdistribusi normal dengan mean μ tidak diketahui dan variansi populasi σ diketahui yaitu dipilih σ = 1 Apabila diambil sampel dari distribusi normal dengan mean maka nilai-nilai statistik intrinsik yang merupakan ukuran kekuatan untuk menolak hipotesis H : μ = dan bila hal tersebut diulang sebanyak B = 1 kali maka hasilnya dinyatakan pada Gambar 3 Terlihat bahwa nilai-nilai statistik intrinsik cenderung kecil dengan rata-rata 1,87 dan hanya,46 % yang mempunyai nilai lebih dari 5 Apabila sampel diambil dari populasi yang mempunyai mean berturut-turut (a) -1 (b) -,5 (c),5 dan (d) 1 maka nilai-nilai statistik intrinsik dinyatakan pada Gambar 4 Terlihat bahwa nilai-nilai statistik intrinsik cenderung makin membesar jika mean populasi yang menjadi asal dari sampel jauh dari M-6
Histogram of 4 6 8 1 1 4 6 8 Gambar 3 Histogram dari nilai-nilai statistik intrinsik jika sampel diambil dari distribusi normal dengan mean dan variansi 1 serta digunakan untuk pengujian hipotesis H : μ = Dalam hal ini digunakan pengulangan B = 1 Histogram of Histogram of 1 3 4 5 6 (a) untuk mu = -1 5 1 15 5 (b) untuk mu = -5 Histogram of Histogram of 5 1 15 5 3 1 3 4 5 6 (c) untuk mu = 5 (d) untuk mu = 1 Gambar 4 Histogram dari nilai-nilai statistik intrinsik jika sampel diambil dari populasi yang mempunyai mean berturut-turut (a) -1 (b) -,5 (c),5 dan (d) 1 Dalam hal ini digunakan pengulangan B = 1 M-7
Kasus Pada kasus σ tidak diketahui, estimasi titik untuk parameter mean populasi μ berdasarkan mean sampel ditentukan dengan cara memilih nilai μ yang meminimalkan nilai statistik intrinsik Gambar 5 menunjukan nilai statistik intrinsik bila digunakan nilai μ antara -4 dan 4 jika diberikan mean sampel x = dan n=1 Terlihat bahwa nilai statistik intrinsik akan mencapai minimum jika μ = x = sehingga μ = x = merupakan estimasi titik untuk mean populasi μ 5 1 15-4 - 4 mean populasi mu Gambar 5 Nilai statistik intrinsik jika diberikan mean μ dan mean sampel x = Gambar 6 menyatakan nilai-nilai statistik intrinsik untuk μ jika diberikan mean sampel berturut-turut yaitu (a) -1, (b) -,5, (c),5 dan (d) 1 Dalam hal ini juga diberikan variansi sampel adalah 1 Terlihat bahwa nilai statistik akan mencapai minimum pada mean sampelnya Berdasarkan nilai statistik intrinsik ini juga dapat ditentukan interval kredibel untuk parameter μ 5 1 15 5 1 15-4 - 4 (a) mean populasi mu dan mean sampel xbar = -1-4 - 4 (b) mean populasi mu dan mean sampel xbar = -5 5 1 15 5 1 15-4 - 4-4 - 4 (c) mean populasi mu dan mean sampel xbar = 5 (d) mean populasi mu dan mean sampel xbar = 1 Gambar 6 Nilai-nilai statistik intrinsik untuk μ jika diberikan variansi sampel 1 dan mean sampel berturut-turut yaitu (a) -1, (b) -,5, (c),5 dan (d) 1 Misalkan dimiliki sampel x 1, x,, x n berukuran n = 5 dari popolasi berdistribusi normal dengan mean μ dan variansi populasi σ tidak diketahui Apabila diambil sampel dari distribusi normal dengan mean dan variansi 1 maka nilai-nilai statistik intrinsik yang merupakan ukuran kekuatan untuk menolak hipotesis nol H : μ = dinyatakan pada Gambar 7 Terlihat bahwa nilai-nilai statistik intrinsik cenderung kecil dengan rata-ratanya,99 dan M-8
hanya,6 % yang mempunyai nilai lebih dari 5 Apabila sampel diambil dari populasi yang mempunyai mean berturut-turut (a) -1 (b) -,5 (c),5 dan (d) 1 maka nilai-nilai statistik intrinsik dinyatakan pada Gambar 8 Terlihat bahwa nilai-nilai statistik intrinsik cenderung makin membesar jika mean populasi yang menjadi asal dari sampel jauh dari Histogram of 4 6 8 1 3 4 5 6 Gambar 7 Histogram dari B = 1 nilai-nilai statistik intrinsik yang merupakan ukuran kekuatan untuk menolak H : μ = jika diberikan sampel yang diambil dari populasi normal dengan mean dan variansi 1 Histogram of Histogram of 5 1 15 5 3 35 5 1 15 5 Histogram of Histogram of 5 1 15 5 1 15 5 3 35 Gambar 8 Histogram dari B = 1 nilai-nilai statistik intrinsik yang merupakan ukuran kekuatan untuk menolak H : μ = jika diberikan sampel yang diambil dari populasi normal dengan variansi 1 dan mean populasi berturut-turut (a) 1 (b) -,5 (c),5 dan (d) 1 KESIMPULAN Dalam makalah di atas telah dijelaskan bagaimana parameter mean populasi diestimasi dan dilakukan uji hipotesis dengan menggunakan metode Bayesian obyektif jika dianggap sampel diambil dari distribusi normal Metode tersebut dapat juga diperluas penggunaannya untuk parameter variansi populasi M-9
DAFTAR PUSTAKA [1] Bernardo, J dan R Rueda () Bayesian Hypotesis Testing : A Reference Approach, International Statistical Review 7, 351-37 [] Juarez, M A ( 4 ) Objective Bayesian Methods for Estimation and Hypothesis Testing, Valencia : University of Valencia [3] Setiawan, A (9a) Estimasi Titik Bayesian Obyektif, Prosiding Seminar Sains dan Pendidikan Sains IV FSM UKSW, Salatiga [4] Setiawan, A (9b) Credible Interval Bayesian Obyektif, Prosiding Seminar Nasional Matematika, Universitas Katolik Parahyangan, Bandung [5] Setiawan, A (1b) Pengujian Hipotesis dengan Metode Bayesian Obyektif, disampaikan dalam Konferensi Nasional Matematika XV 3 Juni 3 Juli 1, UNIMA, Tondano [6] Setiawan, A (11) Pengujian Hipotesis tentang Parameter Populasi Berdistribusi Eksponensial dengan Metode Bayesian Obyektif, Prosiding Seminar Nasional Statistika Universitas Diponegoro 11, ISBN : 987-979-97-14-4 M-1