PENGUJIAN HIPOTESIS DENGAN METODE BAYESIAN OBYEKTIF Adi Setiawan Program Studi Matematika Industri dan Statistika, Fakultas Sains dan Matematika Universitas Kristen Satya Wacana Jl Diponegoro 5-6 Salatiga 5711, Indonesia e-mail: adi_setia_3@yahoo.com Abstrak Pengujian hipotesis merupakan hal yang sangat penting dalam inferensi statistika. Dalam makalah ini dibahas tentang bagaimana melakukan pengujian hipotesis dengan menggunakan metode Bayesian obyektif. Untuk menggambarkan penggunaan metode ini digunakan sampel yang diperoleh dari populasi yang berdistribusi Bernouli atau yang berdistribusi Normal. Studi simulasi dilakukan untuk memberikan gambaran yang lebih jelas penggunaan metode. Kata kunci : pengujian hipotesis, Bayesian obyektif, reference prior, reference posterior, intrinsic discrepancy loss function, intrinsic statistic. 1. Pendahuluan Metode Bayesian obyektif untuk menentukan estimasi titik dan estimasi interval kredibel) telah dijelaskan berturut-turut dalam makalah Setiawan 9a) dan Setiawan 9b). Dalam makalah ini akan dijelaskan tentang pengujian hipotesis dengan menggunakan metode Bayesian obyektif. Selanjutnya sampel dari populasi yang berdistribusi Bernoulli digunakan untuk memberikan gambaran bagaimana metode ini digunakan.. Dasar Teori Inferensi Bayesian sering kali dikritik karena mendasarkan diri pada pemilihan distribusi prior sehingga akan mempengaruhi kesimpulan yang diambil. Khususnya pemberian prior pada hipotesis nol dan hipotesis alternatif akan sangat janggal. Metode Bayesian obyektif yang digunakan dalam pengujian hipotesis diharapkan akan dapat mengatasi masalah ini. Dengan menggunakan metode ini, akan dihasilkan inferensi yang hanya tergantung pada data dan distribusi anggapan populasi yang menjadi asal sampel. Diskrepansi intrinsik intrínsic discrepancy) p 1, p ) antara dua fungsi densitas p 1 x) dengan x X 1 dan p x) dengan x X didefinisikan sebagai p1, p) mink p x) p1 x) ), K p1 x) p x) ) dengan p1 x) K p1 x) p x)) p1 x) log dx. p x) X Untuk dua keluarga fungsi densitas M1 p1 x ), x 1 ), dan M p x ), x ),
dapat didefinisikan diskrepansi intrinsik M, M ) min p x ), p x ). 1 1, Diskrepansi intrinsik diusulkan sebagai fungsi kerugian loss function ) obyektif untuk estimasi titik. Misalkan bahwa gambaran yang sesuai dari tingkah laku probabilistik dari kuantitas random x diberikan oleh model { p x, ), x,, }. Diskrepansi intrinsik antara p x, ) dan keluarga densitas { p x, ), } adalah, ; ) inf, ;, ) dengan, ;, ) min K,, ), K,, ). Misalkan { p x, ), x,, } adalah model parametrik yang dapat digunakan untuk menggambarkan tingkah laku kuantitas random x. Statistik intrinsik intrinsic statistic) didefinisikan sebagai d x) E [ x], ; ), x) d d dengan, ) adalah posterior referensi untuk parameter dari model x p x, ) bila, ; ) adalah parameter yang menjadi perhatian. Apabila diinginkan untuk melakukan pengujian hipotesis H { = } maka statistik intrinsik merupakan ukuran dari kekuatan bukti melawan penggunaan model M dengan M p x, ), }. { Hal itu berarti H akan ditolak jika dan hanya jika d x ) untuk suatu batas d Juarez, 4). Bernardo dan Rueda ) mengusulkan untuk menggunaka aturan sebagai berikut : jika d 1 maka tidak ada bukti untuk menolak H, jika d,5 maka terdapat bukti lemah mild) untuk menolak dan jika d > 5 maka terdapat bukti kuat strong) untuk menolak H. Metode di atas dapat diterapkan pada sampel berikut ini. Misalkan dimiliki x = x 1, x,..., x n ) yang terdiri dari pengamatan Bernoulli yang saling bebas dan tergantung pada sehingga mempunyai fungsi kepadatan probabilitas x i 1 x p x i i ) 1 ) dengan x i = {, 1 }. Berdasarkan data x, akan dilakukan pengujian hipotesis nol H : =. Kullback-Leibler divergence antara p x ) dan p x 1) adalah K 1) 1 log[ 1 / ] 1 1) log[ 1 1) /1 )] dan diskrepansi intrinsik antara p x ) dan p x ) dapat dinyatakan sebagai 1 K 1) 1,1 1) 1, ) n. K 1 ) yang lain
1 1 Dalam hal ini prior yang digunakan adalah prior Jeffry yaitu ) Beta, dan 1 1 reference posterior yang bersesuaian adalah x) Beta r, n r dengan r n x i i1. Selanjutnya diperoleh intrinsik statistik 1 1 1 d, x), ) Beta r, n r d. 1) Jika statistik intrinsik yang dihitung menggunakan persamaan 1) berdasarkan sampel x lebih dari 5 maka terdapat bukti yang kuat untuk menolak H : = Bernardo, 9). 3. Studi Simulasi dan Pembahasan Apabila berdasarkan ukuran sampel n dan statisik cukup t, akan dilakukan pengujian hipotesis bahwa H : =, maka dapat ditentukan nilai statistik intrinsik yang dapat digunakan untuk ukuran penolakan hipotesis H. Apabila statistik intrinsik lebih besar 5 maka dipunyai bukti yang kuat untuk menolak hipotesis H. Pada Gambar 1 diberikan nilai statistik intrinsik untuk ukuran sampel n=1 dan statistik cukup t=1. Berdasarkan Gambar 1, dapat disimpulkan bahwa untuk ukuran sampel n=1 dan statistik cukup t =1, hipotesis H : = akan mempunyai nilai statistik intrinsik yang kecil jika dekat dengan,1 dan nilai statistik intrinsik akan makin membesar jika jauh dari,1. Interpretasi yang analog dapat dilakukan untuk hal yang serupa. Pada Gambar diberikan nilai statistik intrinsik untuk ukuran sampel n=1 dan statistik cukup t=, 4, 6, 8 berturut-turut untuk a), b), c ) dan d) serta,1). Demikian juga cara yang sama dapat dilakukan untuk n=3 dan statistik cukup t=6, 1, 18, 4 berturut-turut untuk a), b), c ) dan d) serta,1). Hasil dari penggunaan n=3 dapat dilihat pada Gambar 3. Terlihat jelas dari Gambar dan Gambar 3 bahwa makin besar ukuran sampel n dan untuk statistik cukup t yang bersesuaian maka akan semakin besar statistik intrinsik yang diperoleh. a) n=1,t=1, Ho : =, dalam,1) 1 3 4 Gambar 1. Nilai statistik intrinsik jika diberikan usuran sampel n = 1 dan statistik cukup hipotesis nol H : = dengan,1). t=1 serta
a) n=1,t=, Ho : =, dalam,1) b) n=1, t=4, Ho : =, dalam,1) 1 3 4 1 3 4 c) n=1, t=6, Ho : =, dalam,1) d) n=1, t=8, Ho : =, dalam,1) 1 3 4 1 3 4 Gambar. Nilai statistik intrinsik jika diberikan usuran sampel n = 1 dan statistik cukup a) t=, b) t=4, c) t=6 dan d) t=8 serta hipotesis nol H : = dengan,1). a) n=3,t=6, Ho : =, dalam,1) b) n=3, t=1, Ho : =, dalam,1) 4 6 8 4 6 8 c) n=3, t=18, Ho : =, dalam,1) d) n=3, t=4, Ho : =, dalam,1) 4 6 8 4 6 8 Gambar 3. Nilai statistik intrinsik jika diberikan usuran sampel n = 3 dan statistik cukup a) t=6, b) t=1, c) t=18 dan d) t=4 serta hipotesis nol H : = dengan,1).
Histogram 1 nilai..1..3.4.5.6 4 6 8 Gambar 4. Histogram B=1 nilai statistik intrinsik dari sampel yang digunakan untuk pengujian hipotesis H : =,1 jika sampel ukuran sampel ukuran n=1 dibangkitkan dari distribusi Bernoulli dengan parameter =,1. Simulasi dilakukan dengan cara membangkitkan sampel ukuran n = 1 yaitu x = x 1, x,..., x n ) dari distribusi Bernoulli dengan parameter =,1 sehingga akan diperoleh statistik cukup t n x i i 1. Berdasarkan n dan t maka dapat ditentukan nilai intrinsik statistik d untuk pengujian hipotesis H : =,1. Apabila hal ini diulang sebanyak bilangan besar B = 1 kali maka akan diperoleh histogram dari B nilai intrinsik statistik yang dinyatakan pada Gambar 4. Seperti yang diharapkan nilai-nilai intrinsik statistik akan cenderung kecil. Nilai-nilai statistik intrinsik tersebut mempunyai mean 1 dan simpangan baku,8653. Hanya,9 % dari nilai-nilai statistik intrinsik tersebut yang lebih dari 5. Apabila dilakukan pembangkitan sampel ukuran n=1 dari distribusi Bernoulli dengan parameter dengan a) =, b) =,4 c) =,6 dan d) =,8. Jika parameter yang digunakan untuk membangkitkan sampel dekat dengan,1 maka nilai-nilai intrinsik statistik cenderung kecil dan sebaliknya nilai-nilai intrinsik statistik akan cenderung besar jika parameter yang digunakan untuk membangkitkan sampel jauh dari,1.
a) =, b) =,4..4.8.1...4 5 1 15 1 3 4 5 6 c) =,6 d) =,8..15.3..1. 4 6 8 1 1 1 1 14 16 18 Gambar 5. Histogram B=1 nilai statistik intrinsik dari sampel yang digunakan untuk pengujian hipotesis H : =,1 jika sampel ukuran sampel ukuran n=1 dibangkitkan dari distribusi Bernoulli dengan parameter a) =,, b) =,4, c) =,6, dan d) =,8. 4. Kesimpulan Metode Bayesian obyektif dalam pengujian hipotesis dalam kasus sampel dianggap berasal dari populasi yang berdistribusi Bernuolli telah dijelaskan di atas. Penelitian ini dapat diperluas untuk kasus distribusi-distribusi yang biasa dikenal baik yang mempunyai parameter nuisance maupun yang tidak. Daftar Pustaka [1] Bernardo, J. dan R. Rueda ) Bayesian Hypotesis Testing : A Reference Approach, International Statistical Review 7, 351-37. [] Juarez, M. A. 4 ) Objective Bayesian Methods for Estimation and Hypothesis Testing, Valencia : University of Valencia. [3] Setiawan, A. 9a) Estimasi Titik Bayesian Obyektif, Prosiding Seminar Sains dan Pendidikan Sains IV FSM UKSW, Salatiga ISBN 978-979-198-63-9. [4] Setiawan, A. 9b) Credible Interval Bayesian Obyektif, Prosiding Seminar Nasional Matematika, Universitas Katolik Parahyangan, Bandung ISSN 197-399.