Uji Hipotesis dan Aturan Keputusan

Uji Hipotesis dan Aturan Keputusan oleh: Khreshna Syuhada, PhD. 1. Pendahuluan Pada perkuliahan tingkat 2, telah dikenalkan masalah uji hipotesis sebagai berikut: Seorang peneliti memberikan klaim bahwa rata-rata umur seekor binatang air tertentu lebih dari 5 tahun. Untuk itu, peneliti mengambil sampel berukuran n dan menguji pada tingkat signifikansi α. Apakah data mendukung klaim peneliti? Langkah-langkah pengujian hipotesis adalah 1. Hipotesis: H 0 versus H 1 2. Tingkat signifikansi: α 3. Statistik uji: Z, T 4. Daerah kritis 5. Nilai statistik uji 6. Kesimpulan Catatan: Kita dapat menggunakan teknik p-value. 2. Hipotesis, Statistik Uji dan p-value Hipotesis, H 0 dan H 1, adalah pernyataan tentang model peluang. Dapat juga dikatakan sebagai karakteristik populasi. H 0 umumnya menyatakan tidak ada efek, tidak ada perbedaan dsb. H 1 adalah lawan dari H 0 ; H 0 : θ = θ 0 ; H 0 : θ θ 0 ; H 0 : θ θ 0. Statistik uji adalah fungsi dari data dan θ 0. Statistik uji dipilih untuk membedakan H 0 dengan H 1. Umumnya, statistik uji memuat penaksir dari θ. Statistik uji yang dikenal antara lain Z, T, χ 2 ; Z = Z n = X µ 0 σ/ n. p-value adalah ukuran kekonsistenan antara data dan H 0. Didefinisikan: p-value = P (Z > z obs H 0 ), 1

untuk H 1 : µ > µ 0, dimana Z adalah statistik uji dan z obs adalah realisasinya. Menghitung p-value untuk Z > z obs dengan mengikuti arah H 1. Nilai p-value yang kecil berarti data tidak konsisten dengan H 0 ; nilai p-value yang kecil adalah bukti menolak H 0. Kesalahan (umum) tentang p-value: p-value yang besar adalah bukti untuk mendukung H 0 p-value yang sangat kecil menunjukkan adanya efek yang besar/penting Pandang uji hipotesis H 0 : µ = 100 versus H 1 : µ 100 berdasarkan sampel berukuran 1 dari N(0, 20 2 ). Misalkan nilai µ yang sebenarnya adalah µ = 105 dan kita dapatkan X = 101. Nilai statistik uji Z adalah yang memberikan z obs = 101 100 20 = 0.05 p-value = 2(1 Φ(0.05)) = 2(1 0.5199) = 0.9601. Perhatikan bahwa p-value besar namun data tidak mendukung/memberikan bukti bahwa H 0 benar. Misalkan pemberian obat standar pada penderita flu akan menurunkan gejalanya pada 66% populasi. Seorang peneliti mencoba menemukan obat baru dan ingin menguji H 0 : p = 0.62 versus H 1 : p > 0.62. Statistik uji yang dipakai adalah Z = p p 0 p0 (1 p 0 )/n. Jika obat baru menurunkan gejala flu pada 62.1% dari sampel sebanyak n = 3000000, maka nilai z obs = 3.5684 yang memberikan p-value sebesar 0.00018. 3. Rasio Likelihood Salah satu cara untuk menguji hipotesis H 0 : θ = θ 0 versus H 1 1-sisi atau 2-sisi adalah dengan menguji rasio likelihood LR = L(θ 0 X) max θ L(θ X) 2

dimana memaksimumkan penyebut yang dimaksudkan adalah atas semua θ yang memenuhi H 1. LR adalah rasio dari peluang dari data dibawah H 0 terhadap peluang terbesar yang mungkin dari data dibawah H 1. Nilai LR berada diantara nol dan satu. Nilai yang kecil diinterpretasikan sebagai bukti yang melawan H 0. Misalkan kita ingin menguji H 0 : p = p 0 versus H 1 : p p 0 menggunakan sampel acak dari distribusi Geometrik dengan parameter p. Kita tahu bahwa Rasio likelihoodnya adalah p ML = 1 X. LR = (1 p 0) n( X 1) p n 0 (1 1/ X) n X n ( ) n( X 1) 1 p0 = Xp Xn X n 1 0. Dari plot log LR versus X, kita dapatkan bahwa log LR kecil jika X jauh lebih besar/kecil dari 4. Catatan: jika X = 4 maka 1/ X = 0.25 = p 0 dan LR sama dengan 1, yang artinya log LR-nya sama dengan nol. 4. Daerah Penolakan, Kesalahan dan Kuasa Misalkan dipunyai X 1,..., X n. Daerah penolakan adalah himpunan nilai-nilai dari statistik uji yang menolak H 0. Daerah penerimaan adalah komplemen dari daerah penolakan. Kesalahan dalam uji hipotesis: Tipe I: kesalahan menolak H 0 yang benar Tipe II: kesalahan menerima H 0 yang salah Tingkat signifikansi α adalah peluang menolak H 0 yang benar; atau dengan kata lain kesalahan tipe I, α = P (menolak H 0 H 0 benar). Kesalahan tipe I sangat diperhatikan dalam uji hipotesis (dibanding dengan kesalahan tipe II); kita ingin kesalahan tipe I sekecil mungkin. 3

Kesalahan tipe II, notasi: β, adalah peluang menerima/gagal menolak H 0 yang salah, β = P (menerima H 0 H 0 salah) yang, tentu saja, kita ingin nilainya sekecil mungkin. Kuasa (power) didefinisikan sebagai peluang menolak H 0 yang salah, 1 β = P (menolak H 0 H 0 salah) Fungsi Kuasa Misalkan X 1,..., X n sampel acak dari f X (x θ). Misalkan ruang parameter θ adalah Θ. Misalkan Θ 0 dan Θ 1 adalah subruang dari Θ yang saling asing. Pandang uji H 0 : θ Θ 0 versus H 1 : θ Θ 1. Fungsi kuasa adalah fungsi dari θ, didefinisikan sebagai berikut π(θ) = P (menolak H 0 θ Θ 1 ). Contoh-1: Pandang uji H 0 : p = 0.4 versus H 1 : p 0.4 berdasarkan sampel acak berukuran 10 dari Bernoulli(p). Misalkan Y = X i. Jika daerah kritisnya adalah menolak H 0 jika Y 0 atau Y 8, maka α = 1 P (1 Y 7 p = 0.4) = 0.0183 Sedangkan kesalahan tipe II dan kuasanya adalah β = P (1 Y 7 p) kuasa = 1 P (1 Y 7 p) Plot sbb: (plot β dan/atau kuasa dapat dibuat untuk berbagai nilai p) Contoh-2: Misalkan X 1, X 2,..., X n sampel acak normal dengan parameter (µ, σ 2 ). ingin menguji hioptesis Kita H 0 : µ = µ 0 versus H 1 : µ > µ 0. Statistik uji yang dapat digunakan adalah Z = Z n = X µ 0 σ/ n 4

yang berdistribusi N(0, 1). Tingkat signifikansi α (atau kesalahan tipe I) dapat ditentukan sbb: α = P (menolak H 0 H 0 benar) = P (Z > z 1 α µ = µ 0 ) = P (Z > z 1 α ) Dengan cara sama, kita dapat menentukan kesalahan tipe II, β = P (gagal menolak H 0 H 0 salah) = P (Z z 1 α µ > µ 0 ) Fungsi kuasanya adalah π(µ 1 ) = P (Z > z 1 α µ = µ 1 ) ( X µ0 ) = 1 P σ/ n z 1 α µ = µ 1 ( X µ1 + µ 1 µ ) 0 µ = 1 P σ/ z 1 α = µ1 n ( X µ1 = 1 P σ/ n z 1 α µ 1 µ ) 0 σ/ µ = µ 1 n ( = 1 Φ z 1 α µ ) 1 µ 0 σ/ n Misalkan kita memiliki hipotesis-hipotesis sederhana [hipotesis sederhana adalah hipotesis yang secara lengkap memberikan spesifikasi distribusi dari data. Tidak ada parameter yang tidak diketahui dalam hipotesis sederhana] yang akan diuji dengan tingkat signifikansi α. Daerah penolakan (daerah kritis) dapat ditentukan dengan memperhatikan statistik uji yang dipakai. Contoh-3: Misalkan X 1, X 2,..., X 25 sampel acak normal dengan variansi 100. Akan ditentukan daerah penolakan untuk uji H 0 : µ = 0 versus H 1 : µ = 1.5, pada tingkat signifikansi α = 0.1. Perhatikan bahwa statistik uji yang kita gunakan adalah Z = X µ 0 σ/ n ; 5

yang mana H 0 akan ditolak jika X µ 0 σ/ n > z 1 α X > µ 0 + z 1 α σ n X > 0 + 1.28 10 25 Sementara itu, kuasa dihitung sbb ( X µ0 ) 1 P σ/ n z 1 α µ = 1.5 ( = 1 Φ z 1 α µ ) 1 µ 0 σ/ n ( = 1 Φ 1.28 1.5 0 ) 10/ 25 = 1 Φ(0.53) = 1 0.7019 Jadi, Untuk α = 0.1, tolak H 0 untuk X > 2.56 dan kuasa 0.2981, Untuk α = 0.01, tolak H 0 untuk X > 4.66 dan kuasa 0.0571. Contoh-4: Kita dapat pula menentukan daerah penolakan dengan menggunakan rasio likelihood. Untuk Contoh-3 diatas, perhatikan bahwa rasio likelihood LR = L(µ 0) L(µ 1 ) = exp ( 1 n 2σ 2 (X i µ 0 ) 2) exp ( 1 n 2σ 2 (X i µ 1 ) 2), dimana nilai kecil dari statistik uji diatas berkorespondensi dengan nilai kecil dari n (X i µ 1 ) 2 n (X i µ 0 ) 2 atau ditulis (kita dapat pula memperhatikan exp dan σ 2 ) 2n X(µ 0 µ 1 ) + nµ 2 1 nµ 2 0 < K untuk suatu K. Misalkan µ 0 = 0, µ 1 = 1.5, n = 25. Kita akan menolak H 0 jika X > K (25)(1.52 ). 2(25)(1.5) 6

Contoh-5: Misalkan X 1, X 2,..., X n sampel acak Poisson. Akan ditentukan rasio likelihood untuk uji H 0 : λ = λ 0 versus H 1 : λ = λ 1, λ 1 > λ 0. pada tingkat signifikansi α = 0.1. Fungsi likelihood: L = λ n x i e λn n (x i!), yang mana untuk λ 0 = 2 dan λ 1 = 1/2, fungsi likelihoodnya, berturut-turut, adalah L(λ 0 ) = L(2) = 2 n x i e 2n n (x i!), dan x i e (1/2)n L(λ 1 ) = L(1/2) = (1/2) n n (x i!). Sehingga, rasio likelihoodnya yang berakibat atau LR = 2 n x i e 2n (1/2) n x i e (1/2)n < K 4 n x i e (3/2)n < K ( n ) x i ln 4 3 n < ln K. 2 Jadi, H 0 ditolak jika n x i < K. Contoh-6: Perhatikan uji hipotesis berikut: H 0 : p = 0.5 versus H 1 : p = 0.6. Misalkan sampel acak Bernoulli berukuran n = 10 diambil untuk menguji hipotesis diatas; nilai Y = X i yang mungkin adalah 0, 1,..., 10. Untuk Y = 4, sebagai contoh, diperoleh L(p 0 ) = L(0.5 ) = (0.5) 4 (1 0.5) 10 4 dan L(p 1 ) = L(0.6) = (0.6) 4 (1 0.6) 10 4. 7

Sehingga rasio likelihoodnya 1.84. Kita dapat menghitung rasio likelihood untuk semua nilai Y yang mungkin. Kesimpulannya: rasio likelihood akan makin kecil nilainya untuk Y semakin besar. Seperti pada contoh sebelumnya, daerah penolakan dapat ditentukan melalui rasio likelihood, ( ) Y ( ) n ( ) Y 5 5 4 LR = < K 6 4 5 atau (4/6) Y (5/4) n < K. ( ) Jadi, H 0 ditolak jika Y > ln K(4/5) n (4/6). Misalkan daerah penolakannya adalah 8 Y 10. Kesalahan tipe I-nya adalah α = P (Y > 7) = 1 P (Y 7) = 0.0547. (jika daerah penolakannya adalah Y {7, 8, 9, 10}, maka α = 0.1719). Sementara itu, kita dapat menghitung kuasa; nilainya 0.1673 (untuk p = 0.6). Jika kita ambil p = 0.7, nilai kuasa 0.3828. Fungsi kuasa dapat digambar dan kita menyimpulkan bahwa kuasa akan menuju 1 untuk p semakin dekat ke 1; kuasa menuju α untuk p semakin dekat ke 0.5. Kesimpulan: Tidak ada tes lain dengan α 0.0547 yang memberikan kuasa lebih besar. Lema Neyman-Pearson Misalkan uji rasio likelihood menolak H 0 jika L(θ 0 )/L(θ 1 ) < K pada tingkat signifikansi α. Maka, tes lain dengan tingkat signifikansi α α memiliki kuasa yang lebih kecil atau sama dengan kuasa dari uji rasio likelihood. Catatan: Lema N-P menyatakan bahwa diantara semua tes pada tingkat signifikansi α, uji rasio likelihood akan meminimumkan β Lema N-P menyatakan bahwa dari seluruh tes dengan tingkat signifikansi α, tes yang menolak H 0 untuk nilai rasio likelihood yang kecil adalah tes yang paling kuasa (Most Powerful Test atau MP Test). MP test berlaku untuk hipotesis H 0 dan H 1 sederhana. Jika MP test berlaku untuk setiap H 1 maka dikatakan sebagai Uniformly Most Powerful Test atau UMP Test. 8

5. Selang Kepercayaan dan Uji Hipotesis Misalkan 99% selang kepercayaan untuk µ dari distribusi normal adalah ( 2.0; 3.0). Akankah uji H 0 : µ = 3 versus H 1 : µ 3 ditolak pada tingkat signifikansi α = 0.01? Perhatikan bahwa pada sampel acak normal dengan mean µ tidak diketahui dan σ 2 diketahui, kita dapat menguji H 0 : µ = µ 0 versus H 1 : µ µ 0. Pada tingkat α, kita akan menolak H 0 jika X < µ 0 z α/2 σ n atau X > µ 0 + z α/2 σ n. Dengan kata lain, H 0 gagal ditolak (diterima) jika X µ 0 < z α/2 σ n. Kita dapat membentuk 100(1 α)% selang kepercayaan untuk µ 0 (yang artinya untuk µ), X z α/2 σ n, X + zα/2 σ n. Jadi, µ 0 akan berada dalam selang kepercayaan jika dan hanya jika H 0 gagal ditolak. Untuk soal diatas, H 0 ditolak karena µ 0 berada diluar selang kepercayaan. 6. Uji Rasio Likelihood Diperumum (GLR) Perhatikan kembali rasio likelihood yang telah dijelaskan subbab 3 diatas. Untuk sampel acak normal dengan mean µ dan variansi σ 2 dan kita ingin menguji H 0 : µ = µ 0 versus H 1 : µ µ 0, maka rasio likelihood yang kita punya adalah ( [ n LR = exp 1 ( ) 2 n ( Xi µ 2σ 2 0 Xi X ) ]) 2. 9

Menolak H 0 artinya nilai LR yang kecil, ekivalen dengan nilai besar dari ( ) 2 n ( Xi µ 0 Xi X ) ) 2 atau 2LR = 1 σ 2 ( n 2LR = n ( X µ 0 ) 2 σ 2. Kita dapat menunjukkan bahwa ( X µ 0 ) 2 χ 2 σ 1. 2 Jadi, H 0 ditolak jika n σ ( X µ 2 0 ) 2 > χ 2 α. Catatan: hasil ini ekivalen dengan yang telah ditulis diatas, yaitu H 0 ditolak jika X < µ 0 z α/2 σ n atau X > µ 0 + z α/2 σ n. 7. Latihan (a) Misalkan sampel acak normal berukuran n dengan mean µ (diketahui) dan variansi σ 2 (tidak diketahui). Tentukan MP Test pada tingkat α untuk hipotesis H 0 : σ 2 = σ 2 0 versus H 1 : σ 2 = σ 2 1 (σ 2 1 > σ 2 0). Tunjukkan pula bahwa tes ini ekivalen dengan χ 2 -test. (b) Misalkan X B(100, p). Pandang uji hipotesis H 0 : p = 0.5 versus H 1 : p 0.5 untuk X 50 > 10. (i) Tentukan α (ii) Sketsa grafik kuasa sebagai fungsi dari p. (gunakan pendekatan normal untuk distribusi binomial dalam menjawab pertanyaanpertanyaan diatas) (c) Misalkan X p.a. Binomial dengan n percobaan yang memiliki peluang sukses p. Untuk uji hipotesis kita dapat menentukan GLR sbb: dan daerah penolakan... H 0 : p = 0.5 versus H 1 : p 0.5 10