Bab 2: Sifat-Sifat Estimator Statistika FMIPA Universitas Islam Indonesia
Statistik Cukup Dalam kondisi real, kita tidak mengetahui parameter dari populasi data yang akan kita teliti Informasi dalam sampel X 1, X 2,..., X n akan digunakan untuk melakukan inferensi tentang parameter θ Bila ukuran sampel n besar, kita perlu meringkas daftar nilai sampel x 1, x 2,..., x n atau mencari sifat-sifat kuncinya agar data tersebut bisa lebih bermakna Hal ini biasanya dikerjakan dengan menghitung statistiknya, misalkan mean sampel, variansi sampel, nilai observasi terbesar, dan nilai observasi terkecil.
Untuk keperluan notasi, X = (X 1, X 2,..., X n ) menyatakan sampel random, sedangkan x = (x 1, x 2,..., x n ) menyatakan nilai sampelnya Setiap statistik T = t(x ) selalu menghasilkan reduksi data Dalam melakukan inferensi, kita selalu menggunakan nilai terobservasi dari statistik yaitu T = t(x ) bukan keseluruhan sampel terobservasi x dan memperlakukan dua sampel x dan y sama asalkan t(x) = t(y) meskipun nilai x dan y tidak sama
Terdapat tiga asas reduksi data, 1 Asas Kecukupan (Sufficiency) Asas kecukupan mengembangkan metode reduksi data yang tidak menghilangkan informasi tentang θ dengan meringkas data 2 Asas Likelihood Asas likelihood menggambarkan fungsi parameter yang ditentukan oleh sampel terobservasi yang memuat semua informasi tentang θ yang tersedia dari sampel 3 Asas Invarian Asas invarian adalah metode lain reduksi data yang mengawetkan beberapa sifat utama dari model
Asas Kecukupan Statistik Cukup Statistik cukup (sufficient statistics) untuk parameter θ adalah statistik yang dalam arti tertentu bisa menyerap semua informasi tentang θ yang termuat dalam sampel. Setiap informasi tambahan dalam sampel di samping harga statistik cukup, tidak memuat informasi tambahan tentang θ.
Bila T = t(x ) adalah statistik cukup untuk θ, maka setiap inferensi tentang θ harus bergantung pada sampel X hanya melalui harga T = t(x ). Bila x dan y adalah dua titik sampel sedemikian hingga t(x) = t(y), maka inferensi tentang θ harus sama, tidak tergantung apakah X = x atau Y = y yang terobservasi.
Definisi 1 Statistik T = t(x ) disebut statistik cukup untuk suatu keluarga distribusi f X (x θ) jika dan hanya jika distribusi bersyarat dari X diberikan harga T tidak bergantung pada θ: f X T (x t, θ) = h(x)
Contoh 1 Statistik Cukup Misalkan X 1, X 2,..., X n adalah i.i.d sampel acak berdistribusi Bernoulli dengan parameter θ, 0 < θ < 1. Akan ditunjukkan bahwa T = n X i adalah statistik cukup untuk θ. Perhatikan bahwa T menjumlah harga-harga X i yang sama dengan 1 sehingga T berdistribusi Binomial(n, θ).
Bukti: f X T (x t, θ) = f X,T (x, t) = f X 1,X 2,...,X n,t (x 1, x 2,..., x n, t) f T (t) f T (t) n θ x i (1 θ) 1 x n n i x i (1 x i ) θ (1 θ) = ( ) = ( ) n n θ t t (1 θ) n t θ t t (1 θ) n t = θt (1 θ) n t ( ) = n θ t t (1 θ) n t 1 ) = ( n t 1 n n x i Karena f X T (x t, θ) tidak bergantung pada θ, maka T = n adalah statistik cukup dari θ. X i
Contoh 2 Statistik Cukup Misalkan X 1, X 2,..., X n adalah i.i.d N(µ, σ 2 ) dengan σ 2 diketahui. Akan ditunjukkan bahwa mean sampel T = X = X 1+X 2 +...+X n n adalah statistik cukup untuk µ.
Bukti:
Definisi 2 Suatu statistik T = t(x ) adalah cukup untuk suatu keluarga distribusi f X (x θ) jika dan hanya jika fungsi peluangnya dapat difaktorkan sebagai: f X (x θ) = g(t(x) θ) h(x)
Contoh 3 Statistik Cukup Misalkan X 1, X 2,..., X n adalah i.i.d berdistribusi Bernoulli dengan parameter θ, maka
n f X (x θ) = θ x i (1 θ) 1 x i n x i = θ (1 θ) n n ( n ) = g x i θ h(x) dengan h(x) = 1. Jadi, T = n X i merupakan statistik cukup untuk θ. x i
Contoh 4 Statistik Cukup Misalkan X 1, X 2,..., X n adalah i.i.d berdistribusi Normal dengan parameter (µ, σ 2 ) dengan σ 2 diketahui, maka
f X (x θ) = = n 1 e 1 (x i µ) 2 2 σ 2 2π σ 1 e 1 2 (2π) n 2 σn = h(x) g( x µ) n (x i x) 2 σ 2 e 1 2 Jadi, T = X adalah statistik cukup untuk µ. ( x µ) 2 σ 2
Bila T = t(x ) statistik cukup dan g( ) fungsi 1-1 maka g(t(x )) juga merupakan statistik cukup.
Contoh 5 Statistik Cukup Misalkan X 1, X 2,..., X n adalah peubah acak dengan fungsi peluang f Xi (x i θ) = θ x θ 1, 0 < x < 1, θ > 0 Tunjukkan bahwa T = n X i adalah statistik cukup untuk θ
Bukti: f X (x θ) = n θ x θ 1 i ( n ) θ 1 = θ n x i ( n ) = g x i θ h(x) dengan h(x) = 1. Jadi, T = n X i adalah statistik cukup untuk θ.
Contoh 6 Statistik Cukup Misalkan X 1, X 2,..., X n adalah peubah acak i.i.d berdistribusi Uniform dengan parameter (0, θ), 0 < x < θ, akan ditunjukkan bahwa T = Max X i adalah statistik cukup untuk θ.
Bukti: f X (x θ) = n 1 θ, 0 < x i < θ = 1 θ n, 0 < max x i < θ = 1 θ n, I (0,θ)(max x i ) = g(max x i θ) h(x) dengan h(x) = 1. Jadi, T = Max X i adalah statistik cukup untuk θ.
Definisi f X (x θ) disebut keluarga eksponensial jika f X (x θ) bisa ditulis sebagai [ k ] f X (x θ) = h(x) c(θ) exp w i (θ) t i (x)
Contoh 7 Statistik Cukup Misalkan X Binomial(n, θ), maka ( ) n f X (x θ) = θ x (1 θ) n x x ( ) ( ) n θ x = (1 θ) n x 1 θ ( ) ( n = (1 θ) n exp log x ( ) ( n = (1 θ) n exp x log x ( n dengan h(x) = x w(θ) = log ( θ 1 θ ). ( ) θ x ) 1 θ ( )) θ 1 θ ), c(θ) = (1 θ) n, t(x) = x, dan
Contoh 8 Statistik Cukup Misalkan X Eksp(λ) dengan λ = 1 θ, maka f X (x θ) = 1 θ e 1 θ x = 1 [ θ exp x 1 ] θ dengan h(x) = 1, c(θ) = 1 θ, t(x) = x, dan w(θ) = 1 θ.
Contoh 9 Statistik Cukup Misalkan X N(µ, σ 2 ), maka
Statistik Cukup Jika T = t(x ) adalah statistik cukup dan keluarga eksponensial, maka statistik tersebut masuk ke dalam keluarga lengkap.
Statistik Cukup Sifat Suatu statistik T = t(x ) memiliki sifat lengkap jika E(g(t)) = 0 g(t) = 0
adalah keluarga lengkap tetapi keluarga lengkap tidak identik dengan keluarga Eksponensial. Contoh: X U(0, θ)
Contoh 10 Statistik Cukup Misalkan X i U(0, θ). Akan dibuktikan bahwa T = Max X i adalah statistik lengkap.
Bukti: Pertama kali yang harus dilakukan adalah mencari fungsi peluang T = t(x ). F T (t) = P(T t) = P(Max X i t) = P(X 1 t, X 2 t,..., X n t) n = P(X i t) (1) Diketahui X i U(0, θ), maka f Xi (x i ) = 1 θ, 0 x i θ
Sehingga P(X i t) = Kembali ke persamaan (1), maka F T (t) = t 0 1 θ dx i = t θ n ( t ) n t n P(X i t) = = θ θ n f T (t) = d dt F T (t) = n tn 1 θ n, 0 < t < θ Selanjutnya akan ditunjukkan bahwa E(g(t)) = 0 g(t) = 0
E(g(t)) = θ 0 θ 0 θ n θ n 0 g(t) f T (t) dt = 0 g(t) n tn 1 θ n dt = 0 g(t) t n 1 dt = 0 Kemudian kedua ruas diturunkan terhadap θ, sehingga diperoleh
n( n) θ n+1 θ 0 d n dθ θ n g(t) t n 1 dt + n θ n d dθ θ n2 θ n+1 0 n n θ θ n θ 0 θ 0 g(t) t n 1 dt = 0 g(t) t n 1 dt = 0 g(t) t n 1 dt + n θ n g(θ) θn 1 = 0 θ 0 g(t) t n 1 dt + n g(θ) θ = 0 0 + n g(θ) = 0 g(θ) = 0 θ
Statistik Cukup 1 Misalkan X 1, X 2,..., X n adalah peubah acak-peubah acak berdistribusi Gamma dengan α = 2 dan β = θ > 0. Buktikan definisi bahwa T = n X i adalah statistik cukup untuk θ menggunakan definisi 1 dan 2. 2 Buktikan bahwa keluarga distribusi Poisson dengan parameter θ termasuk dalam keluarga Eksponensial. 3 Diketahui X 1, X 2,..., X n adalah peubah acak dari distribusi dengan f Xi (x i θ) = θ 2 x e θx, 0 < x <, θ > 0 Buktikan T = n X i adalah statistik cukup lengkap untuk θ.