STATISTICS WEEK 6 Oleh: Hanung N. Prasetyo DISTRIBUSI NORMAL
Pengantar: Dalam pokok bahasan disini memuat beberapa distribusi kontinyu yang sangat penting di bidang statistika. diantaranya distribusi normal. Distribusi ini sangat berperan pada statistik inferensial yaitu dalam pengujian hipotesis, pengujian panjang umur (lifetesting) dan sebagainya
Kompetensi: Setelah mempelajari materi pokok bahasan disini, mahasiswa diharapkan: 1. Mampu menggunakan konsep-konsep dasar teori Distribusi Probabilitas Kontinu secara benar. 2. Mampu melakukan operasi hitungan-hitungan yang berkaitan dengan distribusi normal 3. Terampil dalam mengerjakan soal-soal tugas dan latihan.
Daftar Isi Materi: Distribusi Normal Distribusi Normal Baku Luas Daerah dibawah Kurva Normal
PerhatikangrafikHistogram dan Poligonberikut f(x) Histogram Poligon Kurva X
6.1 Distribusi Normal Distribusi probailitas kontinyu yang terpenting di bidang statistik adalah distribusi Normal. Grafiknya disebut kurva normal, berbentuk lonceng seperti gambar 6.1. Distribusi ini ditemukan Karl Friedrich (1777-1855) yang juga disebut distribusi Gauss. Perubah acak X yang bentuknya seperti lonceng disebut perubah acak normal dengan persamaan matematik distribusi probabilitas yang bergantung paramerter µ (mean) dan σ(simpangan baku) dinyatakan n(x; µσ, ) Pada gambar (6.2) melukiskan dua kurva normal dengan simpangan baku yang sama tapi rata-rata berbeda, gambar 6.3 melukiskan beberapa kurva yang mempunyai mean sama tetapi standart deviasi bebeda. Gambar 6.4 mellukiskan kurva normal dengan mean dan standart deviasi yang berbeda.
Distribusi Normal Distribusi normal merupakan salah satu distribusi yang paling penting dalam statistika. Disebut pula dengan distribusi Gauss (Gaussian distribution). Fungsi densitas dari variabel random Xdengan mean µdan variansi σ 2 adalah: n 1 ( ) (1/ 2) [( x µ )/ σ] x; µ, σ = e 2 2πσ, < x <
dnorm(x) 0.2 0.3 0.4 σ 0.0 0.1-4 -2 0 2 4 Gambar 6.1 Kurva normal µ x
Distribusi Normal dnorm(x, 5, 1) 0.2 0.3 0.4 0.5 1 2 2 2 1 = 2 = 1 µ µ σ σ 0.0 0.1 0 2 4 6 8 10 x Gambar 6.2 Kurva normal dengan simpangan baku sama
Distribusi Normal dnorm(x, 0, 0.25) 1.0 1.5 2 1= 0, 1 = 0.25 µ σ 2 2= 0, 2 = 0.5 µ σ 0.0 0.5 2 3 = 0, 3 = 0.75 µ σ 2 4= 0, 4 = 1 µ σ -4-2 0 2 4 Gambar 6.3 Kurva normal dengan rata-rata sama x
dn norm(x, 1, 0.5) 0.4 0.6 0.8 2 = 2, 2 = 1 µ σ µ σ 1= 1, 1= 0. 5 0.0 0.2-6 -4-2 0 2 4 x Gambar 6.4 Kurva normal dengan mean dan standart deviasi yang berbeda
Karakteristik Distribusi Normal Data merupakan data kontinu (interval atau rasio) Sebaran bersifat simetris dengan modus tunggal (unimodal) Mean=median=modus Batas nilai memungkinkan untuk seluruh bilangan riil tak terbatas kekiri maupun kekanan Secara umum karakteristik ditentukan oleh dua parameter yaitu mean dan standar deviasi
P(x 1 < X < x 2 ) = Perhitungan Probabilitas pada Distribusi Normal x x 2 1 n( x ; µ, σ) dx = x 2 1 (1 / 2) σ 2πσ x 1 e [ ] 2 ( x µ ) / dx Integral di atas tidak dapat diselesaikan secara analitis. Untuk memudahkan perhitungan tersedia tabel normal yang berisikan luas dibawah area kurva normal baku x µ z= σ
Sifat Distribusi Normal Grafik simetri terhadap sumbu tegak x (=μ) Grafik selalu berada diatas sumbu X (f(x)>0) Mempunyai satu nilai Modus Grafik mendekati sumbu X (tidak akan memotong sumbu X) Luas dibawah kurva f(x) dan diatas sumbu X sama dengan satu ( P - < x< = ) ( ) 1
Kurva Normal Kurva normal yang dibentuk oleh normal, memiliki bentuk lonceng simetris dan lebih lanjut memiliki properti sebagai berikut: 1.memiliki modus, median, dan mean pada satu titik 2.kurva berbentuk simetri terhadap sumbu vertikal yang melewati µ 3.kurvamemilikititikbelokpadax=µ±σ 4.kurva normal mencapai sumbu horizontal secara asimptot
Tumpuk/stack Tumpang tindih 14 16 18 20 22 24 26
Sebaran Y~N(M,SD) dan Z~N(0,1) Sebaran Y~N(M,SD) dan Z~N(0,1) P(x) 0.0 0.1 0.2 0.3 0.4 P(x) 0.0 0.1 0.2 0.3 0.4-6 -4-2 0 2 4 6-6 -4-2 0 2 4 6 Sebaran Y~N(M,SD) X dan Z~N(0,1) X Sebaran Y~N(M,SD) dan Z~N(0,1) P(x) 0.0 0.1 0.2 0.3 0.4 P(x) 0.0 0.1 0.2 0.3 0.4-6 -4-2 0 2 4 6-6 -4-2 0 2 4 6 X X
Distribusi Normal Distribusi Normal Prob 0.00 0.05 0.10 0.15 0.20 P0.95 0.025 0.025 6.08 13.92 Prob 0.00 0.05 0.10 0.15 0.20 P0.99 0.005 0.005 4.848 15.152 4 6 8 10 12 14 16 Rentang Nilai 4 6 8 10 12 14 16 Rentang Nilai
BentukumumKurvaDistribusi Normal Disebut juga dengan Distribusi Gauss. f(x) -σ σ 1 X-µ - 2 σ 1 f( X) = e σ 2 π σ = simpangan baku µ = rata - rata π = 3,14159... µ X e = 2,71828...
6.2. Luas daerah di bawah kurva Normal Luas daerah kurva normal antara x = a dan x = b dinyatakan sbb: b 1 x µ 2 σ 2 1 P(a x b) = f(x)dx = e dx 2πσ 2 a b a dnorm(x) 0.0 0.1 0.2 0.3 0.4-4 -2 0 2 4 a b Gambar 6.5 Luas daerah P(a<x<b)= luas daerah di arsir x
Fungsi padat perubah acak normal X, dengan rata-rata 2 dan variansi σ dinyatakan sebagai: 1 x ( )( µ ) 2 n(x; µσ, ) = 1 e 2 σ ; < x< 2πσ µ dengan π = 3, 14159... dan e = 2, 71828... µ 2 Begitu dan σ diketahui, maka kurva normal dapat ditentukan. Misal: µ = 50; σ = 5 maka ordinat n(x; 50, 5) dengan mudah dapat dihitung.
Untuk mengatasi kesulitan menghitung integral. Gunakan tabel distribusi normal standart (Z) yaitu distribusi normal dengan µ = 0 danσ 2 = 1 x µ Caranya menggunakan transformasi dengan rumus z= σ Setiap pengamatan perubah acak X dapat ditransformasikan ke perubah acak Z dengan rata-rata 0 dan variansi 1. x µ Jika X mendapat nilai padananya diberikan oleh z= σ. Jadi jika X bernilai x = x 1 dan x = x 2 maka perubah acak Z akan Bernilai x1 µ dan x z kemudian dinyatakan sebagai: 1= 2 µ z σ 2 = σ 2 x2 1 x µ z 2 1 2 1 2 1 ( z) P(x 2 1 x x 2) e σ = dx= e dx 2 2 2πσ x 2πσ 1 z1 z2 = n(z, 0, 1) dx= P(z1 < z< z 2) z1
0.0 0.1 dnorm(x, 1, 0.75) 0.2 0.3 0.4 0.5-4 -2 0 2 4 Gambar 6.6 P(x1<x<x2) untuk kurva normal yang berbeda x X1 x2
Distribusi Normal Baku Distribusi perubah acak normal dengan rata-rata nol dan variansi 1 disebut distribusi normal baku dno orm(x, -1, 0.5) 0.4 0.6 0.8 0.0 0.2 dn norm(x, 0, 1) 0.2 0.3 0.4 0.0 0.1-4 -3-2 -1 0 1 2 x1 x2 z1 z2-4 -2 0 2 4 P(x1 < x< x 2) P(z1 < z< z 2) Ganbar 6.7 Distribusi normal asli dan yang telah ditransformasikan z P(x1 < x< x 2) = P(z1 < x< z 2)
Probabilitas P(a<X<b) P(a<X<b) ditentukan oleh luas daerah dibawah kurva f(x) f(x) Menghitungnya luas daerah di bawah kurva f(x) dengan interval a dan b dilakukan dengan menggunakan rumus integral. Akan lebih mudah dihitung jika nilainilai X ditransformasikan menjadi nilai-nilai baku Z. a µ b X Z= X -µ σ
Probabilitas P(a<X<b) (lanjutan) µ-3σ µ-2σ µ-σ µ µ+σ µ+2σ µ+3σ -3-2 -1 0 1 2 3 Dengan transformasi tersebut maka diperoleh Distribusi Normal Z yang mempunyai rata-rata µ = 0 dan simpangan baku σ = 1. Distribusi Normal Z ini disebut dengan Distribusi Normal Standar. Probabilitas menjadi P(z1<Z<z2).
Probabilitas P(a<X<b) (lanjutan) f(x) -3-2 -1 0 1 2 3 X z1 z2
Probabilitas P(a<X<b) (lanjutan) Probabilitas P(z1<Z<z2) dihitung dengan memakai tabel Distribusi Normal Standar. Contoh : Tentukan probabilitas dari P ( 0 < Z 2,53 ) Jawab : 0 2,53 Daerah P(0<Z<2,53) Dari tabel diperoleh 0,4943 P ( 0< Z 2,53) Maka = 0,4943
Contoh 6.1 Diketahui suatu distribusi normal dengan µ = 50 σ = 10 dan antara 45 dan 62 Jawab: Dicari nilai z yang berpadaan dengan z 45 50 1= = 0. 5 10 Jadi: dan Carilah probabilitas bahawa X mendapat nilai 62 50 2 10 x z = = 1. 2 P( 45< x < 62) = P( 0, 5< z < 1. 2) = 45 dan x = 62 1 2 adalah 0.00 0.01 0.02 0.03 0.0 04 0 20 40 60 80 100 P( 45< x < 62) Gambar 6.7 Luas daerah contoh 6.1 0.0 0.1 0.2 0.3 0.4-4 -2 0 2 4 P( 0, 5< z < 1. 2)
Gunakan tabel distribusi normal standart, diperoleh: P( 45< x < 62) = P( 0, 5< z < 1, 2) = P(z < 1, 2) P(z < 0, 5) = 0, 8849 0, 3085 = 0, 5764 Tabel 6.1. Luas daerah di bawah kurva normal z 0.00 0.04.. 0.09 : : -0.5 0.3085 0 : : 1.2 0.8849 : :
PELUANG EKSAK No B.Bawah B. Atas Luas (Peluang) 1 Mean -1,645 Deviasi Baku 2 Mean -1,96 Deviasi Baku Mean + 1,645 Deviasi Baku Mean +1,96 Deviasi Baku 90% 95% 3 Mean -2,58 Deviasi Baku Mean +2,58 Deviasi Baku 99%
LATIHAN Hitung probabilitas dari nilai Z berikut : P(Z<-1,75) P(-2,75<Z<-1,52) P(Z>-1,52) P(Z<0,97) Bila X adalah variabel acak berdistribusi normal dengan rata-rata 25 dan simpangan baku 10, tentukan probabilitas P(20<X<38)!
Distribusi Kumulatif Perhitungan probabilitas variabel random Z yang berdistribusi normal standar akan lebih mudah dihitung dengan memakai fungsi distribusi kumulatif. Distribusi kumulatif dari Z adalah F(z) dimana F(z) = P(Z<z) sehingga : P ( z1< Z< z2) = P( Z< z2) P( Z< z1) = F ( z2) F( z1)
Hitung probabilitas dari P(-1,43<Z<2,53) a. Dengan distribusi normal standar b. Dengan distribusi kumulatif Jawab: a. P(-1,43<Z<2,53)=P(0<Z<1,43)+P(0<Z<2,53) =0,4236+0,4943=0,9179 b. P(-1,43<Z<2,53)=F(2,53)-F(-1,43) Dari tabel distribusi normal standar kumulatif nilai z2=2,53 ada diantara 2,50 dan 2,55 juga diantara 2,326 dan 2,576. Kita pilih yang I. Sedangkan nilai z1=-1,43 ada diantara -1,405 dan -1,476 juga diantara -1,40 dan -1,45. Kita pilih yang II. Jika za=2,50 dan zb=2,55 kemudian Lz2=luas daerah (besar nilai) z2, Lza dan Lzb masing-masing untuk za dan zb maka besar z2 dapat dihitung dengan rumus : z2 - za zb - za = Lz2- Lza Lzb - Lza
2,53-2,50 2,55-2,50 Lz2= (-1,40) Lz1-0,0808 = (-1,40) -1,43- -1,45- Lz1= Jadi P Contoh (lanjutan) = 0,99428 Lz2-0,9938 0,9946-0,9938 0,07642 0,0735-0,0808 (-1,43< Z< 2,53) = F( 2,53) F( -1,43) = 0,99428-0,07642 = 0,91786
Contoh Distribusi Normal 1. Tinggi badan mahasiswa ITB berdistribusi normal dengan µ= 165 cm dan σ= 10 cm. Berapa probabilitas seorang mahasiswa yang dipilih secara acak memiliki tinggi lebih dari 180 cm? Tentukan ambang di mana persentase mahasiswa yang melewati ambang batas ini tidak lebih dari 5%!
Contoh Distribusi Normal 2. Sebuah pabrik lampu menghasilkan lampu dengan usia nyala yang berdistribusi normal dengan µ= 2500 jam dan σ= 100 jam. Suatu batch dinyatakan sebagai baik kalau dari 5 lampu yang diuji, maksimum 1lampu yang usianya kurang dari 2350 jam. Berapa probabilitas suatu batch dinyatakan baik? Kalau terjadi kerusakan pada proses produksi sehingga µ-nya menjadi 2400 jam, berapa probabilitas kerusakan ini terdeteksi?
Pendekatan Distribusi Normal Terhadap Distribusi Binomial Pada saat nsangat besar dan ptidak bernilai ekstrim mendekati 0 atau 1, perhitungan terhadap distribusi binomial dapat dilakukan dengan menggunakan pendekatan perhitungan distribusi normal. Teorema: Jika Xadalah sebuah variabel random binomial dengan mean µ= np dan variansi σ 2 = npq, maka bentuk limit pada saat n dari distribusi binomial tersebut adalah: Z = X np npq dengan z berdistribusi normal baku n(z; 0,1)
Pendekatan Dist. Normal atas Dist. Binomial (Contoh) Probabilitas seorang pencandu narkoba terkena virus hepatitis B dari sebuah suntikan adalah 0,6. Jika di suatu kota terdapat 1000 orang pecandu, tentukan probabilitas bahwa tidak kurang dari 100 orang pecandu tersebut mengidap virus hepatitis B!
LATIHAN 1. Jika diketahui variabel random X mempunyai distribusi normal dengan rata-rata 18 dan standar deviasi 2,5 hitung nilai k sehingga P(X<k)=0,2578! 2. Sebanyak 1000 rim kertas koran dengan berat 60 gram diketahui bahwa rata-rata tiap rimnya berisi 450 lembar dengan standar deviasi 10 lembar. Jika distribusi jumlah kertas per rim tersebut berdistribusi normal, berapa persen dari kertas rim itu yang berisi 455 lembar atau lebih?
LATIHAN (lanjutan) 3. Nilai ujian statistika sebagian besar mahasiswa mempunyai distribusi normal dengan rata-rata 34 dan standar deviasi 4. Jika X menyatakan nilai-nilai mahasiswa tersebut, berapakah batas nilai Xo agar 10% dari kelompok nilai terendah berada dibawah Xo? 4. Dari 200 mahasiswa yang mengikuti ujian Statistika diperoleh nilai rata-ratanya adalah 60 dan standar deviasinya adalah 10. Bila distribusinya menyebar secara normal, berapa : a. persen yang mendapat nilai A jika nilai A>=80 b. persen yang mendapat nilai C jika nilai C terletak pada interval 56<=C<=68 c. persen yang mendapat nilai E jika nilai E<45
LATIHAN (lanjutan) 5. Suatu percobaan mengenai ukuran ruang memori dengan menggunakan metode Quickshort menyatakan bahwa ukuran penggunaan ruang memori berdistribusi normal dengan rata-rata 510,8 byte dan simpangan baku 40,67 byte. a. Berapa persen dalam percobaan tersebut ditemukan ruang memori yang melebihi 600 byte? b. Jika ditemukan 10 buah percobaan mempunyai ruang memori berkisar antara 500 sampai 550 byte, berapakah jumlah percobaan yang telah dilakukan oleh peneliti? c. Jika dalam percobaan tersebut ditemukan bahwa 10% hasil terendah, berapakah ukuran memori tertinggi dari kelompok hasil percobaan dengan ukuran memori terendah tersebut?