MATERI STATISTIK Distribusi Frekwensi Perhitungan Tendensi Pusat Penyimpangan atau Dispersi Teori Probabilitas Teori Distribusi Distribusi Sampling / Pengambilan Contoh Pengujian Hipotesis Regresi dan Korelasi Linear Sederhana Statistik Nonparametrik
Daftar Pustaka 1. Spiegel, M.R., "Theory and Problms of Statistics (Schaum's Outline), 2nd ed in SI Units", Mc Graw- Hill Book Co. Singapore, 1992 2. Waypole, R.E, R.H Myers, "Probability and Statistics for Engineers and Scientists", 4th ed. Macmillan Publishing Company, USA, 1994 3. Ir. M.Iqbal hasan, M.M. "Pokok-Pokok Statistik 1 " Edisi Kedua, Penerbit Bumi Aksara, 2002 4. Ir. M.Iqbal hasan, M.M. "Pokok-Pokok Statistik 2 " Edisi Kedua, Penerbit Bumi Aksara, 2002 5. Danang Sunyoto, "Ringkasan Statistik Deskriptif : Teori, Soal dan Penyelesaiannya
Jenis-jenis Distribusi Frekwensi Distribusi frekwensi adalah susunan data menurut kelas-kelas interval tertentu atau menurut kategori tertentu dalam sebuah daftar, sehingga dapat diperoleh gambaran sederhana dan sistematis dari data yg diperoleh. Bagian-bagian Distribusi Frekwensi : 1. Kelas (Class) Kelas adalah kelompok nilai data atau variabel 2. Batas Kelas (Class limits) Batas kelas adalah nilai-nilai yg membatasi kelas yg satu dgn kelas lainnya, terdapat 2 kelas yaitu batas kelas bawah (lower class limits) yg terletak disebelah kiri setiap kelas, dan batas kelas atas (upper class limits) yg terletak disebelah kanan setiap kelas
3. Tepi Kelas (Class boundary/true class limits) Tepi kelas disebut juga batas nyata kelas yg tak mempunyai lubang u/ angka tertentu antara kelas yg satu dgn lainnya. Tepi bawah kelas (batas kelas bawah) : tepi bawah kelas= batas bawah kelas 0,5 Tepi atas kelas (batas kelas atas) : tepi atas kelas= batas atas kelas + 0,5 4. Titik tengah kelas/tanda kelas (Class mid point/class marks) Titik tengah kelas adalah angka atau nilai data yg tepat terletak di tengah suatu kelas yg mewakili kelasnya. Titik tengah kelas= ½(batas atas+batas bawah) kelas 5. Interval kelas (class interval) Interval kelas adalah selang yg memisahkan kelas yg satu dgn kelas yg lain
6. Panjang interval kelas/luas kelas (Interval Size) Panjang interval kelas adalah jarak antara tepi atas kelas dan tepi bawah kelas. 7. Frekwensi kelas (Class frequency) Frekwensi kelas adalah banyaknya data yg termasuk ke dlm kelas tertentu Penyusunan Distribusi Frekwensi : 1. Mengurutkan data dari yg terkecil ke terbesar 2. Menentukan jangkauan (range) dari data Jangkauan (R) = data terbesar data terkecil 3. Menentukan banyaknya kelas (k) Rumus Sturgess : k = 1 + 3,3 log n; n=banyaknya data, k Є bulat ( bulatkan ke atas) atau R k = + 1 i
4. Mentukan panjang interval kelas i = R k 5. Menentukan batas bawah kelas pertama Biasanya dipilih dari data terkecil atau dari pelebaran (data yg lebih kecil dari data terkecil) dan selisihnya harus kurang dari panjang interval kelas 6. Menuliskan frekwensi kelas secara melidi dlm kolom turus (tally) sesuai banyaknya data
78 72 74 79 74 71 75 74 72 68 72 73 72 74 75 74 73 74 65 72 66 75 80 69 82 73 74 72 79 71 70 75 71 70 70 70 75 76 77 67 65 66 67 68 69 70 70 70 70 71 71 71 72 72 72 72 72 72 73 73 73 74 74 74 74 74 74 74 75 75 75 75 75 76 77 78 79 79 80 82 Jangkauan R = 82 65 = 17 Banyaknya kelas (k) adalah k = 1 + 3,3 log 40 = 1 + 5,3 = 6,3 6 Panjang interval kelas (i) = 17 / 6,3 = 2,7 3 Batas kelas pertama = 65
Diameter Turus Frekwensi FKKD FKLD 0 40 65 67 III 3 3 37 68 70 IIII I 6 9 31 71 73 IIII IIII II 12 21 19 74 76 IIII IIII III 13 34 6 77 79 IIII 4 38 2 80 82 II 2 40 0 Jumlah 40
45 40 35 30 25 20 FKKD FKLD 15 10 5 0 65 68 71 74 77 80 83 Kurva Genrawan Ogive Hoendarto
Jenis-jenis Distribusi Frekwensi 1. Distribusi frekwensi biasa : Distribusi frekwensi numerik Distribusi frekwensi peristiwa/ kategori 2. Distribusi frekwensi relatif : dinyatakan dalam bentuk perbandingan, desimal atau persentasi 3. Distribusi frekwensi kumulatif : Distribusi frekwensi kumulatif kurang dari Distribusi frekwensi kumulatif lebih dari
Kurva Frekwensi 1. Simetris atau berbentuk lonceng => distribusi normal 2. Tidak Simetris atau condong : ke kiri (kecondongan negatif) dan ke kanan (kecondongan positif) 3. Bentuk J atau J terbalik dimana salah ujung kurva memiliki frekwensi maksimun 4. Bentuk U dimana kedua ujung kurva memiliki frekwensi maksimun 5. Bimodal dimana memiliki 2 maksimal 6. Multimodal dimana memiliki lebih dari 2 maksimal 7. Uniform bila nilai-nilai variabel dalam suatu interval mempunyai frekwensi yang sama
PENGUKURAN NILAI PUSAT Ukuran nilai/tendensi pusat : suatu nilai yg dapat mewakili sekumpulan data atau dianggap sebagai rata-rata. Jenis-jenis ukuran nilai pusat : 1. Rata-rata hitung/mean, jika data berupa sampel ditulis X (baca eks bar) jika berupa populasi ditulis µ (baca myu) : a. Data yg tdk dikelompokkan X = ΣX/n = (X 1 + X 2 + + X n ) / n
b. Data yg dikelompokkan 1) Metode biasa : X = ΣfX/f 2) Metode simpangan rata-rata : X = M + Σfd / Σf _ M = rata-rata hitung x sementara d = X M 3) Metode coding : X = M + i. Σfu/ Σf
2. Median ( Me atau Md ) : nilai yg tepat berada ditengah data setelah diurutkan, maka disebut juga rata-rata posisi a. Data yg tdk dikelompokkan/tunggal Me = ½ ( n + 1 ) b. Data yg dikelompokkan 1 n ( f2)0 M e = TKB + 2. f M e i TKB = tepi kelas bawah n = jumlah frekwensi (Σ f2 )0 = jlh frek kelas2 seb kelas median i = panjang interval kelas f Me = frekwensi kelas median
3. Modus (Mo) : nilai yg paling sering muncul (frekwensi terbanyak) dalam data a. Data yg tdk dikelompokkan/tunggal b. Data yg dikelompokkan d1 Mo = TKB + i. d + d 1 2 TKB = tepi kelas bawah d 1 = selisih frekwensi kelas modus dengan fre2 kelas sebelumnya d 2 = selisih frekwensi kelas modus dengan fre2 kelas sesudahnya i = panjang interval kelas
Fraktil Fraktil adalah nilai-nilai yg membagi seperangkat data yg terurut menjadi beberapa bagian yg sama. Fraktil dapat berupa kuartil, desil dan persentil. a. Kuartil ( Q ), fraktil yg membagi data yg terurut menjadi 4 bagian yg sama. Terdapat 3 kuartil yaitu kuartil bawah/pertama (Q 1 ), Kuartil tengah/kedua (Q 2 ) dan kuartil atas/ketiga (Q 3 ). Kuartil kedua = median. 1. Kuartil data tunggal : j( n + 1) Q nilai ke j j = 4 2. Kuartil data berkelompok : Q jn ( f j)0 = TKB 4 j + i j = 1, 2, 3 f j. Q j
b. Desil ( D ), fraktil yg membagi data yg terurut menjadi 10 bagian yg sama. Terdapat 9 desil yaitu desi pertama (D 1 ), desi kedua (D 2 ), dan desil kesembilan (D 9 ). Desil kelima (D 5 ) sama dengan median. 1. Desil data tunggal : D j = nilai ke j(n+1)/10 j= 1,2,, 9 2. Desil data berkelompok : D j= 1,2,, 9 jn ( 10 j j = TKB j +. f D j f )0 i
c. Persentil ( P ), fraktil yg membagi data yg terurut menjadi 100 bagian yg sama. Terdapat 99 persentil yaitu persentil pertama (P 1 ), persentil kedua (P 2 ), dan persentil kesembilan puluh sembilan (P 99 ). Persentil kelima puluh (P 50 ) sama dengan median. 1. Persentil data tunggal : P j = nilai ke j(n+1)/100 j= 1,2,, 99 2. Persentil data berkelompok : P j= 1,2,, 99 jn ( 100 j j = TKB j +. f P j f )0 i
Rata-rata Kuadrat / Quadratic Mean Rata-rata kuadrat merupakan pengembangan dari rata-rata hitung melalui pengkuadratan dan pengakaran data a.data yg tdk dikelompokkan/tunggal b.data yg dikelompokkan n X n x x x Q i n M = + + + = ) (... ( 2 2 2 2 2 1 n X f n x f x f x f Q i i n n M = + + + = ) (... ( 2 2 2 2 2 2 1 1
Rata-rata Ukur / Rata-rata Geometris Jika perbandingan setiap dua data berurutan adalah tetap atau hampir tetap, maka rata-rata ukur lebih baik digunakan daripada rata-rata hitung a.data yg tdk dikelompokkan/tunggal G = n x x... xn 1. 2 atau 1 log G = (log x + log x2 +... + log x n 1 n b.data yg dikelompokkan log G = ( f.log f x) )
Rata-rata Harmonis / Harmonic Mean Pada umumnya rata-rata harmonis digunakan untuk menghitung data tentang rata-rata tingkat pertumbuhan/kecepatan a.data yg tdk dikelompokkan/tunggal b.data yg dikelompokkan = + + + = i M n M x n H atau x x x n H 1 1... 1 1 2 1 = i i M x f f H
HUBUNGAN RATA-RATA HITUNG, MEDIAN DAN MODUS Hubungan antara ketiganya akan memberikan gambaran bentuk kurva data ybs, yaitu : 1. Jika rata-rata hitung, median dan modus memiliki nilai yg sama, maka kurvanya berbentuk simetris dimana ketiganya terletak pada titik di tengah-tengah absis dan berimpit 2. Jika rata-rata hitung lebih besar daripada yg lainnya, maka kurvanya condong ke kanan dgn ekor memanjang ke arah positif 3. Jika rata-rata hitung lebih kecil daripada yg lainnya, maka kurvanya condong ke kiri dgn ekor memanjang ke arah negatif
KURVA HUBUNGAN RATA-RATA HITUNG, MEDIAN DAN MODUS X = Me = Mo X > Me > Mo X < Me < Mo
Jika distribusinya tidak terlalu condong, hubungan rata-rata hitung, median dan modus secara matematis ditulis : Mo = X 3 ( X Me )
Rata-rata ukur untuk pertumbuhan atau kenaikan X t P t = P0 (1 + ) Atau : P t = P 0 ( 1 + r ) t Atau : r = P t = keadaan akhir pertumbuhan P 0 = keadaan awal pertumbuhan X = rata-rata pertumbuhan t = satuan waktu yg digunakan r = tingkat bunga t P t P0 1 100
Penyimpangan atau Dispersi Ukuran dispersi (ukuran variasi / penyimpangan) adalah ukuran yg menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yg berbeda dengan nilai-nilai pusatnya. Jadi merupakan pelengkap dari nilai pusat dalam penggambaran sekelompok data sehingga lebih jelas dan tepat
Jenis-jenis dispersi 1.Jangkauan (range / R) : selisih nilai terbesar dengan nilai terkecil data setelah diurutkan. a. Jangkauan data tunggal : R = X n X 1 b. Jangkauan data berkelompok : 1) Selisih titik tengah kelas tertinggi dgn titik tengah kelas terendah 2) Selisih tepi atas kelas tertinggi dgn tepi bawah kelas terendah
2.Jangkauan antarkuartil dan jangkauan semi interkuartil a. Jangkauan antarkuartil : selisih antara nilai kuartil atas (Q 3 ) dengan nilai kuartil bawah ( Q 1 ) : JK = Q 3 Q 1 b. Jangkauan semi interkuartil : setengah dari selisih kuartil atas (Q 3 ) dengan nilai kuartil bawah ( Q 1 ) : Q d = ½ (Q 3 Q 1 ) Berlaku untuk data tunggal maupun data berkelompok. Pencilan : data yg dianggap salah catat/ukur atau dari kasus yg menyimpang, karenanya perlu diteliti ulang. Pencilan kurang dari pagar dalam dan lebih dari pagar luar
3.Deviasi rata-rata (simpangan ratarata) : nilai rata-rata hitung dari harga mutlak simpangan-simpangannya. a. Deviasi rata-rata data tunggal : DR = 1/n Σ X X = ( Σ X X ) / n b. Deviasi rata-rata data berkelompok : DR = 1/n Σ f X X = ( Σf X X ) / n
4.Varians : nilai tengah kuadrat simpangan dari nilai tengah atau simpangan rata-rata kuadrat. Untuk sampel disimbolkan s 2 dan populasi disimbolkan σ 2. a. Varians data tunggal : 1. Metode biasa a. Untuk sampel besar (n>30) : s 2 = (Σ(X X) 2 ) / n b. Untuk sampel kecil (n=<30) : s 2 = (Σ(X X) 2 ) / n - 1
2. Metode angka kasar a. Untuk sampel besar (n>30) : s 2 = ΣX 2 / n (ΣX / n) 2 b. Untuk sampel kecil (n=<30) : s 2 = ΣX 2 / n-1 (ΣX ) 2 / n(n-1) b. Varians data berkelompok 1. Metode biasa a. Untuk sampel besar (n>30) : s 2 = (Σf(X X) 2 ) / n b. Untuk sampel kecil (n=<30) : s 2 = (Σf(X X) 2 ) / n - 1
2. Metode angka kasar a. Untuk sampel besar (n>30) : s 2 = ΣfX 2 / n (ΣfX / n) 2 b. Untuk sampel kecil (n=<30) : s 2 = ΣfX 2 / n-1 (ΣfX) 2 / n(n-1) 3. Metode coding a. Untuk sampel besar (n>30) : s 2 = i 2 (Σfu 2 ) / n - (Σfu / n ) 2 b. Untuk sampel kecil (n=<30) : s 2 = i 2 (Σfu 2 ) / n-1 - (Σfu) 2 / n(n-1)
Varians gabungan Misalkan, terdapat k buah subsampel sebagai berikut : -Subsampel 1, berukuran n 1 dgn varians s 1 2 -Subsampel 2, berukuran n 2 dgn varians s 2 2 -,. -Subsampel k, berukuran n k dgn varians s k 2 Jika digabungkan menjadi sebuah sampel berukuran n 1 + n 2 + + n k = n, maka varians gabungannya : s gab2 = (n 1-1)s 12 + (n 2-1)s 22 + + (n k - 1)s k 2 ( n 1 + n 2 + + n k ) - k atau s gab2 = ((Σn 1)s 2 ) / Σ n - k
5.Simpangan baku (standar deviasi) : akar dari tengah kuadrat simpangan dari nilai tengah atau akar simpangan rata-rata kuadrat. Untuk sampel disimbolkan s dan untuk populasi disimbolkan σ. a. Simpangan baku data tunggal : 1. Metode biasa a. Untuk sampel besar (n>30) : s = (Σ(X X) 2 ) / n b. Untuk sampel kecil (n=<30) : s = (Σ(X X) 2 ) / n -1 2. Metode angka kasar a. Untuk sampel besar (n>30) : s = ΣX 2 / n (ΣX / n) 2 b. Untuk sampel kecil (n=<30) : s = ΣX 2 / n-1 (ΣX ) 2 / n(n-1)
b. Simpangan baku data berkelompok : 1. Metode biasa a. Untuk sampel besar (n>30) : s = (Σf(X X) 2 ) / n b. Untuk sampel kecil (n=<30) : s = (Σf(X X) 2 ) / n -1 2. Metode angka kasar a. Untuk sampel besar (n>30) : s = ΣfX 2 / n (ΣfX / n) 2 b. Untuk sampel kecil (n=<30) : s = ΣfX 2 / n-1 (ΣfX) 2 / n(n-1) 3. Metode coding a. Untuk sampel besar (n>30) : s = i Σfu 2 / n (Σfu / n) 2 b. Untuk sampel kecil (n=<30) : s = i Σfu 2 / n-1 (Σfu) 2 / n(n-1)
Koefisien Variasi, ukuran dispersi yg dibahas sebelumnya merupakan dispersi absolut yg hanya dapat digunakan untuk melihat penyimpangan-penyimpangan nilai yg terdapat pda suatu kumpulan data, untuk membandingkan dispersi atau variasi dari beberapa kumpulan data digunakan dispersi relatif : Dispersi relatif = dispersi absolut/rata-rata
1. Koefisien Variasi ( KV) : KV = s / X X 100% 2. Variasi Jangkauan ( VR) : VR = R / X X 100% 3. Variasi Simpangan rata-rata ( VSR) : VSR = SR / X X 100% 4. Variasi Kuartil ( VQ ) : VQ = Q d / M e X 100% VQ = Q 3 Q 1 / Q 3 + Q 1 X 100%
Deviasi Kuartil : rentang antar kuartil, yaitu antara nilai kuartil 1 s/d kuartil 3, jadi mengabaikan 25% nilai terendah dan 25% nilai tertinggi. Koefisien variasi kuartil : V = deviasi kuartil / median Atau : DK V = = ( Q ( Q 3 Q1) 2 3 2Q Q 2 1 )
Kemencengan atau Kecondongan Kemencengan/kecondongan (skewness) : tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi, jadi X = Me = Mo. 1. Koefisien kemencengan Pearson : nilai selisih rata-rata dengan modus dibagi simpangan baku : sk = ( X Mo ) / s Atau sk = 3 ( X Me ) / s
Sk = 0 -> kurva memiliki bentuk simetris Sk > 0 -> X terletak di sebelah kanan Mo, ekor kurva memanjang ke kanan atau menceng positif Sk < 0 -> X terletak di sebelah kiri Mo, ekor kurva memanjang ke kiri atau menceng negatif
2.Koefisien kemencengan Bowley : berdasarkan hubungan kuartil-kuartil dari sebuah distribusi. (Q 3 Q 2 ) ( Q 2 Q 1 ) Sk B = (Q 3 Q 2 ) + ( Q 2 Q 1 ) Atau : Q 3 2 Q 2 + Q 1 Sk B = Q 3 Q 1
Koefisien kemencengan Bowley sering disebut kuartil koefisien kemencengan : 1. Jika Q 3 -Q 2 > Q 2 -Q 1, maka akan menceng ke kanan atau positif 2. Jika Q 3 -Q 2 < Q 2 -Q 1, maka akan menceng ke kiri atau negatif 3. sk B = ± 0,10 maka distribusi yg menceng tidak berarti 4. sk B > 0,30 maka distribusi yg menceng berarti
3.Koefisien kemencengan Persentil : berdasarkan hubungan antarpersentil (P 90, P 50 & P 10 ) dari sebuah distribusi. (P 90 P 50 ) ( P 50 P 10 ) Sk P = (P 90 P 10 ) Atau : P 90 2 P 50 + P 10 Sk P = P 90 P 10
4.Koefisien kemencengan Momen : berdasarkan pada perbandingan momen ke-3 dengan pangkat tiga simpangan baku. Koefisien ini disebut juga kemencengan relatif α 3. 1.α 3 = 0, maka distribusi simetris 2.α 3 = +, maka distribusi menceng ke kanan 3.α 3 = -, maka distribusi menceng ke kiri 4.α 3 > 0,50, menurut Karl Pearson adalah distribusi sangat menceng 5.Menurut Kenney dan Keeping nilai α 3 bervariasi antara ± 2 untuk distribusi yang menceng
- Untuk data tunggal : α M 3 1/n Σ(X-X) 3 3 = = s 3 s 3 - Untuk data berkelompok : M 3 1/n Σ(X-X) 3 f α 3 = = s 3 s 3 α i 3 Σfu 3 Σfu 2 Σfu Σfu 3 3 = X - 3 +2 s 3 n n n n
Keruncingan ( Kurtosis ) Keruncingan : tingkat kepuncakan dari sebuah distribusi yang biasanya diambil secara relatif terhadap suatu distribusi normal. 1. Leptokurtik merupakan distribusi yg memiliki puncak relatif tinggi 2. Platikurtik merupakan distribusi yg memiliki puncak hampir mendatar 3. Mesokurtik merupakan distribusi yg memiliki puncak tidak tinggi dan tidak mendatar Jika distribusinya merupakan distribusi simetris, maka distribusi mesokurtik dianggap sebagai distribusi normal
a. Koefisien keruncingan (kurtosis) dilambangkan dengan α 4. Jika : α 4 < 3, maka distribusinya adalah distribusi platikurtik α 4 > 3, maka distribusinya adalah distribusi leptokurtik α 4 = 3, maka distribusinya adalah distribusi mesokurtik 1. Untuk data tunggal : 1/n Σ(X-X) α 4 4 = s 4 2. Untuk data berkelompok : 1/n Σ(X-X) 4 f α 4 = s 4
b. Koefisien kurtosis Persentil dilambangkan dengan K (kappa). ½ (Q 3 Q 1 ) K = P 90 - P 10 Bilangan z ( z score ) Dari sampel ukuran n data X 1, X 2,.. X n dengan rata-rata X dan simpangan baku s, dapat dibentuk data baru z 1, z 2,... Z n dgn menggunakan bilangan z : z i = ( X i X ) / s i = 1, 2, 3,.. Variabel baru ini mempunyai rata-rata 0 dan simpangan baku 1. Bilangan z sering diubah menjadi distribusi yg baru dgn rata-rata x 0 dan simpangan baku s 0 yg disebut angka standar atau angka baku : z i = X 0 + s 0 ((X i X) / s ) maka jika X 0 = 0 dan s 0 = 1, rumusnya kembali ke asal
Keruncingan ( Kurtosis ) Keruncingan atau kurtosis : tingkat kepuncakan dari sebuah distribusi yang biasanya diambil secara relatif terhadap suatu distribusi normal. Berdasarkan keruncingan, kurva distribusi dibedakan atas 3 macam : 1. Leptokurtik : distribusi yg memiliki puncak relatif tinggi 2. Platikurtik : distribusi yg memiliki puncak hampir datar 3. Mesokurtik : distribusi yg memiliki puncak tidak tinggi dan tidak mendatar juga
Jika distribusinya simetris maka distribusi mesokurtik dianggap sebagai distribusi normal. 1. Koefisien keruncingan/kurtosis ( α 4 ) - α 4 < 3, maka distribusi platikurtik - α 4 > 3, maka distribusi leptokurtik - α 4 = 3, maka distribusi mesokurtik a. Data tunggal 1/n Σ(X X) α 4 4 = s 4 b. Data berkelompok 1/n Σ(X X) 4 f α 4 = s 4
2. Koefisien Kurtosis Persentil K (kappa), untuk distribusi normal, nilai K = 0,263 K = ½ ( Q 3 Q 1 ) P 90 P 10