Distribution Widya Rahmawati Contoh Kasus Mahasiswa A sudah mendapatkan data hasil penelitian Mahasiswa A sedang mempertimbangkan angka statistik mana yang sebaiknya ditampilkan (mean atau median) analisis statistik mana yang sebaiknya digunakan (parametrik atau non parametrik) 2 1
Contoh Kasus Agar mahasiswa A dapat memutuskan angka statistik mana yang akan ditampilkan (mean atau median), dan analisis statistik mana yang sebaiknya digunakan (parametrik atau non parametrik) Maka mahasiswa A harus memahami konsep Distribusi Normal 3 Variation in Continues and Categorical Data 4 2
Sifat-Sifat Distribusi Normal: Bentuk distribusi normal ditentukan oleh μ dan σ. 2 1 2 1 μ 1 = μ 2 σ 1 > σ 2 μ 1 < μ 2 σ 1 = σ 2 2 1 μ 1 < μ 2 σ 1 < σ 2 5 Skewness Skewness adalah derajat ketidaksimetrisan suatu distribusi. Jika kurva frekuensi suatu distribusi memiliki ekor yang lebih memanjang ke kanan (dilihat dari meannya) maka dikatakan menceng kanan (positif) dan jika sebaliknya maka menceng kiri (negatif). Yang menjadi acuan: nilai yang ekstrim 6 3
Kurtosis Kurtosis adalah derajat keruncingan suatu distribusi (biasanya diukur relatif terhadap distribusi normal). Kurva yang lebih lebih runcing dari distribusi normal dinamakan leptokurtik, yang lebih datar platikurtik dan distribusi normal disebut mesokurtik. 7 Distribusi Normal Sekitar 68% (2/3) luas dari kurva distribusi normal berada ± 1 SD dari nilai mean, atau 68% dari peluang sampel yang diambil secara acak akan berada diantara mean ± 1 SD ± 1 z-score Sekitar 95% dari luas kurva normal berada pada ± 2 SD daro nilai mean (tepatnya 1,96 SD) ± 2 z-score Sekitar 99,7% dariluas kurva normal berada dalam ± 3 SD dari nilai mean ± 3 z-score 8 4
Distribusi Normal x ± 1 SD = ± 1 z-score= 68% X ± 2 SD = ± 2 z-score = 95% 9 X ± 3 SD = ± 3 z-score = 99,7% CIRI DISTRIBUSI NORMAL 1. Nilai mean, median (nilai tengah) dan modus (puncak) adalah sama/berhimpit. 2. Sebagian besar data terletak di bagian tengah kurva, dan hanya sebagian kecil data yang terletak pada kedua ekor kurva 3. Kurvanya simetris, berbentuk lonceng yang terbagi menjadi 2 bagian sama besar (simetris) 4. Luas daerah yang terletak dibawah kurva dan diatas garis mendatar = 1 10 5
Untuk data yang terdsitribusi normal, sebagian besar data terletak di antara mean ± 2 SD (sekitar 95% dari area kurva), dan hanya sebagian kecil (5% area kurva) yang terdapat diluar kurva Angka yang berada diluar kurva dianggap sebagai angka ekstrim (outlier) Oleh karenanya, angka 5% sering dipakai sebagai titik potong untk besarnya error yang dapat ditolelir atau menentukan apakah suatu hasil analisis statistik dikategorikan signifikan/tidak. 11 Besarnya error dari suatu uji statistik dapat dihitung, hasil perhitungannya disebut sebagai p-value P-value < 0,05: menunjukkan bahwa error uji statistik lebih kecil dari besarnya yang bisa ditolelir (0,05), maka hasil analisis tersebut adalah signifikan P-value>0,05: menunjukkan bahwa error uji statistik lebih besar dari besarnya error yang bisa ditolelir (o,05), maka hasil analisis tersebut adalah tidak signifikan UJI NORMALITAS: Jika p-value >0,05, maka tidak ada perbedaan antara nilai variabel yang diuji dengan distribusi data standart yang selalu normal, atau diatribusi data dari variabel yang diuji adalah NORMAL 12 6
Cara menilai normalitas distribusi data Metode Parameter Kriteria distribusi data dikatakan normal Keterangan Deskriptif Koefisien Varian Nilai koefisien varians < 30% SD/Mean x 100% Rasio Skewness Nilai Rasio skewness -2 s.d. +2 Skewness / SE Skewness Rasio Kurtosis Nilai rasio kurtosis -2 s.d. +2 Kurtosis / SE Kurtosis Histogram Simetris, tidak miring kiri maupun kanan, tidak terlalu tinggi atau terlalu rendah Box plot Simetris, median tepat di tengah, tidak ada outlier atau nilai ekstrim Normal Q-Q plots Data menyebar di sekitar garis Detrended Q-Q plots Data menyebar di sekitar garis pada nilai 0 Analitis Kolmogorov Smirnov Nilai kemaknaan (p) > 0,05 Untuk sampel besar (>50) Shapiro Wilk Nilai kemaknaan (p) > 0,05 Untuk sampel kecil ( 50) 13 Contoh kasus Suatu penelitian ingin menghubungkan rata-rata intake remaja dengan IMT nya. Sebelum menentukan uji yang akan dilakukan, terlebih dahulu dilakukan uji statistik untuk mengetahui normalitas distribusi data Berikut data IMT dan intake masing-masing subyek. No Intake Energi (kkal) IMT (kg/m2) 1 2300 24,22 2 2700 28,69 3 2600 27,55 4 2350 21,30 5 1800 19,25 6 2600 29,76 7 2100 22,72 8 2700 20,23 9 1900 20,24 10 2050 22,79 11 1900 23,01 12 2600 27,77 13 1650 16,63 14 2650 26,84 15 1950 19,15 16 1900 19,14 17 2500 26,14 18 1800 19,23 19 1700 18,42 20 1650 16,22 14 7
SPSS: Analyze Descriptive Statistics Explore 15 Statistics Descriptive Plots Histogram; Normality plots with test 16 8
Interpretasi hasil output: Data: IMT Koefisien varians = (standart deviasi / mean) x 100% (4.14 /22.46 )*100% = 18,43 % (berdasarkan koefisien varians = normal) Rasio Skewness = Skewness/SE Skewness 0.310 / 0.512 = 0,605 (berdasarkan rasio skewness = normal) Rasio Kurtosis = Kurtosis/SE Kurtosis -1.128 /.992 = 1,137 (berdasarkan rasio kurtosis = normal) Data: Intake (3.85732E2 / 2.1700E3) * 100% (385,73 / 2170,0 ) * 100% = 17,78 % (berdasarkan koefisien varians = normal) 0.135 / 0.512 = 0,264 (berdasarkan rasio skewness = normal) -1.654 /.992 = -1,667 (berdasarkan rasio kurtosis = normal) 17 Histogram Berdasarkan histogram: simetris Berdasarkan histogram: tidak simetris 18 9
Normal Q-Q Plot Berdasarkan Normal Q-Q plot: menyebar di sekitar garis Berdasarkan Normal Q-Q plot: menyebar di sekitar garis, jarak dengan garis lebih jauh 19 Detrended Normal Q-Q plot Berdasarkan Detrended Normal Q-Q plot: menyebar di sekitar garis titik nol Berdasarkan Detrended Normal Q-Q plot: menyebar di sekitar garis titik nol 20 10
Boxplot Berdasarkan boxplot: simetris, median berada tepat di tengah Berdasarkan boxplot: tidak simetris, median berada agak ke bawah 21 Uji Normalitas Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. IMT subyek.154 20.200 *.938 20.224 intake energi (kkal) a. Lilliefors Significance Correction *. This is a lower bound of the true significance..168 20.143.884 20.021 Distribusi Data IMT = normal Intake Energi = Tidak Normal Jika p-value >0,05, maka tidak ada perbedaan antara nilai variabel yang diuji dengan distribusi data standart yang selalu normal, atau diatribusi data dari variabel yang diuji adalah NORMAL 22 11