Statistik Non Parametrik Tjipto Juwono, Ph.D. March 2017 TJ (SU) Non Parametrik March 2017 1 / 26
Tipe-tipe Variabel dan Level Pengukuran Tipe-tipe Variabel kualitatif Bersifat non-numerik (tidak dapat dinyatakan dengan angka). kuantitatif Bersifat numerik (dapat dinyatakan dengan angka). Ada dua macam: 1 diskrit 2 kontinu TJ (SU) Non Parametrik March 2017 2 / 26
Tipe-tipe Variabel dan Level Pengukuran Level Pengukuran 1 Ordinal 2 Nominal 3 Interval 4 Ratio TJ (SU) Non Parametrik March 2017 3 / 26
Statistik Parametrik vs Statistik Non-Parametrik Statistik Parametrik: Berurusan dengan variabel kuantitatif, dengan level pengukuran interval atau ratio. Kita melakukan uji hipotesa di mana populasinya mempunyai bentuk tertentu (misalnya distribusi normal). Statistik Non-Parametrik: Kita tidak mengandaikan bahwa populasinya mempunyai bentuk tertentu. Statistik non-paramterik dapat kita gunakan untuk menganalisa data-data dengan variabel yang bertipe kualitatif dengan level pengukuran ordinal atau nominal. TJ (SU) Non Parametrik March 2017 4 / 26
Distribusi Chi-Square Salah satu distribusi yang dapat digunakan untuk analisa statistik non-parametrik adalah distribusi Chi-square (χ 2 ). Distribusi ini tidak menggambarkan distribusi dari populasi (ingat bahwa dalam statistik non-parametrik kita tidak mengandaikan bentuk dari distribusi populasi). Distribusi ini menggambarkan distribusi dari suatu besaran yang disebut Chi-square (χ 2 ). χ 2 = [ (f o f e ) 2 ] (1) Dengan f o adalah frekuensi observasi dan f e adalah frekuensi ekspektasi. Bandingkan dengan distribusi-z di mana besaran Z merupakan besaran dari populasi. f e TJ (SU) Non Parametrik March 2017 5 / 26
Distribusi Chi-Square Statistik χ 2 juga digunakan untuk menganalisa apakah suatu kelompok data adalah dari populasi normal. Dalam hal ini statistik Chi-square digunakan sebab kita tidak dapat mengasumsikan bahwa data itu adalah dari populasi normal. Penggunaan lain dari statistik χ 2 adalah untuk melakukan analisa kontingensi. Data didistribusikan dalam suatu tabel kontingensi, dan kita ingin mengetahui apakah suatu kategori adalah lebih penting daripada kategori lainnya. TJ (SU) Non Parametrik March 2017 6 / 26
Karakteristik distribusi Chi-Square TJ (SU) Non Parametrik March 2017 7 / 26
Karakteristik distribusi Chi-Square Positively skewed Non-negative Bergantung pada df TJ (SU) Non Parametrik March 2017 8 / 26
Goodness-of-Fit Test Hipotesa f 0 : Frekuensi hasil observasi f e : Frekuensi yang diekspektasi H 0 : Tidak ada perbedaan antara frekuensi observasi dengan frekuensi ekspektasi H 1 : Ada perbedaan antara frekuensi observasi dengan frekuensi ekspektasi. TJ (SU) Non Parametrik March 2017 9 / 26
Goodness-of-Fit Test Statistik Tes adalah χ 2 = [ (f o f e ) 2 ] Nilai kritis-nya adalah nilai χ 2 dengan df = (k 1); k adalah jumlah kategori. f e (2) TJ (SU) Non Parametrik March 2017 10 / 26
Goodness-of-Fit Test Sebuah restoran ingin mengetahui apakah ada preferensi terhadap makanan favorit. Survey dilakukan dengan mengambil sampel 120 orang dewasa yang ditanya makanan favorit mereka. Diperoleh hasil sebagai berikut. Makanan Favorit Frekuensi Ayam 32 Ikan 24 Daging 35 Pasta 29 Total 120 Dapatkah disimpulkan bahwa tidak ada preferensi di antara keempat macam makanan tersebut? (Level of significance α = 0.05). TJ (SU) Non Parametrik March 2017 11 / 26
Goodness-of-Fit Test Step 1 Nyatakan H 0 dan H 1 H 0 : tidak ada perbedaan antara f 0 dan f e H 1 : ada perbedaan antara f 0 dan f e Step 2 Pilih level of significance α = 0.05 Step 3 Pilih statistik tes χ 2 = [ (f o f e ) 2 ] f e TJ (SU) Non Parametrik March 2017 12 / 26
Goodness-of-Fit Test Step 4 Nyatakan Decision Rule H 0 ditolak jika: [ (f o f e ) 2 ] > 7.815 f e df=n-1 TJ (SU) Non Parametrik March 2017 13 / 26
Goodness-of-Fit Test Step 5 Hitung χ 2 dan buat keputusan Makanan Favorit f o f e (f o f e ) 2 /f e Ayam 32 30 0.133 Ikan 24 30 1.200 Daging 35 30 0.833 Pasta 29 30 0.033 Total 120 120 2.200 χ 2 data < χ2 critical Kesimpulan: H 0 tidak ditolak. Artinya: tidak ada preferensi. Tidak ada makanan yang lebih disukai daripada lainnya. TJ (SU) Non Parametrik March 2017 14 / 26
Frekuensi ekspektasi tidak sama Menurut sebuah survei nasional, diperoleh data tentang warga berusia lanjut. Dalam satu tahun, 40% tidak pernah masuk rumah sakit, 30% masuk rumah sakit sekali, 20% dua kali, dan 10% tiga kali atau lebih. Sebuah sampel yang terdiri dari 150 warga berusia lanjut mempunyai komposisi: 55 tidak pernah masuk rumah sakit dalam setahun, 50 masuk satu kali, 32 dua kali, dan sisanya tiga kali atau lebih. Dapatkah kita menyimpulkan bahwa data sampel itu konsisten dengan hasil survei nasional? Gunakan α = 0.05. TJ (SU) Non Parametrik March 2017 15 / 26
Frekuensi ekspektasi tidak sama Jumlah Masuk RS Survei (%) f o f e 0 40 55 60 1 30 50 45 2 20 32 30 3 atau lebih 10 13 15 Total 100 150 150 Dapatkah kita menyimpulkan bahwa data sampel itu konsisten dengan hasil survei nasional? TJ (SU) Non Parametrik March 2017 16 / 26
Frekuensi ekspektasi tidak sama Step 1 Nyatakan H 0 dan H 1 H 0 : tidak ada perbedaan antara f o dan f e H 1 : ada perbedaan antara f o dan f e Step 2 Pilih level of significance α = 0.05 Step 3 Pilih statistik tes χ 2 Step 4 Nyatakan Decision Rule H 0 ditolak jika: [ (f o f e ) 2 ] > 7.815 f e TJ (SU) Non Parametrik March 2017 17 / 26
Frekuensi ekspektasi tidak sama Step 5 Hitung χ 2 dan buat keputusan Jumlah Masuk RS Survei (%) f o f e (f o f e ) 2 /f e 0 40 55 60 0.4167 1 30 50 45 0.5556 2 20 32 30 0.1333 3 atau lebih 10 13 15 0.2667 Total 100 150 150 1.3723 χ 2 data < χ2 critical Kesimpulan: H 0 tidak ditolak. Data sampel konsisten dengan hasil survei nasional. TJ (SU) Non Parametrik March 2017 18 / 26
Limitasi Chi-square Jika jumlah cell hanya dua, maka frekuensi ekspektasi pada masing-masing cell paling sedikit harus sama dengan 5. Individu f o f e Dapat membaca 641 642 Buta huruf 7 6 TJ (SU) Non Parametrik March 2017 19 / 26
Limitasi Chi-square Jika jumlah cell lebih dari dua, maka Chi-square tidak dapat digunakan jika lebih dari 20% dari cell yang ada memuat f e < 5 TJ (SU) Non Parametrik March 2017 20 / 26
Limitasi Chi-square Jika lebih dari 20% dari cell yang ada memuat f e < 5, kita dapat berusaha menggabungkan beberapa cell menjadi satu. TJ (SU) Non Parametrik March 2017 21 / 26
Menguji Apakah Distribusi Suatu Data Berasal dari suatu Populasi Normal Penjualan 180 Kendaraan. Dengan mean=$1843.17 dan standard deviasi $643.63. TJ (SU) Non Parametrik March 2017 22 / 26
Menguji Apakah Distribusi Suatu Data Berasal dari suatu Populasi Normal Gunakan rumus berikut untuk menghitung Z Z = X µ σ TJ (SU) Non Parametrik March 2017 23 / 26
Menguji Apakah Distribusi Suatu Data Berasal dari suatu Populasi Normal Dari tabel, H 0 ditolak jika χ 2 > 11.07. Kesimpulan: H 0 tidak ditolak. Artinya, data berbentuk normal. TJ (SU) Non Parametrik March 2017 24 / 26
Analisa Kontingensi TJ (SU) Non Parametrik March 2017 25 / 26
Analisa Kontingensi χ 2 = (27 24)2 + (35 30)2 + (33 36)2 +...+ (25 20)2 24 30 36 20 = 5.729 (3) H 0 ditolak jika χ 2 > 11.345. Jadi, kesimpulan? TJ (SU) Non Parametrik March 2017 26 / 26