UJI CHI SQUAR (Uji data kategorik) A. Pendahuluan Uji statistik nonparametrik ialah suatu uji statistik yang tidak memerlukan adanya asumsi-asumsi mengenai sebaran data populasinya (belum diketahui sebaran datanya dan tidak perlu berdistribusi normal). Oleh karenanya statistik ini juga dikemukakan sebagai statistik bebas sebaran (tdk mensyaratkan bentuk sebaran parameter populasi, baik normal atau tidak). Statistika non-parametrik dapat digunakan untuk menganalisis data yang berskala Nominal atau Ordinal. Data berjenis Nominal dan Ordinal tidak menyebar normal. Selain itu statistik ini dapat digunakan pada data yang berjumlah kecil, yakni kurang dari 30 data. Banyak alternatif uji statistik nonparametrik seperti yang ditunjukkan pada Lampiran. Berbagai literatur memberikan pengelompokan kategori statistik nonparametrik dengan berbagai cara yang berbeda. Namun demikian, secara sederhana dan berdasarkan prosedur yang sering digunakan, uji-uji tersebut dapat dikelompokkan atas kategori berikut: Prosedur untuk data dari sampel tunggal Prosedur untuk data dari dua kelompok atau lebih sampel bebas (independent) Prosedur untuk data dari dua kelompok atau lebih sampel berhubungan (dependent) Korelasi peringkat dan ukuran-ukuran asosiasi lainnya Distribusi Chi kuadrat digunakan untuk menguji homogenitas varians beberapa populasi. Masih ada beberapa persoalan lain yang dapat diselesaikan dengan mengambil manfaat distribusi chi-kuadrat ini, diantaranya : 1. Menguji proporsi untuk data multinom. Menguji kesamaan rata-rata data poisson 3. Menguji independen antara dua faktor didalam kontingensi 1
4. Menguji kesesuaian antara data hasil pengamatan dengan model distribusi dari mana data itu diduga diambil, dan 5. Menguji model distribusi berdasarkan data hasil pengamatan. B. Prosedur untuk Data dari Sampel Tunggal dengan Chi-Kuadrat Akan diuji distribusi frekuensi kategori variabel motivasi hasil amatan dengan distribusi frekuensi kategori variabel sama yang diharapkan. Hipotesis nol uji tersebut adalah: tidak terdapat perbedaan distribusi variabel motivasi hasil amatan dengan distribusi harapan. Prosedur ini banyak digunakan pada uji normalitas variabel. Misalkan sebuah eksperimen menghasilkan peristiwa-peristiwa atau kategorikategori A 1, A,, A k yang saling terpisah masing-masing dengan peluang p 1 = P(A 1 ), p = P(A ),., p k = P(A k ). Akan diuji pasangan hipotesis : H 0 : p i = p io, i = 1,,, k dengan p io sebuah harga yang diketahui H a p i p io Disini, tentu saja p i = p io = 1 Agar mudah diingat, adanya kategori A i, hasil pengamatan O i dan hasil yang diharapkan i, sebaiknya disusun dalam daftar sebagai berikut : Kategori A 1 A... A k Pengamatan O 1 O... O k Diharapkan 1... k Rumus yang digunakan dalam uji tersebut adalah: dengan keterangan: k ( Oi i ) i1 i
O i = banyaknya kasus yang diamati dalam kategori i. i = banyaknya kasus yang diharapkan k i1 = penjumlahan semua kategori k. Contoh : Dalam suatu eksperimen genetika menurut Mendell telah diketemukan bahwa semacam karakteristik diturunkan meurut perbandingan 1 : 3 : 3 : 9 untuk kategori-kategori A, B, C, dan D. Akhir-akhir ini dilakukan 160 kali pengamatan dan terdapat 5 kategori A, 3 kategori B, 3 kategori C dan 100 kategori D. Dengan menggunakan = 0,05, apakah data di atas menguatkan teori genetika tersebut? Penyelesaian : Berdasarkan teori, diharapkan terdapat 1/16 X 160 = 10 kategori A, masing-masing 30 kategori B dan C, dan 90 kategori D. Data hasil pengamatan dan yang diharapkan adalah sebagai berikut. Kategori A B C D Pengamatan ( O i ) 5 3 3 100 Diharapkan ( i ) 10 30 30 90 Dari rumus didapat : = (5 10) 10 4 X = (O i i ) i=4 i (3 30) (3 30) (100 90) + + + = 5,38 30 30 90 Dari tabel distribusi Chi kuadrat diperoleh X 1 0,05;(4 1) memperlihatkan H 0 diterima yang artinya teori menurut Mendell benar. Atau dengan cara : = 7,81. Sehingga pengujian 3
kategori O (O ) A 5 10,5 B 3 30 1,633333 C 3 30 0,133333 D 100 90 1,111111 TOTAL 160 160 5,377778 Dengan cara tersebut, maka diperoleh = 5,377 atau 5, 38. Derajad kebebasan (db) uji tersebut adalah jumlah kategori (k) dikurangi 1 = 4 1 = 3. Pada taraf signifikasi () = 5% harga tabel = 7,81. Karena Latihan : hitung < tabel, maka hipotesis nol diterima. Diduga bahwa 50% dari semacam kacang bentuknya keriput dan 50% lagi halus. Pengamatan dilakukan terhadap sebuah sampel acak terdiri atas 80 butir kacang dan terdapat 56 keriput sedangkan sisanya halus. Dalam taraf 0,05, dapatkah kita menyokong dugaan tersebut? PNYLSAIAN kategori Pengamatan Harapan (O ) Keriput 56 40 6,4 Halus 4 40 6,4 χ hit 1,8 χ tab = χ 0,05;1 = 3,841 Karena χ hit = 1,8 > 3,84 = χ tab maka H 0 ditolak artinya dugaan bahwa 50% kacang keriput dan 50% kacang halus tidak benar C. Prosedur untuk Sampel Independen 4
Hollingshead (1949) meneliti pilihan kurikulum oleh pelajar di kota lmtown ditinjau dari kelas sosialnya. Kurikulum yang ada mencakup persiapan ke PT, umum, dan perdagangan. Sedangkan kelas sosial yang ada dikelompokkan menjadi 4. Hipotesis nol yang diajukan Hollingshead adalah: proporsi siswa yang tercatat dalam ketiga kemungkinan kurikulum adalah sama untuk semua kelas sosial. Dengan untuk k sampel independen, rumus yang digunakan adalah sebagai berikut: r k ( Oij ij ) i1 j1 ij dengan keterangan: O ij = jumlah kasus yang diobservasi dalam baris ke i pada kolom ke j ij = jumlah kasus yang diharapkan dalam baris ke i pada kolom ke j r k i1 j1 = jumlah semua sel Dalam penelitian Hollingshead diperoleh data hasil observasi (O) dan data yang diharapkan (O) seperti Tabel. Untuk menghitung ( O ) i i i perlu dibuat kolom ((O-)^)/. Tabel. Uji Statistik Nonparametrik Data dari k Sampel Independen dengan Chi-Kuadrat Kelas Sosial I II III IV Kurikulum O O O O ((O- )^) / ((O- )^)/ ((O- )^) / ((O- )^)/ Total O Persiap-an PT 7.7 3 34.04 30.3 40 3.09 38.01 16 1.74 5.40.14 81 5
Umum 18.58 11 3.09 77.49 75 0.08 97.13 107 1.00 13.80 14 0.00 07 Perdagangan 9.15 1 7.6 38.18 31 1.35 47.86 60 3.08 6.80 10 1.51 10 Total 35 44.40 14 6 4.5 183 16.8 6 3.65 390 = 44.40+4.5+16.8+3.65 = 69.39. Derajad kebebasan dalam uji tersebut, db = (4-1) * (3-1) = 6. Dengan α= 5% dan db = 6 diperoleh tidak diterima. tabel = 1.59. Karena hitung > tabel, maka Ho D. Prosedur untuk Sampel Dependen Uji McNemar dua sampel dependen dapat diperluas untuk dipakai dalam penelitian yang mempunyai lebih dari dua kelompok sampel. Perluasan ini, yakni uji Q Cochran k sampel berhubungan memberi suatu metode untuk menguji apakah tiga himpunan atau lebih mempunyai frekuensi atau proporsi saling berbeda atau tidak. Rumus yang digunakan dalam uji Q Cochran adalah: k( k 1) k Q N k i1 k k G j ( j1 j1 L i N i1 L i G j ) dengan keterangan: G j = jumlah keseluruhan sukses dalam kolom ke j L i = jumlah keseluruhan sukses dalam barir ke i. Misalkan diteliti pengaruh 3 cara wawancara terhadap kemungkinan jawaban dari 10 responden. Jika jawaban pertanyaan ya dikode 1 dan jawaban tidak dikode 0. Hipotesis nol penelitian ini berbunyi: kemungkinan jawaban ya adalah sama untuk ketiga jenis wawancara. Data penelitian ini ditunjukkan pada Tabel 3. 6
Tabel 3. Uji Statistik Nonparametrik Data dari k Sampel Dependen dengan Uji Q Cochran Responden Wawancara 1 Wawancara Wawancara 3 L i 1 L i 1 0 0 1 1 1 1 0 1 4 3 1 1 1 3 9 4 1 1 0 4 5 0 1 0 1 1 6 1 0 1 4 7 1 1 1 3 9 8 1 0 1 4 9 0 0 0 0 0 10 0 0 1 1 1 G 1 = 6 G = 4 G 3 = 7 L i 17 L i 37 10 i1 10 i1 Berdasarkan tabel tersebut, maka Q dapat dihitung sbb: (3 1){[3(6) Q 3(4) 3(7) (3)(17) 37 ] (17) } Q = 0.180 db = k 1 = 7
= 0.05 Q tabel ( tabel) = 5.99. Q hitung < Q tabel -> Ho diterima.. Korelasi Peringkat dan Ukuran-Ukuran Asosiasi Lainnya Koefisien kontingensi C adalah suatu ukuran kadar asosiasi atau relasi antara dua himpunan variabel. Ukuran ini berguna khususnya kalau kita hanya mempunyai data variabel dalam skala nominal. Koefisien kontingensi yang dihitung berdasarkan suatu tabel kontingensi akan mempunyai harga yang sama bagaimanapun katogori yang ada disusun dalam baris-baris dan kolom-kolomnya. Rumus yang digunakan untuk menghitung koefisien kontingensi adalah sebagai berikut: C N r k ( Oij ij ) i1 j1 dimana ij Misalkan digunakan data hasil observasi pilihan kurikulum oleh pelajar di kota lmtown ditinjau dari kelas sosialnya seperti Tabel. Dengan mengetahui harga = 69.39; maka dapat dihitung: 69.39 C = 0.39. 390 69.39 Dengan demikian berdasarkan pada data Tabel diperoleh relasi atau asosiasi antara kelas sosial dan pilihan kurikulum adalah 0.39. F. Chi square (uji independensi) Untuk menlakukan analisis chi square kita memerlukan tabel bantu untuk mempermudah perhitungan dengan mengunakan uji chi square. Tabel yang biasa seperti pada format berikut: Sebuah contoh ilustrasi: 8
Variable dependen X Variabel Ya Tidak Variable independen Ya a b Tidak c d Rumus n ad bc 1/ n X Keterangan a ba cb d c d Sel A adalah faktor yang terpapar (tidak patuh ) dan terjadi infeksi. Sel B adalah faktor yang terpapar dan tidak terjadi infeksi Sel C adalah faktor yang tidak terpapar dan kejadian infeksi Sel D adalah faktor yang tidak terpapar dan tidak terjadi infeksi. Kasus 1. Seorang manajer rumah sakit ingin mengetahui apakah terdapat perbedaan antara laki-laki dan perempuan dalam kedisiplinan bekerja. Kedisiplinan bekerja dalam kasus ini diukur dengan kelengkapan absensi kehadiran kerja setiap hari selama 1 bulan. Jika asumsi kedisiplinan kerja dihitung dengan jumlah tidak pernah absen dalam satu bulan dimana dalam satu bulan terdapat 6 hari kerja efektif. Berdasarkan hasil pengamatan diperoleh data sebagai berikut: ID Jenis kelamin Kedisiplinan ID Jenis kelamin Kedisiplinan 1 Laki-laki 4 16 Perempuan 3 Laki-laki 5 17 Perempuan 4 9
3 Laki-laki 5 18 Perempuan 3 4 Laki-laki 6 19 Perempuan 3 5 Laki-laki 6 0 Perempuan 3 6 Laki-laki 6 1 Perempuan 3 7 Laki-laki 6 Perempuan 6 8 Perempuan 4 3 Perempuan 6 9 Perempuan 4 Laki-laki 5 10 Perempuan 3 5 Laki-laki 5 11 Perempuan 4 6 Laki-laki 6 1 Perempuan 3 7 Laki-laki 6 13 Perempuan 3 8 Laki-laki 6 14 Perempuan 3 9 Laki-laki 6 15 Perempuan 3 30 Laki-laki 6 Hint : H 0 : ada perbedaan antara jenis kelamin dengan kedisiplinan kerja H 1 : tidak ada perbedaan antara jenis kelamin dengan kedisiplinan kerja 10
PRAKTK UJI CHI SQUAR Pengantar Analisis kategorik disyaratkan skala data dalam bentuk kategorik. Sebelum masuk ke analisis lebih lanjut kita harus memahami apa dan bagaimana yang dimaksud dengan skala data. Skala data yang dikenal selama ini antara lain skala rasio, skala interval, skala ordinal dan skala nominal. Sifat yang prinsip dari sekala data adalah skala rasio dapat intervalkan, skala interval dapat di ordinalkan, skala ordinal dapat di nominalkan. Skala rasio lebih menekankan pada hasil pengukuran dengan salah satu sifat adalah jarak antara satu pengamatan dengan pengamatan lain mempunyai jarak yang sama dan tidak memiliki nilai nol absolut. Skala interval hampir sama dengan skala rasio tetapi mempunyai nilai nol absolut. Skala ordinal memiliki sifat jarak antara satu pengamatan dengan pengamatan satunnya tidak mengharuskan memiliki jarak yang sama dan skala nominal lebih menekankan pada kaitannya mutually eksklusif (satu meniadakan yang lainnya). Studi kasus Seorang manajer rumah sakit ingin mengetahui apakah terdapat perbedaan antara laki-laki dan perempuan dalam kedisiplinan bekerja. Kedisiplinan bekerja dalam kasus ini diukur dengan kelengkapan absensi kehadiran kerja setiap hari selama 1 bulan. Jika asumsi kedisiplinan kerja dihitung dengan jumlah tidak pernah absen dalam satu bulan dimana dalam satu bulan terdapat 6 hari kerja efektif. Berdasarkan hasil pengamatan diperoleh data sebagai berikut: 11
ID Jenis kelamin Kedisiplinan ID Jenis kelamin Kedisiplinan 1 Laki-laki 4 16 Perempuan 3 Laki-laki 5 17 Perempuan 4 3 Laki-laki 5 18 Perempuan 3 4 Laki-laki 6 19 Perempuan 3 5 Laki-laki 6 0 Perempuan 3 6 Laki-laki 6 1 Perempuan 3 7 Laki-laki 6 Perempuan 6 8 Perempuan 4 3 Perempuan 6 9 Perempuan 4 Laki-laki 5 10 Perempuan 3 5 Laki-laki 5 11 Perempuan 4 6 Laki-laki 6 1 Perempuan 3 7 Laki-laki 6 13 Perempuan 3 8 Laki-laki 6 14 Perempuan 3 9 Laki-laki 6 15 Perempuan 3 30 Laki-laki 6 Pada kasus di atas didapatkan bahwa jenis skala data untuk variabel jenis kelamin adalah kategorik sedangkan pada variabel kedisiplinan skala data adala rasio. Langkah penyelesaian Merubah skala data dari rasio ke kategorik Langkah-langkah 1. Buka program spss, kemudian buat variabel jenis kelamin dan kedisiplinan.. Isikan data pada tabel tersebut ke dalam program spss. Sebelum data diisi ke dalam spss kita rubah dulu cara pemasukan data kedalam spss dimana yang jenis kelamin laki-laki kita beri kode 1
1 sedangkan perempuan kita beri kode. jadi yang dimasukan kedalam program spss adalah kodenya. 3. Setelah data terisi akan tampak seperti gambar berikut: 4. Setelah data dimasukan kedalam program spss. Kemudian langkah selanjutnya memberi label pada jenis kelamin yaitu dengan memberi label 1 adalah laki-laki dan adalah perempuan dan merubah skala data variabel kedisiplinan menjadi kategori yaitu disiplin dan tidak disiplin. Untuk merubah variabel kedisiplinan pada menu utama spss pilih Transform kemudian pilih Recode in to different variabel. Seperti terlihat pada gambar berikut: 13
Kemudian rubah kode kedisiplinan dengan 1 adalah disiplin dan tidak disiplin. Seperti pada gambar berikut: Pada variabel jenis kelamin beri label untuk 1 adalah laki-laki dan adalah perempuan dan variabel kategori kedisiplinan diberi label 1 adalah disiplin dan adalah tidak disiplin. Seperti pada gambar berikut: 14
5. Setelah data dikategorikan. Akan terlihat seperti gambar berikut: 6. Kemudian lakukan analisis data. Dari menu utama spss pilih Analize kemudian sub menu Deskriptif statistik, kemudian Crosstabs. Seperti pada gambar berikut: 15
7. Setelah itu masukan variabel jenis kelami kedalam kotak rows dan kategori kedisiplinan kedalam Coloums. Seperti tampak pada gambar berikut: 8. Pilih menu statistik untuk melakukan analisis atau menu yang lain sesuai dengan keinginan. Pada menu statistik pilih chi square dan risk. 16
9. Hasil analisis akan tampak pada gambar berikut: CROSSTABS /TABLS=jeniskelamin BY kategorikedisiplinan /FORMAT= AVALU TABLS /STATISTIC=CHISQ RISK /CLLS= COUNT /COUNT ROUND CLL. Crosstabs [DataSet1] Case Processing Summary jeniskelamin * kategori kedisiplinan Cases Valid Mis sing Total N Perc ent N Perc ent N Perc ent 30 100,0% 0,0% 30 100,0% 17
Tabel ini menujukan bahwa jumlah sampel yang dianalisis sebanyak 30 subjek dengan kategori missing variable tidak ada. jeniskelamin * kategori kedisiplinan Crosstabulation Count jeniskelamin Total laiki-laki perempuan kategori kedisiplinan disiplin tidak disiplin Total 9 5 14 14 16 11 19 30 Berdasarkan analisis tabulasi silang diperoleh hasil bahwa laki-laki sebanyak 14 subjek perempuan 16 subjek sedang pada kedisiplinan 11 subjek yang tidak disiplin 19 subjek. Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's xact Tes t Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (-sided) 8,63 b 1,003 6,537 1,011 9,14 1,003 8,335 1,004 30 a. Computed only for a x table xact Sig. (-sided),007,005 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,13. xact Sig. (1-sided) Analisis data chi square menunjukan bahwa nilai chi square 8.63, sedangkan nilai probabilitas signifikansi 0.003. hal ini menunjukan bahwa jika dibandingkan dengan standar normal kemaknaan hipotesis pada tingkat kemaknaan α = 0.05 dapat disimpulkan bahwa hipotesis nol ditolak. Ini memberi arti bahwa terdapat perbedaan tingkat kedisiplinan karyawan antara laki-laki dan perempuan. 18
Risk stimate Odds Ratio for jeniskelamin (laiki-laki / perempuan) For cohort kategori kedisiplinan = disiplin For cohort kategori kedisiplinan = tidak disiplin N of Valid Cases 1,600 1,999 79,436 5,143 1,38 19,916,408,197,844 30 95% Confidence Interval Value Lower Upper Jika dilihat dari aspek risiko jenis kelamin mempunyai risiko untuk disiplin sebesar 1,6 kali jika disbanding dengan perempuan. Kerjakan soal latihan dibawah ini Di suatu sekolah pada bulan Juli diadakan pemilihan murid teladan. Sebelum pemilihan pihak sekolah ingin mengetahui apakah murid perempuan mempunyai peluang yang sama dengan murid laki-laki untuk dapat menjadi siswa teladan. Untuk tujuan tersebut guru-guru mengambil sample yang terdiri dari 300 siswa dan ternyata 00 orang memilih siswa laki-laki dan 100 orang memilih siswa perempuan. Bagaimanakah kesimpulan pihak sekolah?(χ tab Calon Siswa Frek. Observasi Frek. Harapan Laki-laki 00 150 Perempuan 100 150 Jumlah 300 300 = 3, 841) 19