Suplemen Responsi Pertemuan ANALISIS DATA KATEGORIK (STK351) Departemen Statistika FMIPA IPB Pokok Bahasan Sub Pokok Bahasan Referensi Waktu Uji Dua Populasi Uji Mann-Whitney Uji beda proporsi contoh besar Uji tanda dan uji peringkat bertanda Wilcoxon data berpasangan Applied Nonparametric Statistic Daniel (1990) Jumat 1 Sept 01 15.30 17.30 Kelengkapan: Tabel Normal Baku, Tabel Binomial, Tabel Wilcoxon dan Tabel Mann-Whitney Uji Mann-Whitney Prosedur nonparametrik yang digunakan untuk menguji hipotesis mengenai median dua populasi yang saling bebas diperkenalkan oleh Mann dan Whitney (1947). Prosedur ini dinamakan uji Mann-Whitney (Mann-Whitney test). Asumsi a. Data terdiri dari contoh acak X 1, X,, X n yang berasal dari populasi 1 dengan median M x, dan contoh acak Y 1, Y,, Y n dari populasi dengan median M y. Nilai M x dan M y tidak diketahui. b. Kedua contoh saling bebas c. Peubah acak bersifat kontinu d. Skala pengukuran minimal ordinal e. Fungsi sebaran dari kedua populasi hanya dipisahkan oleh lokasi parameter a. (Dua arah) : H 0 : M x = M y vs. H 1 : M x M y b. (Satu arah) : H 0 : M x M y vs. H 1 : M x < M y c. (Satu arah) : H 0 : M x M y vs. H 1 : M x > M y Statistik uji Mann-Whitney dapat ditentukan melalui prosedur berikut : 1. Gabungkan kedua data contoh.. Peringkatkan setiap pengamatan dari yang terkecil hingga terbesar. Jika terdapat ties (nilai yang sama), beri peringkat tengah (mid-rank). 3. Jumlahkan peringkat yang berasal dari populasi 1. Nyatakan hasilnya sebagai S. 4. Statistik uji Mann-Whitney dapat diperoleh melalui rumus : n1 ( n1 1) T S
Kaidah Keputusan a. ( a) : Tolak H 0 jika T < w α/ atau T > w 1 α/, di mana w 1 α/ = n 1 n w α/ b. ( b) : Tolak H 0 jika T < w α c. ( c) : Tolak H 0 jika T > w 1 α, di mana w 1 α = n 1 n w α w adalah nilai kritis bagi T Tabel A.7 : Mann-Whitney Catatan Untuk contoh berukuran besar (yaitu n 1, n > 0) dapat didekati dengan sebaran normal sebagai berikut : Jika ada ties : Z T n n 1 3 1 n1n t t n1n n1 n 1 1 1 n n n n 1 1 Jika tidak ada ties : Z n 1 n T n n n n 1 1 1 1 Keputusan : Tolak H 0 jika Z hit > Z α Contoh : Di bawah ini adalah data berat badan 1 mahasiswa (6 putra dan 6 putri). Apakah benar bahwa berat badan mahasiswa putra melebihi berat badan mahasiswa putri? : Kriteria Berat Badan (kg) Mahasiswa Putra (X) 63 59 74 5 70 61 Mahasiswa Putri (Y) 47 45 57 54 59 50 : H 0 : M x M y H 1 : M x > M y Mahasiswa Putra (X) Tinggi 63 59 74 5 70 61 Jumlah Peringkat 10 7.5 1 4 11 9 53.5 Mahasiswa Putri (Y) Tinggi 47 45 57 54 59 50 Peringkat 1 6 5 7.5 3 Dari tabel diketahui bahwa jumlah peringkat contoh dari populasi mahasiswa putra adalah 53.5, sehingga S = 53.5. Dengan demikian, statistik uji adalah : T n ( n 1) 6(6 1) 53.5 3.5 1 1 S / 8
Keputusan : yang diujikan adalah H 1 : M x > M y sehingga H 0 ditolak jika T > w 1 α. Berdasarkan tabel A.7, untuk n 1 =6, n =6 dan α=.05 diperoleh w α =8, sehingga w 1 α = n 1 n w α = (6)(6) 8 = 8 Dengan demikian, karena T =3.5 lebih besar dari w 1 α = 8 dapat disimpulkan bahwa berat badan mahasiswa putra melebihi berat badan mahasiswa putri. Output MINITAB Mann-Whitney Test and CI: Berat_Putra (X); Berat_Putri (Y) N Median Berat_Putra (X) 6 6,00 Berat_Putri (Y) 6 5,00 Point estimate for ETA1-ETA is 11,50 95,5 Percent CI for ETA1-ETA is (,00;0,00) W = 53,5 Test of ETA1 = ETA vs ETA1 > ETA is significant at 0,015 The test is significant at 0,014 (adjusted for ties) Uji Median Uji median (median test) adalah salah satu prosedur yang paling sederhana untuk menguji hipotesis awal bahwa dua contoh yang saling bebas berasal dari populasi dengan median sama. Asumsi a. Data terdiri dari contoh acak X 1, X,, X n yang berasal dari populasi 1 dengan median M x, dan contoh acak Y 1, Y,, Y n dari populasi dengan median M y. Nilai M x dan M y tidak diketahui. b. Skala pengukuran minimal ordinal. c. Peubah yang diamati bersifat kontinu. d. Kedua populasi mempunyai bentuk sebaran yang sama. e. Jika dua populasi mempunyai median yang sama, untuk setiap populasi, peluang p sebuah nilai pengamatan akan melebihi grand median adalah sama. H 0 : M x = M y H 1 : M x M y Uji median juga dapat digunakan untuk uji satu arah, namun membutuhkan perhitungan yang kompleks. Statistik uji Mann-Whitney dapat ditentukan melalui prosedur berikut : 1. Gabungkan seluruh pengamatan dari kedua populasi dan hitung median dari n1 n pengamatan. 3 / 8
. Klasifikasikan pengamatan-pengamatan tersebut : (a) apakah merupakan contoh 1 atau contoh, dan (b) apakah nilainya di atas atau di bawah median contoh. Biasanya, klasifikasi ini disajikan dalam bentuk tabel kontingensi : Hubungan terhadap median contoh Contoh 1 Total Di atas A B A + B Di bawah C D C + D Total A + C = n 1 B + D = n N = n 1 + n Berdasarkan tabel kontingensi di atas, jika hipotesis awal benar maka A dan C mendekati n 1 / serta B dan D mendekati n /. 3. Jika contoh mendekati sebaran normal, statistik uji dapat dihitung melalui rumus : T ( A / n1 ) ( B / n ) A B di mana p p(1 p) (1/ n ) (1/ n ) N 1 Kaidah Keputusan Untuk taraf nyata α tertentu, nilai kritis bagi T akan bersesuaian dengan nilai z pada tabel normal baku (A.). Dengan demikian, untuk hipotesis H 0 : M x = M y lawan H 1 : M x M y, tolak H 0 jika T -z atau T z. Contoh : Sebuah studi hendak meneliti apakah terdapat penurunan kemampuan eliminasi obat pada penderita penyakit hati. Dua sampel diteliti, sampel normal (sehat) dan sampel penderita cirrhosis hepatis. Setiap subjek mendapat phenylbutazone per oral 19 mg/kg BB. Melalui analisis darah, waktu konsentrasi plasma tertinggi (dalam jam) diukur pada masing-masing subjek. Hasilnya dapat dilihat pada tabel berikut: waktu konsentrasi plasma tertinggi (jam) waktu konsentrasi plasma tertinggi (jam) phenylbutazone pada subjek cirrhosis phenylbutazone pada subjek normal (X) hepatis (Y) 45.6 41.3 0.1 1.5 49.0 3.5 14.0 7.0 13.7 8.8 4.3 11. 37.9 17.4 9.7 18.0 6.8 13.8 17.8 7.9 30.6 6.3.6 4.0 14.4 15.0 35.5 10.7 Ujilah pada taraf nyata 5%, apakah median waktu puncak konsentrasi plasma phenylbutazone tidak berbeda antara subjek normal dengan subjek dengan cirrhosis hepatis? (http://www.scribd.com/doc/87515950/uji-median, 19 september 01) 4 / 8
: H 0 : M x = M y H 1 : M x M y : Median n1 n adalah (15 13) / 14. Jumlah pengamatan pada setiap contoh yang berada di atas dan di bawah 14 disajikan dalam tabel berikut : Hubungan terhadap median=14 Contoh X Y Total Di atas A = 9 B = 5 A + B = 14 Di bawah C = 6 D = 8 C + D = 14 Total n 1 = 15 n = 13 N = 8 Selanjutnya dapat dihitung : p (9 5) / 8 0.50 sehingga T (9 /15) (5 /13) (0.50)(1 0.50)[(1/15) (1/13)] 1.14 Berdasarkan tabel normal baku, untuk α = 0.05 nilai kritis statistik uji median adalah z = 1.96. Karena statistik uji T = 1.14 lebih kecil dari z = 1.96 maka H 0 tidak ditolak dan simpulkan bahwa median dua populasi tersebut sama. Nilaip untuk uji ini adalah (0.50 0.379)=0.54. Output MINITAB Mood Median Test: Respon versus Subjek Mood median test for Respon Chi-Square = 1,9 DF = 1 P = 0,56 Subjek N<= N> Median Q3-Q1 Cirrhosis hepatis 8 5 18,0 1,7 Normal 6 9 6,8 4,1 Overall median = 0,8 A 95,0% CI for median(cirrhosis hepatis) - median(normal): (-1,5;8,) Uji Tanda untuk Data Berpasangan Prosedur uji tanda untuk data berpasangan atau disebut juga uji tanda dua contoh yang saling berhubungan (sign test for two related sample) sangat mirip dengan uji tanda satu contoh (Pertemuan 1). Pada prinsipnya, selisih dua data berpasangan akan diubah menjadi serangkaian tanda plus (+) dan minus (-). Uji tanda ini berguna ketika data yang digunakan diukur dalam skala ordinal. Asumsi a. Data terdiri dari n pasang pengamatan (X 1, Y 1 ), (X, Y ),, (X n, Y n ). Peubah yang diamati adalah X i Y i = D i, yang merupakan selisih nilai data berpasangan. Median D dinyatakan sebagai M D. b. Masing-masing pasangan saling bebas. 5 / 8
c. Skala pengukuran minimal ordinal pada setiap pasangan. d. Peubah yang diamati bersifat kontinu. a. (Dua arah) : H 0 : M D = 0 vs. H 1 : M D 0 b. (Satu arah) : H 0 : M D 0 vs. H 1 : M D > 0 c. (Satu arah) : H 0 : M D 0 vs. H 1 : M D < 0 Hitung selisih setiap data berpasangan X i Y i = D i. Hitung banyaknya nilai D yang bertanda minus (S-) dan banyaknya nilai yang bertanda plus (S+). Apabila terdapat ties, X i = Y i atau D i =0, hilangkan pengamatan tersebut. Statistik uji yang akan digunakan untuk setiap hipotesis adalah : a. ( a) : S = S = min (S-, S+) b. ( b) : S = S- c. ( c) : S = S+ Kaidah Keputusan a. ( a) : Tolak H 0 jika P(x S b(n,0.5)) α/ b. ( b) : Tolak H 0 jika P(x S- b(n,0.5)) < α c. ( c) : Tolak H 0 jika P(x S+ b(n,0.5)) < α Contoh : Misalkan, suatu survei dilakukan untuk mengetahui pendapat mahasiswa mengenai derajat kesulitan kuliah pada tingkat II dan tingkat III, dengan hipotesis bahwa perkuliahan tingkat II lebih mudah dari tingkat III. Diperoleh data sebagai berikut : Mahasiswa ke- 1 3 4 5 6 7 8 9 10 Tingkat II 3 3 3 3 Tingkat III 1 1 1 1 3 1 1 Dimana : 1 : Sangat sulit, : Sulit, 3 : Mudah, 4 : Sangat mudah : H 0 : M II M III atau M D 0 H 1 : M II > M III atau M D > 0 Mahasiswa ke- 1 3 4 5 6 7 8 9 10 Tingkat II 3 3 3 3 Tingkat III 1 1 1 1 3 1 1 D 1 1 1 1 1 1 0 0 1 Tanda + + + + + + + + : Berdasarkan data di atas, n=8, S+=8, S-=0. Karena hipotesis nol M D 0, maka statisitik uji yang digunakan adalah S-. 6 / 8
Keputusan : Dari tabel binomial (A.) diperoleh P(S 0 b(8,0.5)) = 0.0039, sehingga pada taraf nyata 5% hipotesis nol ditolak dan simpulkan bahwa perkuliahan di tingkat III lebih sulit daripada di tingkat III. Uji Peringkat Bertanda Wilcoxon untuk Data Berpasangan Prosedur uji peringkat bertanda Wilcoxon untuk data berpasangan (Wilcoxon signedrank test for paired observation) pada dasarnya sama seperti uji peringkat bertanda Wilcoxon pada populasi tunggal. Perbedaannya terletak pada data yang diuji. Pada pengujian data berpasangan, yang digunakan adalah data selisih data yang berpasangan. Asumsi a. Data yang dianalisis terdiri dari n pengamatan dengan selisih D i = Y i X i. b. Selisih berupa peubah acak kontinu. c. Sebaran populasi dari selisih adalah simetris denga nilai tengah M D d. Selisih saling bebas e. Selisih yang diukur minimal berskala selang/interval a. (Dua arah) : H 0 : M D = 0 vs. H 1 : M D 0 b. (Satu arah) : H 0 : M D 0 vs. H 1 : M D > 0 c. (Satu arah) : H 0 : M D 0 vs. H 1 : M D < 0 Prosedur umum uji peringkat bertanda Wilcoxon adalah sebagai berikut : 1. Hitung selisih nilai D i = Yi Xi. Jika hasilnya D i = 0, abaikan pengamatan tersebut.. Beri peringkat untuk D i. Jika ada nilai yang sama (disebut ties) beri peringkat tengah (mid-rank). 3. Pasangkan tanda plus dan minus pada peringkat sesuai nilai pada langkah pertama. 4. Hitunglah : jumlah peringkat bertanda plus (T+), dan jumlah peringkat bertanda minus (T-). Statistik uji yang digunakan untuk masing-masing hipotesis adalah adalah : a. ( a) : T = T = min (T-, T+) b. ( b) : T = T- c. ( c) : T = T+ Kaidah Keputusan a. ( a) : Tolak H 0 jika T T n(α/) b. ( b) : Tolak H 0 jika T- T n(α) c. ( c) : Tolak H 0 jika T+ T n(α) Catatan Untuk contoh berukuran besar dapat didekati dengan sebaran normal baku menggunakan rumus : 7 / 8
T* n n 1 T 4 n 4 n 1 n 1 Contoh : Ujilah hipotesis pada contoh soal sebelumnya dengan uji Wilcoxon untuk data berpasangan : : H 0 : M II M III atau M D 0 H 1 : M II > M III atau M D > 0 Mahasiswa ke- 1 3 4 5 6 7 8 9 10 Tingkat II 3 3 3 3 Tingkat III 1 1 1 1 3 1 1 D 1 1 1 1 1 1 0 0 1 Tanda + + + + + + + + Peringkat 4 4 4 4 4 4 4 8 : Berdasarkan data di atas diperoleh n=8, T+=36, T-=0. Karena hipotesis nol M D 0, maka statisitik uji yang digunakan adalah T-. Keputusan : Dari tabel Wilcoxon (A.3), diperoleh T 8(0.05) =6 (p-value=0.0547). Karena T- < T 8(0.05) hipotesis nol ditolak dan simpulkan bahwa perkuliahan di tingkat II lebih mudah daripada di tingkat III. B o n u s 1. Exercise 3.4, chapter 3, p. 97 (di buku referensi). Exercise 3., chapter 3, p. 89 (di buku referensi) 3. Nilai-nilai yang diberikan pada pengukuran kualitas produk kertas yang diproduksi melalui dua proses yang berbeda, yang didasarkan pada sampel random berukuran 9 dari masing-masing proses, ditunjukan sebagai berikut: Tipe Proses 1 3 4 5 6 7 8 9 Proses A 6.1 9. 8.7 8.9 7.6 7.1 9.5 8.3 9.0 Proses B 9.1 8. 8.6 6.9 7.5 7.9 8.3 7.8 8.9 Ujilah bahwa tidak ada perbedaan dalam kualitas produk dari dua proses produksi kertas itu! gunakan taraf nyata 10% (Mendenhall 1969 dalam Djarwanto 1987 1 ) Note : CMIWW (Correct Me If We re Wrong) 1 Djarwanto. 1987. Kumpulan Soal dan Penyelesaiannya: Statistik Nonparametrik. Yogyakarta: BPFE Prepared by : Nur Andi Setiabudi, S. Stat Edited by : Didin Saepudin 8 / 8