4.7 TRANSFORMASI UNTUK MENDEKATI KENORMALAN Saat asumsi keormala tidak dipuhi maka kesimpula yag kita buat berdasarka suatu metod statistik yag mesyaratka asumsi keormala meadi tidak baik, sehigga mucul upaya utuk membuat kesimpula meadi lebih baik yaitu dega metrasformasika data shigga medekati keormala. Trasformasi data ii disaraka berdasrka pertimbaag teori atau betuk dta itu sediri ( dapat uga karea kedeaya). Secara teori, suatu data dapat dihitug sehigga medekati distribusi ormal dega trasformasi berikut: Skala asli Perhituga, y Proporsi, pˆ Korelasi, r Skala hasil trassformasi y Logit ( pˆ ) = Fisher s z(r) = pˆ log p + log r r Dalam bayak kasus, pemiliha trasormasi yag tepat tidaklah mudah sehigga ada beberapa tekik utuk meetukaya, diataraya adalah sebagai berikut: A. Peetua Trasformasi Haya Berdasarka Betuk Data Himpua trasformasi yag sagat bergua dalam kasus ii iebut himpua kekuata trasormasi. Kekuata trasformasi ii didiefiisika haya utuk variabel berilai positif, meskipu demikia kita dapat meambahka kostata tuggal terhadap kasus yag memuat variabel egatif, sehigga kekuata trasformasi tetap dapat diguaka. Misalka x merupaka observasi acak. Himpua kekuata trasformasi dituukka oleh parameter. Nilai yag diberika utuk meyataka sebuah trasformasi utama. Sebagai cotoh, perhatika x dega = -. Karea x - = /x, pemiliha dari ii berkorespodebsi
secara timbal balik dega trasformasi. Kita dapat mecari himpua trasformasi dega meerapka retag utuk kekuata x dari yag egatif sampai yag positif. Utuk = 0, kita defiisika x 0 = l x. barisa traformasi yag mugki adalah:, x - = /x, x 0 = l x, x /4 = x, x / = x, x, x 3, Saat data dalam betuk diagram titik marial atau histogram ilaiya terlalu lebar, maka kita harus meyusutkaya (aaog utuk keadaa sebalikya ). Hal ii aka dapat memperbaiki tigkat kesimetrisa data. Setelah kita mecoba betuk trasformasi yag sesuai, maka hasil trasformasiya tetap harus diui keormalaya dega membuatya dalam Q-Q plot, ika masih belum ormal kita dapat mecoba betuk trasformasi yag lai higga ditemuka yag palig sesuai. B. Peetua Trasformasi Berdasarka Iformasi dari Data da Faktor- Faktor di Luar Data (seperti peyederhaaa atau iterpretasi yag dimudahka) Metode aalisis sederhaa tersedia utuk memilih kkuata trasformasi. Kita awali dega memfokuska perhatia kita pada kasus uivariat. Box da Cox memperhatika himpua kekuata trasformasi yag sedikit dimodifikasi berikut: (5) Dega ilai kotiu utuk x > 0. Diberika observasi X,X,,X, peyelesaia Box-Cox memilih pedekata kekuata trasformasi dega mecari ilai yag memaksimumka fugsi ( ) ( ) l ( ) = l ( x x ) + ( ) l x (6)
Catat bahwa x () adalah seperti yag didefiisika pada (5) da (7) Adalah rata-rata observasi yag ditrasformasi. Setelah kita memakimumka (6) dega memperhatika parameter rata-rata da variasi populasi, maka suku pertama dari (6) merupaka kostata, yaitu logaritma atural dari fugsi likelihood ormal. Perhituga l() utuk ilai yag bayak lebih baik dikeraka dega megguaka komputer. Dega meggguaka komputer kita dapat membuat grafik l() vs sebaik peampila tabel pasaga (, l()), utuk mempelaari tigkah laku (sifat-sifat) yag dekat dega ilai maksimum ˆ. Sigkatya, ika = 0 (logaritma ormal) atau = ½ (akar kuadrat) medekati ˆ, maka salah satuya harus dipilih karea kesederhaaa betuk trasformasiya. Selai megguaka metode perhituga (6), beberapa statikawa meyaraka prosedur yag serupa dega meetuka ilai ˆ, dega membuat variabel yag baru Da kemudia meghitug varias sampel saat teradi variasi yag miimum, maka uga aka maksimum. Kometar: Kii telah diketahui bahwa trasformasi yag dihasilka dega memaksimumka l() dapat memperbaiki (medekati) keormala. Bagaimaapu uga tidak ada amia bahwa pmiliha yag terbaik 3
aka meghasilka himpua yag ditrasformasi yag cukup sesuai dega istribusi ormal. Hasil yag diperoleh dari trasformasi berdasarka (6) harus tetap diui utuk megetahui ada atau tidakya pelaggara asumsi keormala semetara. Hal ii megimplikasika bahwa ada tekik trasformasi lai dega kekuata yag sama yag bisa diguaka utuk medekati keormala. Setelah memahami kasus utuk uivariat, sekarag kita aka megembagkaya utuk kasus multivariat, kekuata trasormasi,, 3 haruslah dipilih utuk masig-masig variabel.,..., Misalka adalah kekuata trasformasi dari p karakteristik yag diukur. Masigmasig k dapat dipilih dega memaksimumka l k ( k ) ( k ) ( ) = l ( xk xk ) + ( k ) l x k (9) Dega x k, x k,, x k merupaka observasi pada variabel ke k, k =,,,p. Disii (0) Merupaka rata-rata aritmatik dari observasi yag telah ditrasformasi. Observasi multivariat ke- yag telah ditrasformasi adalah x ( ˆ) k ˆ x ˆ ˆ x = ˆ M ˆ x ˆ 4
Dimaa ˆ ˆ secara idividu. ˆ,,..., p adalah ilai yag memaksimumka persamaa (9) Prosedur trasformasi utuk medekati keormala pada observasi multivariat adalah sepada dega prosedur traformasi utuk medekati keormala pada tiap distribusi marialya. Meskipu keormala marial tidaklah cukup meami keormala dari diatribusi gabugaya, amu dalam peerapa praktisya hal ii sudah cukup baik. Jika tidak, kita harus memulaiya dega ilai ˆ ˆ ˆ,..., p yag diperoleh dega megguaka prosedur di atas da melakuka iterasi higga ditemuka himpua dari ilai = [ ˆ ˆ,..., ˆ p ], yag secara bersama-sama l( ˆ ˆ,..., ˆ p )= l S( ) + ( ) l xi + ( ) l x +... + ( p memaksimumka ) l x () p Dimaa S() adalah matriks kovaria yag dihitug dari x ( ˆ) k ˆ x ˆ ˆ x = ˆ M ˆ x ˆ J=,,, Memakimumka persamaa () pada hakikatya tidaklah lebih sulit dari memaksimumka persamaa tersebut secara iividu yag dapat dilihat pada persamaa (9), hal ii uga tidak memberika hasil yag 5
bear-bear lebih baik. Terdapat metode piliha yag berdasarka pada persamaa () da sepada dega memaksimumka fugsi likelihood multivariat atas µ,, da, igat kembali bahwa metode yag berdasarka persamaa (9) berkorespodesi dega memaksimumka fugsi likelihood uivariat ke-k atas µ k, σ kk, da k. fugsi likelihood dibagu atas dasar aggapa bahwa terdapat beberapa k. yag dapat membuat observasi k xk x =, =,,..., k berdistribusi ormal Cotoh : Perhatika kembali kasus pada cotoh soal omer, telah kita simpulka bahwa observasi tersbut tidak berdistribusi ormal, sehigga kita dapat mecoba metrasformasikaya supaya medekati ormal. Ita aka meetuka kekuata trasformasi () dari = -,0 sampai dega =,5, da megguaka ilai yag memakimumka fugsi l k Dega ( k ) ( k ) ( ) = l ( xk xk ) + ( k ) l x k Da Utuk itu kita aka mecari ilai l() utuk = -,0 sampai dega =,5. Kita haya aka meampilka perhituga utuk = -,0, sedagka 6
utuk ilai yag lai dikeraka dega cara yag serupa da hasilya aka itampilka dalam tabel. Utuk = -,0 dega batua program excell diperoleh Sehigga 4 4 (,0) (,0) l(,0) = l xk xk +,0 4 = - l[/4 (049,30)] + (-)(-00,3) = - l (48,3) + 00,6 = - (6, 78) + 00,6 = 70,5 4 ( ) ( ) Berikut disaika ilai l() utuk = -,0 sampai dega =,5 l() l() l() l x -.0 70.5-0.9 75.65-0.8 80.46-0.7 84.94-0.6 89.06-0.5 9.79-0.4 96.0-0.3 98.97-0. 0.39-0. 03.35 0.0 04.83 0. 05.84 0. 06.39 0.3 06.5 0.4 06.0 0.5 05.50 0.6 04.43 0.7 03.03 0.8 0.33 0.9 99.34.0 97.0. 94.64. 9.96.3 89.0.4 86.07.5 8.88 7
Berdasarka hasil di atas, dapat kita lihat bahwa pada saat ekitar 0.3 ilai l() meadi maksimum. Kita aka memilih megguaka = 0.5 utuk metrasformasika data pada soal. Sehigga data observasi x,,,, 4 aka kita ubah meadi x da diharapka aka berdistribusi ormal. Berikut isaika ilai dari x da x, =,,, 4 ; = 0.5 No. ove Radiasi (x ) 0.5 x N0. Ove Radiasi x = (x ) 0.5 x 0.5 x = 0.5 0.5 -.5 0.05 -. 0.09 -.8 3 0.03 -.34 3 0.8 -.39 4 0.05 -. 4 0.0 -.75 5 0.5 -.5 5 0.05 -. 6 0.0 -.75 6 0. -.65 7 0.5 -.5 7 0.08 -.87 8 0.09 -.8 8 0.05 -. 9 0.08 -.87 9 0.08 -.87 30 0.8 -.39 0 0.0 -.75 3 0.0 -.75 0.07 -.94 3 0.0 -.33 0.0 -.50 33 0. -.70 8
3 0.0 -.74 34 0.30 -.04 4 0.0 -.75 35 0.0 -.50 5 0.0 -.75 36 0.0 -.33 6 0.0 -.75 37 0.0 -.33 7 0.0 -.50 38 0.30 -.04 8 0.0 -.75 39 0.30 -.04 9 0.0 -.74 40 0.40-0.8 0 0.40-0.8 4 0.30 -.04 0.0 -.75 4 0.05 -. IV. kesimpula Pada pembahasa tekik-tekik statistik multivariat, aka bayak diasumsika bahwa stiap vektor observasi X berdistribusi ormal multivariat. Kesimpula yag diambil berdasarka tekik multivariat yag megasumsika keormala pada dataya aka meadi tidak kokoh (diraguka keberlakuaya) saat asumsi keormala multivariat pada data tidak terpeuhi. Oleh karea itu, meadi petig bagi kita utuk memplaari tetag distribusi ormal multivariat ii, yaitu megeai sifat-sifat yag dimilikiya agar kita dapat megetahui data yag kita olah memeuhi distribusi ormal atau tidak. Meaksir asumsi-asumsi keormala multivariat dapat dilakuka melalui peguia pada distribusi marial uivariat da bivariatya, karea pada umumya data yag memeuhi asumsi keormala pada distribusi marial uivariat atau bivariatya aka berbetuk ormal pada multivariatya. Adapu peguia keormala pada data uivariat diataraya dapat dilakuka dega megguaka pedekata keormala utuk distribusi samplig proporsi, Q-Q plot da megguaka batua program komputer melalui ui Shapiro-Wilks, sedagka peguia keormala pada data bivariat diataraya dapat dilakuka 9
dega meghitug titik-titik dalam kotur da membadigkaya dega teori peluag da megguaka Chi-square plot. Saat asumsi keormala tidak dipeuhi maka kesimpula yag kita buat berdasarka sesuatu metode statistika yag mesyaratka asumsi keormala meadi tidak baik, sehigga mucul upaya utuk membuat keimpula meadi lebih baik yaitu dega metrasformasika data sehigga medekati keormala. Trasformasi data utuk medekati keormala ii dapat ditetuka berdasarka betuk data serta faktor-faktor di luar data. 0