-2- TRANSFORMASI DATA 1. TRANSFORMASI UNTUK KESIMETRIKAN DATA 2. TRANSFORMASI RENTANG SEBARAN DATA PEMBANDINGAN KELOMPOK DATA D10F-3003 / 4 (3-1) SKS ADE (Analisis Data Eksplorasi) Tim Teaching ADE
Transformasi Data 1 Transformasi Untuk Kesimetrikan Data 2 Transformasi Homogenitas Rentang Sebaran Page 2
1 Transformasi untuk Kesimetrikan Data Data yang kita miliki, terutama data asli, seringkali tidak menunjukkan pola simetrik. Ketidaksimetrikan data (kemiringan pola sebaran) dapat dilihat dari posisi Me di dalam kotak suatu box-plot. Page 3
1 Transformasi untuk Kesimetrikan Data Letak Me yang lebih dekat ke q B mencirikan suatu sebaran dengan kemiringan positif (menjulur ke atas). Letak Me yang lebih dekat ke q A mencirikan suatu sebaran dengan kemiringan negatif (menjulur ke bawah). Panjang garis yang menjulur dari kotak, menjadi petunjuk adanya data yang agak jauh dari kumpulannya dan hal ini tidak selalu berarti pola sebaran tersebut miring Page 4
1 Transformasi untuk Kesimetrikan Data Selama posisi Me terhadap q B maupun q A relatif seimbang, garis yang terlalu panjang hanya menunjukkan bahwa sebaran data itu memiliki ekor atau kemenjuluran yang lebih panjang dari semestinya. Contoh : Lihat data Tingkat bunuh diri Page 5
BOX PLOT 25-34 35-44 45-54 55-64 65-74 Page 6
1 Transformasi untuk Kesimetrikan Data Tujuan transformasi jelas, yaitu membuat sedekat mungkin dengan bentuk standar, yaitu berpuncak tunggal, simetri, mengecil dengan mulus di kedua sisinya. Tangga transformasi Tukey : -1/x 2-1/x logx X 1/2 X X 2 X 3 anti log X lebih kuat sedang tetap sedang lebih kuat Mengoreksi juraian ke atas Mengoreksi juraian ke bawah Page 7
PEMBANDINGAN KELOMPOK DATA Dalam proses analisis data, kita sering menghadapi data yang terdiri dari beberapa kelompok berbeda. Pemeriksaan bentuk atau pola sebaran data bagi masing-masing kelompok dapat dilakukan dengan melihat boxplot nya, yaitu dengan cara menggambarkan boxplot nya masing-masing secara berdampingan. Page 8
PEMBANDINGAN KELOMPOK DATA Karena pusat perhatian kita lebih tertuju pada pembandingan karakteristik antar klp. maka yang kita periksa tidak hanya lokasi pusat data saja tetapi juga rentang penyebaran datanya. Kehomogenan rentang penyebaran dari beberapa klp. data akan menyederhanakan proses pembandingan, karena kita dapat memusatkan perhatian pada pembandingan lokasi pemusatannya. Page 9
CONTOH Data tentang tingkat bunuh diri untuk lima klp. umur yg berbeda Negara L/p 25-34 35-44 45-54 55-64 65-74 Negara L/p 25-34 35-44 45-54 55-64 65-74 Kanada L 21.6 27.3 31.1 335 23.5 L 7.8 10.6 17.9 20.2 28.2 Belanda P 7.8 11.5 14.8 12.3 9.2 P 4.7 8.2 10.5 15.8 17.3 Israel L 9.4 9.8 10.2 14 27.3 L 26.2 29.1 35.9 32.3 27.5 Polandia P 7.6 4.2 6.7 22.9 19.1 P 4.4 4.7 6.6 7.3 7 Jepang L 21.5 18.7 21.1 31.1 48.7 L 4.1 7 9.6 13.7 21.9 Spanyol P 14 10.3 13.2 21 40.1 P 1.4 1.6 3.8 5.4 5.7 Austria L 28.8 40.3 52.3 52.8 68.5 L 27.6 40.5 45.7 51.2 35.1 Swedia P 8.4 16.4 22.4 21.5 29.4 P 13 17.5 19.6 22.4 17.1 Perancis L 16.4 25.2 36.1 47.3 56 L 21.7 33.6 41.1 50.3 50.8 Swiss P 6.6 8.9 13 16.7 18.5 P 10.4 15.9 18.2 20.1 20.6 Jerman L 28.3 34.6 41.3 49.1 51.8 L 9.6 12.7 14.6 17 21.7 Inggris P 11.3 15.6 24.2 25.6 27.3 P 5.1 6.5 10.7 13 14.1 Hongaria L 48.2 65 84.1 81.3 107.4 L 19.6 22.2 27.8 32.8 36.5 USA P 12.7 18.4 26.9 34.7 47.9 P 8.6 12.1 12.5 11.4 9.3 Italia L 7.1 8.3 10.8 17.9 26.6 P 3.5 3.7 5.5 6.7 7.7 Page 10
BOX PLOT 25-34 35-44 45-54 55-64 65-74 Page 11
INTERPRETASI Pada boxplot di atas, nampak bahwa pusat dari kelima klp. data naik seiring dengan naiknya usia. Juga nampak bahwa secara keseluruhan dengan bertambahnya usia, observasi makin menyebar. Untuk membandingkan sebaran, sebaiknya pusat dikeluarkan, sehingga Me untuk semua kelompok menjadi nol. Untuk membandingkan bentuk, pusat dan sebaran data dikeluarkan (ingat standarisasi!). Dengan standarisasi akan terlihat kelompok data mana yang bentuknya paling mendekati simetri Page 12
2 Transformasi Homogenitas Rentang Sebaran Pembandingan pusat kelompok data akan lebih efisien kalau rentang sebarannya lebih homogen. (Salah satu asumsi dalam ANAVA untuk pembandingan data adalah homogenitas varians) Untuk menyamakan sebaran, perlu diketahui hubungan sebaran dengan pusat data. Bila sebaran cenderung naik bersama dengan naiknya pusat, diperlukan trans. yang membuat sebaran data yang pusatnya tinggi menjadi lebih kecil, mis. X 1/2, log X, -1/X Bila sebaran mengecil dengan naiknya pusat, diperlukan trans. yang membuat sebaran data yang pusatnya tinggi menjadi lebih besar, mis. X 2, X 3. Page 13
2 Transformasi Homogenitas Rentang Sebaran Plot pasangan (log Me, log d) pada diagram pencar Tarik garis lurus putus-putus yang paling mendekati titik-titik yang ada Ambil dua titik pada garis, sebaiknya berupa pasangan (log Me, log d) dari kelompok data Hitung nisbah sbb. : Nisbah = log d titik yang tinggi - log d titik yang lebih rendah log Me titik yang tinggi log Me titik yang lebih rendah Page 14
2 Transformasi Homogenitas Rentang Sebaran Nilai nisbah ini merupakan arah garis. Lakukan transformasi berdasarkan acuan sbb. : Nisbah kira-kira ½ 1 3/2 2 Transformasi yang dicoba X 1/2 Log x -1/x - 1/x 2 Contoh: Lihat data tentang tingkat bunuh diri (laki-laki) dari lima kelompok umur Page 15