ANALISIS DATA UNIVARIATE DAN MULTIVARIATE Febti Eka Pratiwi (383) cation_forever@yahoo.com Ria Dhea Layla NK (38363) d.d_bgt@hellokitty.co.id Abstrak Peningkatan produksi padi guna penyediaan beras sebagai makanan pokok sebagian masyarakat Indonesia sangat diperlukan, sehingga pada akhirnya akan meningkatkan pendapatan petani sebagai bagian terbesar penduduk Indonesia. Keberhasilan dalam menangani masalah produksi padi akan menempatkan negara kita dalam posisi yang kuat dari segi pemenuhan kebutuhan pokok rakyat dan kita tidak khawatir akan menggantungkan pada beras impor. Data dari percobaan ini diambil dari tugas akhir Statistika ITS oleh Janawir (3976) dengan judul Pemetaan Potensi Produksi Padi dan Pendugaan Fungsi Produksi Padi di Jawa Timur Tahun 996. Data yang memiliki mean sama memiliki puncak yang terletak pada garis vertikal yang sama. Nilai varians dari data berbeda. Data yang memiliki mean berbeda. Kurva terletak jauh lebih ke kanan berarti bahwa nilai mean data yang diwakili oleh kurva merah memiliki mean lebih besar. Dari data empat di uji secara bersama ternyata data berdistribusi normal. Uji normalitas secara univariate per variable menunjukan bahwa semua data tidak berdistribusi normal. Berdasarkan matrik varian covarian di atas diketahui bahwa covarian sehingga diketahui bahwa data dependen. Kata Kunci: mean, garis vertikal, varians, distribusi normal, Uji normalitas, univariate, matrik varian covarian. Pendahuluan Peningkatan produksi padi guna penyediaan beras sebagai makanan pokok sebagian masyarakat Indonesia sangat diperlukan, sehingga pada akhirnya akan meningkatkan pendapatan petani sebagai bagian terbesar penduduk Indonesia. Keberhasilan dalam menangani masalah produksi padi akan menempatkan negara kita dalam posisi yang kuat dari segi pemenuhan kebutuhan pokok rakyat dan kita tidak khawatir akan menggantungkan pada beras impor. Untuk tercapainya peningkatan produksi pertanian diperlukan suatu pembinaan faktor produksi pertanian yang mencakup aspek metoda penggunaan sarana produksi dan tata guna sumberdaya (lahan dan air) serta aspek ketenagakerjaan, guna tercapainya produktivitas usaha tani yang tinggi disertai dengan kelestarian sumberdaya pertanian. Upaya pengembangan produki mencakup kegiatan yang berhubungan tata guna,seperti: (a) peningkatan produksivitas per unit usaha, dan (b) peningkatan luas panen melalui perbaikan pola tanam maupun perluasan areal dan mengamankan pertanaman yang ada dari fuso akibat jasad pengganggu maupun bencana alam, kebanjiran dan kekeringan. Respon terhadap penggunaan teknologi pertanian tergantung pada lingkungan, iklim, cara penggarapan lahan serta keadaan tanah serta keadaan terarah/ kondisi geografis suatu daerah. Jawa Timur merupakan salah satu lumbung padi nasional mengalami peningkatan produksi padi yang luar biasa selam 2 tahun terakhir ini, bahkan 2 persen dari total produksi padi nasional yang telah berhasil disumbangkan, yang merupakan hasil dari adanya irigasi yang baik, adopsi varians benih unggul secara umum lebih cocok dengan berbagai kondisi pertanaman dan penggunaan pupuk, nitrogen dan pupuk
lainnya dalam jumlah yang tinggi, namun hal ini tidaklah berarti produksi padi di Jawa Timur seragam diseluruh kabupaten. Ada perbedaan-perbedaan regional yang nyata dalam ekosistem-ekosistem sawah di Jawa Timur. 2. Landasan Teori Secara umum dalam metode statistika terdapat banyak cara dalam melakukan pengelompokan salah satunya adalah dengan menggunakan metode analisis diskriminan dan regresi logistik. Akan tetapi sebelum melakukan analisis diskriminan dan regresi logistik, perlu pemenuhan beberapa asumsi antara lain semua variabel prediktor berdistribusi multinormal dan kesamaan matriks varian kovarians antar kelompok. 2. Uji itas Univariate Asumsi normalitas harus terpenuhi untuk mengetahui apakah data berdistribusi normal atau atau tidak, serta untuk mengetahui apakah data sampel berasal dari populasi yang berdistribusi normal. Pengujian normalitas dapat dilakukan dengan beberapa macam, yaitu:. Probability Plot : pada plot penyebaran, data menyebar mendekati atau mengikuti pola garis normal sehingga data dapat diasumsikan bersdistribusi normal. 2. Pengujian Statistik dengan menggunakan uji Andersong-Darling normality test, Kolmogorov-Smirnov normality test, W-test, Liliefors, dsb. Apabila pengujian normalitas tidak dapat dipenuhi maka solusinya dapat dilakukan dengan: transformasi data, pendeteksian data outlier (pencilan) dan regresi bootsrap. Langkah-langkah uji kenormalan Kolmogorov-Smirnov adalah sebagai berikut H : F(x) = F(x), data berdistribusi normal H : F(x) F(x), data tidak berdistribusi normal D=Sup F n ( x) F ( x) Daerah penolakan : Tolak H bila D > Dα 2.2 Distribusi Multivariate Multivariate adalah suatu perluasan dari distribusi univariate normal sebagai aplikasi pada variabel-variabel yang mempunyai hubungan. Dalam analisis multivariate, asumsi multivariate normal harus diperiksa untuk memastikan data pengamatannya mengikuti distribusi normal agar statistik inferensia dapat digunakan dalam menganalisis data tersebut. Bila dalam pengujian normal dari data tersebut mendekati garis linier normal maka dapat disimpulkan bahwa data berdistribusi multivariate normal. Distribusi normal multivariate data dapat diperiksa dengan menghitung nilai jarak pada setiap pengamatan yaitu : 2 T - d x x S x x j j j dengan j =,2,3...n dan n adalah banyaknya data dimana Xj : pengamatan data ke-j S- : invers matriks varians kovarians S 2 2 2 d kemudian d diurutkan d2... dn. Lalu dibuat QQ plot antara dimana j=,2,...n dengan p merupakan banyaknya variabel. 2 d ( j) q dengan j 2
Bila plot mendekati garis lurus maka dapat disimpulkan bahwa data berdistribusi normal multivariate. Atau dapat juga dihitung jarak kuadrat dari setiap pengamatan paling tidak %. Adapun cara yang dilakukan dengan mengurutkan dari kecil ke yang besar. Setelah itu dibuat plot antara dengan ( ) dimana j =,2,...p dan p adalah banyaknya variabel pendukung. Variabel acak X= (X, X2,...,Xp) berdistribusi normal dengan : { } Secara sederhana ditulis X~Np,p =2 disebut Bivariet : { [( ) ( ) ( ) ( ) ]} 3. Metodologi Penelitian Data dari percobaan ini diambil dari tugas akhir Statistika ITS oleh Janawir (3976) dengan judul Pemetaan Potensi Produksi Padi dan Pendugaan Fungsi Produksi Padi di Jawa Timur Tahun 996. Variabel yang digunakan adalah: X: Data Jumlah Pemberian Pupuk 2 data. X2: Data Berat Benih sebanyak 2 data. X3: Data Pengairan sebanyak 2 data. X4: Data Curah Hujan sebanyak 2 data. 4. Analisis Data dan Pembahasan Bab ini membahas tentang analisis data dan pembahasan dari masalah yang terjadi. Berikut adalah hasil analisis data dan pembahasan: 4. Analisis Data Analisa data dari variabel X merupakan jumlah pemberian pupuk, variabel X 2 merupakan berat benih, variabel X 3 merupakan pengairan dan variabel X 4 merupakan curah hujan dengan disertai dengan interpretasi masing-masing data yang telah di bangkitkan menggunakan software minitab yang kemudian dianalisa dengan menggunakan uji normalitas secara univariate dan multivariate. 4.2 Pembahasan Pembahasan dari variabel random serta berat badan balita (X), tinggi badan balita (X2), dan lingkar kepala balita (X3) adalah sebagai berikut: 4.2. Pengujian Distribusi Univariate ( mean sama, varian berbeda ) Dengan membangkitkan dua data yang berdistribusi normal menggunakan software minitab dengan data masing-masing sebanyak dimana nilai mean kedua data sebesar dan varians data pertama sebesar, varians data kedua sebesar 3. hasil plot distribusi normal dari data tersebut adalah sebagai berikut: 3
Frequency Frequency Histogram of ms; ms3 4 3 Variable ms ms3 Mean StDev N 4,948, 4,83 3,4 2-3 3 6 Data 9 2 Gambar 4. Plot Sebaran dengan Mean Sama, Varian Berbeda Gambar 4. menunjukkan bahwa kedua kurva tersebut berhimpit karena kedua data mempunyai rata-rata sama yaitu sebesar 4,9. Namun, nilai variansnya berbeda sehingga didapatkan kurva yang berwarna hitam lebih runcing dari pada kurva yang berwarna merah karena kurva yang berwarna hitam mempunyai keragaman yang lebih kecil dari pada kurva yang berwarna merah. 4.2.2 Pengujian Distribusi Univariate ( mean berbeda, varian sama ) Dengan membangkitkan dua data yang berdistribusi normal menggunakan software minitab dengan data masing-masing sebanyak dimana nilai varians kedua data sebesar 3 dan mean data pertama sebesar, mean data kedua sebesar. hasil plot distribusi normal dari data tersebut adalah sebagai berikut: Histogram of ms3; ms3 4 2 Variable ms3 ms3 Mean StDev N 4,83 3,4, 2,929 8 6 4 2-3 3 6 9 Data 2 8 Gambar 4.2 Plot Sebaran dengan Mean Berbeda, Varian Sama Gambar 4.2 menunjukkan bahwa kedua kurva tersebut sejajar (saling lepas) karena kedua data mempunyai nilai rata-ratanya berbeda. Kurva yang berwarna hitam mempunyai rata-rata yang lebih kecil dari pada kurva yang berwarna merah, sehingga didapatkan kurva yang berwarna hitam lebih ke kiri dari pada kurva yang berwarna 4
Percent merah. Namun, lebar kurva sama karena sebaran datanya sama yaitu dengan nilai varian sebesar 3. 4.3 Pengujian Multivariate Pada Data Jumlah Produksi Padi Hasil pengujian normal multivariate pada data jumlah produksi padi di Jawa Timur adalah sebagau berikut : a. Pengujian Multivariate Pada Data Jumlah Pemberian Pupuk 99 9 8 Probability Plot of Jumlah pemberian pupuk Mean 37.76 StDev 3.78 N 2 A D 4.36 P-V alue <. 2 - - Jumlah pemberian pupuk 2 Gambar 4.3 Anderson-Darling Data Jumlah Pemberian Pupuk Adapun pengujian kenormalan Anderson-darling adalah sebagai berikut : H : F(x) = F (x), data berdistribusi normal H : F(x) F (x), data tidak berdistribusi normal P-value Daerah penolakan : Tolak H bila P-value <, <, Berdasarkan pengujian diatas dikatahui bahwa P-value < sehingga kesimpulannya adalah tolak H, ini berarti bahwa data tidak berdistribusi normal. b. Pengujian Multivariate Pada Data Berat Benih Adapun pengujian kenormalan Anderson-darling adalah sebagai berikut : H : F(x) = F (x), data berdistribusi normal H : F(x) F (x), data tidak berdistribusi normal P-value
Percent Percent Daerah penolakan: Tolak H bila P-value <, <, Probability Plot of Berat benih 99 9 9 8 7 6 4 3 2 Mean 4.32 StDev.3 N 2 AD 2.442 P-Value <, -2-2 Berat benih Gambar 4.4 Uji Anderson-Darling Berat Benih Berdasarkan pengujian diatas yang ditunjukkan oleh gambar 4.4 diketahui bahwa P- value < sehingga kesimpulannya adalah tolak H, ini berarti bahwa data tidak berdistribusi normal. c. Pengujian Multivariate Pada Data Pengairan 3 4 Probability Plot of pengairan 99 9 9 8 7 6 4 3 2 Mean 3.8 StDev 69.6 N 2 AD 4.38 P-Value <, - pengairan 2 3 Gambar 4. Uji Anderson-Darling Pengairan Adapun pengujian kenormalan Anderson-darling adalah sebagai berikut : H : F(x) = F (x), data berdistribusi normal H : F(x) F (x), data tidak berdistribusi normal P-value 6
Percent Daerah penolakan : Tolak H bila P-value <, <, Berdasarkan pengujian diatas dikatahui bahwa P-value < sehingga kesimpulannya adalah tolak H, ini berarti bahwa data tidak berdistribusi normal. d. Pengujian Multivariate Pada Data Jumlah Produksi Padi Probability Plot of Jumlah produksi padi 99 9 9 8 7 6 4 3 2 Mean 3 StDev 62 N 2 AD 4.333 P-Value <, -3-2 - 2 3 Jumlah produksi padi 4 6 Gambar 4.6 Uji Anderson-Darling Produksi Padi Adapun pengujian kenormalan Anderson-darling adalah sebagai berikut : H : F(x) = F (x), data berdistribusi normal H : F(x) F (x), data tidak berdistribusi normal P-value Daerah penolakan : Tolak H bila P-value <, <, Berdasarkan pengujian diatas dikatahui bahwa P-value < sehingga kesimpulannya adalah tolak H, ini berarti bahwa data tidak berdistribusi normal. Tabel 4. Multivariate Matrix COVA 299237 8463, 762, 742,7 2243,8 8463 2892,8 86,9 26,6 778, 762 86,9 32,9 6,4 7,2 7426 26,6 6,4 4783,7 82, 2243 778, 7,2 82, 34, Berdasarkan putput minitab diatas, varian covarian maka data tersebut dependen. 7
. Kesimpulan Data yang memiliki mean sama memiliki puncak yang terletak pada garis vertikal yang sama. Nilai varians dari data berbeda terlihat pada luasan kurva yang berbeda dimana kurva yang memiliki nilai varians lebih besar maka kurva lebih melebar. Data yang memiliki mean berbeda yang terlihat pada puncak kedua kurva tidak terletak pada garis vertikal yang sama. Kurva terletak jauh lebih ke kanan berarti bahwa nilai mean data yang diwakili oleh kurva merah memiliki mean lebih besar. Dari data empat variabel yaitu jumlah pemberian pupuk, berat benih, pengairan, dan curah hujan setelah di uji sacara bersama ternyata data berdistribusi normal. Uji normalitas secara univariate per variable menunjukan bahwa semua data tidak berdistribusi normal. Berdasarkan matrik varian covarian di atas diketahui bahwa covarian sehingga diketahui bahwa data dependen. Daftar Pustaka Janawir.22.Tugas Akhir Pemetaan Potensi Produksi Padi dan Pendugaan Fungsi Produksi Padi di Jawa Timur Tahun 996.Surabaya:Institut Teknologi Sepuluh Nopember Johnson, A. Richard.24. Applied Multivariate Statistical Analysis. New Jersey Sembiring, RK.99.Analisis Regresi.Bandung:ITB 8