ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS

Ukuran: px
Mulai penontonan dengan halaman:

Download "ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS"

Transkripsi

1 Dr. Hanna Arini Parhusip, lahir di kota Salatiga, 27 Februari Sarjana bidang Matematika diperoleh pada tahun 1992 dari UGM, S2 bidang Matematika Industri diperoleh tahun 1997 dari Univ. Kaiserslautern Jerman, dan S3 Matematika Terapan diperoleh tahun 2003 dari ITB dan Sandwich program dengan Univ. Kaiserslautern, Jerman. Bergabung sebagai pengajar di UKSW tahun Mengajar matematika di UKSW untuk berbagai mata kuliah S1 seperti analisa real, aljabar linear, optimasi nonlinear, persamaan diferensial, metode numerik, komputasi matematika, pemodelan dan analisa data multivariat, English mathematics, filosofi untuk sains, dan juga menjadi konsultan pengajar di SMP dan SMA Kalam Kudus Solo dan Kumon di Salatiga. Kegiatan ini juga mendorong untuk memperhatikan matematika pada dunia pendidikan dengan berbagai kurikulum internasional yang digunakan di Indonesia. Selain itu, juga menjadi dosen tamu untuk beberapa universitas di luar Jawa dan beberapa sekolah. Penelitian yang sering dilakukan adalah menganalisa data industri di Salatiga dan sekitarnya sehingga banyak terkait dengan pemodelan dan optimasi. Dari Laboratorium Kimia di UKSW dengan beberapa kajian: optimasi protein, optimasi steviosida, optimasi untuk bidang pertanian dan pemodelan matematika dengan diferensial juga menjadi kegemarannya. Sekalipun demikian, penelitian bidang pendidikan matematika juga dilakukan (pengajaran Kalkulus dengan MATLAB, visualisasi fungsi kompleks). Terdorong untuk mempromosikan matematika melalui budaya, cabang kalkulus diolah dan dimanfaatkannya untuk membuat motif-motif cantik untuk batik. Kegiatan ini akan dikembangkan agar menjadi aktivitas kreatif dari mahasiswa bersama secara ber- Sri Winarso Martyas Edi, S.Kom,M.Cs. Lahir di Kab. Semarang, 29 Maret Pendidikan terakhir di Magister Sistem Informasi Fakultas Teknologi Informasi UKSW. Riwayat pekerjaan: bergabung dengan program studi Diploma 3 Teknik Informatika Fakultas Teknologi Informasi tahun sekarang, resmi bergabung dengan pusat studi SIMITRO tahun 2014, bidang minat penelitian rekayasa sistem web dan multimedia, GIS, simulasi dan modeling. Dr. Sri Yulianto Joko Prasetyo, lahir di Klaten 25 Juli 1971, Pendidikan S1 bidang Biologi dari UKDW Yogyakarta pada tahun 1996, S2 bidang Ilmu Komputer dari UGM pada tahun 2003, dan S3 bidang Ilmu Komputer dari UGM pada tahun Saat ini aktif mengajar di Universitas Kristen Satya Wacana Salatiga pada Program Strata 1 Fakultas Teknologi Informasi pada Mata Kuliah Rekayasa Perangkat Lunak, Sistem Terdistribusi dan Basisdata, Strata 2 Program Magister Agroteknologi pada Mata Kuliah Analisis Spasial dan Analisis Statistik dan Strata 2 Program Magister Manajemen Pendidikan pada Mata Kuliah Literasi Komputer dan Sistem Informasi Manajemen Pendidikan. Penelitian yang telah dikerjakan atas pembiayaan Dikti sejak tahun 2008 hingga sekarang meliputi Hibah Bersaing 3 tahun, Hibah Stranas 2 tahun, dan Hibah Unggulan PT 2 tahun. Penelitian atas pembiayaan Asean Development Bank (ADB) diperoleh pada tahun Sejak tahun 2008 telah mempublikasikan 11 jurnal internasional. G R A F I K A ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS Dr. H.A. Parhusip Dr. Sri Yulianto Joko Prasetyo Sri Winarso Martyas Edi, S.Kom, M.Cs Dr. H.A. Parhusip Sri Winarso Martyas Edi, S.Kom, M.Cs Dr. Sri Yulianto Joko Prasetyo 2 x x 1 2 f x e x 2 x 1 exp 1/ x Var ( X1) Kov( X1, X2) Kov( X2, X1) Var ( X2) S x ' x p ( ) D F Y i 1 max ( i i, F Y i 1 i N N N B 11 B 1 12 B 21 B22

2 ANALISA DATA DENGAN PEMODELAN UNTUK ILMU SAINS dan SOSIAL menggunakan MATLAB, SCILAB Menggunakan SPSS 16 menggunakan R Untuk peneliti dan pengajar : mahasiswa S1, S2, S3, saintis, ekonom dan pengguna matematika pada umumnya. Untuk kalangan pemula membuat karya tulis ilmiah, Aplikasi di bidang sains dan ilmu sosial untuk staff perencana program pembangunan Dr. H.A. Parhusip Sri Winarso Martyas Edi, S.Kom,M.Cs. Dr. Sri Yulianto Joko Prasetyo G R A F I K A Penerbit Tisara Grafika SALATIGA 2014

3 Katalog Dalam Terbitan PAR Parhusip, H. A. a Analisa data pemodelan untuk ilmu sosial dan sains / H. A. Parhusip. (et al).-- Salatiga : Tisara Grafika, xvii, 398 hlm. ; 25 cm. ISBN Statistics. I. Title. Cetakan pertama : Juni 2014 ISBN : Hak Cipta : Pada Penulis Editor : Dr. Sri Yulianto Desain Sampul : Tisara Grafika Tata letak : Harrie Siswanto Percetakan : Tisara Grafika Penerbit : Tisara Grafika Data dan program pada buku ini dapat didownload dari: mathica2014.wix.com Hak Cipta dilindungi oleh Undang-undang Dilarang mengutip atau memperbanyak sebagian atau seluruh buku ini tanpa seijin penulis Diterbitkan oleh: G R A F I K A JL. DIPONEGORO 98 D - SALATIGA JAWA TENGAH Telp.: Fax : Mobile: harisis_05@yahoo.com, harriesiswanto@gmail.com Bank: BNI Cabang Salatiga No. Rek Kerjasama dengan: Pusat Studi SIMITRO UNIVERSITAS KRISTEN SATYA WACANA SALATIGA

4 Kata Pengantar Buku ini ditulis untuk memberikan contoh-contoh menganalisa data dengan statistika maupun dengan matematika yang diintegrasikan dengan cara melakukan pemodelan dan cara pemrograman dengan MATLAB dan R. Hal ini sebagai materi untuk menterjemahkan data yang ada di dalam sehari-hari dan dapat dipakai untuk melakukan perencanaan. Data yang diambil untuk studi merupakan data-data dari sekitar Salatiga, Jawa Tengah sehingga dapat dimanfaatkan untuk contoh membuat penelitian dan karya ilmiah. Masalah yang sering muncul bukanlah cara menggunakan metode tetapi lebih pada cara memformulasi suatu masalah dari data atau lebih dikenal dengan melakukan pemodelan yang selanjutnya dapat merujuk teori yang terkait dengan model tersebut. Buku ini ditulis sebagai media bagi para peneliti untuk berbagai strata. Untuk para matematikawan dan statistikawan, buku ini sangat membantu dalam memberikan contoh mengintegrasikan matematika dan statistik. Bagi para pengguna matematika dan statistika, maka buku ini membantu untuk lebih menajamkan cara mengemukakan karya ilmiah dengan lebih saintifik terutama yang bermula dengan adanya data. Salatiga, Juni 2014 Penulis iii

5 iv

6 Daftar Isi Kata Pengantar Daftar Isi Daftar Tabel Daftar Gambar iii v viii xiii 1 STATISTIKA DISKRIPTIF Variansi dan matriks kovariansi Cara Bekerja dengan SPSS Variansi-Kovariansi dan korelasi formula dalam SPSS Studi Korelasi (Linear) Distribusi Frekuensi 34 2 DISTRIBUSI NORMAL Fungsi kepadatan distribusi normal Untuk Satu variabel random Untuk Satu variabel random Untuk 3 variabel random Uji Data Uji chi-kuadrat Uji Kolmogorov Smirnov (K-S test) Uji normal multivariat Uji normal multivariat dengan plot chi-kuadrat Transformasi data menjadi berdistribusi 88 normal 3 MULTI VARIAT REGRESI Regresi linear sederhana Regresi fungsi 1 peubah untuk polinomial derajat k 98 (k >1) 3.3. Regresi linear Multivariat (klasik) Residu dan Hasil Regresi Hasil analisis variansi Regresi dengan SPSS Regresi dengan program R 122 v

7 3.8 Linear regresi dengan variabel prediktor banyak Regresi GSTAR (Generalized Space Time Auto 165 Regressive) Model GSTAR PCA (PRINCIPAL COMPONENT ANALYSIS) Pendahuluan Dasar-Dasar PCA PCA dengan standarisasi Variabel Kegiatan Penelitian Bagaimana Memulai Analisa Data dengan Pemodelan Kegiatan Penelitian Kasus Kependudukan ANOVA DAN MANOVA Latar Belakang Repeated Measures (Pengukuran Berulang) ANOVA One way-anova Bagaimana ANOVA dengan SPSS Two Way-ANOVA Two Way ANOVA dengan SPSS Perbandingan Berpasangan (Paired Comparisons) METODE DISKRIMINAN Pendahuluan Dasar-Dasar Metode Diskriminan Metode Fisher untuk Mendiskriminasi Beberapa 271 Populasi 6.3. Kegiatan penelitian LEBIH LANJUT DENGAN GSTAR dan HASIL 291 PENELITIAN TERKAIT 7.1 Pendahuluan Modifikasi GSTAR Masalah optimasi padi dan modifikasi GSTAR Modifikasi GSTAR untuk produksi padi 299 vi

8 8 BERBAGAI KEGIATAN PENELITIAN TEORI 331 DENGAN PEMROGRAMAN 8.1 Jarak Statistik Dekomposisi Spektral untuk matriks Kovariansi Uji statistik untuk hasil parameter dari model modifikasi 346 GSTAR DAFTAR PUSTAKA PENELITIAN BERBASIS KONSEP DAN PENDEKATAN 351 SPASIAL 9.1. Pendahuluan Sains Informasi Geografis Analisis Data Spasial Metode Eksplorasi dan Analisis Data Spasial Visualisasi Data Spasial Teknologi Informasi dalam Analisis Spasial 372 DAFTAR PUSTAKA KONSEP ANALISIS SPASIAL STATISTIKA Klasifikasi metode analisis dan tujuan analisis Spasial 378 Statistik 10.2 Konsep Spatial Autocorrelation Local Indicators of Spatial Autocorrelation/LISA 386 vii

9 Daftar Tabel 1.1 Notasi statistik dan maknanya Istilah statistik dan maknanya Cara mendapatkan variansi satu variabel random Program scilab untuk menghitung variansi Cara mendapatkan variansi dua variabel random Mencari nilai variansi X dan Y dengan program scilab Cara mendapatkan variansi tiga variabel random Pola data yang akan diolah Bentuk data berdasarkan angket yang diberikan 19 (diperoleh dari informasi informal oleh observer) 1.10 Nilai rata-rata tiap subvariabel dalam variabel X 1 untuk 20 tiap responden 1.11 Rata-rata tiap 3 pertanyaan berturutan untuk tiap 21 responden pada variabel 1.12 Rata-rata 3 pertanyaan untuk tiap responden dalam 23 variabel Y Hasil korelasi (hanya yang lebih besar 0.5) antara 26 subvariabel dalam Y 1.14 Korelasi antara subvariabel dalam X 1 dan X 2 (hanya yang lebih besar 0.5) 1.15 Korelasi antara sub variabel dalam X 1 dan X 2 (hanya yang lebih besar 0.5) 1.16 Korelasi X 2 dan Y Data untuk 4 macam perlakuan pada 19 anjing Program Scilab untuk menyusun matriks kovariansi 39 data pada Tabel 1.18, Data Tabel 1.3 yang distandarisasi Daftar program yang merupakan kelanjutan program 41 pada Tabel Data diambil dari (Johnson, and Wichern, 2007) Data polusi udara viii

10 2.3 Data tekanan udara Boyolali bulan Juli-November Daftar pertanyaan untuk mengevaluasi dosen 85 (Parhusip dan Setiawan, 2011) 2.5 Hasil evaluasi terhadap 6 dosen untuk berbagai mata 85 kuliah yang disajikan 2.6 Daftar nilai hasil 3 matakuliah (Johnson andwichern, 86 hal.195) 3.1 Data indeks saham LQ45 dari 5 perusahaan pada 104 periode 1 Agustus September Pola data indeks LQ45 (variabel tak bebas) (sumbu vertikal) dan indeks saham AALI (sumbu horizontal) pada 1 Agustus September Hasil regresi linear (k =1) Hasil regresi univariat untuk polinomial derajat k=1,2,3, 107 dan Data 2 variabel prediktor dan 1 variabel respon (Y) 114 dalam Excel 3.6 Indeks Harga Saham per Sektor di Bursa Efek Jakarta Indeks LQ45 (kolom ke-3) dengan nilai saham pada 139 saat penutupan (kolom ke-4 hingga 8) 3.8 Rata-rata suhu udara tahun Rata-rata kelembaban udara tahun Rata-rata curah hujan tahun Rata-rata suhu udara, curah hujan, dan kelembaban udara tiap bulan di tahun Rata-rata curah hujan dan kelembaban udara Data curah hujan dan kelembaban udara Hasil keluaran regresi program R Hasil keluaran dengan program SPSS Sifat dari yang diperoleh Sifat-sifat dari Rata-rata Suhu Udara tahun Rata-rata Kelembaban Udara tahun Rata-rata Curah hujan tahun ix

11 3.21 Hasil uji korelasi Pearson untuk Kecamatan Selo, 183 Ampel, dan Boyolali 3.22 Hasil penaksiran parameter dengan bobot lokasi 185 seragam 3.23 Hasil penaksiran parameter dengan bobot lokasi 185 normalisasi korelasi silang 4.1 Data pengukuran variabel untuk 4 sektor saham Data pengukuran variabel untuk 4 sektor saham 196 (tak berdimensi) 4.3 Daftar 15 kota dengan nilai korelasi terbesar Nilai Korelasi Indeks Harga Konsumen dan Inflasi 202 dengan Metode Regresi 4.5 Principal Component Analysis Inflasi di 66 Kota di 204 Indonesia 4.6 Principal Component Analysis Indeks Harga Konsumen 206 di 66 Kota di Indonesia 4.7 Contoh data lingkar dada, berat pupuk urea dan berat untuk 208 sapi dari Peternakan Rakyat Dukuh Belon, Kel. Kumpulrejo, Kec. Argomulyo, Kota Salatiga dari tanggal 15 Juli 2008 s/d 30 Agustus 2008 (Parhusip dan Ayunani, 2009) 4.8 Data pupuk urea yang diberikan sesuai dengan berat 209 untuk sapi dari Peternakan Rakyat Dukuh Belon, Kel. Kumpulrejo, Kec. Argomulyo, Kota Salatiga dari tanggal 15 Juli 2008 s/d 30 Agustus 2008 (Parhusip dan Ayunani, 2009) 4.9 Data berbagai variabel yang diukur pada sapi dari 210 Peternakan Rakyat Dukuh Belon, Kel. Kumpulrejo, Kecamatan Argomulyo, Kota Salatiga dari tanggal 15 Juli 2008 sampai dengan 30 Agustus 2008 (Parhusip dan Ayunani, 2009) 4.10 Data berbagai variabel yang diukur pada sapi (lanjutan 210 Tabel 4.9) 4.11 Data pengguna kontrasepsi pada tiap desa di Kecamatan 211 Sidorejo 4.12 Data Kepadatan Penduduk Kota Salatiga pada tahun per km 2 x

12 4.13 Daftar data banyaknya tenaga kerja tahu dan tempe 216 berdasarkan wilayah di Salatiga 4.14 Daftar pengguna kontrasepsi pada penduduk pada tiap 220 Kecamatan di Salatiga pada tahun Kepadatan Penduduk kota Salatiga tahun 2008 untuk 221 tiap kecamatan dan kelurahan 5.1a Perbedaan ANOVA dan MANOVA b Keluaran ANOVA Between-Subjects Factors Daerah konfidensi 95% untuk δ Hasil analisa paired comparisons kelas B Daerah konfidensi 95% untuk δ a Rata-rata dan standar deviasi Kelas A b Hasil dari tes multivariat untuk Kelas A minggu 256 pertama, kedua, dan ketiga 5.5c Hasil analisa perbandingan berpasangan Kelas A d Rata-rata dan standar deviasi Kelas B e Hasil analisa perbandingan berpasangan Kelas B f Hasil tes multivariat Kelas A dan B untuk variabel 260 Kelas 5.5g Perbedaan rata-rata respon Kelas A dan B untuk 260 variabel Kelas 5.5h Hasil tes multivariat rata-rata respon mahasiswa i Rata-rata respon mahasiswa j Hasil tes multivariat dari interaksi Kelas dengan Ratarata 261 respon mahasiswa 5.5k Hasil analisa perbandingan berpasangan minggu 264 pertama sampai minggu ketiga 6.1 Data jumlah penduduk miskin dan garis kemiskinan di 274 kota dan desa di seluruh provinsi di Indonesia pada bulan Maret Data Pengamatan Tingkat Kemiskinan di Kota Data Pengamatan Tingkat Kemiskinan di Desa Tabel substitusi nilai x 0 masing-masing Kab/Kota pada 287 persamaan (6.4) xi

13 6.5 Pengelompokkan Kab/Kota penghasil ternak besar atau ternak kecil Parameter pada model modifikasi GSTAR (persamaan ) untuk data luas lahan kritis pada Selo, Ampel, dan Cepogo 7.2 Model modifikasi GSTAR untuk banyaknya produksi 296 padi 7.3 Parameter untuk model modifikasi GSTAR untuk 296 produksi padi yang tergantung pada area lahan kritis 7.4 Parameter dari produksi panen padi (tak berdimensi) 297 yang dimodelkan dengan persamaan (7.7) 7.5 Nilai tiap parameter pada model (P.4)-(P.6) Hasil optimasi produksi panen padi dari tiap daerah Data kegiatan penelitian Klasifikasi metode analisis dan tujuan analisis Spasial 380 Statistik 10.2 Metode atau fungsi yang digunakan setiap jenis Metode analisis menurut Legendre dan Marie (1989) 396 xii

14 Daftar Gambar 1.1 Jendela untuk menulis data Jendela nama variabel Jendela tipe variabel Jendela analisa Jendela keluaran SPSS Input variabel Jendela SPSS untuk variabel Hasil keluaran SPSS Pilihan pada jendela descriptive Menu korelasi dari SPSS Kovariansi data X dan Y dari contoh Keluaran SPPS dengan fungsi Correlate Daerah hipotesis, penerimaan dan penolakan H Keluaran SPSS Keluaran SPSS untuk histogram Data polusi Tabel 1 yang diuji kenormalannya Plot chi-square data tekanan udara Boyolali Juli- 84 November tahun Horizontal merupakan nilai dan vertikal menyatakan 91 nilai kritis batas normal 2.7 Uji normal data tekanan udara bulan Juli-November Histogram untuk normalitas data tiap bulan dari Juli- 94 November QQ-Plot dari data bulan Juli-November tahun Data yang diolah Pola data indeks LQ45 (variabel tak bebas)(sumbu 105 vertikal) dan indeks saham AALI (sumbu horizontal) pada 1 Agustus September Hasil regresi linear (k =1) Hasil regresi univariat untuk polinomial derajat k=1,2,3, 107 dan Data 2 variabel prediktor dan 1 variabel respon (Y) dalam Excel 115 xiii

15 3.6 Tampilan SPPS17 untuk layar tampilan Variabel View Data Tabel 3.2 yang ditampilkan sebagian Jendela Analyze Isi Jendela Analyze Pilihan kajian statistik untuk variabel Pertanian saja Hasil keluaran analisis untuk Pertanian Hasil keluaran analisis untuk Pertanian Uji normalitas untuk variabel pertanian dengan Q-Q plot Hubungan linear volume saham pada AAL Sep 2010-Sep terhadap nilai saham pada pembukaan, tinggi dan rendah 3.15 Profil data Perusahaan AAL dan BPKP pada 1 Sep Sep 2011 dengan data nilai saham pada saat pembukaan, tinggi, rendah, penutupan dan volume saham tiap waktu 3.16 Hubungan nilai volume data (horizontal ) dan yang hasil 133 regresi (vertical dari perusahaan AAL Sep 2010-Sep 2011) 3.17 Hubungan nilai volume data (horizontal) dan yang hasil 133 regresi (vertikal dari perusahaan BBKP Sep 2010-Sep 2011) 3.18 Ilustrasi setiap variabel X (perusahaan) terhadap nilai 141 indeks LQ Perbandingan data dan hasil estimasi regresi multivariate; 141 data disimbolkan (*) dan pendekatan disimbolkan o 3.20 Ilustrasi hubungan linear antar variabel tak bebas dan 145 tak bebas untuk tiap variabel untuk data Tabel Uji normalitas data Gambar Hasil analisis regresi dari Tabel 3.10 dengan program R Gambar hasil analisis regresi pada tabel 3 dengan program 161 R 3.24 Jendela Minitab untuk memulai analisa diskriptif Jendela Minitab untuk menyimpan matriks kovariansi Jendela Minitab untuk membangkitkan data normal xiv multivariate Jendela minitab tampilan akhir Jendela minitab untuk transformasi Box -Cox 175 xiv

16 3.29 Jendela minitab untuk transformasi Box -Cox Jendela minitab untuk transformasi Box -Cox Jendela minitab untuk transformasi Box -Cox Jendela minitab untuk trend analysis Jendela minitab untuk trend analysis Jendela minitab untuk trend analysis dengan differencing Grafik Transformasi Box-Cox untuk Kecamatan Selo, 184 Ampel, dan Cepogo 3.36 Hasil perbandingan data asli dengan data model dengan 184 bobot lokasi seragam 3.37 Hasil perbandingan data asli dengan data model dengan 185 bobot lokasi seragam 3.38 Hasil perbandingan data asli dengan data model dengan bobot lokasi normalisasi korelasi silang Grafik korelasi indeks harga konsumen dan inflasi 66 kota 198 dalam diagram batang dan scatter plot 4.2 Histogram indeks harga konsumen 66 kota dengan principal 200 component analysis 4.3 Principal Component Analysis Inflasi di 66 Kota di 204 Indonesia 4.4 Contoh daftar penerima subsidi kedelai perkecamatan kota 215 Salatiga Oktober 2008 (Hanya ditunjukkan sebagian) 4.5 Kepadatan penduduk Sidorejo sebagai fungsi jenis kontrasepsi 219 yang digunakan. Tanda (*) untuk data dan tanda o hasil pendekatan fungsi linear 5.1 Jendela SPSS untuk anova Lokasi dan distribusi curah hujan (Sumber: web) Pola hujan daerah Aceh, Ambon, Ampenan, Bandung, 240 Banjarmasin 5.4 Pola hujan daerah Bengkulu, Denpasar, Gorontalo, 240 Jakarta, Jambi 5.5 Pola hujan daerah Kendari, Kupang, Manado, Medan, 241 Padang 5.6 Pola hujan daerah Palangkara, Palembang, Palu, Pangkal pinang, Pekan baru. 241 xv

17 5.7 Pola hujan daerah Pontianak, Samarinda, Semarang, 241 Sentani, Serang 5.8 Pola hujan daerah Surabaya, Tanjung karang, Ternate, 241 Ujung pandang, Yogyakarta 5.9 Distribusi normal multivariate curah hujan di Indonesia Skema pola data respon mahasiswa sebagai hasil survei oleh Rahandika A (Pritasari, dkk,2013) Grafik rata-rata respon mahasiswa pada Kelas A dan Kelas B Sumbu horisontal menunjukkan indeks data (provinsi), sumbu vertikal menunjukkan quantile distribusi chisquare dengan signifikansi 5% Hasil plot x 0 menurut pertidaksamaan (6.4): sumbu 276 vertikal menunjukkan nilai ruas kiri dari pertidaksamaan (6.4), sumbu horisontal menunjuk-kan indeks x Hasil plot data kemiskinan di kota dengan perhitungan 279 Fisher s Discriminant: sumbu horisontal menunjukkan nilai y1, sumbu vertikal menunjukkan nilai y2 6.4 Hasil plot data kemiskinan di desa dengan perhitungan 2.80 Fisher s Discriminant: sumbu horisontal menunjukkan nilai y1, sumbu vertikal menunjukkan nilai y2 6.5 plot data asli dan data simulasi ( si Kaya ) di kota plot data asli dan data simulasi ( si Kaya ) di desa Grafik Cek Normal untuk data peternakan tiap kabupaten 284 di Jawa Tengah 6.8 Grafik Karakteristik Peternakan Kab/Kota di Jawa Tengah Pendekatan curah hujan dengan persamaan (7.2) pada Selo 293 Horizontal: indeks, Vertikal: banyaknya curah (tak berdimensi, karena data sudah distasionerisasi) 7.2 Regresi GSTAR untuk curah hujan di Selo. Data (*,o,dan 293 model (*) ditunjukkan dengan garis 7.3 Pendekatan dan data hasil produksi padi di Selo sebagai model produksi padi yang tergantung produksi padi di Selo pada waktu sebelumnya, dan produksi padi dari Ampel dan Cepogo 294 xvi

18 7.4 Model GSTAR (disimbolkan -o ) dan data (disimbolkan 298 * ) untuk produksi panen padi sebagai fungsi lahan kritis dan curah hujan pada waktu yang sama 7.5 Luas lahan kritis di Selo sebagai fungsi luas lahan kritis di 304 Ampel dan Cepogo pada waktu yang sama 7.6 Banyaknya curah hujan di Selo sebagai fungsi curah hujan 304 di Ampel dan Cepogo pada waktu yang sama dimana data tak berdimensi 7.7 Banyaknya panen padi di Selo sebagai fungsi lahan kritis 305 dan curah hujan menurut model (P.4)-(P.6) 7.8 Gambar peta Boyolali berdasarkan zona arkeologi dengan 318 pembobotan 7.9 Hasil pemrograman untuk peta Boyolali dengan pembobotan 319 dengan data simulasi 8.1 Scatter plot data Tabel Data dalam ellips untuk c = Data dalam ellips untuk c = 4 (tanda. ) dan untuk c=2 339 (tanda - ) 8.4 Grafik ellips yang dirotasikan Hasil rotasi ellips dengan c = Citra satelit dalam sistem pranatamangsa baru versi Kabupaten Boyolali 9.2 Peta analog Kabupaten Boyolali Foto udara erupsi Gunung Merapi LIDAR DSM (Digital Surface Model) Sumatera Selatan Data raster Data dalam bentuk titik Data dalam bentuk gari Data dalam bentuk area Representasi serangan wereng batang coklat di wilayah 371 Lab. PHP V Surakarta bulan Januari - Desember Contoh Moran Scatterplot Kepadatan Penduduk 385 di Kabupaten Semarang 10.2 Proses pembangunan GIS menurut Anselin dan Ord Proses ESDA Proses analisis spasial 395 xvii

19 xviii

20 1 STATISTIKA DISKRIPTIF Statistik diskriptif merupakan statistik untuk menjelaskan data misalkan dengan grafik, perhitungan rata-rata dan menentukan ekstrim data. Statistik Inferensial umumnya mengijinkan kita untuk menjelaskan parameter dari populasi berdasarkan sampel tes dengan tes statistik, misalkan Chi-Square, T-Tests, Korelasi, ANOVA. Untuk melakukan keduanya maka kita perlu beberapa definisi standar dalam statistik. 1.1 Variansi dan matriks kovariansi Sebelum matriks kovariansi dibahas, maka perlu dibahas definisi variansi dan matriks kovariansi. Variansi untuk variabel acak X dengan data sebanyak n adalah ( X ) E( X ) E( X ), E( X ) 2 Var( X ) E (1.1) Notasi E(X ) dibaca sebagai nilai harapan X dan secara komputasi berdasarkan sampel hal ini ditunjukkan dengan nilai rata-rata-rata sampel (disimbolkan x ). Secara sama kita dapat menuliskan untuk populasi dan sampel besaran-besaran statistik yang banyak kita jumpai dengan notasi menurut Tabel 1.1. ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL DAN SAINS 1

21 Notasi populasi E(X ) E( X 2 ) Var(X)= XY Ε 2 Tabel 1.1 Notasi statistik dan maknanya ΕXY ΕX ΕY XY X Y Notasi/formula untuk sampel x n n i 1 i1 2 s n s x 2 i n n i1 2 s x n i x 2 i x 2 Makna notasi Rata-rata Setiap data dikuadratkan kemudian dirata-rata Variansi Deviasi standard S Matriks kovariansi s XY n i1 x y n i i x y Variansi antara X dan Y Catatan: beberapa istilah dasar yang sering digunakan tidak banyak dibahas di sini, diantaranya ditunjukkan pada Tabel 1.2. Tabel 1.2. Istilah statistik dan maknanya Istilah statistik Mean Median Mode Quantil Central tendency Dispersion Skewness Kurtosis Arti Jenis rata-rata data yang diperoleh dari jumlah data dibagi banyaknya. Jenis rata-rata data yang merupakan nilai tengah data setelah data diurutkan Data yang paling sering muncul (frekuensi terbesar) Membagi data dalam 4 bagian Pengukuran pusat data Penyebaran data Ukuran kecondongan (kurva yang tidak simetris) Ukuran keruncingan/ketinggian kurva 2 STATISTIKA DISKRIPTIF

22 Contoh 1.1 Misalkan X = [ ] T Var( X ) ( X 2 2 E( X 2 ) ) = 15, = 2,9167. Nilai tersebut secara rinci ditunjukkan pada Tabel 1.3. Jumlah Rata-rata Tabel 1.3. Cara mendapatkan variansi satu variabel random X n i1 x x i 2 X 21 n i1 x i 2 = Mencari variansi untuk variabel acak X data sebanyak n dengan Program Scilab ditujukan pada Tabel 1.4. X=[1:6]' X2=X.^2 JX=sum(X) JX2=sum(X2) Jbar=mean(X) X2bar=mean(X2) X=[1:6]' EX=mean(X) X2=X.^2 EX2=mean(X2) arx=ex2-ex^2 Tabel 1.4. Program scilab untuk menghitung variansi Program scilab Keterangan Data vector x x 2 Menjumplahkan komponen-komponen x Menjumplahkan x 2 Menghitung x yaitu xi 2 Menghitung n Menghitung var (x) ANALISA DATA UNTUK ILMU SOSIAL & SAINS 3

23 Variansi menunjukkan perbedaan data terhadap rata-rata. Jika variabel acak lebih dari 1 (sebutlah X dan Y), maka variansi dapat bervariasi yaitu: variansi antar data dalam variabel acak X, variansi antar data dalam variabel acak Y dan variansi antara data dalam X dan data dalam Y. keseluruhan variansi disimbolkan dengan kovariansi. Variansi antar data dalam variabel acak X disimbolkan Var(X) = Kov(X,X). Variansi antar data dalam variabel acak Y ditulis Var(Y)=Kov(Y,Y). Variansi antara data dalam X dan data dalam Y disimbolkan Kov(X,Y)=Kov(Y,X). Jika banyaknya variabel acak banyak maka penulisan variansi antar variabel acak perlu disusun secara praktis sehingga ditampilkan dalam bentuk matriks. Untuk kovariansi antara 2 variabel acak X dan Y disimbolkan Kov( X, X ) Kov( X, Y) Kov( Y, X ) Kov( Y, Y) Var( X ) Kov( Y, X ) Kov( X, Y) X Var( Y) YX XY. (1.2) Y dengan Kov(X,Y) diformulasikan sebagai XY Kov, X Y X Y X Y XY XY X Y XY X Y (1.3) Untuk data yang diberikan, maka notasi notasi dinyatakan dalam Y rata-rata dari perkalian data antara X dan Y. Contoh 1.2 Diberikan 2 variabel acak X dan Y yaitu y X dinyatakan dalam x dan. Demikian pula notasi XY menyatakan X = [ ] T ; Y = [ ] T. 4 STATISTIKA DISKRIPTIF

24 Secara detail maka nilai variansi X dan Y dinyatakan pada Tabel 1.5. Ε XY Ε X Ε Y Ε XY Diperoleh XY X Y = (3.5)( )= Untuk Var(X)=Kov(X,X) yaitu 2 Var( X ) E( X 2 ) 2 ( X ) Sedangkan Var(Y)=Kov(Y,Y) diperoleh Var( 2 2 E( Y ) ( 0.5) 2 Y ) E( Y ) = 15, = Secara keseluruhan kovariansi antar variabel dapat diperoleh dengan menggunakan persamaan (1.2) diperoleh Var( X ) Kov( Y, X ) Kov( X, Y) Var( Y) Jumlah Rata-rata Tabel 1.5. Cara mendapatkan variansi dua variabel random n i1 x i X Y 2 Y XY n 21 i1 x i X 2 2 =91 n i1 x y 3 i n i1 y i =91 = -9 y n i1 x i y i ANALISA DATA UNTUK ILMU SOSIAL & SAINS 5

25 Mencari nilai variansi X dan Y dengan program scilab ditunjukan pada Tabel 1.6. Tabel 1.6. Mencari nilai variansi X dan Y dengan program scilab Program scilab X=[ ]' X2=X^2 Y=[ ]' Y2=Y^2 XY=X.*Y Keterangan Data X, Y, X 2 dan Y 2 Hasil XY Menjumlahkan X, X 2, Y, Y 2, XY JX=sum(X) JX2=sum(X2) JY=sum(Y) JY2=sum(Y2) JXY=sum(XY) Menghitung kovariansi antar variabel kovxy=jxy-jx*jy EXY=mean(XY);EX=mean(X);EY=mean(Y) EXY EX kovxy=exy-ex*ey EX2=mean(X2) varx=ex2-ex2^2 varx=ex2-ex^2 EY2=mean(Y2);varY=EY2-EY^2 Secara sama maka matriks kovariansi untuk 3 variabel acak X, Y, Z adalah Cov Cov Cov X,X CovX,Y CovX,Z Y,X CovY,Y CovY,Z Z,X Cov Z,Y Cov Z,Z Contoh 1.3. Diberikan 3 variabel acak X,Y,Z. (1.4) X = [ ] T ; Y = [ ] T ; Z= [ ] Secara sama, matriks kovariansi dapat diperoleh dari data Tabel 1.7. T. 6 STATISTIKA DISKRIPTIF

26 Tabel 1.7. Cara mendapatkan variansi tiga variabel random Jm l n i1 X Y Z Z 2 XY XZ YZ XYZ x 21 3 i n i1 n z i i1 y i 17 n i1 n zi 195 x 9 x z i i 63 y z 61 i i i x y z 381 y i i i1 n i 1 n i1 n i1 i i i Ra -ta Ra -ta x 3.5 y -0.5 z z Diketahui bahwa Kov ( X, Z) Kov( Z, X). Demikian pula Sehingga dapat diperoleh Kov ( Y, Z) Kov( Z, Y). Kov( X, Z) ΕXZ ΕX ΕZ ΕXZ Kov( Y, Z) ΕYZ ΕY ΕZ ΕYZ Untuk Var(X) = Kov(X,X) diperoleh 2 Var( X ) E( X 2 ) Sedangkan Var(Y)=Kov(Y,Y) diperoleh Var( Xz Y X 2 E( X ) E( Y ) ( 0.5) 2 Y ) E( Y ) = 15, = Demikian pula secara sama pada Var(Z)=Kov(Z,Z) Var( Z) E( Z 2 ) 2 2 E( Z) Akhirnya matriks kovariansi untuk 3 variabel random X,Y dan Z dengan data di atas adalah Yz Z Z. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 7

27 X,X CovX,Y CovX,Z Y,X CovY,Y CovY,Z Z,X CovZ,Y CovZ,Z Cov Cov Cov Var Cov Cov X CovX,Y CovX,Z Y,X VarY CovY,Z Z,X CovZ,Y VarZ Invers matriks kovariansi muncul pada fungsi densitas distribusi normal multivariat. Hal ini dibahas pada fungsi densitas distribusi normal yang dimulai dari 1 variabel, kemudian dilanjutkan untuk 2 dan 3 variabel. Akhirnya akan diperumum untuk p variabel random. Selanjutnya kita akan belajar cara bekerja dengan SPSS. 1.2 Cara Bekerja dengan SPSS Untuk pengguna SPSS maka data yang kita olah akan kita kerjakan dengan SPSS. Berikut ini kita perlu memperkenalkan terlebih dahulu SPSS. Kasus 1. Untuk 1 variabel Perhatikan bahwa standard deviasi adalah akar dari variansi. Tahap 1. Jendela SPSS untuk data, kita input dengan memilih menu Data View sebagaimana yang ditunjukkan pada Gambar 1.1 (kiri) Gambar 1.1. Jendela untuk menulis data 8 STATISTIKA DISKRIPTIF

28 Tahap 2. Untuk menamakan variabel maka kita perlu memilih jendela variabel View. Gambar 1.2. Jendela nama variabel Untuk tipe data maka dapat dipilih sebagai berikut Gambar 1.3. Jendela tipe variabel Tahap 3. Jendela untuk menganalisa Dalam hal ini kita menghendaki keluaran standar deviasi. Kita memilih menu berturut-turut adalah Analyze, Descriptive Statistics, Descriptives dan contreng pada options untuk standar deviasi dan yang lain yang diperlukan. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 9

29 Gambar 1.4. Jendela analisa Tahap 4. Hasil keluaran ditunjukkan pada Gambar 1.5. Gambar 1.5. Jendela keluaran SPSS 10 STATISTIKA DISKRIPTIF

30 Tahap 5. Analisa data Jadi variansi data Tabel 2 adalah 3.5 sehingga s Perhatikan bahwa dari formula yang digunakan diperoleh nilai eksak adalah s = Jadi hasil yang diperoleh dapat dianggap sama. Dari hasil kita dapat belajar memahami bagaimana angka-angka yang muncul pada SPSS diperoleh dengan mengerti formula yang terkait terlebih dahulu. Kasus 2. Variansi untuk 2 variabel random Contoh 1.3 Diberikan 2 variabel acak X dan Y yaitu X = [ ] T ; Y = [ ] T. Tahap 1. Input data pada SPSS ditunjukkan pada Gambar 6. Tahap 2. Penamaan Variabel Gambar 1.6. Input variabel Gambar 1.7. Jendela SPSS untuk variabel ANALISA DATA UNTUK ILMU SOSIAL & SAINS 11

31 Tahap 3. Kita akan mencari variansi ataupun standard deviasi, maka kita dapat memilih menu yang sama: Analyze Descriptive Statistics Descriptives Kita dapat memilih jenis analisis yang dikehendaki dengan memilih Options, maka akan muncul jendela options dan kita memilih tiap tipe analisis yang kita kehendaki dengan menggunakan tanda V (mencontreng) pada kotak yang disediakan. Gambar 1.8 Hasil keluaran SPSS Gambar 1.9. Pilihan pada jendela descriptive Bandingkan dengan matriks kovariansi yang muncul (lihat subbab 1.1) yaitu Var( X ) Kov( Y, X ) Kov( X, Y) Var( Y) Dari hasil ini kita tetap menganggap hasil yang diperoleh dari SPPS benar (sekalipun ada error) karena standar yang kita gunakan dalam pembahasan adalah analisa data dengan SPSS. Pada bagian ini variansi antar 2 variabel 12 STATISTIKA DISKRIPTIF

32 tidak muncul di SPSS. Padahal hal itulah yang diamati. Hal ini dapat diperoleh dengan menggunakan fungsi correlation dari SPSS. Dengan memilih Correlate -> Bivariate->Options, kemudian contreng yang diperlukan sebagaimana ditunjukkan pada Gambar 1.9. Gambar 1.10.Menu korelasi dari SPSS Gambar Kovariansi data X dan Y dari contoh Variansi-Kovariansi dan korelasi formula dalam SPSS Catatan: Dari formula diperoleh bahwa Cov(X,Y)= Sedangkan SPSS memberikan Hal ini membingungkan bagi pengguna. Demikian pula dengan menggunakan formula yang juga muncul dari literatur lain (Web1) yaitu ANALISA DATA UNTUK ILMU SOSIAL & SAINS 13

33 n 1 Cov( X, Y ) ( xi x)( yi y). n i1 Dari formula ini diperoleh Cov(X,Y)=2.75. Ada pula, yang menggunakan formula Dari formula ini diperoleh n 1 Cov( X, Y ) ( xi x)( yi y) (1.5) n 1 i1 n 1 Cov ( X, Y ) ( xi x)( yi y) 3.3. n 1 i1 Hasil ini menggembirakan karena sesuai dengan keluaran SPSS. Jadi formula yang kita gunakan untuk menjelaskan keluaran kovariansi adalah persamaan (1.5). Kita dapat memperluas pengetahuan ini untuk menyelidiki nilai-nilai hasil SPSS yang berbeda dengan formula baku yang digunakan pada umumnya. Demikian pula untuk variansi, setelah dicermati, maka Var(X) didefinisikan pada SPSS sebagai n 1 2 Cov( X, X ) Var( X ) ( x i x) (1.6) n 1 Contoh 1.4 Untuk data X=[1,2,3,4,5,6] maka Cov(X,X)=Var(X) = 3.5 yang sama dengan hasil keluaran SPSS. Sedangkan data Y=[1,2,-3,-4,5,6] maka Cov(Y,Y)=Var(Y) = yang sesuai dengan hasil keluaran SPSS. Oleh karena itu korelasi formula SPSS dapat diselidiki lebih lanjut. Yaitu n i1 ( xi x)( yi y) 1 i1 Corr( X, Y ) rxy (1.7) n 1 Var( X ) Var( Y ) 14 STATISTIKA DISKRIPTIF

34 ANALISA DATA UNTUK ILMU SOSIAL & SAINS 15

35 Contoh 1.5 Untuk data yang diberikan di atas diperoleh hasil yang sama dengan keluaran SPSS yaitu: ( xi x)( yi y) 1 i1 Corr( X, Y ) r n 1 Var( X ) Var( Y ) n XY. Daftar Pustaka Web Studi Korelasi (Linear) Hubungan antara 2 variabel dinyatakan dalam bentuk koefisien korelasi. Formula yang umum digunakan adalah korelasi menurut Pearson. Korelasi antara 2 variabel X dan Y memenuhi (Web1) ( xi ( xi x)( yi y) rxy. (1.8) 2 2 [ x) ][ ( y y) ] Ada pula yang memformulasikan dalam bentuk r XY i ( xi x)( yi y) (1.9) Var( X ) Var( Y) Nilai korelasi ini berkisar diantara -1 dan 1, atau 1 r 1. Korelasi bernilai negatif dikatakan korelasi antara 2 variabel negatif (meningkatnya salah satu variabel menyebabkan nilai variabel yang lain menurun). Demikian pula secara analog dapat didefinisikan korelasi positif. Nilai korelasi 1 berarti korelasi terhadap dirinya sendiri. XY 16 STATISTIKA DISKRIPTIF

36 Contoh 1.6 Carilah korelasi antara variabel X dan Y pada Contoh 1.2. Jawab: kita dapat menggunakan SPSS dengan keluaran yang ditunjukkan pada Gambar Gambar Keluaran SPPS dengan fungsi Correlate Nilai yang diperoleh sesuai dengan formula (1.5). Nilai 1 pada kolom 1 dan 2 menunjukkan korelasi antara dirinya sendiri. Kita dapat menulis hasil ini dengan menuliskan dalam bentuk matriks korelasi yaitu R Sebagaimana diketahui dari teori bahwa korelasi dikatakan ada jika koefisien korelasi lebih besar dari 0.5. Jadi dapat kita tulis XY YX Korelasi antara variabel X dan Y sama artinya dengan korelasi antara Y dan X. Dari hasil ini maka korelasi antara kedua variabel dikatakan tidak kuat. Jika ada 3 variabel maka kita akan mempunyai matriks korelasi 3 x 3. Seringkali ada banyak variabel yang harus diamati korelasi antar variabel secara bersama-sama. Sehingga kita mempunyai matriks korelasi. Perhatikan bahwa r jj menyatakan korelasi antar variabel yang sama sehingga r jj =1. Korelasi antar 2 variabel yang berbeda dikatakan kuat jika rij 0.5dan semakin kuat rij jika mendekati 1. Perhatikan bahwa r jj menyatakan korelasi antar variabel yang sama sehingga r jj =1. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 17

37 Jika kita mempunyai 3 variabel, maka kita akan mempunyai matriks korelasi berukuran 3 x 3 sebutlah Contoh 1.7. Diberikan 3 variabel r11 r12 r13 R r21 r22 r23. r 31 r31 r33 X 1, X 2, dan Y Sebagai contoh hasil analisa, maka matriks berikut merupakan matriks korelasi yang diperoleh dengan bantuan program (Excel) dengan fungsi correl (menggunakan persamaan 1), yaitu R Dari matriks ini berarti antara variabel X 1 dan X 2 tidak berkorelasi karena r r Demikian pula korelasi X 1 dan Y adalah r r menunjukkan tidak berkorelasi. Secara sama, diperoleh kesimpulan yang sama korelasi antara X 2 dan Y karena r 32 r Contoh 1.8 Dalam aplikasi seringkali dijumpai data dimana kita perlu mendefinisikan sendiri variabel yang dibahas. Dari observasi, diperoleh data dengan 2 variabel bebas (independent) (sebutlah X 1 dan X 2 ) dan 1 variabel dependent (sebutlah Y). Pada analis data multivariat variabel bebas disebut juga variabel prediktor, dan variabel tak bebas dikenal juga sebagai variabel respon. Setiap variabel X 1, X 2, dan Y mempunyai banyaknya variabel berturut-turut n 1, n 2 dan n 3. Jadi X1 x11, x12,..., x1 n ], [ 1 18 STATISTIKA DISKRIPTIF

38 X x, x,..., x ], Y y, y,..., y ]. Selain itu setiap 2 [ n2 [ 1 2 n3 x 1 mempunyai m 1 pengamatan (yang menyatakan banyaknya sampel). Demikian pula setiap x 2 mempunyai m 2 pengamatan dan y mempunyai m 3 sampel. Pola data yang diamati mempunyai bentuk sebagaimana ditunjukkan pada Tabel 1.8. Tabel 1.8. Pola data yang akan diolah X 1 X 2 Y x 1,11 x 1,12 x 1,1 n 1 x 1,11 x 1,12 x 1,1 n 1 y 1,1 y 1,2 y 1, n 3 x 2,11 x 2,11 y 2,1 xm 2,11 x m 2, 12 x m 2, 1n1 xm 1,11 x m 1, 12 x m 1, 1n1 ym 3,1 y m 3, 1 y m3, 1 Contoh 1.9. Misalkan diberikan bentuk data berdasarkan angket yang diberikan menurut Tabel 1.9. Bahan ini sebenarnya materi tesis S2, tapi karena belum dipublikasikan maka saya tuliskan disini sebagai contoh analisa yang datang dari riset S2. Perhatikan bahwa setiap kolom menunjukkan 1 jenis pertanyaan yang diajukan pada m1 sampel. Kita akan menyelidiki korelasi antara variabel respon dengan variabel prediktor. Karena masing-masing variabel mempunyai subvariabel yang lain maka kita dapat melakukan analisa dengan beberapa tahap. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 19

39 Tabel 1.9. Bentuk data berdasarkan angket yang diberikan (diperoleh dari informasi informal oleh observer) VARIABEL PENELITIAN Manajamen pada tempat A X ) ( 1 Kepemimpinan tempat A ( X 2 ) INDIKATOR 1. Fungsi manajemen 2. Planning 3. Organizing 4. Actuating 5. Controlling 1. Pemimpin yang Visioner 2. Pemimpin yang Handal 3. Pemimpin Pekerja Keras 4. Pemimpin Yang Melayani 5. Pemimpin Yang Bertanggung Jawab NO Item Jumlah Item Manajemen dan Kepemimpinan tempat B (Y ) 1. Visi 2. Planning 3. Organizing 4. Actuating 5. Controlling 6. Pemimpin yang Visioner 7. Pemimpin yang Handal 8. Pemimpin Pekerja Keras 9. Pemimpin Yang Melayani Kita perhatikan bahwa setiap 3 pertanyaan dalam observasi menyatakan 1 variabel kualitas. Oleh karena itu kita dapat menyederhanakan variabel data dengan melakukan rata-rata tiap 3 item pertanyaan. Contoh 1.10 Berdasarkan hasil angket, maka nilai rata-rata fungsi manajemen adalah 5=( )/3. Secara sama kita dapat melakukan perataan terhadap pertanyaan yang lain. Artinya kita dapat menyusun nilai variabel X 1 untuk tiap sampel sebagaimana ditunjukkan pada Tabel Demikian pula untuk variabel X 2 dan Y, nilai rata-rata masing-masing subvariabel tiap variabel ditunjukkan berturut-turut pada Tabel 1.10 dan Tabel STATISTIKA DISKRIPTIF

40 Tabel Nilai rata-rata tiap subvariabel dalam variabel responden X 1 untuk tiap No responden No1-3 No.4-6 No.7-9 N No ANALISA DATA UNTUK ILMU SOSIAL & SAINS 21

41 No responden No1-3 No.4-6 No.7-9 N No Tabel Rata-rata tiap 3 pertanyaan berturutan untuk tiap responden pada variabel X 2 No responden No No No No No STATISTIKA DISKRIPTIF

42 No responden No No No No No ANALISA DATA UNTUK ILMU SOSIAL & SAINS 23

43 Tabel Rata-rata 3 pertanyaan untuk tiap responden dalam variabel Y No responden No No No No No No No No No STATISTIKA DISKRIPTIF

44 No responden No No No No No No No No No Jadi kita dapat menyederhanakan data variabel X 1 menjadi 5 subvariabel dan variabel X 2 dengan 5 subvariabel dan variabel Y adalah 10 variabel. Analisa selanjutnya dapat dilakukan korelasi antara subvariabel dalam X 1 dan X 2 dengan setiap subvariabel Y. Kita akan menyelidiki korelasi X 1, X 2 dan Y. Matriks korelasi berukuran 19 x 19. Untuk menyederhanakan penyusunan matriks korelasi kita akan menampilkan bagian demi bagian. Perhitungan korelasi mengikuti formula korelasi yang standar dan kita dapat menggunakan correl pada Excell untuk menghitung korelasi. Korelasi antar subvariabel dalam X 1 R X ANALISA DATA UNTUK ILMU SOSIAL & SAINS 25

45 Dari hasil ini menunjukkan bahwa subvariabel kedua dan subvariabel ke-1 (Planning dan Fungsi manajemen) serta subvariabel ke-4 dan ke-5) yaitu (Actuating dan Controlling) yang saling berkorelasi. Sedangkan subvariabel ke-3 dengan subvariabel yang lain tidak berkorelasi. Oleh karena itu subvariabel ketiga dapat kita abaikan. Pembahasan Contoh 1.9 Korelasi antar subvariabel dalam X 2 Secara sama dapat diperoleh matriks korelasi antara subvariabel dalam X 2 yaitu R X (1.10) Dari hasil ini maka dapat disimpulkan bahwa hanya subvariabel ke-2 dan ke-3 dan subvariabel ke-4 dan ke-5 yang saling berkorelasi (sekalipun tidak kuat). Jadi subvariabel ke-1 tidak berkorelasi dengan yang lain yaitu pemimpin yang Visioner. Hal ini nampaknya tidak seperti dengan anggapan pada umumnya. Korelasi antar subvariabel dalam Y Demikian pula matriks korelasi antar subvariabel dalam Y adalah R Y STATISTIKA DISKRIPTIF

46 Kita dapat memahami subvariabel ke 1 dan 3. ke 2 dan ke-9. ke 3 dan 9. ke 4 dan ke-9. ke 3 dan ke-4. ke 4 dan ke-8. ke 6 dan ke-4. ke-6 dan ke-5 tidak berkorelasi secara signifikan. Agar lebih jelas. kita dapat menuliskan nilai korelasi yang lebih besar dari 0.5 dengan makna kualitatif dari masing-masing subvariabel dalam Tabel Sebagian korelasi ditunjukkan pada Tabel untuk menjelaskan hubungan korelasi terhadap nama masing-masing subvariabel. Tabel Hasil korelasi (hanya yang lebih besar 0.5) antara subvariabel dalam Y Visi Y Pemimpin yang Visioner Pemimpin yang Handal Pemimpin Pekerja Keras Pemimpin Yang Melayani Y Visi Planning Planning Organizing Actuating Controlling Organizing Actuating Controlling Pemimpin yang Visioner Pemimpin yang Handal Pemimpin Pekerja Keras Pemimpin Yang Melayani Pada matriks korelasi ataupun Tabel 1.13, subvariabel controlling dan pemimpin yang visioner berkorelasi paling besar. Hal ini sesuai dengan harapan umum adanya pemimpin yang visioner dapat menjadi pengontrol alannya program. Secara sama dapat dipelajari pula korelasi antara X 1 dan X 2. Kita juga dapat menggunakan semua variabel yang sudah mendapat respon dari ANALISA DATA UNTUK ILMU SOSIAL & SAINS 27

47 responden dan kita asumsikan berdasarkan linearitas bahwa setiap subvariabel Y (yaitu dan X 2 ). y j mempunyai hubungan linear terhadap variabel X 1 Korelasi X 1 dan X 2 R X1,X (1.11) Perhatikan bahwa komponen matriks dari baris ke-1.kolom ke-1 hingga baris ke-5. kolom ke-5 merupakan merupakan matriks korelasi antar subvariabel X 1 saja yaitu matriks R X1 (sebagaimana ditunjukkan pada persamaan (1.1)). Demikian pula komponen-komponen matriks baris ke-6. kolom ke-6 hingga baris ke-10.kolom ke-10 merupakan matriks korelasi antar subvariabel dalam X 2 saja yaitu R X 2 menjelaskan korelasi antar subvariabel pada. Blok matriks yang lain X 1dan X 2. Contohnya komponen pada baris ke 1. kolom ke-6 atau baris ke-6. kolom ke-1 menyatakan besar korelasi antara Fungsi manajemen (subvariabel pertama dalam X 1) dan Pemimpin yang Visioner (subvariabel pertama dalam X 2 ). Besar korelasi sebesar yang menunjukkan korelasi yang kecil atau dikatakan tidak berkorelasi secara signifikan. Kita dapat mengamati antar subvariabel pada kedua variabel tersebut. Matriks korelasi menunjukkan bahwa besar korelasi tidak signifikan. Hal ini nampaknya berbeda dengan 28 STATISTIKA DISKRIPTIF

48 asumsi yang diambil dari pemahaman umum bahwa keduanya berkorelasi kuat. Kita akan mencoba data diskala dalam (0.1] yaitu dengan membagi data tiap kolom dengan maksimum tiap kolom. Kemudian dilakukan analisa korelasi dengan cara yang sama. Kemungkinan data yang mempunyai satuan nilai dapat mengganggu analisa. Korelasi X 1dan X 2 dengan menskala data dalam (0.1] Kita menskala Tabel 1.10 dan Tabel 1.11 kemudian kita hitung matriks korelasi sebagaimana di atas. Data disusun dalam bentuk [ Diperoleh matriks korelasi antara X1dan X 2 adalah X1 2 X ]. R X 1, X (1.12) Perhatikan bahwa matriks korelasi terdiri dari 4 blok. Dengan membandingkan matriks ini terhadap matriks korelasi pada persamaan (1.11). maka diperoleh kesimpulan bahwa penskalaan tidak memberikan perubahan nilai korelasi. Oleh karena itu data yang digunakan tetap sebagaimana pada Tabel Matriks korelasi pada persamaan (1.12) menunjukkan bahwa tidak ada korelasi yang sangat kuat antar subvariabel dalam X1dan X 2. akan tetapi korelasi tetap ada (karena nilai komponen korelasi > 0.5) untuk: subvariabel ke 1 dari X1dan subvariabel ke-5 dari X 2. sebesar ; ANALISA DATA UNTUK ILMU SOSIAL & SAINS 29

49 subvariabel ke 2 dari subvariabel ke 2 dari X 1dan subvariabel ke-5 dari X 1dan subvariabel ke-2 dari X 2 X 2. sebesar ;. sebesar ; subvariabel ke 4 dari X 1dan subvariabel ke-2 dari X 2. sebesar ; Kita dapat menuliskan dalam bentuk matriks kualitatif yang terkait dengan nilai korelasi yang ditunjukkan pada Tabel Tabel Korelasi antara subvariabel dalam (hanya yang lebih besar 0.5) X 1 dan X 2 Pemimpin yang visioner Pemimpin yang handal X 2 Pemimpin pekerja keras Pemimpin yang melayani Pemimpin yang bertanggung jawab X 1 Fungsi manajemen Planning Organizing Actuating Controlling Komponen matriks korelasi yang lebih kecil dari 0.5 tidak dituliskan untuk mempermudah dalam melakukan analisa. Analisa menunjukkan bahwa pemimpin yang visioner tidak berkorelasi dengan apapun. Pemimpin yang bertanggung jawab berkorelasi dengan fungsi manajemen. Secara administrasi, hasil ini mendukung pemahaman umum bahwa manajemen dan pemimpin yang bertanggung jawab dapat dianggap cukup valid untuk berkorelasi. Demikian pula perencanaan dan pemimpin yang handal mempunyai korelasi. Sedangkan controlling tidak menunjukkan korelasi apapun terhadap subvariabel dalam X STATISTIKA DISKRIPTIF

50 Kita perlu menganalisa apakah subvariabel dalam suatu variabel berbeda secara signifikan. Hal ini akan dilakukan pada penelitian lebih lanjut. Secara sama kita dapat melakukan korelasi variabel juga korelasi variabel X 2 dan Y. X 1 dan Y; Korelasi variabel X 1 dan Y Kita akan menyusun data dalam bentuk [ X 1 Y] sehingga matriks korelasi akan berukuran (5+9) x (5+9). Sebagaimana di atas. kita akan mempunyai matriks korelasi yang terdiri dari 4 blok. sebutlah R RX X 1 T R 1 X1, Y dimana, Y RY blok R X1 berukuran 5 x 5. T R X1, Y berukuran 5 x 9. R X1, Y berukuran 9 x 5 dan R Y berukuran 9 x 9. Jadi kepentingan kita hanya mempelajari korelasi X 1 dan Y maka kita hanya memperhatikan matriks T R X1, Y atau R X1, Y. Kita akan menyusun matriks R X1, Y dalam Tabel Hal ini berarti daftar subvariabel dalam Y pada baris dan daftar subvariabel dalam X 1 pada kolom. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 31

51 Tabel Korelasi X 1 dan Y Y Visi Fungsi manajemen X 1 Planning Organizing Actuating Controlling Planning Organizing Actuating Controlling Pemimpin yang visioner Pemimpin yang handal Pemimpin pekerja keras Pemimpin yang melayani Pemimpin yang bertanggung Jawab Dari hasil ini maka subvariabel Visi. pemimpin yang visioner. pemimpin yang handal. dan pemimpin yang bertanggung jawab dalam variabel Y tidak berkorelasi dengan subvariabel dalam X 1. Kita akan menyelidiki korelasi X 2 dan Y. Korelasi X 2 dan Y Kita mencari korelasi secara sama dan hasilnya ditunjukkan pada matriks R X 2, Y STATISTIKA DISKRIPTIF

52 Dari matriks ini diperoleh bahwa hanya subvariabel Controlling dalam Y dan Pemimpin Yang Bertanggung Jawab yang menunjukkan korelasi cukup signifikan (sebesar ). Selanjutnya subvariabel pemimpin yang melayani pada variabel Y berkorelasi (sebesar ) dengan Controlling pada X 2 dan Pemimpin yang bertanggung jawab berkorelasi pula dengan Controlling pada X 2 sebesar Sedangkan subvariabel yang lain tidak cukup signifikan korelasinya. Tabel Korelasi X 2 dan Y Y Pemimpin yang visioner Pemimpin yang handal X 2 Pemimpin pekerja keras Pemimpin yang melayani Pemimpin yang bertanggung jawab Visi Planning Organizing Actuating Controlling Pemimpin yang visioner Pemimpin yang handal Pemimpin pekerja keras Pemimpin yang melayani Pemimpin yang bertanggung Jawab Kita dapat mengatakan bahwa pemimpin yang visioner (subvariabel dalam Y) berkorelasi dengan pemimpin yang handal (subvariabel X 2 ) sebesar Demikian pula pemimpin yang melayani berkorelasi dengan pemimpin yang bertanggung jawab sebesr Pemimpin yang ber- ANALISA DATA UNTUK ILMU SOSIAL & SAINS 33

53 tanggung jawab pada variabel Y juga berkorelasi pemimpin yang bertanggung jawab pada variabel X 2 sebesar Semua korelasi dapat dikatakan tidak terlalu kuat karena karena besarnya korelasi hanya sedikit lebih besar dari 0.5. Controlling pada variabel Y berkorelasi dengan pemimpin yang bertanggung jawab pada X 2 sebesar Kesimpulan Contoh 1.9 Pada bagian di atas telah ditunjukkan studi korelasi antara 2 variabel prediktor X 1 dan X 2 dengan variabel respon Y. Karena setiap variabel memuat subvariabel dengan adanya 3 pertanyaan untuk responden untuk tiap subvariabel. maka data dirata-rata. Berdasarkan rata-rata tiap 3 pertanyaan untuk tiap subvariabel per setiap responden maka data kemudian dapat diolah. Dari semua pengamatan yang diperoleh. data menunjukkan bahwa besar korelasi antar variabel yang berbeda tidak terlalu kuat karena tidak terlalu besar dari 0.5. Jika kita perhatikan maka korelasi yang paling besar ditunjukkan dalam korelasi antar subvariabel dalam Y saja yaitu Controlling dan pemimpin yang visioner dengan korelasi sebesar dan korelasi antara Visi dan pemimpin yang melayani sebesar Jikalau kita menghendaki kesimpulan secara kualitatif yang menyatakan korelasi antara X 1. X 2 dan Y maka kita dapat mengatakan bahwa korelasi yang diperoleh tidak kuat (karena hanya lebih besar sedikit dari 0.5. atau diantara bahkan lebih kecil dari 0.7). Dengan kata lain korelasi manajemen dan kepemimpinan tempat A dengan kepemimpinan di tempat B. 34 STATISTIKA DISKRIPTIF

54 Latihan soal 1.1 Tabel Data untuk 4 macam perlakuan pada 19 anjing (Data diambil dari: Johnson, and Wichem. 2002). Perlakuan Anjing x x x x Data ini akan kita teliti kovariansi antara 2 variabel berbeda (jadi diperoleh matriks kovariansi 4x4) dan korelasi antara 2 variabel yang berbeda (jadi diperoleh matriks kovariansi 4x4). Tahap 1. Data dicopy Tahap 2. Karena yang tercopy termasuk no maka jendela data sebagai berikut. 1.5 Distribusi Frekuensi Data dapat direpresentasikan dalam frekuensi (berapa banyak kali data tersebut muncul). ANALISA DATA UNTUK ILMU SOSIAL & SAINS 35

55 Contoh Diberikan data sebagai berikut Dengan menuliskan dalam bentuk Tabel frekuensi, maka dapat disusun sebagai berikut Nilai Frekuensi Nilai Frekuensi kumulatif =3 3+3 =6 4+6 = = = = = =25 Frekuensi relatif Penyusunan Tabel data berdasarkan frekuensinya diperlukan untuk membahas beberapa penjelasan distribusi seperti: (a) Distribusi Presentasi kumulatif (kolom 3) (b) Presentasi kumulatif (kolom 4) (c) Distribusi Frekuensi relatif (probabilitas) (d) Distribusi probabilitas kumulatif (kolom 6) Frekuensi kumulatif diperoleh dari pertanyaan: berapa banyak skor yang sama atau lebih kecil dari X?. Misal X=8, maka jawaban dari pertanyaan tersebut adalah 3 (karena 2 + 1), yaitu nilai 8 muncul 2 kali dan nilai 1 muncul 1 kali. SPSS dikerjakan sebagaimana Contoh-contoh yang lalu. 36 STATISTIKA DISKRIPTIF

56 Kita perlu memilih variabel yang dianalisis dengan memilih tanda panah untuk X1 hingga X4. Sehingga diperoleh jendela berikut. Selanjutnya kita tinggal klik Ok. Maka diperoleh keluaran variansi (dengan memilih options) ANALISA DATA UNTUK ILMU SOSIAL & SAINS 37

57 Korelasi Dari Tabel 1.20 tersebut dapat diperoleh korelasi antar variabel dengan memilih Anaylize -> Correlate ->Bivariate Dari keluaran ini, maka kita mendapatkan korelasi antara 2 variabel berbeda, demikian pula kovariansinya. Dengan mengikuti persamaan 1.4, maka matriks kovariansi untuk 4 variabel dapat diperoleh dengan menggunakan disusun matriks kovariansi untuk 4 variabel yaitu Cov Cov Cov Cov X 1,X 1 CovX 1,X 2 CovX 1, X 3 CovX 1, X 4 X 2,X 1 Cov X 2,X 2 Cov X 2,X 3 Cov X 2,X. 4 X 3,X 1 CovX 3,X 2 CovX 3,X 3 CovX 3,X 4 X,X CovX,X CovX,X CovX,X Dengan data tabel maka matriks kovariansi sampel (disimbolkan S) dengan bantuan program Scilab adalah STATISTIKA DISKRIPTIF

58 S Adapun program Scilab untuk ini dengan menghapus daftar data dapat ditunjukkan pada Tabel Dari hasil tersebut kita akan menyusun fungsi densitas normal untuk 4 variabel dengan matriks kovariansi yang telah diperoleh. Ternyata nilai S (determinan S) terlalu besar yaitu S = 4.360D+13 = , sehingga koefisien pada fungsi densitas normal menjadi terlalu kecil atau mendekati 0. Untuk itu data selanjutnya haruslah distandarisasi. Salah satu cara untuk melakukan standarisasi data adalah X k X k xk, s : = Var ( X k ) =standard deviasi data. s k Data Tabel 1.17 hasil standarisasi sebagian ditunjukkan pada Tabel 1.20 ANALISA DATA UNTUK ILMU SOSIAL & SAINS 39

59 Tabel Program Scilab untuk menyusun matriks kovariansi data pada Tabel 1.18, 1.3 Program Scilab Keterangan X=[X1 X2 X3 X4] Penyusunan data menjadi matriks X //kovariansi antara X(i) dan X(i+1) s=zeros(4,4) for i=1:3 for j=1:4 [cov,mean]=corr(x(:,j),[x(:,i+1)],2) s(j,i+1)=cov(1,1); s(i+1,j)=s(j,i+1); end end susuns=s for i=1:4 s(i,i)=mean(x(:,i).*x(:,i))-mean(x(:,i))^2 end susuns=s Menyusun matriks nol berukuran 4x4 Menghitung kovariansi Merupakan hasil matriks kovariansi yang dicari Menggunakan formula dapat diperoleh matriks kovariansi Ŝ yaitu Ŝ X 1 Tabel Data Tabel 1.3 yang distandarisasi X X 3 X 4 40 STATISTIKA DISKRIPTIF

60 X 1 X X 3 X 4 det S ˆ Sˆ Program Scilab untuk melakukan standarisasi dengan formula dan menentukan invers maupun determinan dari matriks kovariansi yang sudah distandarisasi ditunjukkan pada Tabel Latihan soal 1.1 : Gunakan data 4 variabel yang distandarisasi untuk mencari korelasi antar variabel. Latihan soal 1.2 : Project 1 (tiap mahasiswa berbeda) Carilah data dari literatur (misal skripsi mahasiswa) untuk data multivariat 1. Tuliskan latar belakang data tersebut (tentang apa) 2. Hasil apa dalam analisa literatur tersebut 3. Metode apa yang digunakan untuk menganalisa 4. Tuliskan pustaka/sumber data. Contoh : Saya., H.A.,2010. Pengamatan saya pada saya tentang saya masa lalu, skripsi, Fakultas Sains dan Matematika, UKSW. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 41

61 Tabel Daftar program yang merupakan kelanjutan program pada Tabel Daftar program //data distandarisasi [m,n]=size(x); Xt=zeros(m,n); for i=1:4 stdku(i)=sqrt(s(i,i)); rata(i)=mean(x(:,i)); Xs=(X(:,i)-rata(i))./stdku(i); Xt(:,i)=Xs end //Hitung matriks kovariansi untuk data yang sudah distandarisasi ss=zeros(4,4) for i=1:3 for j=1:4 [cov,mean]=corr(xt(:,j),[xt(:,i+1)],2) ss(j,i+1)=cov(1,1); ss(i+1,j)=ss(j,i+1); end end susuns2=ss for i=1:4 ss(i,i)=mean(xt(:,i).*xt(:,i))-mean(xt(:,i))^2 end susuns2=ss S2=susunS2 Xt=Xt invs2=inv(s2) determinans2=det(s2) Xt menyatakan distandarisasi Keterangan Xˆ : data yang ss meyatakan kovariansi antara 2 variabel yang berbeda S2 menyatakan Ŝ Untuk melakukan analisa data, seringkali kita harus terlebih dahulu menguji apakah data valid dan reliable (dapat dipercaya untuk dianalisa sesuai dengan kasus yang dikehendaki). Demikian pula distribusi data seringkali perlu diuji. Uji yang paling sering digunakan adalah uji normalitas data. Ketiga hal tersebut akan kita bahas pada subbab berikut. 42 STATISTIKA DISKRIPTIF

62 Selain itu beberapa uji lain seperti uji kesamaan rata-rata juga akan disinggung (dengan uji t), agar pembaca dapat langsung menggunakan SPSS secara cepat dan mudah. Demikian pula perintah SPSS yang terkait juga ditunjukkan. 1.5 Beberapa Uji statistik dengan SPSS Validitas dan Reliabilitas Tulisan berikut ini diperoleh dari penjelasan dari youtube (video internet). Masalah validitas dan reliabilitas seringkali membingungkan peneliti. Pada waktu menyusun pertanyaan untuk survei, maka pertanyaan yang diajukan dianggap penting untuk mendukung menjawab permasalahan yang akan dipelajari. Validitas mengukur seberapa penting item pertanyaan tersebut. Pihak yang mendapatkan pertanyaan (yang diobservasi) seringkali memberikan respon yang berbeda terhadap pertanyaan yang diajukan. Sehingga jawaban yang diberikan ada yang dapat dipercaya dan ada yang tidak dapat dipercaya. Demikian pula pada pengukuran dapat terjadi kesalahan secara sistematik dan tidak sistematik. Kita tidak dapat menghindari adanya kesalahan dalam pengukuran. Tindakan demikian mencakup masalah reliabilitas. Metode reliabilitas dibuat untuk meminimalkan kritis terhadap ketidakvalid-an data hasil observasi. Reliabilitas mempertanyaan apakah data konsisten/persis dan pengukuran dapat diulang. Informasi SPSS (video) yang ada sejauh ini adalah cara mengukur reliabilitas yaitu dengan Cronbach alfa yang mengukur konsistensi ANALISA DATA UNTUK ILMU SOSIAL & SAINS 43

63 pada internal reliabitas. Jika Cronbach alfa > 0.8 maka dianggap data yang digunakan reliable (dapat dipercaya untuk dianalisa lebih lanjut). Angka 0.8 juga masih dapat ditoleransi (dibuat lebih kecil misal 0.7). Jadi metode ini diterapkan umumnya sebelum data dianalisa lebih lanjut Cara SPSS Perintah dasar : Analyze->Scale->Reliability analysis ok Contoh : File Reliabel.sav File terdiri dari data harga penutupan saham dari berbagai perusahaan pada bulan Februari Juli 2011 dari Indeks LQ45. Kita akan mempelajari validitas data dengan memperhatikan reliabilitas internal data. Dengan perintah dasar di atas diperoleh gambar Cronbach's Alpha Reliability Statistics Cronbach's Alpha Based on Standardized Items N of Items Analisa: keluaran Cronbach s alpha menunjukkan sebesar untuk keseluruhan data asli. Sedangkan jika distandarisasi, maka Cronbach alpha lebih besar yaitu Hal ini menyarankan kita untuk menggunakan data dalam bentuk yang distandarisasi jika akan dianalisa lebih lanjut. masih dapat menganggap data cukup reliable karena hasil tes sekitar 0.7. Sekalipun Cronbach s alpha menunjukkan sebesar pada data mulamula, kita dapat menganggap Cronbach s alpha sekitar STATISTIKA DISKRIPTIF

64 Dari tabel selanjutnya ditunjukkan bagaimana Cronbach alpha divariasi jika salah satu variabel (salah satu perusahaan) tidak terlibat dalam analisa, maka kelayakan data maksimal dapat diubah sebesar 0.7. Oleh karena penulis/pengamat menyarankan keseluruh perusahaan dapat dilibatkan dalam analisa lebih lanjut. Item-Total Statistics Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item- Total Correlation Squared Multiple Correlation Cronbach's Alpha if Item Deleted AALI E ADRO E ANTM E ASII E ASRI E BBCA E BBKP E BBNI E BBRI E BBTN E BDMN E BJBR E BMRI E BNBR E BRAU E BSDE E BTEL E BUMI E CPIN E DOID E ELSA E ANALISA DATA UNTUK ILMU SOSIAL & SAINS 45

65 Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item- Total Correlation Squared Multiple Correlation Cronbach's Alpha if Item Deleted ELTY E ENRG E GGRM E GJTL E INCO E INDF E INDY E INTP E ISAT E ITMG E JSMR E KLBF E LPKR E LSIP E MEDC E PGAS E PTBA E SMCB E SMGR E TINS E TLKM E UNSP E UNTR E UNVR E Kesimpulan: Sebagai hasil pengamatan secara keseluruhan maka data perlu distandarisasi dan seluruh perusahaan dapat dilibatkan dalam analisa lebih lanjut. 46 STATISTIKA DISKRIPTIF

66 Latihan Soal 1.4 Berikut ini diberikan data Hubungan antara konsep diri dengan gaya hidup hedonis pada remaja (Purnomo,P.K,2009) yang dituliskan pada file Lat_Soal4_1.xlsx dengan keterangan sebagai berikut Variabel terikat: gaya hidup hedonis (perilaku individu yang mengutamakan kesenangan dan kenikmatan sebagai tujuan utama dalam hidupnya yang ditampilkan dalam beberapa bentuk perilaku, yaitu suka mencari perhatian, cenderung impulsif, kurang rasional, cenderung follower, mudah dipengaruhi, senang mengisi waktu luang di tempat yang santai). Variabel bebas: konsep diri (pandangan individu terhadap dirinya sendiri baik dalam dimensi fisik, psikis, sosial dan moral). Menggunakan skala dalam bentuk pilihan jawaban dan menggunakan empat kemungkinan jawaban sangat sesuai (SS), sesuai (S), tidak sesuai (TS), dan sangat tidak sesuai (STS). Skala gaya hidup hedonis : 24 item setelah uji coba menjadi 16 item Skala konsep diri: 24 item setelah uji coba menjadi 15 item Hasil Uji Validitas dan Reliabilitas (1) Uji Validitas Skala Gaya Hidup Hedonis Skala yang digunakan dalam uji coba kemudian diuji validitasnya menggunakan korelasi product moment dengan bantuan SPSS. Pengujian skala gaya hidup hedonis ini dilakukan sebanyak tiga kali dengan ANALISA DATA UNTUK ILMU SOSIAL & SAINS 47

67 koefisien yang digunakan 0,30. Dari hasil pengujian terhadap skala gaya hidup hedonis didapatkan validitas skala tersebut dari rentang 0,347 sampai dengan 0,643. Skala Konsep Diri Skala yang digunakan dalam uji coba kemudian diuji validitasnya menggunakan korelasi product moment dengan bantuan SPSS. Pengujian skala konsep diri ini dilakukan sebanyak tiga kali dengan koefisien yang digunakan 0,30. Dari hasil pengujian terhadap skala konsep diri didapatkan validitas skala tersebut dari rentang 0,342 sampai dengan 0,656. (2) Uji Reliabilitas Skala Gaya Hidup Hedonis Setelah dilakukan uji validitas dilakukan uji reliabilitas dengan menggunakan cronbach s alpha. Pada skala gaya hidup hedonis diperoleh koefisien reliabilitas sebesar 0,849. Reliabilitas skala ini tergolong reliabel. Hasil SPSS pada Tabel berikut: Tabel 1 Reliabilitas Skala Gaya Hidup Hedonis Reliability Statistics Cronbach's Alpha N of Items Skala Konsep Diri Setelah dilakukan uji validitas dilakukan uji reliabilitas dengan menggunakan cronbach s alpha. Pada skala konsep diri diperoleh koefisien reliabilitas sebesar 0,860. Reliabilitas skala ini tergolong reliabel. 48 STATISTIKA DISKRIPTIF

68 Tabel 2 Reliabilitas Skala Konsep Diri Cronbach's Alpha Reliability Statistics N of Items Uji Normalitas Uji normalitas dilakukan terhadap dua data penelitian yaitu variabel konsep diri sebagai variabel X dengan variabel gaya hidup hedonis sebagai variabel Y. Penghitungan menggunakan uji one-sample kolmogrovsmirnov test dengan bantuan SPSS. Hasil uji normalitas dengan Kolmogrov-Smirnov test menunjukkan bahwa variabel konsep diri memiliki K-S yaitu 1,109 dan signifikansinya yaitu 0,171 dengan p value > 0,05 yang berarti variabel konsep diri mempunyai distribusi penyebaran yang normal. Pada pengujian variabel gaya hidup hedonis diperoleh K-S yaitu 1,272 dan signifikansinya yaitu 0,079 dengan p value > 0,05 yang berarti variabel gaya hidup hedonis mempunyai distribusi penyebaran yang normal. Tabel 3 One-Sample Kolmogorov-Smirnov Test TOTAL X TOTAL Y N Normal Parameters a,,b Mean Std. Deviation Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 49

69 1.5.4 Uji Linearitas Uji linieritas dilakukan antara variabel konsep diri dengan variabel gaya hidup. Perhitungan dilakukan dengan menggunakan bantuan SPSS. Hasil uji Linieritas adalah 10,238 dan signifikansinya sebesar 0,002 dengan p value < 0,05 yang berarti hubungan antara kedua variabel tersebut bersifat linear. Tabel 4. Uji Linearitas Model Summary and Parameter Estimates Dependent Variable:GAYAHIDUP Model Summary Parameter Estimates Equation R Square F df1 df2 Sig. Constant b1 Linear The independent variable is KONSEPDIRI Uji Korelasi Tahap selanjutnya adalah uji korelasi dengan korelasi pearson, diperoleh hasil sebesar -0,308. Hal ini menunjukkan adanya hubungan negatif antara konsep diri dengan gaya hidup hedonis. 50 STATISTIKA DISKRIPTIF

70 Tabel 5 Correlations KONSEPDIRI GAYAHIDUP KONSEPDIRI Pearson Correlation ** Sig. (2-tailed).002 N GAYAHIDUP Pearson Correlation ** 1 Sig. (2-tailed).002 N **. Correlation is significant at the 0.01 level (2-tailed). Dapat disimpulkan bahwa ada korelasi negatif antara konsep diri dengan gaya hidup hedonis pada remaja, semakin positif konsep diri remaja maka remaja akan semakin tidak memiliki gaya hidup hedonis dan sebaliknya semakin negatif konsep diri remaja maka remaja akan semakin memiliki gaya hidup hedonis. Pada berbagai buku statistika dalam bahasa Indonesia seringkali sampel yang muncul data bertipe kontinu (bersifat numerik) saja atau kategorikal saja. Sedangkan untuk sekumpulan data dengan berbagai tipe jarang dijumpai. Pada buku ini diberikan contoh data yang mengikuti pola jenis variabel dari referensi berupa youtube (video) yang terkait dengan penggunaan SPPS (contoh Uji berbagai tipe data Sebelum melakukan analisa, perlu diketahui bahwa data dipandang sebagai variabel. Variabel dibedakan menjadi variabel kategori (contoh: sex: laki-laki atau perempuan, variabel dengan jawaban ya/tidak ) dan variabel kontinu (misal: umur) Materi merujuk pada referensi: Materi You tube SPPS-Data Analysis part 1 dengan data yang diinovasi (data yang ANALISA DATA UNTUK ILMU SOSIAL & SAINS 51

71 dibuat dengan jenis variabel yang sama dengan sumber tetapi detail item tiap data berbeda nilainya (tidak bisa mengetik dengan persis) Kegiatan Penelitian 1. Catatan : Data dimodifikasi isinya tetapi jenis variabel diisi sama File data : Latihan1.xls Latar belakang data: data berisi tentang pemilihan tahun 2008 pada suatu negara yang diukur terdiri berbagai pertanyaan seperti : Umur, jenis kelamin, partai politik: konservatif atau demokrat atau yg lain. Jenis kelamin disimbolkan M (laki-laki) dan F (perempuan). Partai politik disimbolkan D = Demokrat dan R = Republik. Tahap 1. Karena isi file banyak dalam excel, maka data perlu ditranfer langsung pada SPSS dengan cara : Simpan file dalam format txt, diberi nama Latihan1.txt Tahap 2. Untuk membuka pada SPSS : (file excel perlu ditutup terlebih dahulu) SPSS: ->Open data->penuhi pertanyaan yang sesuai. Misalkan file yang sudah jadi diberi nama :Sudahedit.sav Perhatikan bahwa keterangan variabel perlu diedit secara manual. A. Analisa data kategori Tahap 3. Cara SPSS : Analyze->Frequencies->pilih Sex, partai politik dan Apakah anda memilih th STATISTIKA DISKRIPTIF

72 Klik Ok : Tahap 4. Keluaran akan muncul dalam bentuk berikut: Sex Frequency Percent Valid Percent Cumulative Percent Valid Female M Total Partai politik Frequency Percent Valid Percent Cumulative Percent Valid D R Total ANALISA DATA UNTUK ILMU SOSIAL & SAINS 53

73 Apakah anda memilih pada pemilihan 2008? Frequency Percent Valid Percent Cumulative Percent Valid No Y Total Pembahasan : keluaran pada Tabel ke-2 dan ke-3 kosong karena ada yang tidak terisi pada data (missing value). Untuk mengatasi hal ini maka yang kosong diisi dengan X (simpan dengan file Sudahedit2.sav) Tahap 5. Yang tidak terisi diisi dengan X (pada kolom Partai dan *pemilihan2008, kemudian pada Variabel View, kolom Missing diisi dengan menuliskan X pada menu discrete missing value (lihat gambar menu SPSS berikut) Tahap 6. Keluaran SPSS pada Tabel ke-2 dan ke-3 berubah sebagai berikut 54 STATISTIKA DISKRIPTIF

74 Partai politik Frequency Percent Valid Percent Cumulative Percent Valid D R Total Missing X 1.9 Total Apakah anda memilih pada pemilihan 2008? Frequency Percent Valid Percent Cumulative Percent Valid No Y Total Missing X 1.9 Total B. Analisa Data Variabel Kontinu Descriptive Statistics N Minimum Maximum Mean Std. Deviation Umur Orientasi politik Orientasi politik Valid N (listwise) 116 Klik: Analyze ->Descriptive Statistics->Crosstabs->Pilih variabel Sex dan Partai politik ->Diperoleh jendela berikut ini ANALISA DATA UNTUK ILMU SOSIAL & SAINS 55

75 .-> Kita ingin melihat hubungan antara 2 variabel secara horizontal (antar 2 variabel yang berbeda dan vertikal (antar subyek dalam1 variabel) : Klik cells dan kliks Row and Coloumn 56 STATISTIKA DISKRIPTIF

76 C. Analisa 2 variabel kategori Catatan: keluaran bisa beda dengan you tube Case Processing Summary Cases Valid Missing Total N Percent N Percent N Percent Sex * Partai politik % 1.9% % Sex * Partai politik Crosstabulation Partai politik Demokrat I R Total Sex Female Count % within Sex 31.0% 3.6%.0% 100.0% % within Partai politik 54.2% 25.0%.0% 72.4% M Count % within Sex 68.8% 28.1% 3.1% 100.0% % within Partai politik 45.8% 75.0% 100.0% 27.6% Total Count % within Sex 41.4% 10.3%.9% 100.0% % within Partai politik 100.0% 100.0% 100.0% 100.0% Cara baca/analisa : (bisa bermacam-macam) Dari keluaran Male (laki-laki) ditandai dengan M, maka ada 68.8% pada Demokrat dan 3.1% pada Republik. Jelas bahwa nampak M lebih berada ANALISA DATA UNTUK ILMU SOSIAL & SAINS 57

77 pada partai demokrat. Dari data prosentase demikian. Tapi kita juga dapat menguatkan dengan menggunakan uji Chi-square. Cara sebagai berikut : Tahap 7. Dari Crosstab->Cells->Expected -> Statistics->Chi-square Untuk itu perlu disusun Ho. Ho : prosentase M pada D = prosentase M pada R. Keluaran sebagai berikut Chi-Square Tests Value Df Asymp. Sig. (2-sided) Pearson Chi-Square a Likelihood Ratio N of Valid Cases 116 a. 3 cells (37,5%) have expected count less than 5. The minimum expected count is,28. Analisa: kolom p=asymp.sig =p value < 0.05 maka maka jelas kita menolak Ho (kita tidak bisa mengatakan prosentase M pada D sama dengan prosentase M pada R sebagaimana kita harapkan). D. Analisa 2 Variabel Kontinu Diambil Sex dan Orientasi politik Cara SPSS : Analyze->Correlate->Bivariate Keluaran 58 STATISTIKA DISKRIPTIF

78 Correlations Umur Orientasi politik Orientasi politik Umur Pearson Correlation Sig. (2-tailed) N Orientasi politik Pearson Correlation Sig. (2-tailed) N Orientasi politik Pearson Correlation Sig. (2-tailed) N Pembahasan: pada variabel Umur maka test statistik pada baris ke-1 kolom ke-3 (yaitu ) sedangkan nilai p pada baris ke-2 kolom ke-3 (yaitu 0.796). Dari sini tidak ada perbedaan ysng mencolok diantara kedua orientasi politik. Jadi hasil ini menunjukkan bahwa semakin tua umur semakin konservatif tidak terbukti dari sampel yang diobservasi. E. Analisa 2 grup independent dengan dng t test Reference: part 2 youtube Cara SPSS: Analyze->Compare Means->Independent Sample t-test-> Isikan Umur dan pada Grup variabel adalah Partai-> maka perlu Define Grup (klik) dan tulis grup 1: D dan grup 2 : R (ingat harus huruf besar karena dari definisi variabel ditulis huruf besar)->continue->ok Jendela yang dimaksud ditunjukkan berikut ini. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 59

79 Sedangkan keluaran ditunjukkan 2 tabel berikut. Group Statistics Partai politik N Mean Std. Deviation Std. Error Mean Umur D R STATISTIKA DISKRIPTIF

80 Um ur Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. T Df Independent Samples Test Sig. (2- tailed) t-test for Equality of Means Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper ANALISA DATA UNTUK ILMU SOSIAL & SAINS 61

81 Pembahasan: Tabel pertama menunjukkan rata-rata dan standard deviasi untuk masing-masing grup sedangkan Tabel kedua menunjukkan hasil t-test. Test Levene: menggunakan Ho kesamaan variansi antar 2 grup (atau kesamaan standard deviasi). Notasi Sig. adalah hasil p-value. Jika p-value < 0.05 maka Ho ditolak artinya memang ada perbedaan standard deviasi. Pada kasus kita p-value adalah > 0.05 jadi tidak ada perbedaan yang signifikan untuk standard deviasi kedua grup. Oleh karena itu kita melihat baris pertama (yaitu asumsi kesamaan variansi dapat diterima). Kita melihat kolom t dan hasilpvalue (ditunjukkan Sig.(2 tailed)). Disini p-value > 0.05 artinya bahwa rata-rata dapat dianggap sama (Ho: rata-rata antar 2 grup sama). Pada video (hasil sebaliknya karena data berbeda). Kolom 95% Confidence Interval menunjukkan seberapa besar interval yang diijinkan untuk mengatakan rata-rata dapat dianggap sama/ataupun kika berbeda. F. Analisa 2 grup dependent dengan t-test Terkadang kita ingin membandingkan 2 grup dependent. Pada kasus ini ada variabel Pretest dan Post test yang dipandang sebagai variabel dependent. Cara menganalisa analog dengan di atas. Cara SPSS : Analyze->Compare Means->Paired Sampled t-test-> Klik Pretest dan Post test->ok Keluaran : Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 Pretest Postes Paired Samples Correlations N Correlation Sig. Pair 1 Pretest & Postes STATISTIKA DISKRIPTIF

82 Paired Samples Test Pair 1 Pretest- Postes Mean Std. Deviation Paired Differences Std. Error Mean 95% Confidence Interval of the Difference Lower Upper t df Sig. (2-tailed) Pembahasan: Hasil menunjukkan rata-rata dan standard deviasi, maupun korelasi antar variabel. Hasil t-test pada Tabel ke-3. Sig. = <0.05 artinya menolak Ho sehingga rata-rata keduanya berbeda. Demikian pula kolom 95% confidence menjelaskan seberapa besar berbeda pada batas bawah dan pada batas atas. G. Membandingkan Lebih Dari 2 Grup Independent Untuk studi rata-rata lebih dari 2 grup maka kita tidak dapat menggunakan t-test tetapi perlu dengan ANOVA. Cara SPSS: Analyze-> General Linear Model-> Univariate-> Var dependent: Umur dan Fixed Factor (sebagai independent var adalah Partai politik) Keluaran: Between-Subjects Factors Value Label N Partai politik D Demokrat 48 I 12 R 1 ANALISA DATA UNTUK ILMU SOSIAL & SAINS 63

83 Dependent Variable:Umur Tests of Between-Subjects Effects Source Type III Sum of Squares Df Mean Square F Sig. Corrected Model a Intercept Partai Error Total Corrected Total a. R Squared =,012 (Adjusted R Squared = -,014) Pembahasan: Keluaran yang perlu diperhatikan adalah baris Partai dan Error. Df untuk partai adalah 3 dan df untuk error adalah 112. Secara sama kita memperhatikan Sig.= > 0.05 artinya tidak ada perbedaan yang signifikan diantara grup maka kita tidak perlu mengadakan Post hoct test. Post hoct test dilakukan jika hasil test ini menunjukkan ada perbedaaan yang signifikan dalam grup tetapi yang membuat perbedaan itu tidak diketahui. Post hoct test digunakan untuk melihat siapa yang membuat perbedaan (hal ini hasil pada youtube, perhatikan you tube). Efek gender dapat pula dianalisa secara simultan sebagai berikut Cara SPSS: Analyze-> General Linear Models->Univariate-> Tambahkan Sex pada Fixed Factor(s)-> OK (jendela berikut) 64 STATISTIKA DISKRIPTIF

84 Keluaran : Between-Subjects Factors Value Label Partai politik D Demokrat 48 N I 12 R 1 Sex F Female 84 M 32 Dependent Variable:Umur Source Tests of Between-Subjects Effects Type III Sum of Squares Df Mean Square F Sig. Corrected Model a Intercept Partai Sex Partai * Sex Error Total Corrected Total ANALISA DATA UNTUK ILMU SOSIAL & SAINS 65

85 Dependent Variable:Umur Source Tests of Between-Subjects Effects Type III Sum of Squares Df Mean Square F Sig. Corrected Model a Intercept Partai Sex Partai * Sex Error Total a. R Squared =,021 (Adjusted R b. Squared = -,024) Pembahasan: perhatikan bahwa hanya ada 1 Error pada keluaran, sehingga df ke-2 pada laporan merupakan df untuk Error. Perhatikan bahwa Sex terdiri dari 2 level (F dan M) akan tetapi tidak terlihat pada hasil pada tabel ke-2 manakah yang memberikan hasil angka itu. Untuk itu kita perlu menggunakan fasilitas SPSS Split file sebagai berikut. Cara SPSS : Data->Split File->klik Compare Groups->Pilih sex (pada menu Grup based on)->ok->kemudian lakukan t-test lagi seperti diatas Yaitu : (kita tetap membandingkan dengan D dan R)-independent Sample t- test->ok (hasil berbeda dengan you tube, perhatikan you tube) Kegiatan Penelitian 1.2 Diberikan data hasil survey untuk menyelidiki p penyesuaian sosial anak berbakat tergantung dari dukungan sosial orangtuanya dan tingkat keberbakatannya. 66 STATISTIKA DISKRIPTIF

86 Analisa data tersebut dari berbagai aspek sebagaimana ditunjukkan pada hasil-hasil di atas. Petunjuk : Misalkan : Variabel bebas = Dukungan sosial orang tua (Sumbu X) Variabel Tak bebas = Penyesuaian sosial (Sumbu Y). Data pada file KegPen2_*.xls DAFTAR PUSTAKA Maulia. D Penyesuaian sosial anak berbakat ditinjau dari tingkat keberbakatan dan dukungan sosial orangtua. Skripsi, Semarang: Fak. Psikologi Universitas Katolik Soegijapranata. Purnomo. P.K., Hubungan antara Konsep Diri dengan Gaya Hidup Hedonis Pada Remaja. Skripsi, Semarang: Fakultas Psikologi Universitas Katolik Soegijapranata. ANALISA DATA UNTUK ILMU SOSIAL & SAINS 67

87 2 DISTRIBUSI NORMAL Sebagian uji statistik mensyaratkan bahwa data berdistribusi normal. Pada Bab 2 ini kita akan menjelaskan fungsi kepadatan distribusi normal (sering disingkat pdf) untuk data multivariat. Bentuk matematis yang seringkali dianggap sulit bagi para ilmuwan bidang sosial adalah bentuk matriks kovariansi untuk multivariat, inversnya dalam fungsi kepadatan distribusi normal multivariat. Demikian pula aljabar yang terkait dengan matriks kovariansi akan dibahas lebih detail dari latihan soal pada Bab Fungsi kepadatan distribusi normal Untuk Satu variabel random Telah diketahui fungsi kepadatan variabel random yang berdistribusi normal untuk 1 variabel random X adalah f x e x x x x 2, exp 1/ x (2.1) Bentuk ini dikembangkan untuk 2 variabel random Untuk dua variabel random Sebutlah variabel random X 1 dan X 2, matriks kovariansi antara kedua variabel adalah ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 67

88 Kov( X 1, X 2 ) Var ( X 1 ) ; Var ( X 2 ) Kov( X 2, X 1 ) 1 Bentuk akar pada 12 = 21 dan bagian eksponen dalam 2 2 mengalami perubahan. Kovariansi antar 2 variabel dalam faktor 1 menjadi 2 2 (2.2) x x dimana = det (yaitu determinan dari matriks kovariansi). Secara lengkap adalah (2.3) x x 2 Demikian pula bentuk 2 2 untuk 2 variabel random X 1 dan X 2 1 mengalami perubahan. Bentuk 2 berubah menjadi invers dari matriks kovariansi yaitu (2.4) Untuk mempermudah penulisan 1 maka 1 ditulis B 1 11 B21 B ; B B12 B22 ; B12 B21 ; B Ingat menurut penjelasan matriks kovariansi 2 variabel random. Bentuk x x 2 pada x x juga berubah. Agar bermakna skalar, maka bentuk perkalian pembilang dan penyebut sebagai bentuk kuadrat ditulis 68 DISTRIBUSI NORMAL

89 x1 1 x 1 x x2 2 = x1 1 x1 1 x 1 x2 2 B11 B12 1 B x 21 B B11 x1 1 B12 x2 2 B21 x1 1 B22 x2 2 x2 2 x1 1 ( B11 x1 1 B12 x2 2 ) x2 2 ( B21 x2 2 B22 x2 2 ). Sehingga fungsi kepadatan normal untuk 2 variabel random X1 dan X2 adalah f x1, x2 1 exp x x 1 x x2 2 Dengan diperoleh dari persamaan (2.3) dan 1 diperoleh dari persamaan (2.4) Untuk 3 variabel random Sama seperti untuk 2 variabel, matriks kovariansi antara 3 variabel merupakan matriks kovariansi sebagaimana ditunjukkan persamaan (2.2), yaitu Var X Cov X,Y Cov X,Z Var Y Cov Y,Z Cov Y,X Cov Z,X Cov Z,Y Var Z Bentuk akar pada dan bagian eksponen dalam mengalami perubahan. Kovariansi antar 3 variabel dalam faktor (2.5) x x ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 69

90 1 menjadi 2 2 dimana =det (yaitu determinan dari matriks kovariansi persamaan (2.5)). Berdasarkan kaidah Sarrus, maka determinan untuk matriks kovariansi 3 variabel dapat ditulis Kita memerlukan Kita akan mencari setiap komponen invers matriks kovariansi tersebut dengan menggunakan aturan Sarrus. Menurut penjelasan matriks kovariansi antara 3 variabel merupakan matriks kovariansi sebagaimana ditunjukkan persamaan (2.5) maka bentuk akar pada eksponen dalam x x dan bagian juga berubah. Agar bermakna skalar, maka 2 2 bentuk perkalian pembilang dan penyebut sebagai bentuk kuadrat ditulis x1 1 x2 2 x3 3 1 x1 1 x 2 2 x3 3 C11 C12 C13 C 23 C33 x1 1 x 2 2 x3 3 x1 1 x2 2 x3 3 C x1 1 x2 2 C11 x1 2 C12 x 2 2 C13 x1 1 x3 3 C x C x C x C 31 x1 2 C 31 x 2 2 C 33 x3 3 C C31 C32 = x1 1 C11 x1 2 C12 x2 2 C13 x DISTRIBUSI NORMAL

91 + x2 2 C21 x1 2 C22 x2 2 C23 x2 2 + x3 3 C31 x1 2 C31 x2 2 C33 x3 3 Kita dapat menghitung invers matriks 3 x 3 dengan aturan Sarrus. Contoh 2.1 Data yang diambil dari sebuah perusahaan komputer misalkan X1 dan X2 ditunjukkan pada Tabel 2.1. Tabel 2.1. Data diambil dari (Johnson, and Wichern, 2007) X `1 X Y Data yang diambil dari sebuah perusahaan komputer misalkan X1 dan X2. Dari data diperoleh rata-rata sampel untuk X 1 dan X 2 berturut-turut adalah x ; x Akan disusun matriks kovariansi dari data tersebut yaitu antara X1 dan X. Dengan menggunakan kovariansi antara 2 variabel random pada persamaan (2.5) diperoleh matriks kovariansi sampel (disimbolkan S) yaitu S ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 71

92 Sedangkan determinan S dan invers S adalah S = ( )( )-( )( )= dan S Sehingga fungsi kepadatan normal untuk 2 variabel random X 1 dan X 2 untuk sampel data yang digunakan adalah f x1, x2 = 1 exp x exp x x 1. x x x x x Sejauh ini uji statistik belum diperkenalkan. 2.2 Uji Normalitas Data Uji normalitas digunakan untuk mengetahui apakah populasi data berdistribusi normal atau tidak. Uji ini biasanya digunakan untuk mengukur data berskala ordinal, interval, ataupun rasio. Jika analisis menggunakan metode parametrik, maka persyaratan normalitas harus terpenuhi yaitu data berasal dari distribusi yang normal. Jika data tidak berdistribusi normal, atau jumlah sampel sedikit dan jenis data adalah nominal atau ordinal maka metode yang digunakan adalah statistik nonparametrik (Web 1) Uji chi-kuadrat Prosedur pengujian normalitas data dilakukan dengan menetapkan nilai H0 : data berdistribusi normal dan H1: data tidak berdistribusi normal. 72 DISTRIBUSI NORMAL

93 Menentukan taraf nyata (α) untuk mendapatkan nilai chisquare tabel 2tabel 2 (1 );dk, dilanjutkan menentukan kriteria hipotesis H0 ditolak jika 2 hitung 2 tabel dan H0 diterima jika 2 hitung 2 tabel (Web 2). Gambar 2.1 Daerah hipotesis, penerimaan dan penolakan H0 Sebuah populasi dikatakan mempunyai distribusi normal jika populasi tersebut mempunyai penyebaran data yang terkonsentrasi pada sekitar nilai tengah secara simetrik. Kita dapat memperumum fungsi kepadatan (2.1)-(2.3). Fungsi kepadatan normal multivariat adalah (Jhonson and Wichern, 2007) f ( x) 2 1 p/2 1/ 2 e x ' 1 x / 2 dengan xi, i 1,2,... p (2.4.a) dengan n : banyaknya observasi pada tiap variabel random, : matriks kovariansi dari populasi, : determinan matriks kovariansi populasi, p: banyaknya variable random, μ=:rata-rata populasi. Oleh karena itu sudah sewajarnya bahwa kondisi data berdistibusi normal jika x ' 1 x p2 ( ) (2.4.b) dipenuhi dengan p2 ( ) menyatakan distribusi chi-squre. Apabila persamaan (2.4.b) tidak dipenuhi maka data tidak berdistribusi normal. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 73

94 2.2.2 Uji Kolmogorov Smirnov (K-S test) K-S Test (Chakravartet.al, 1967) digunakan untuk menentukan distribusi suatu data sampel. Selain itu, dapat juga digunakan untuk menguji normalitas suatu data digunakan dengan cara menstrandarkan sampel kemudian membandingkannya dengan distribusi normal. K-S Test Analysis Hipotesis dari K-S Test: H0: Data mengikuti sebaran normal H1: Data tidak mengikuti sebaran nomal Statistik uji: D max F (Yi 1 i N i 1 i, F Yi N N di mana: F merupakan fungsi komulatif distribusi yang akan diuji dan harus berupa distribusi kontinyu. Significance level: alpha Daerah kritis: Tolak H0 apabila nilai kritis D lebih besar dari nilai kritis pada table, atau peluang nilai kritis D lebih kecil dari significance level (alpha). Uji ini menggunakan grafik Q-Q plot dan memperhatikan pola histogram. Dengan Q-Q plot, kita cukup memperhatikan data mengikuti pola garis linear y=x.sedangkan menggunakan histogram, cukup memperhatikan bahwa bentuk histogram mengikuti bentuk kurval normal. Contoh 2.2 Gunakan data Tabel 2.1 untuk melihat normalitas data dengan Q-Q plot dan histogram. Dengan SPSS, perintah yang digunakan adalah 74 DISTRIBUSI NORMAL

95 Analyze->Frequencies->Charts->klik Histograms dan with normal curves. Hasil ditunjukkan pada Gambar 2.2 dan Gambar 2.3. Gambar 2.2. Keluaran SPSS Gambar 2.3 Keluaran SPSS untuk histogram Analisa Gambar : Dari tampilan tersebut kita dapat menyimpulkan bahwa variabel X 1 berdistribusi normal, sedangkan variabel X 2 tidak berdistribusi normal. Pada Gambar 2.2 jelas bahwa histogram X 2 tidak berdistribusi normal. Pada waktu menggunakan Q-Q plots perlu juga dengan histogram untuk menguji asumsi bahwa populasi berdistribusi normal dimana histogram terlihat simetrik. Hasil keluaran SPSS menunjukkan bahwa uji normalitas selalu tiap variabel. Sedangkan normalitas multivariate diperlukan program untuk mendefinisikan matriks kovariansi secara multivariate. Untuk itulah diperlukan program MATLAB untuk dapat memenuhi persamaan (2.4.b). Hal ini ditunjukkan berikut ini. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 75

96 2.2.3 Uji normal multivariat Contoh 2.3 (Johnson and Winchern, 2007, hal. 159, Contoh 4.11) Selidiki data polusi udara yang terdiri dari 7 variabel yang diambil dari literatur dan ditunjukkan pada Tabel 2.2 dengan prosedur sebagai berikut : Tabel 2.2 Data polusi udara %SOURCE Data courtesy of Professor G. C. Tiao. %TABLE 1.3 AIR-POLLUTION DATA %WindU,) Solar rad.(x2) COU3) NOU<) %x DISTRIBUSI NORMAL x x x x x x

97 Tahap 1. Buatlah program dengan nama file Ceknormal1.m Pada bagian ini sebelum menggunakan rumus 2.4.b, maka perlu dicek apakah kovariansi matriks positive definite (nilai eigen semua positif) clear close all load 'Datapolusiudara.dat' X=Datapolusiudara; Rerata=mean(X); [n,p]=size(x); Kovariansi=cov(X) %cek positive definite Cekeigen=eig(Kovariansi) Tahap 2. Keluaran Matriks kovariansi S = Kovariansi = Columns 1 through Column ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 77

98 78 DISTRIBUSI NORMAL

99 Nilai eigen berturut-turut adalah Tahap 3. Karena nilai eigen positif semua maka proses dapat dilanjutkan. Kita tambahkan program dengan mencari invers dan karena banyak observasi maka kita melakukan tahapan setiap data dikurangi rata-rata masing-masing dan disimpan pada vektor M. InversKov=inv(Kovariansi); M=zeros(n,p); % menyediakan matriks/vektor untuk X - Miu for i=1:p Bantu1=X(:,i)-Rerata(i); M(:,i)=Bantu1; end Tahap 4. Kita akan menguji cek kenormalan dengan mengimplementasikan persamaan (2.4.b) pada program %Cekkenormalan Normalkah= M(1,:)*InversKov*M(1,:)' %Perhatikan notasi berbeda Batas= chi2inv(0.95,p);; %Dari tabel vbanding=zeros(n,2); for j=1:n Normalkah= M(j,:)*InversKov*M(j,:)' vbanding(j,1)=normalkah; vbanding(j,2)=batas; end Ceknormal=vbanding Keluaran untuk bagian ini adalah sbb ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 79

100 Tahap 5. Karena melihat daftar lebih sulit, maka hasil informasi dapat ditunjukkan menggunakan Gambar. Keluaran bagian ini ditunjukkan berikut ini. 80 DISTRIBUSI NORMAL

101 Tahap 6. Tentu kita ingin melihat data yang mana yang tidak normal. Maka pada bagian program ditambahkan untuk mencari indeks data yang tidak normal sebagai berikut. %Cari berapa banyak normal dan tidak normal I=find(vbanding(:,1)>Batas) nyangtidaknormall=length(i); prosentasenormal=(length(vbanding)length(i))/length(vbanding)*100 Keluaran bagian ini I= prosentasenormal = Keluaran program ditunjukkan pada Gambar 2.3. Gambar 2.4 Data polusi Tabel 1 yang diuji kenormalannya (tanda o menyatakan ( X )' 1 ( X ), tanda garis menyatakan besarnya p ( ) = 7 (0.05) = Pembahasan hasil program: Data yang tidak normal adalah data ke-7, ke-8, dan ke-39. Sedangkan persentase normal sebesar %. Jika prosentasi ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 81

102 tersebut sudah dianggap cukup baik maka data secara keseluruhan berdistribusi normal. Catatan : 1. Dengan program MATLAB memang tidak ada tingkat signifikansi sebagaimana ditunjukkan pada SPSS dimana setiap variabel diuji kenormalannya dengan tingkat signifikansi tertentu. Akan tetapi pada bagian ini kita cukup melihat prosentasi kenormalan data. Menurut Johnson and Wichern (2007) bahwa data dikatakan normal mutlivariat jika lebih dari 50% saja sudah cukup. 2. Dengan memperhatikan skewness koefisien dari suatu data pula menjelaskan lebih kuat tentang normalitas data (Richardson dan Smith, 1993). Akan tetapi hal ini tidak ditunjukkan pada Bab ini Uji normal multivariat dengan plot chi-kuadrat Uji ini dilakukan dengan menggunakan persamaan (2.4.b) untuk tiap sample dimana perlu mengurutkan data sedemikian hingga memenuhi kondisi sebagai berikut d 2j x j x ' S 1 x j x j=1,,n (2.4.c) Proses mengkonstruksi chi-plot sebagai berikut (1) Urutkan persamaan (2.4.c) dari yang terkecil hingga terbesar yaitu : d 12 d 22 d dn2 (2) d 12, p2 j 1 / 2 / 2 dimana Gambarlah pasangan p2 j 1 / 2 / 2 adalah 100 j 1 / 2 / 2 persentil dari distribusi chi-kuadrar dengan derajat bebas p. Plot yang dihasilkan haruslah berpola garis linear. Contoh 2.4 Tekanan udara di Boyolali pada Bulan Juli-November 2009 ditunjukkan pada Tabel DISTRIBUSI NORMAL

103 Tabel 2.3 Data tekanan udara Boyolali bulan Juli-November 2009 TANGGAL JULI AGUSTUS SEPTEMBER OKTOBER NOVEMBER Jumlah Rata ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 83

104 Program MATLAB untuk hal ini disimpan dalam analisismulti.m dan data disimpan dalam file multivar.dat. Berikut ini program tersebut : clear close all load 'multivar.dat' P=multivar; [n,p]=size(p); %for i=1:p % M(:,i) =P(:,i)./max(P(:,i)); % end X=P; Rerata=mean(X); [n,p]=size(x); Kovariansi=cov(X) InversKov=inv(Kovariansi); M=zeros(n,p); % menyediakan matriks/vektor untuk X - Miu for i=1:p Bantu1=X(:,i)-Rerata(i); M(:,i)=Bantu1; end %Buat dkuadrat menurut hal.184 dkuadrat=zeros(n,1); for j=1:n dkuadrat(j)= M(j,:)*InversKov*M(j,:)' end d2=sort(dkuadrat) %buat X2 for j=1:n chikuadrat(j)=chi2inv(1-(n-j+1/2)/n,p) end %Digambar plot(d2,chikuadrat,'*') 84 DISTRIBUSI NORMAL

105 Hasil keluaran program ditunjukkan pada Gambar Gambar 2.5. Plot chi-square data tekanan udara Boyolali Juli-November tahun 2009 Dari Gambar 2.4 sumbu horizontal menujukkan bulan dan sumbu vertikal menunjukkan chi-square. Data berdistribusi normal dengan tingkat persentase kenormalan 83.33% dikarenakan hanya ada 5 data penyebab tidak normal yakni data ke 26, 27, 28, 29, 30. Menurut Johnson and Wichern (2007), maka data sudah berdistribusi normal. Jadi data univariat tidak normal tetapi data secara multivariat normal. Tugas penelitian 2.1 Misalkan diberikan data angket pertanyaan kepada mahasiswa untuk mengevaluasi pengajaran dosen dengan daftar pertanyaan menurut Tabel 2.4 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 85

106 Tabel 2.4 Daftar pertanyaan untuk mengevaluasi dosen (Parhusip dan Setiawan, 2011) No Pertanyaan Kejelasan tentang rencana perkuliahan selama satu semester Kejelasan tentang sistem penugasan dan evaluasi Sistematika penyampaian kuliah Usaha dosen ybs dalam memotivasi mahasiswa Kejelasan mengenai materi perkuliahan yang diberikan dosen ybs Suasana menyenangkan yang diciptakan dosen selama perkuliahan Kejelasan dalam menjawab pertanyaan mahasiswa mengenai materi kuliah Daya tarik yang dibangkitkan dosen terhadap mata kuliah ini Kejelasan mengenai tujuan dari setiap tugas yang diberikan Cara dosen ybs merangsang pemikiran kritis mahasiswa Usaha dosen ybs membantu mahasiswa memahami materi perkuliahan Dosen memberikan kesempatan untuk bimbingan di luar jam kuliah Efektifitas penggunaan waktu kuliah dalam setiap pertemuan Relevansi tugas-tugas yang diberikan terhadap bahan kuliah Mutu koreksi/umpan balik dosen atas tugas dan tes kepada mahasiswa Secara keseluruhan kualitas pembelajaran dosen ybs adalah Tabel 2.5 Hasil evaluasi terhadap 6 dosen untuk berbagai mata kuliah yang disajikan X1 4,00 4,00 4,00 3,20 4,00 3,20 4,00 3,73 4,00 3,73 3,73 4,00 3,47 3,47 3,73 3,73 X2 2,67 2,51 2,72 2,41 2,59 2,79 2,41 2,33 2,21 2,33 2,62 2,31 2,51 2,23 2,36 2,64 86 DISTRIBUSI NORMAL X3 2,89 3,00 2,11 2,78 2,11 2,89 3,11 2,33 3,00 2,89 3,00 2,56 3,56 3,22 3,11 2,78 X4 2,71 2,57 2,29 2,14 2,29 2,29 2,43 2,14 2,71 2,29 2,71 2,86 2,86 2,71 2,29 2,57 X5 2,62 2,58 3,01 3,48 3,14 3,48 3,35 2,88 2,75 2,67 3,40 3,18 3,05 3,05 2,92 3,35 X6 3,20 3,05 2,83 2,83 2,88 2,85 3,12 2,67 3,02 3,03 2,92 2,43 3,38 3,20 2,92 3,12

107 Soal Latihan 2.1 Data yang akan kita gunakan adalah data nilai dari 3 mata kuliah dari 87 mahasiswa yang ditunjukkan pada Tabel 2.6. Tabel 2.6 Daftar nilai hasil 3 matakuliah (Johnson andwichern, hal.195) No Nilai sosial dan sains Nilai Verbal Nilai Sains ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 87

108 No Nilai sosial dan sains Nilai Verbal Nilai Sains DISTRIBUSI NORMAL

109 No Nilai sosial dan sains Nilai Verbal Nilai Sains Tahap 2. Tunjukkan bahwa matriks kovariansi positive definite Tahap 3. Jelas bahwa data mempunyai matriks kovariansi yang positive definite maka kita dapat mencari invers matriks. Soal Latihan 2.2 Data Tabel 2.3 yaitu sebagai variabel X=[ X1, X 2, X 3 ] di atas telah ditunjukkan berdistribusi normal. Kita akan menguji apakah setiap subhimpunan dari X berdistribusi normal. Setiap subhimpunan dari X yang tidak kosong dan selain X adalah X1, X 2, X 3, { X 1, X 2 }, { X 1, X 3 }, { X 2, X 3 } Transformasi data menjadi berdistribusi normal Karena data secara univariat tidak berdistribusi normal, kita akan mencoba mentransformasi data agar berdistribusi normal. Ada berbagai bentuk transformasi untuk membuat data berdistribusi normal sebagai- ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 89

110 mana ditunjukkan pada literatur. Misalkan (Johnson and Wichern, hal ) x 1, 0 x ln x, 0 (2.5) dengan parameter yang harus ditentukan untuk x > 0. Pemilihan parameter ini ditentukan dengan memaksimalkan n 2 n 1 n l ( ) ln x (j ) x( ) 1 ln x j 2 n j 1 j 1 dan x ( ) (2.6) ( ) 1 n ( ) 1 n x j 1 xj. n j 1 n j 1 Transformasi yang lain adalah memperkenalkan variabel baru y (j ) x j 1 1 xi i 1 n 1/ n 1, j =1,...,n. (2.6) Pada literatur tidak ditunjukkan bagaimanakah formula persamaan (2.5)(2.7) dapat diperoleh. Demikian pula, belum ada jaminan bahwa transformasi tersebut cukup menjamin pada distribusi normal. Setelah variabel mula-mula ditransformasi maka uji normalitas dilakukan sebagaimana sebelumnya (menghitung kovariansi dan sebagainya). Kita akan mencoba transformasi persamaan (2.5) dengan memilih parameter dengan trial and error untuk tahap awal. 90 DISTRIBUSI NORMAL

111 Tahap 4. Transformasi normalitas, misal =0 dan X1 yang ditransformasi, program bernama Cekunivariat2b.m clear close all load 'DataTabel5_2.dat' %dapat diganti Tabel sesuai kebutuhan X=DataTabel5_2(:,2:4); Rerata=mean(X); [n,p]=size(x); X1=X(:,1); s=cov(x1); miu=rerata(1); %formula 2.4.b Normalkah= (X1-miu)'*(1/s)*(X1-miu); Batas=3.84 ;%alfa=0.05, p=1; Banding=[Normalkah Batas]; %jelas X1tidak normal %X1 ditransformasi %persamaan 4-34 lamda=0; X1baru=log(X1); sbaru=cov(x1baru); Normalkah2= (X1baru-miu)'*(1/sbaru)*(X1baru-miu); Batas=3.84 ; %alfa=0.05, p=1; Banding2=[Normalkah2 Batas] Keluaran program sbb >> Cekunivariat2b s= e+003 Banding2 = 1.0e+008 * Analisis hasil program: Hasil ini menjelaskan bahwa data dengan transformasi persamaan (2.5) untuk =0 tetap tidak berdistribusi normal. Untuk selanjutnya kita memilih > 0 yaitu dengan 10 titik. Bagian program dapat ditambahkan dengan perintah berikut ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 91

112 %buat X1baru lagi lamda=linspace(0.01,0.5,10); cek=length(lamda); for i=1:cek X1baru=(X1-1)./lamda(i); miu=mean(x1baru); sbaru=cov(x1baru) Normalkah2(i)= (X1baru-miu)'*(1/sbaru)*(X1baru-miu); end Bacanomal=Normalkah2' figure(1) plot(lamda,normalkah2,'*') Keluaran program ditunjukkan pada Gambar 2.4 berikut. Gambar 2.6. Horizontal merupakan nilai dan vertikal menyatakan nilai kritis batas normal Analisis hasil program: Batas normal untuk semua data setelah ditransformasi adalah 86. Jelas hal ini lebih besar dari nilai chi-square sehingga data masih tidak normal. Untuk itu perlu dicari parameter yang tepat sehingga data mula-mula dapat berdistribusi normal. Tentu perlu ada 92 DISTRIBUSI NORMAL

113 kajian lebih lanjut apakah data hasil transformasi setelah menjadi multivariat juga tetap berdistribusi normal. Oleh karena pemilihan dengan trial and error menjadi sangat lama, hal inilah yang menyebabkan perlu adanya suatu fungsi yang dapat mengoptimalkan pemilihan parameter sebagaimana ditunjukkan pada persamaan (2.5). Demikian pula ketika data variabel lama ( X 1 ) distandarisasi tetap diperoleh bahwa variabel baru tidak normal. Dari hasil pratikum, jelas bahwa formula yang diberikan belum diterapkan secara umum (karena pemilihan parameter masih belum digunakan). Akan tetapi alasan penyusunan persamaan (2.5) juga belum jelas. Perlu dicari fungsi yang dapat mentrasformasi data secara sederhana yang tidak mengubah karakteristik data mula-mula. Contoh 2.5 Diberikan data tekanan udara pada bulan Juli sampai dengan bulan November di Boyolali pada tahun 2009 dengan satuan MBS. Analisis Normalitas Data Menguji normalitas data tekanan udara di Boyolali bulan Juli-November tahun 2009 berdistribusi normal atau tidak. Cara pengujiannya dengan menggunakan bantuan software MATLAB dan SPSS. (a) Cara 1 Menganalisis normalitas data tekanan udara di Boyolali bulam JuliNovember tahun 2009 dengan menggunakan batas didapatkan matriks kovarian. Misal = chisquared maka: ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 93

114 .. =.. [ ] Gambar 2.7 Uji normal data tekanan udara bulan Juli-November 2009 Garis horizontal adalah nilai p 2 Kiri : data belum ditransformasi; kanan : data yang sudah ditransformasikan. Gambar 2.7 menunjukkan persentase tingkat normalitas data yaitu % analisis dilakukan secara multivariat. Hal ini berarti data yang diperoleh tidak berdistribusi normal karena tingkat toleransi yang digunakan 20%. Dari keluaran diatas terlihat bahwa penyebab data tidak berdistribusi normal yaitu data ke- 2,3,4,9,12,13,14,17,31 dikarenakan data tersebut terletak di atas batas chi-square. Data pada mulanya tidak berdistribusi normal maka data ditransformasi dengan mengambil log data dengan basis bilangan natural yang kemudian dianalisis dengan cara yang sama yakni dengan chi-square dengan tujuan agar didapatkan data dengan tingkat persentase normal yang semakin meningkat dan diperoleh matriks kovarian. Dimisalkan ln = 94 DISTRIBUSI NORMAL

115 .. =.. [ ] Dari Gambar 2.5 terlihat bahwa data masih berdistribusi tidak normal, hasil data yang diambil logaritma dengan basis bilangan natural (e) memiliki hasil yang tidak jauh berbeda dengan persentase kenormalan %. Tingkat persentase yang sama dikarenakan selisih antara data di setiap bulannya relatif kecil sehingga variansinya pun kecil. Cara 2 Menganalisis normalitas data dengan menggunakan histogram pada SPSS Gambar 2.8 Histogram untuk normalitas data tiap bulan dari Juli-November 2009 (dari kiri ke kanan) Dari Gambar 2.8 menunjukkan bahwa data berdistribusi normal pada bulan Juli, Agustus dan Oktober hal ini dapat diamati dari gambar histogram yang mendekati kurva normal, sedangkan pada bulan ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 95

116 September dan November terlihat data tidak berdistribusi normal karena dari histogram tampak bahwa data tidak mendekati kurva normal dan meledak interval tertentu. Sehingga kami menyimpulkan bahwa jika dilihat secara keseluruhan data tekanan udara tidak berdistribusi normal. Cara 3. Menganalisis data dengan menggunakan QQ-Plot pada SPSS Gambar 2.9 QQ-Plot dari data bulan Juli-November tahun 2009 (dari kiri ke kanan) Dari Gambar 2.9 terlihat bahwa data berdistribusi normal pada bulan Juli, Agustus dan Oktober. Hal ini dapat diamati dari persebaran data di sekitar garis lurus. Sedangkan pada bulan September dan November terlihat data tidak berdistribusi normal karena dari QQ-Plot tampak bahwa data tidak mendekati garis linear. Sehingga kami menyimpulkan bahwa jika dilihat secara keseluruhan data tekanan udara tidak berdistribusi normal. DAFTAR PUSTAKA Johnson, R.A. and Wichern,D.W, Applied Multivariate Statistical Analysis, 6th ed. Prentice Hall, ISBN Richardson, M., Smith, T.,1993. A Test for Multivariate Normality in Stock Returns, Journal of Business, V0l.66 (2), Parhusip, H.A dan Setiawan, A., Modelling on Lecturers Performance with Hotteling-Harmonic-Fuzzy, proceeding 6th SEAMS GMU Conference on Mathematics and its Applications, ISBN , Indonesia. 96 DISTRIBUSI NORMAL

117 3 MULTIVARIAT REGRESI 3.1 Regresi linear sederhana Pada regresi sederhana berarti bahwa model hanya menjelaskan hubungan 1 variabel tak bebas (variabel respon) terhadap 1 variabel bebas (juga disebut variabel prediktor) dimana setiap pasangan memenuhi yi 0 1 xi i. i=1,,n (3.1) 0, 1 dicari berdasarkan data. Secara geometri, jika ada 2 titik maka kita dapat mengilustrasikan garis lurus melalui kedua titik itu dengan 0 disebut intercept sedangkan 1 sebagai gradient. Karena banyaknya data n (lebih dari 2 titik) maka perlu dicari yang terbaik sehingga kita masih dapat membuat garis yang dianggap mengilustrasikan hubungan linear antara tiap pasangan data xi, yi, i=1,...,n. Untuk mendapatkan parameter terbaik digunakan goodness of fit yaitu meminimalkan deviasi kuadrat antara data yang diobservasi dengan model, yaitu deviasi = y - y i,model. 2 i,data (3.2) Ada berbagai selisih/deviasi karena hal ini. Misal dengan SS T (total sum square) adalah jumlah total antara selisih data observasi (Y) dengan ratarata dari hasil model. Sekalipun nantinya parameter sudah diperoleh terbaik yaitu 0, 1 telah diperoleh sehingga y model,i 0 1 xi 96 MULTIVARIAT REGRESI (3.3)

118 maka selisih antara yi,data dan yi,model tidak bisa selalu 0. Oleh karena itu selisih ini disebut residual sum square yang disimbolkan SS R. Selain itu dapat pula dipelajari selisih antara nilai rata-rata data observasi (Y) dengan garis regresi. Jumlah kuadrat selisih ini dikenal dengan model sum squares ( SS M ). Oleh karena ada 2 akibat. Akibat 3.1. Jika nilai SS M besar maka model regresi sangat berbeda dengan rata-rata untuk memprediksi keluaran variabel. Akibat 3.2. Jika nilai SS M kecil maka model regresi sedikit lebih baik dibandingkan dengan rata-rata untuk memprediksi keluaran variabel. Aturan untuk mengukur hal ini digunakan rasio antara keduanya yaitu R2 SS M. SS T (3.4) Yang menarik dari hal ini adalah korelasi Pearson (pada Bab I) dapat diperoleh sebagai akar dari R 2. Cara lain untuk menguji jumlah kuadrat adalah dengan Uji statistik yang dilakukan F-rasio yang mengukur seberapa besar model telah memperbaiki prediksi dari keluaran dibandingkan dengan tingkat ketidaktepatan model F SS M SS R Kita akan melakukan regresi dengan SPSS Contoh 3.1 Perhatikan data Tabel 1 Bab 2. File pada regresiku1_1.sav dengan data pada Gambar 1. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 97

119 Gambar 3.1. Data yang diolah Cara SPSS sebagai berikut:. Klik Analyze -> Regression->Linear Kita akan melakukan regresi untuk variabel tak bebas merupakan fungsi polinomial derajat k. 3.2 Regresi fungsi 1 peubah untuk polinomial derajat k (k >1) Anggap bahwa pasangan data yang kita punyai diberi simbol (t1, s1 ),..., (t n, sn ) dan asumsi kita adalah s=f(t) yaitu fungsi polinomial p(t ) x0 x1t... xk t k. (3.5) Perhatikan bahwa peubah bebas disini adalah t, sedangkan x0,..., xk koefisien polinomial yang harus dicari berdasarkan data. Kita perlu mencari x0,..., xk sehingga deviasi nilai si p(t i ) sekecil mungkin. Karena berlaku untuk semua data i=1,...,n, maka masalah ini menjadi masalah meminimalkan jumlahan kuadrat jarak (makna least square) yaitu n R x0, x1,..., xk si p(t i ) i 1 98 MULTIVARIAT REGRESI 2 2 k si x j t i j. i 1 j 0 n (3.6)

120 Pemilihan jarak kuadrat yang diminimalkan tetapi bukan jarak si p(t i ) dikarenakan perlunya sifat terdefinisinya turunan R. Sebagaimana pada kalkulus, untuk meminimalkan R, maka perlu turunan R terhadap masingmasing variabel. Fungsi R pada persamaan (3.6), menjadi fungsi variabel x0, x1,..., xk karena x0, x1,..., xk tidak diketahui dan sedang dicari. Untuk proses selanjutnya akan lebih baik jika R dinyatakan dalam bentuk notasi vektor dan matriks. Contoh 3.2 n Jika x1 y1... xn y n xi yi maka dalam notasi vektor dapat ditulis i 1 sebagai dot product antara 2 vektor misal x [ x1 xn ]T, y [ y1 y n ]T sehingga n x1 y1... xn yn xi yi = x. y = x T y i 1 Persamaan (3.5) dapat ditulis dalam notasi matriks dan vektor dengan membentuk sebagai berikut s1 x0 x1t1 x2t12 x3t13... xk t1k s2 x0 x1t2 x2t22 x3t23... xk t2k s2 x0 x1t n x2t n2 x3t n3... xk t nk. 1 t1 1 t 2 A 1 t n t12 t1k s1 x0 k 2 t 2 t 2 s 2 x1, b, x. 2 k tn tn sn xk (*) ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 99

121 Dengan menggunakan definisi norm vektor maka n R x0, x1,..., xk si p(t i ) 2 i 1 = b Ax 2 k si x j t i j i 1 j 0 n b Ax b Ax 2 = b b 2b Ax Ax Ax = b b 2 AT b x x AT Ax. Oleh karena itu turunan pertama R terhadap masing-masing variabel (yaitu x0, x1,..., xk ditulis sebagai vektor (ingat kalkulus pebuah banyak) R R R,..., x k x 0 T T = b b 2 A b x x A Ax = 2 AT b 2 AT Ax. T (3.6) Pada kalkulus fungsi 1 peubah y = f(x) kita tahu bahwa x = x* d2y peminimal atau pemaksimal terjadi jika df/dx=0. Jika 0 pada x = dx 2 x* maka titik kritis (x*,y(x*)) merupakan titik minimum lokal. Analog dengan kalkulus kita akan mencari peminimum R yaitu * mencari x x yang memenuhi R 0. Yaitu dari persamaan (3.6) * dengan menyebut x x diperoleh 2 AT b 2 AT Ax * 0. Atau AT Ax * = AT b. (3.7). * Apakah benar x x peminimal?. Kita perlu menyelidiki turunan kedua R (disebut Hessian R). Kita akan menuliskan teorema untuk sembarang fungsi kontinu f dengan peubah banyak. 100 MULTIVARIAT REGRESI

122 Sifat titik kritis (maksimum atau minimum) ditunjukkan oleh tipe matriks Hessian (matriks yang memuat turunan kedua dari fungsi terhadap masing-masing variabel bebas). Misal matriks Hessian disimbolkan H f maka berlaku sifat berikut. Teorema 3.3. Misalkan A matriks simetris n x n dan QA ( y) y Ay merupakan bentuk kuadratik yang berkaitan dengan A. Maka A dan QA ( y) dikatakan (a) n Positive semidefinite jika QA ( y) y Ay 0 untuk semua y R ; (b) n Positive definite jika QA ( y) y Ay 0 untuk semua y R dan y 0; (c) n Negative semidefinite QA ( y) y Ay 0 untuk semua y R ; (d) n Negative definite QA ( y) y Ay 0 untuk semua y R dan y 0. (e) Indefinite jika QA ( y) y Ay 0 untuk suatu y Rn dan n QA ( y) y Ay 0 untuk y R yang lain. Terkadang teorema berikut lebih mudah. Teorema 3.4. Jika H f adalah sebuah matrik simetri, maka: 1. Matrik H f positive definite jika dan hanya jika semua nilai eigen dari H f positif. 2. Matrik H f positive semidefinite jika dan hanya jika semua nilai eigen dari H f Matrik H f indefinite jika dan hanya jika ada satu nilai eigen yang negatif dan ada satu nilai eigen yang positif. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 101

123 4. Khusus untuk matriks simetris 2 x 2, kita dapat mengenali sifat matriks menurut teorema berikut. a11 Teorema 3.5 Jika A matriks simetris 2 x 2, sebutlah A a12 a12 a 22 (a) a11 a12 > 0; Positive definite jika hanya jika a11 0, det a12 a22 (b) a11 a12 > 0. Negative definite jika hanya jika a11 0, det a12 a22 Diasumsikan x * adalah sebuah titik kritis dari sebuah f (x ) yang mempunyai derivatif pertama dan kedua yang kontinu di suatu D R n dan H f adalah matriks Hessian f (x ) di x * maka x * adalah 1. Sebuah peminimum lokal untuk f (x ) jika H f di D adalah positive semidefinite di D. 2. Sebuah peminimum lokal secara tegas untuk f (x ) jika H f positive definite di D 3. Sebuah pemaksimal lokal untuk f (x ) jika H f adalah negative semidefinite di D. 4. Sebuah pemaksimum lokal secara tegas untuk f (x ) jika H f adalah negative definite di D. Kita akan menerapkan teorema tersebut dengan f=r dan x0, x1,..., xk. Hessian R yaitu Hf x= T T T = ( R) ( 2 A b 2 A Ax ) 2 A A. Karena A berbentuk n x (k +1) maka AT A berbentuk (k+1)x(k+1). k 1 Menggunakan teorema 2a berarti perlu diambil sembarang y R 102 MULTIVARIAT REGRESI

124 sehingga jelas bahwa y. AT A y = berbentuk kuadratik, jelas Hf Ay.A y= Ay 2. Karena * positive definite. Artinya x x pada AT Ax * = AT b pada persamaan (3.7) merupakan peminimal R. * T Untuk mendapatkan x pada (3.7) maka A A harus invertible. T Jelas A A karena matriks tersebut positive definite. Jadi kita dapat * memperoleh x pada (3.7) yaitu T 1 x * = ( A A) AT b. (3.8) * * * Jadi jika x * = ( x0, x1,..., xk ) telah diperoleh dan subsitusikan pada polinomial p(t ) x0* x1*t... xk* t k Disebut best least square (k-th degree polynomial) yaitu regresi terbaik untuk derajat polinomial derajat k. Kegiatan Penelitian pada bagian ini dilakukan dengan Program MATLAB. Kegiatan Penelitian 3.1. Disediakan data Tabel 3.1 yang merupakan tabel indeks saham LQ45 dari 5 perusahaan pada periode 1 Agustus September ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 103

125 Tabel 3.1 Data indeks saham LQ45 dari 5 perusahaan pada periode 1 Agustus September 2011 TGL ^JKSLQ45 AALI ADRO ANTM ASII BBCA 1 01-Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Sep Sep Sep Sep Sep Kita akan beranggapan bahwa Indeks LQ45 (kolom3) sebagai fungsi indeks saham AALI. Pola data ditunjukkan pada Gambar 3.2. Sebutlah y = data indeks LQ45 dan x := indeks saham AALI sehingga y=f(x). Kita akan menggunakan formula (3.7) untuk data Tabel 3.1. Pada MATLAB disusun program 104 MULTIVARIAT REGRESI

126 Gambar 3.2. Pola data indeks LQ45 (variabel tak bebas)(sumbu vertikal) dan indeks saham AALI (sumbu horizontal) pada 1 Agustus September 2011 Tahap 1. Untuk regresi dengan k =1. clear close all load 'Cekindex.dat' M=Cekindex; [m,n]=size(m); Y=M(:,1); X=M(:,2:n); %REGRESI POLINOMIAL order k untuk y=f(x1) figure plot(x(:,1),y,'*') %susun mtriks k=1; %order polinomial A=zeros(m,k+1); A1=ones(m,1); A(:,1)=A1; A(:,k+1)=X(:,1).^k; det1=det(a'*a) %Betastar, Peressini page vb=y; BETA2=inv(A'*A)*A'*vb YX1polorder1=A*BETA2 figure plot(x(:,1),y,'*',x(:,1),yx1polorder1,'-') ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 105

127 Tahap 2. Keluaran dari program ini ditunjukkan pada Gambar 3.3 Gambar 3.3. Hasil regresi linear (k =1) Tahap 3. Kita akan meningkatkan derajat regresi dengan k =2, 3 atau k=4. Catatan: Nama program :Ujipolim.m Program yang sama dapat dilanjutkan dengan hanya merevisi A. Sebagai berikut : k=2; A(:,k+1)=X(:,1).^k; det2=det(a'*a); %Betastar, vb=y; BETA2=inv(A'*A)*A'*vb YX1polorder2=A*BETA2 Hal ini dapat dilakukan secara berulang. Hasil regresi ditunjukkan pada Gambar 3.4 untuk k=1 hingga k= MULTIVARIAT REGRESI

128 Gambar 3.4 Hasil regresi univariat untuk polinomial derajat k=1,2,3, dan 4 Jika kita cermati lebih lanjut, ternyata matriks untuk regresi hampir singular yang juga dikomentari oleh MATLAB mulai k=2, 3 dan 4. Hal ini T juga dapat diuji dengan menghitung determinan ( A A). Jadi pendekatan polinomial tidak terlalu bagus untuk data yang memuat outlier. Kita akan hentikan terlebih dahulu studi ini. Kita lanjutkan studi data Tabel 3.1 dengan anggapan bahwa indeks LQ45 merupakan fungsi indeks saham dari 5 perusahaan secara linear. 3.3 Regresi linear Multivariat (klasik) Misalkan kita mempunyai variabel tak bebas Y [ y1,..., yn ]T dan p variabel bebas dengan mengasumsikan bahwa data disimpan dalam sebuah matriks random X dimana elemen baris menyatakan n observasi X= ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 107

129 [X1...Xp] dan banyaknya kolom menyatakan p variabel X1,..., Xp. Perhatikan bahwa setiap vektor Xj mempunyai n observasi yang ditulis sebagai vektor kolom sehingga jika matriks X ditulis perkomponennya sebagai adalah x11 x12 x x X x n1 x n 2 X1 X2 x1 p x 2 p. x np Xp Model regresi linear dengan variabel tak bebas tunggal Y dalam bentuk y 0 1 X 1 2 X 2... p X p. (3.9) Dengan observasi sebanyak n maka tiap observasi ke-i memenuhi model (3.9) yaitu y1 0 1 x11 2 x12 3 x13... p x p1 1 y2 0 1 x21 2 x22 3 x23... p x2 p n yn 0 1 xn1 2 xn 2 3 x23... p xn2 p n (3.10) dimana suku-suku error diasumsikan mempunyai sifat-sifat 1. E ( j ) 0; (3.11) 2 2. Var ( j ) (konstan) dan (3.12) 3. Cov( j, k ) 0, j k. (3.13) 108 MULTIVARIAT REGRESI

130 Dalam notasi matriks vektor, persamaan (3.10) menjadi y1 1 x11 y 1 x 21 2 y n 1 x n1 x1 p 0 1 x 2 p 1 2. x np p n x12 x 22 xn 2 Ditulis Ynx1 Z ( n x ( p 1)) (( p 1) x1) ( nx1) (3.14) Persamaan (3.11)-(3.13) ditulis dalam bentuk matriks-vektor adalah 1. E ( ) 0; dan T 2 2. Cov( ) E ( ) I. Z ( n x ( p 1)) Perhatikan bahwa kolom pertama matriks hanya mempunyai komponen bernilai 1 dan kolom ke-2 hingga ke p+1 adalah vektor-vektor X1,..., Xp. Parameter regresi yaitu vektor (( p 1) x1) = 0 1 p T diperoleh dengan least square yaitu meminimumkan 2 p R yi 0 j xij. i 1 j 1 n (3.15) Dalam notasi vektor matriks ditulis (lihat untuk regresi univariat) 2 = y Z y Z y Z = y y 2 y Z Z Z. Oleh karena itu turunan pertama R terhadap masing-masing variabel (yaitu 0, 1,... p ditulis sebagai vektor (ingat kalkulus pebuah banyak) yang harus sama dengan 0 yaitu ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 109

131 R R R,..., p 0 = y y 2 y Z Z Z = 2Z T y 2Z T Z 0. T 2Z T y 2Z T Z 0 atau Z T y Z T Z. Jadi T T mendapatkan kita harus menyelesaikan Z y Z Z yaitu Diperoleh Z T Z Z T y. 1 untuk (3.16) Seringkali persamaan (3.16) juga ditulis dalam bentuk mengalikan ruas kiri dan kanan dengan Z diperoleh Z Z Z T Z 1 ZT y H y (3.17) dengan H Z ZTZ 1 ZT (3.18) yang sering disebut sebagai hat matrix. Matriks dengan notasi H ini akan banyak digunakan pada pembahasan lebih lanjut. Perhatikan bahwa persamaan (3.18) menunjukkan bahwa ruas kiri yaitu Z merupakan hasil regresi jika telah ditemukan yaitu yˆ Z. Sehingga persamaan (3.18) dapat ditulis sebagai yˆ H y (3.19) Menurut aljabar linear tidak selamanya invers matriks ada. Untuk itu perlu disyaratkan bahwa dapat diperoleh jika Z T Z 1 ada. Telah diketahui pula bahwa hasil yang diperoleh pada persamaan (3.16) menjamin peminimum R pada persamaan (3.17) asalkan matriks Z T Z 110 MULTIVARIAT REGRESI

132 positive definite (nilai eigen semua positif). Ekspresi Z T Z diperoleh dari ( R) R = Z T Z yang merupakan matriks Hessian R. 3.4 Residu dan Hasil Regresi Misal diberikan hasil fitting /regresi adalah T yˆ yˆ1,..., yˆ n dan T sebutlah vektor residu adalah e y yˆ e1...en. Hasil regresi memenuhi yˆ Z sebagaimana pada persamaan (3.19). Sehingga vektor residu adalah e y yˆ y H y I H y. (3.20) Sehingga matriks variansi dan kovariansi dari matriks residu adalah 2 e 2 I H (3.21) yang didekati oleh s 2 e nxn MSE( I H ). (3.22) 3.5 Hasil analisis variansi Jumlah Kuadrat dan kuadrat rata-rata Sebelum kita menuliskannya dalam bentuk notasi matriks dan vektor kita perlu mengingat kembali notasi-notasi berikut. Total jumlahan kuadrat disingkat SSTO yaitu 2 SSTO yi y y 2 i y. 2 i n (3.23) Dalam notasi vektor maka ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 111

133 y 2 i T = y y (atau ada juga yang menggunakan dot product). Sedangkan untuk menulis y 2 i n maka diperkenalkan terlebih 1 1 dahulu matriks J yaitu J =. 1 1 Sehingga y dapat 2 i n ditulis sebagai y 1 y 2 i n n T Jy (3.24) Contoh : n = 2 maka ekspresi (3.24) berarti 1 1 y1 y1 y 2 y1 y 2 1. y1 y y 2 Jadi kita dapat menuliskan persamaan (3.24) dalam notasi vektor matriks yaitu SSTO y T y 1 y T J y n Sebagaimana y 2 i (3.25), kita dapat menuliskan SSE ei2 yi yˆ i 2 dapat ditulis sebagai T T T T T T SSE e T e y Z y Z = y y 2 Z y Z Z. (3.26) Dari (3.16) kita mempunyai Z T Z pada persamaan (3.26) diperoleh 112 MULTIVARIAT REGRESI 1 Z T y yang dapat disubstitusikan

134 T T T T T SSE = y y 2 Z y Z Z y T y 2 T Z T y T Z T Z Z T Z 1 ZT y. T T T T T T T T = y y 2 Z y Z y y y Z y. Sedangkan SSR = yˆ y merupakan variasi dari regresi yang 2 i, j dapat dituliskan pula dalam notasi matriks dan vektor. Yaitu 1 SSR = T Z T y y T J y. n (3.27) Kita dapat kembali mengkoleksi jumlah kuadrat dari analisis variansi dalam bentuk matriks dari persamaan (3.25)-(3.27) sebagai berikut SSTO y T y 1 y T J y = n 1 y T I J y n SSE y T y T Z T y y T I H y 1 1 SSR T Z T y y T J y y T H J y n n Perhatikan bahwa SSTO mempunyai n-1 derajat kebebasan. SSE mempunyai n-p derajat kebebasan, SSR mempunyai p-1 derajat kebebasan Regresi dengan SPSS Misalkan kita akan menggunakan dengan menyatakan bahwa Y tergantung secara linear dengan X 1 dan Y tergantung secara linear terhadap X 2. Tahap 1. Misalkan diketahui data sudah dituliskan dalam Excel dan anda tidak ingin memindah secara manual tetapi membuka file Excel tersebut. Misalkan dalam Tabel Excel sebagai berikut ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 113

135 Gambar 3.5. Data 2 variabel prediktor dan 1 variabel respon (Y) dalam Excel Tahap 2. Memanggil dalam SPSS Pada jendela SPSS : File ->Open ->Data -> Namafile.xls -> Ok Tahap 3. Melakukan regresi Kasus 1. Y tergantung secara linear dengan X 1 Hal ini ditulis dalam bentuk y 0 1 X Dari persamaan (3.14) maka Z , sehingga ZT MULTIVARIAT REGRESI

136 sehingga Z T Z Z T y 1 Dengan SPSS Perintah standard yang digunakan sebagai berikut : Analyze -> Regression->Linear-> Variable Tak bebast (pilih Y) -> variable Intak bebast (pilih X1) Keluaran yang terkait menunjukkan hasil sebagai berikut Pembahasan: hasil koefisien yang diperoleh menunjukkan hasil yang hampir sama (pada kolom B) Misalkan data yang akan dianalisa merupakan data saham yang ditunjukkan pada Tabel 3.2. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 115

137 Tahap 1. Data Tabel 3.6 Indeks Harga Saham per Sektor di Bursa Efek Jakarta Pertanian Industri Dasar Aneka Industri Industri Barang Konsumsi Keuangan Pertambangan Properti Perdagangan 2006 Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember Januari Februari Maret April Mei Juni Juli Akhir Periode 116 MULTIVARIAT REGRESI

138 Pertanian Industri Dasar Aneka Industri Industri Barang Konsumsi Keuangan Pertambangan Properti Perdagangan Agustus September Oktober November Akhir Periode Sumber : Bursa Efek Jakarta, tahun Tahap 2. Memulai SPSS17 Untuk memulai SPSS17 maka kita perlu mendefinisikan variabel yang digunakan. Agar lebih mudah penjelasan lebih lanjut maka berikut ini ditampilkan adanya 8 variabel yang didefinisikan. Pada layar seperti Gambar 3.6 kita isikan definisi variabel. Untuk sementara Type, Width dan kolom yang lain akan secara otomatis terisi dan kita tidak perlu menggantikan apapun. Gambar 3.6. Tampilan SPPS17 untuk layar tampilan Variabel View Tahap 3. DataView Sedangkan isi data tiap variabel kita tulis pada pilihan DataView pada pojok kiri bawah. Sehingga diperoleh data yang ditampilkan pada Gambar 3.7 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 117

139 Gambar 3.7. Data Tabel 3.2 yang ditampilkan sebagian Tahap 4. Statistik diskriptif yang dipilih Kita akan melakukan statistik diskriptif (mencari rata-rata, maksimum, minimum, variansi dan sebagainya). Hal ini dilakukan dengan memilih Menu Analyze sebagaimana ditunjukkan pada Gambar Gambar 3.8 Jendela Analyze 118 MULTIVARIAT REGRESI Gambar 3.9. Isi Jendela Analyze

140 Pemilihan menu Descriptives akan diperoleh Options, dimana kita dapat memilih kajian statistik yang dikehendaki dengan ditandai V sebagaimana Gambar 5. Gambar Pilihan kajian statistik untuk variabel Pertanian saja Tahap 5. Keluaran SPSS Lanjutkan dengan memilih Continue dan OK pada jendela Descriptives maka akan diperoleh hasil analisis yang dapat disimpan sekehendak. Sebagian hasil ditunjukkan pada Gambar ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 119

141 Statistics Pertanian N Valid Missing Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Percentiles a a. Multiple modes exist. The smallest value is shown Gambar Hasil keluaran analisis untuk Pertanian 120 MULTIVARIAT REGRESI

142 Pertanian Valid Frequency Percent Valid Percent Cumulative Percent Total Gambar Hasil keluaran analisis untuk Pertanian ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 121

143 Tahap 6. Q-Q plot Sebagaimana biasanyaa, kita perlu menyelidiki normalitas data. Kita dapat memilih menu dengan urutan Analyze Descriptive Statistics Q-Qplot- Pertanian OK. Gambar 3.13 Uji normalitas untuk variabel pertanian dengan Q-Q plot Kita telah membahas bagaimana data berdistribusi normal dengan Q-Q plot. Ada menu P-P plot tetapi pada buku ini tidak dibahas karena jarang digunakan. Untuk selanjutnya kita dapat melakukan regresi. Software yang paling sering digunakan dalam regresi adalah dengan program R yang bebas diunduh dari internet. Pada bagian selanjutnya akan dijelaskan bagaimana menggunakan program R untuk regresi secara bertahap. 3.7 Regresi dengan program R Kita akan bekerja dengan banyak menggunakan data dari luar (hasil survei) sehingga kita perlu bagaimana cara memanggil data. 122 MULTIVARIAT REGRESI

144 Kegiatan 1. Menggambar data yang merupakan 2 macam pasangan data > x <- 1:40 > y <- exp(-x) > > plot(density(x), type = "p") > lines(density(y)) Keluaran ditunjukkan pada Gambar 0. Kegiatan 2. Mengambar 2 gambar yang dinyatakan dalam vektor # Define 2 vectors cars <- c(1, 3, 6, 4, 9) trucks <- c(2, 5, 4, 5, 12) # Graph cars using a y axis that ranges from 0 to 12 plot(cars, type="o", col="blue", ylim=c(0,12)) Kegiatan 3. Melakukan multiple regresi dengan fungsi lm pada R Tahap 1. Studi data File : AALSep1th.txt, Terdiri dari 5 kolom Contoh sebagian data : ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 123

145 Tahap 2. Program R Nama File R : TestR2b.txt Isi : #data dibuat dalam 1 matriks data.txt <-read.table("aalsep1th.txt")[,] d <-data.txt x1 <- d[,1] x2 <- d[,2] x3 <- d[,3] y <- d[,5] vd=data.frame(x1,x2,x3,y=y) plot(vd) jpeg(file = "myplot2.jpg") #untuk dicetak pada directory yang sama plot(vd) dev.off() #Fit full model least suare linear with 3 variabel lm3 <-lm(y ~ x1 + x2 + x3, data = vd) lm3 summary(lm3) p <-3 n <- length(x1) qf(0.95, p, n-p-1) Tahap 3. Copy semua isi file dalam command window R diperoleh keluaran program sbb : Call: lm(formula = y ~ x1 + x2 + x3, data = vd) Residuals: Min 1Q Median 3Q Max Coefficients: 124 MULTIVARIAT REGRESI

146 Estimate Std. Error t value Pr(> t ) (Intercept) x e-05 *** x < 2e-16 *** x *** --Signif. codes: 0 *** ** 0.01 * Residual standard error: on 253 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 253 DF, p-value: < 2.2e-16 > p <-3 > > n <- length(x1) > qf(0.95, p, n-p-1) [1] Gambar yang muncul disimpan dalam nama file myplot2.jpg (lihat perintah program) yang ditunjukkan pada Gambar Gambar 3.14 Hubungan linear volume saham pada AAL Sep Sep terhadap nilai saham pada pembukaan, tinggi dan rendah ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 125

147 Cara analisa program: Uji t pada ketiga variabel sangat signifikan dan p-value tiap variabel dibawah Oleh karena itu ketiga variabel bersifat linear terhadap y sehingga H 0 ( j 0 ) ditolak. Karena R 2 adalah 26,.46% dari variansi y maka model cukup baik untuk digunakan sebagai fitting. Nilai F statistik adalah Sedangkan F3,n p 1,0.95 = Sehingga nilai F statistik lebih besar daripada F3,n p 1,0.95. Oleh karena itu j 0 ditolak Hal ini juga dapat disimpulkan oleh nilai p yang cukup kecil. Kegiatan 4. Menghitung kovariansi matriks dengan MCD Var 1: Nama perusahaan ke-1 yang memuat variabel open, tinggi, low, close dan volume Var 2: Nama perusahaan ke-2 yang memuat variabel open, tinggi, low, close dan volume Studi kasus: Var 1 : AAL Sep 2010-Sep 2011 Var 2 : BBKP Sep 2010 Sep 2011 Tahap 1. Menghitung kovariansi masing-masing dengan MCD (Minimum Covariance distance). File R :TestR4.txt Isi : #memanggil data data1.txt <-read.table("aalsep2010_sep2011.txt")[,] data2.txt <-read.table("bbkpsep2010_sep2011.txt")[,] #library tentang MCD library (robustbase) #menamai tiap data dalam variabel d1 dan d2 d1 <-data1.txt d2 <-data2.txt #menghitung covariance d1dan d2 covd1 <-covmcd(d1) summary(covd1) covd2 <-covmcd(d2) summary(covd2) 126 MULTIVARIAT REGRESI

148 Tahap 2 Keluaran program: Copy program pada command window R maka diperoleh sebagai berikut: Minimum Covariance Determinant (MCD) estimator. Call: covmcd(x = d1) -> Method: Minimum Covariance Determinant Estimator. Log(Det.): Robust Estimate of Location: V V1 V2 V3 V4 V5 V V V V Robust Estimate of Covariance: V1 V2 V V V e e e e e+11 > covd2 <-covmcd(d2) > summary(covd2) Minimum Covariance Determinant (MCD) estimator. Call: covmcd(x = d2) -> Method: Minimum Covariance Determinant Estimator. Log(Det.): Robust Estimate of Location: V1 V2 V3 V4 V Robust Estimate of Covariance: V1 V2 V3 V4 V5 V V V V V e e e e e+11 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 127

149 Gambar Profil data Perusahaan AAL dan BPKP pada 1 Sep Sep 2011 dengan data nilai saham pada saat pembukaan, tinggi, rendah, penutupan dan volume saham tiap waktu Tahap 3. Melakukan regresi terhadap masing-masing volume pada masing-masing perusahaan dengan menganggap bahwa volume sebagai fungsi nilai saham pada pada saat pembukaan, tinggi, rendah, penutupan dan volume saham tiap waktu. Perintah R sbb : (disambungkan pada perintah di Tahap 2,. Nama file : TestR4b.txt Isi terkait sbb : #volume perusahan 1 diregresi #data dibuat dalam 1 matriks x11 <- d1[,1] x21 <- d1[,2] x31 <- d1[,3] y1 <- d1[,5] 128 MULTIVARIAT REGRESI

150 #Fit full model least suare linear with 3 variabel vd1=data.frame(x11,x21,x31,y1=y1) z1 <-lm(y1 ~ x11 + x21 + x31, data = vd1) z1 summary(z1) p <-3 n <- length(x11) qf(0.95, p, n-p-1) #untuk perusahaan kedua#################### x12 <- d2[,1] x22 <- d2[,2] x32 <- d2[,3] y2 <- d2[,5] #Fit full model least suare linear with 3 variabel vd2=data.frame(x12,x22,x32,y2=y2) z2 <-lm(y2 ~ x12 + x22 + x32, data = vd2) z2 summary(z2) p <-3 n <- length(x12) qf(0.95, p, n-p-1) Tahap 4. Mencari interval konfidensi parameter dapat dituliskan dengan melanjutkan pada program Tahap 3. summary(z1) # mendaftar hasil parameter confint(z1, level=0.95) # interval konfidensi untuk parameter z1 Keluaran bagian ini sbb : confint(z1, level=0.95) # confidence intervals for parameters 2.5 % 97.5 % (Intercept) x x x Demikian pula untuk z2 dapat dilakukan secara sama ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 129

151 Kegiatan 5. Menggunakan partial least square (library pls) Nama file R : TestR3b.txt Nama file data :Vol5dT.txt Contoh isi data (hanya diambil sebagian baris) #Vol Vol Vol Vol Vol Total Isi program untuk analisis (dengan data lebih banyak baris) ditunjukkan sbb: library("pls") data.txt <-read.table("vol5dt.txt")[,] #memanggil dalam 1 nama variabel d <- data.txt #menggunakan sebagian v1 <- d[,1] v2 <- d[,2] v3 <- d[,3] v4 <- d[,4] v5 <- d[,5] T <- d[,6] #mengkoleksi data dalam data frame untuk semua var d<-data.frame(v1,v2,v3,v4,v5, y=t) #menggunakan pls, lihat paper pls 130 MULTIVARIAT REGRESI

152 dtes <-d[,1:5] ynew <-plsr(y ~ v1 + v2 + v3 +v4 + v5, data = dtes) ynew summary(ynew) Hasil ditunjukkan pada keluaran berikut : Data: X dimension: Y dimension: Fit method: kernelpls Number of components considered: 5 TRAINING: % variance explained 1 comps 2 comps 3 comps 4 comps 5 comps X y Hasil keluaran perlu dibahas (PR). Kegiatan 6. Kita dapat membandingkan data volume dengan hasil fitting (volume) sebagai fungsi nilai saham pada pembukaan, tinggi dan rendah. Akan tetapi karena berupa object, maka variabel z1 dan z2 tidak dapat dipanggil langsung karena memuat daftar parameter. Kita panggil terlebih dahulu isinya pada command R Yaitu >z1 (ENTER) Keluaran berupa daftar parameter Call: lm(formula = y1 ~ x11 + x21 + x31, data = vd1) Coefficients: (Intercept) x x x >z2 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 131

153 Keluaran berupa daftar parameter sbb Call: lm(formula = y2 ~ x12 + x22 + x32, data = vd2) Coefficients: (Intercept) x x22 x Selanjutnya masing-masing kita kalikan dengan variabel intak bebast yaitu (Pada file LanjutR4b.txt) #harus dijalankan setelah Test4b.txt # angka-angka parameter merupakan hasil regresi yang dicopy >y1new= *x *x *x31 >y2new= *x *x *x32 Selanjutnya data mula-mula untuk volume dari tiap perusahaan adalah berturut-turut y1 dan y2 maka kita dapat menunjukkan dekat tidaknya y1 dengan y1new dengan menggambarkan pasangan (y1,y1new). Demikian pula untuk menunjukkan dekat tidaknya y2 dengan y2new dengan menggambarkan pasangan (y2,y2new). >plot(y1,y1new) >plot(y1,y2new) Jika kita ingin mencetak maka kita dapat menggunakan perintah sebagaimana pada Kegiatan 1 : jpeg(file = "myploty1.jpg") #untuk dicetak pada directory yang sama plot(y1,y1new) dev.off() jpeg(file = "myploty2.jpg") #untuk dicetak pada directory yang sama plot(y1,y2new) dev.off() 132 MULTIVARIAT REGRESI

154 Gambar 3.16 Hubungan nilai volume data (horizontal ) dan yang hasil regresi (vertical dari perusahaan AAL Sep 2010-Sep 2011) Gambar Hubungan nilai volume data (horizontal) dan yang hasil regresi (vertical dari perusahaan BBKP Sep 2010-Sep 2011) Bagaimana menganalisa hasil Gambar 3.16 dan Gambar 3.17?. Seberapa jauh kita dapat mempercayai model yang sudah kita gunakan bahwa volume sebagai fungsi nilai saham pada pembukaan, tinggi dan rendah?. Hal ini sama saja mempertanyaan sifat linear dari y1 dan y1new bahwa diharapkan y1 y1new mendekati 0. Demikian pula diharapkan y2 y2new juga mendekati 0. Kegiatan 7. Membuat ellips Pada teori ktia mengetahui bahwa batas-batas interval konfidensi bivariate dapat dinyatakan dalam bentuk ellips. Untuk itu kita perlu tahu cara membuat ellips. Ingat harus menggunakan library ellips Contoh 3.3 Gunakaan perintah ini. # Plot an ellipse corresponding to a 95% probability region for a # bivariate normal distribution with mean 0, unit variances and # correlation 0.8. plot(ellipse(0.8), type = 'l') ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 133

155 Contoh 3.4. Membuat 6 gambar dalam 1 layar Sumber : # Goal: To make a panel of pictures. par(mfrow=c(3,2)) # 3 rows, 2 columns. # Now the next 6 pictures will be placed on these 6 regions. :-) # Let me take some pains on the 1st plot(density(runif(100)), lwd=2) text(x=0, y=0.2, "100 uniforms") # Showing you how to place text at will abline(h=0, v=0) # All these statements effect the 1st plot. x=seq(0.01,1,0.01) par(col="blue") # default colour to blue. # 2 -plot(x, sin(x), type="l") lines(x, cos(x), type="l", col="red") # 3 -plot(x, exp(x), type="l", col="green") lines(x, log(x), type="l", col="orange") # 4 -plot(x, tan(x), type="l", lwd=3, col="yellow") # 5 -plot(x, exp(-x), lwd=2) lines(x, exp(x), col="green", lwd=3) # 6 -plot(x, sin(x*x), type="l") lines(x, sin(1/x), col="pink") Contoh 3. 5 Menggambar ellips Data yang mempunyai outlier 134 MULTIVARIAT REGRESI

156 Tahap 1. Program R File : \\OLAH2New\TestR5.txt d.txt <-read.table("vol5dt.txt")[,] dd <-d.txt Total <-dd[,6] Vol1 <-dd[,1] Vol2 <-dd[,2] library (robustbase) #DRAW ELLIPS library(ellipse) dd <-dd[,1:5] mcd <- covmcd(dd) # compute mcd in advance ## must be a 2-dimensional data set: take the first two columns : tolellipseplot(dd[,1:2]) Tahap 2. Keluaran program Ingat bahwa untuk menyimpan gambar kita harus menyimpannya terlebih dahulu dengan menambahkan perintah simpan file gambar seperti pada Kegiatan 1-2. Tahap 3. Jika ditambahkan dengan program ## an "impressive" example: telef <-d[,1:2] tolellipseplot(telef, classic=true) Apakah hasil keputusan berubah jika data ditransformasi dengan mengurangkan masing-masing variabel dengan rata-rata masing-masing variabel?. Kegiatan Penelitian 3.1. Data mula-mula adalah pada file vol5dt.txt ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 135

157 Asumsi : Lima variabel volu (V1, V2,V3,V4 dan V5) merupakan variabel bebas untuk variabel total volume (kolom ke-6) dari data. Jadi kita mengolah data ini seperti pada program TestR3.txt. Tahap 1. Isi program sbb : (pada file TestR7.txt) data.txt <-read.table("vol5dt.txt")[,] #memanggil dalam 1 nama variabel d <- data.txt #menggunakan sebagian v1 <- d[,1] v2 <- d[,2] v3 <- d[,3] v4 <- d[,4] v5 <- d[,5] T <- d[,6] #mengkoleksi data dalam data frame untuk semua var d<-data.frame(v1,v2,v3,v4,v5, y=t) dtes <-d[,1:6] ynew <-lm(y ~ v1 + v2 + v3 +v4 + v5, data = dtes) ynew summary(ynew) Tahap 2. Keluaran sbb : Call: lm(formula = y ~ v1 + v2 + v3 + v4 + v5, data = dtes) Residuals: Min 1Q Median 3Q Max e e e e e-07 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e e ** v e e e+15 <2e-16 *** v e e e+14 <2e-16 *** 136 MULTIVARIAT REGRESI

158 v e e e+15 <2e-16 *** v e e e+15 <2e-16 *** v e e e+16 <2e-16 *** --Signif. codes: 0 *** ** 0.01 * Residual standard error: 1.041e-07 on 241 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 1.724e+33 on 5 and 241 DF, p-value: < 2.2e-16 Hasil analisa : kelima variabel signifikan terhadap total volume. Kita akan menyelidiki keputusan ini denganmengubah data dengan mengurangkan meannya (masing-masing variabel). Tahap 3. Kita tambahkan program dibawahnya sbb: %mentrasformasi data -yang dikurangi dengan meannya n=length(d[,1]) x1 <- d[,1]/mean(d[,1]) x2 <- d[,2]/mean(d[,2]) x3 <- d[,3]/mean(d[,3]) x4 <- d[,4]/mean(d[,4]) x5 <- d[,5]/mean(d[,5]) T <- d[,6]/mean(d[,6]) #mengkoleksi data dalam data frame untuk semua var d<-data.frame(x1,x2,x3,x4x5, y=t) dtes <-d[,1:6] ynew2 <-lm(y ~ x1 + x2 + x3 +x4 +x5, data = dtes) ynew2 summary(ynew2) Tahap 4. Keluaran bagian tersebut ditunjukkan sbb. > summary(ynew2) Call: lm(formula = y ~ x1 + x2 + x3 + x4 + x5, data = dtes) ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 137

159 Residuals: Min 1Q Median 3Q Max e e e e e-06 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e e e-06 *** x e e e+15 < 2e-16 *** x e e e+14 < 2e-16 *** x e e e+15 < 2e-16 *** x e e e+15 < 2e-16 *** x e e e+16 < 2e-16 *** --Signif. codes: 0 *** ** 0.01 * Residual standard error: 1.126e-07 on 241 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 1.475e+33 on 5 and 241 DF, p-value: < 2.2e-16 Hasil komputasi menunjukkan bahwa kelima variabel signifikan sebagaimana untuk data mula-mula. Jadi sejauh ini perubahan nilai data tidak merubah makna. Kegiatan Penelitian 3.2. Berikut Tabel Indeks LQ45 beserta nilai saham pada saat penutupan dari 5 perusahaan pada kolom 4- kolom ke-9. Masalah: Diasumsikan perusahaan AALI, ADRO, ANTM, ASII, dan BBCA mempunyai hubungan linear terhadap indeks LQ45. Dari ke-5 perusahaan akan ditentukan perusahaan yang dianggap signifikan secara statistik pada LQ MULTIVARIAT REGRESI

160 Tabel 3.7 IndeksLQ45(kolom ke-3) dengan nilai saham pada saat penutupan (kolom ke-4 hingga 8) TGL JKSLQ45 AALI ADRO ANTM ASII BBCA 1 01-Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Agust Sep Sep Sep Sep Sep ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 139

161 Tahap 1. Program untuk mencari beta : Nama program UjiIndex.m load 'Cekindex.dat' M=Cekindex; [m,n]=size(m); %Regresi klasik Y=M(:,1); X=M(:,2:n); Z=[ones(m,1) X]; BETA=inv(Z'*Z)*Z'*Y; Yestimate=Z*BETA; figure subplot(2,2,1) plot(x(:,1),y,'*') subplot(2,2,2) plot(x(:,2),y,'o') subplot(2,2,3) plot(x(:,3),y,'o') subplot(2,2,4) plot(x(:,4),y,'o') figure plot(1:m,y,'*',1:m,yestimate,'o') DAFTAR_BETA=BETA Keluaran program ditunjukkan sbb : >> Ujiindex DAFTAR_BETA = MULTIVARIAT REGRESI

162 Sedangkan plot untuk masing-masing variabel ditunjukkan pada Gambar 3.19 Gambar 3.18 Ilustrasi setiap variabel X (perusahaan ) terhadap nilai indeks LQ45 Gambar Perbandingan data dan hasil estimasi regresi multivariate; data disimbolkan (*) dan pendekatan disimbolkan o ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 141

163 Kita akan menelusuri hasil ini sesuai dengan teori yang diberikan. 1 Misalkan bagaimana menyelidiki matriks Z T Z dalam Z T Z Z T y. Apakah punya invers atau positive definite?. Hal ini ditunjukkan dengan perintah pada MATLAB : lamda=eig(z'*z) sehingga untuk bagian ini diberikan keluaran lamda = 1.0e+011 * Awas, perhatikan bahwa keluaran tersebut tidak Nampak secara jelas bilangannya. Jika dalam formatlong maka data ditunjukkan bahwa bilangan yang dihasilkan tidak 0. Yaitu >> lamda=eig(z'*z) lamda = 1.0e+011 * Jelas nilai eigen positif sehingga matriks Z T Z positive definite. Dengan inferensi maximum likelihood estimator (MLE), (John and Wichern, 2007) dapat ditunjukkan bahwa parameter estimasi ˆ berdistribusi 142 MULTIVARIAT REGRESI

164 N p 1, 2 Z T Z 1 dengan residu ˆ Y Z ˆ. Selain itu n ˆ 2 ˆ T ˆ berdistribusi n ( p 1) 2 2 dengan ˆ 2 adalah MLE dari 2. Dengan MATLAB kita dapat menelusuri bagaimanakah koefisien regresi dapat diperoleh. Akan tetapi hasil analisis statistic tidak dapat dilakukan secara otomatis sebagaimana diberikan oleh R. Oleh karena itu kita mengerjakan analisa secara statistik dengan menggunakan R. Kegiatan Penelitian 3.3: Program R untuk menyelesaikan masalah pada Kegiatan 3.1 Program ditulis dalam IndekR.txt data1.txt <-read.table("index5.txt")[,] #library (robustbase) d1 <-data1.txt #data dibuat dalam 1 matriks x1 <- d1[,2] x2 <- d1[,3] x3 <- d1[,4] x4 <- d1[,5] x5 <- d1[,6] y <- d1[,1] #Fit full model least suare linear with 5 variabel vd1=data.frame(x1,x2,x3,x4,x5,y=y) z1 <-lm(y ~ x1 + x2+ x3 + x4 +x5, data = vd1) z1 summary(z1) p <-5 n <- length(x1) qf(0.95, p, n-p-1) Hasil keluaran R ditunjukkan berikut ini Call: lm(formula = y ~ x1 + x2 + x3 + x4 + x5, data = vd1) Coefficients: (Intercept) x1 x2 x3 x4 x > ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 143

165 > summary(z1) Call: lm(formula = y ~ x1 + x2 + x3 + x4 + x5, data = vd1) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e x e e * x e e *** x e e x e e e-05 *** x e e e-05 *** --Signif. codes: 0 *** ** 0.01 * Residual standard error: on 18 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 5 and 18 DF, p-value: 1.01e-15 > p <-5 > > n <- length(x1) > qf(0.95, p, n-p-1) [1] Kita juga dapat menggambar dengan menambahkan perintah menggambar. Diperoleh hasil Gambar Analisa Program: Uji t pada kelima variabel signifikan untuk variabel X 2, X 4, X 5 selanjutnya variabel X 1 (paling akhir signifikan) sedangkan variabel X 3 dianggap tidak signifikan. Untuk p-value tiap variabel di bawah 0.05 kecuali intercept. Oleh karena itu ketiga variabel X 2, X 4, X 5 bersifat linear terhadap y sehingga H 0 ( j 0 ) ditolak. Karena R 2 adalah 98,49% dari variansi y maka model cukup baik untuk digunakan sebagai fitting. Nilai F statistik 144 MULTIVARIAT REGRESI

166 adalah Sedangkan F5,n p 1,0.95 = Sehingga nilai F statistik lebih besar daripada F5,n p 1,0.95. Oleh karena itu j 0 ditolak Hal ini juga dapat disimpulkan oleh nilai p yang cukup kecil. Jadi kita dapat menyimpulkan bahwa model linear yang kita peroleh adalah Y 2 X 2 4 X 4 5 X 5 dengan , , Nilai 0 tidak masuk dalam model karena berdasarkan value tidak signifikan. Gambar Ilustrasi hubungan linear antar variabel tak bebas dan tak bebas untuk tiap variabel untuk data Tabel 3.4. Dari hasil analisa ini maka masalah hubungan linear saham dari perusahaan AALI, ADRO, ANTM, ASII, dan BBCA terhadap Indeks ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 145

167 LQ45 ditunjukkan secara signifikan oleh ADRO, ASII, dan BBCA sehingga AALI, dan ANTM yang keluar dari LQ45. Apakah hal ini benar secara realistis?. Hal itu menjadi kajian lebih lanjut pada penelitian. Kemungkinan hasil ini dapat diselidiki dengan korelasinya juga. 3.8 Linear regresi dengan variabel prediktor banyak Jika variabel prediktor banyak, maka akan sangat tidak efisien kalau kita harus mendaftar tiap variabel terlebih dahulu sebagaimana pada kegiatan 6b pada bagian : #data dibuat dalam 1 matriks x1 <- d1[,2] x2 <- d1[,3] x3 <- d1[,4] x4 <- d1[,5] x5 <- d1[,6] y <- d1[,1] #Fit full model least suare linear with 5 variabel vd1=data.frame(x1,x2,x3,x4,x5,y=y) z1 <-lm(y ~ x1 + x2+ x3 + x4 +x5, data = vd1) Perhatikan perintah mendaftar hingga ketika kita melakukan regresi. Bagaimana jika kita mempunyai 45 variabel untuk tugas yang sama?. Kita akan merubah tata tulis program tersebut sehingga dapat digunakan untuk variabel yang banyak sebagai berikut. Kegiatan Penelitian 3.4. Program berikut disimpan dalam file IndekU3.txt data1.txt <-read.table("datasemua.txt")[,] d1 <-data1.txt #exclude observaltion that are not used for the analysis X <- d1[,-cbind(1)] #dikurangi kolom 1 #selected data var predictors to be analyzed X1 <- X[,1:5] y <- d1[,1] #Fit full model least suare linear with 5 variabel d=data.frame(x1,y=y) 146 MULTIVARIAT REGRESI

168 hasil<-lm(y~.,data=d) summary(hasil) p <-5 n <- length(x) qf(0.95, p, n-p-1) Keterangan program Perhatikan bahwa Datasemua.txt berisi: kolom 1 variabel respon sedangkan kolom 2 hingga akhir berisi variabel predictor. Untuk itu digunakan perintah menyusun data yang mengurangkan kolom pertama yaitu X <- d1[,-cbind(1)] #dikurangi kolom 1 Jika tidak semua variabel (kolom) dalam data X yang digunakan maka kita menyusun variabel baru yang hanya memuat kolom-kolom yang diperlukan. Misalkan hanya kolom 1 hingga kolom 5. Ingat bahwa kolom 1 dari X adalah kolom 2 dari data mula-mula. Perintah itu dinyatakan dalam X1 <- X[,1:5] Selanjutnya kita dapat melakukan fitting /regresi sebagai berikut d=data.frame(x1,y=y) hasil<-lm(y~.,data=d) Keluaran ditunjukkan pada daftar berikut Call: lm(formula = y ~., data = d) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e V e e * V e e *** ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 147

169 V e e V e e e-05 *** V e e e-05 *** --Signif. codes: 0 *** ** 0.01 * Residual standard error: on 18 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 5 and 18 DF, p-value: 1.01e-15 > > p <-5 > n <- length(x) > qf(0.95, p, n-p-1) [1] Perhatikan bahwa hasil ini memberikan keputusan yang sama seperti pada program IndekR. Tugas Penelitian A Tugas 1. Kerjakan untuk Kegiatan Penelitian 3.3 untuk 10 perusahaan pertama Tugas 2. Kerjakan untuk 20 perusahaan. Tulislah hasil analisa anda Banyak data < banyak variabel Seringkali terjadi bahwa kita hanya mempunyai banyaknya data (n) lebih kecil dari banyaknya variabel (p). Hal ini jelas tidak bisa dianalisa karena melanggar adanya derajat kebebasan. Jikalau hal ini tetap dilakukan maka program untuk akan menunjukkan hasil yang tidak bermakna. Untuk itulah kita perlu menseleksi variabel mana yang dianggap baik dalam analisis yang kemudian dinyatakan dalam regresi. Cara yang paling biasa digunakan adalah dengan memperhatikan korelasi antar 148 MULTIVARIAT REGRESI

170 variabel. Oleh karena itu kita perlu menyusun dan menganalisa korelasi antar variabel. Akan tetapi setelah diolah, bagaimana melanjutkan keputusan ya?. Kegiatan Penelitian 3.5 Korelasi antar variabel Program :IndekU4 berisi sebagai berikut data1.txt <-read.table("datasemua.txt")[,] d1 <-data1.txt #exclude observaltion that are not used for the analysis X <- d1[,-cbind(1)] #dikurangi kolom 1 #misalkan diambil hanya 5 variabel pertama X1 <-X[,1:5] round(cor(x1),3) Keluaran sebagai berikut V2 V3 V4 V5 V6 V2 V3 V4 V5 V Dari hasil ini kita melihat bahwa variabel V3 dan V2 beserta V3, V6 tidak berkorelasi secara signifikan. Demikian pula antara V4 dan V6. Manakah yang kita pertimbangkan dalam regresi?. Nampaknya dari hasil ini tidak banyak membantu dalam memilih. Jika dilakukan principal komponen analisis hal ini juga memberikan masalah yang sama bahwa kita harus menyusun matriks kovariansi. Matriks kovariansi tidak dapat disusun untuk banyak sampel lebih kecil dari banyaknya variabel. Bagaimana kita mengatasi hal ini?. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 149

171 Pemilihan Variabel dalam Model Ternyata pemilihan variabel yang dapat dilibatkan dalam model menjadi diskusi berbagai peneliti. Salah satunya pada literatur (Kutner, dkk ) Jika ada 4 variabel prediktor maka model regresi yang mungkin adalah model tanpa variabel, model dengan 1 variabel (ada 4 model), model dengan 2 variabel sebanyak 6 yaitu X 1 dan X 2, X 1 dan X 3, X 1 dan X 4, X 2 dan X 3, X 2 dan X 4, X 3 dan X 4, juga model dengan 3 variabel dan model dengan 4 variabel. Model mana yang dipilih?. Jika ada 10 variabel maka model regresi yang mungkin adalah sebanyak 210. Ada berbagai metode yang digunakan dalam literatur tersebut tetapi tetap mensyaratkan n > p. Kegiatan Penelitian 3.6 Data rata-rata temperatur, kelembaban udara, dan curah hujan yang diperoleh dari data iklim oleh Komando Pendidikan TNI Angkatan Udara Pangkalan TNI AU Adi Soemarmo tahun berturut-turut ditunjukkan pada Tabel 3.8-Tabel Tabel 3.8 Rata-rata Suhu Udara tahun BULAN JANUARI FEBRUARI MARET APRIL MEI JUNI JULI AGUSTUS SEPTEMBER OKTOBER NOVEMBER DESEMBER MULTIVARIAT REGRESI

172 Tabel 3.9. Rata-rata Kelembaban Udara tahun Bulan Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember Tabel 3.10 Rata-rata Curah hujan tahun Bulan Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember Kasus 1 : Regresi Klasik Diasumsikan bahwa model regresi linier dari data dengan curah hujan sebagai variabel tak bebas adalah = (i) ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 151

173 Dalam notasi matriks -vektor, persamaan (i) menjadi [ ]=[ ditulis ][ ]+[ ] Ynx1 Z ( n x ( 2 1)) (( 2 1) x1) nx1 (ii) Matriks Z ( n x ( 2 1)) pada kolom pertama adalah 1 dan kolom ke-2 dan ke-3, adalah vektor-vektor. Parameter regresi yaitu vector (( 2 1) x1) ] diperoleh dengan least square yaitu meminimumkan =[ 2 2 R yi 0 j xij. i 1 j 1 n Dengan mengikuti prosedur pada persamaan (3.9)-(3.18) dapat diperoleh A 1 Z T y ; A (Z T Z ) (iii) dan =[ ] Kita dapat menggembangkan ide regresi dengan melakukan autoregresi (regresi terhadap dirinya sendiri dimana data merupakan data yang tergantung waktu). Ide ini diperkenalkan agar pembaca dapat memahami ide GSTAR (Generalized Spasial Time Autoregressive Regression: regresi yang datanya tergantung pada waktu dan lokasi) yang akan dibicarakan lebih lanjut pada Bab yang lain. 152 MULTIVARIAT REGRESI

174 Kasus 2 : Autoregresi Diasumsikan model autoregresi dari data curah hujan sebagai variabel tak bebas pada saat t Dapat ditulis = Y( n 1) x1 W(( n 1) x (3 1)) (( 3 1) x1) ( n 1) x1 (v) Untuk mencari estimasi parameter adalah ruas kiri dan ruas kanan dengan = maka diperoleh = dengan mengalikan Sehingga dapat diperoleh parameter yaitu ] =[ dengan = [] =[ (iv) (vi) (vii) = ] Akan dibuktikan bahwa pada persamaan (vii) dan pada persamaan (vii) ada dan terbaik yaitu dengan: 1. Matriks A pada kedua persamaan dikatakan invertible jika determinan dari matriks A tersebut 0. A invertibel artinya penyelesaian dari matriks A tunggal (Peressini, dkk 1998). 2. Error/residu merupakan jarak/beda antara data aktual dengan data pendekatan (dari model hasil fungsi tujuan) yaitu E=. 100% ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 153

175 3. Jika + adalah invers A yang eksak maka secara komputasi ditulis, dimana E matriks error komponen-komponennya merupakan bilangan yang cukup kecil sehingga A+E invertible. Kemudian errornya adalah (Horn dan Johnson,1985) + Akan dicari bentuk + Analog dengan deret + = + + maka perlu menyatakan dalam bentuk lain. + akan diperoleh = = = = + +,, jika < Dengan adalah spektral radius (nilai eigen) dari matriks. Terdapat banyak definisi. dalam matriks, diantaranya yaitu norm Euclid, norm maksimum, dan norm Frobenius. Dalam kasus ini yang digunakan dalam perhitungan adalah norm euclid. Contoh menghitung norm Euclid: Misalkan dipunyai matriks = [ yaitu = [ ], perlu disusun matriks ] untuk mencari norm euclid = max dengan adalah nilai eigen. Nilai eigen dari adalah 0.1 dan Jadi norm euclid dari A adalah. =. (web 3). Diasumsikan <1, batas atas kesalahan relatif dengan menghitung invers adalah jika <. 1 Ruas kanan dikalikan sehingga 154 MULTIVARIAT REGRESI (*)

176 1 1 Didefinisikan = κ { 1 1 = 1 1 jika nonsinguler jika singuler (**) (viii) Persamaan (xiv) disebut conditional number dari invers matriks dengan melihat norm matriks.. Persamaan (*) dengan (**) menjadi 1 1 = 1 1 κ = κ. Jadi error relatif untuk invers matriks terbatas tergantung dari nilai κ sehingga κ tidak boleh terlalu besar. Conditional number matriks pada MATLAB juga menggunakan persamaan (xiv). Menurut Anderson, dkk (1999) jika conditional number di bawah maka nilai i dinyatakan terbaik karena error invers terbatas ke atas. Untuk menghitung conditional number digunakan perintah cond() pada MATLAB. 4. Sifat titik kritis (minimum) ditunjukkan dengan tipe matriks Hessian (matriks yang disusun turunan kedua dari fungsi terhadap masing-masing variabel bebas). = = + = (ix) Menurut Peressini dkk (1998) titik kritis v a sebagai peminimum lokal jika nilai eigen dari mariks Hessiannya bersifat positive semi definite yang artinya nilai eigen 0. Kita akan membahas Kegiatan penelitian yang berkaitan dengan metode tersebut. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 155

177 Kasus 1. Variabel yang digunakan Y : Rata-rata curah hujan tahun : Rata-rata suhu udara tahun : Rata-rata kelembaban udara tahun Pada kasus ini akan dibahas hubungan linier antara suhu dan kelembaban udara terhadap curah hujan sebagai variable tak bebas. Dari data yang diperoleh oleh Komando Pendidikan TNI Angkatan Udara Pangkalan TNI AU Adi Soemarmo yaitu data iklim daerah Surakarta-Boyolali tahun , diolah kembali dengan merata-rata sehingga diperoleh data pada Tabel Tabel.3.11 Rata-rata suhu udara, curah hujan, dan kelembaban udara tiap bulan ditahun No Bulan Curah hujan Suhu udara Kelembaban udara 1 Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember MULTIVARIAT REGRESI

178 Kasus.2 Variabel yang digunakan : Rata-rata curah hujan tahun pada saat t : Rata-rata kelembaban udara tahun pada saat t dengan t = 2,3,4 12 Pada kasus ini akan dibahas apakah ada hubungan linier variabel (curah hujan pada saat t-1), t-1) terhadap variable dan (kelembaban udara pada saat t dan (curah hujan pada saat t) Tabel.3.12 Rata-rata curah hujan dan kelembaban udara t Bulan Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember Tabel.3.13 Data curah hujan dan kelembaban udara ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 157

179 Menguji Normalitas data Data yang ada diuji normalitasnya dengan teknik chi-kuadrat. Pengujian normalitas data dilakukan dengan menggunakan alat bantu MATLAB. Dengan menerapkan persamaan (22) untuk data yang akan dianalisa diperoleh bahwa perhitungan uji normal data mempunyai persentase normal pada kasus 1 adalah % dan pada kasus 2 adalah % sebagaimana ditunjukkan pada Gambar Dapat disimpulkan kedua data sudah cukup normal untuk dapat dianalisis lebih lanjut. Gambar.3.21 Uji normalitas data Gambar 3.12 adalah hasil Uji Normalitas data rata-rata pada Tabel 3.10 dan gambar 3.13 adalah hasil uji normalitas dari Tabel Dari kedua gambar diketahui masing-masing sebanyak 2 data yang berada di atas garis normal. Diperoleh perhitungan uji normal data mempunyai presentase normal pada kasus 1 adalah % dan pada kasus 2 adalah %. Dapat disimpulkan kedua data sudah cukup normal untuk dapat dianalisis lebih lanjut. Melakukan Analisis Regresi Multivariat dan Autoregresi Mencari model regresi linier serta mencari hubungan atau pengaruh variabel tak bebas (curah hujan) dengan masing-masing variabel intak bebasnya yaitu kelembaban serta suhu udara. 158 MULTIVARIAT REGRESI

180 Kasus 1. Dengan menggunakan = maka dilakukan perhitungan untuk memperoleh parameter. Dengan bantuan program R maka didapatlah model regresi pengaruh kelembaban dan suhu terhadap curah hujan adalah sebagai berikut: =.. dengan Y : rata-rata curah hujan; +. : rata-rata suhu udara; :rata-rata kelembaban udara. Hasil yang diperoleh dengan program R didapat bahwa p-value untuk variable dan dibawah 0.05 sehingga dapat dikatakan signifikan.namun tidak pada variable dengan nilai p-value adalah dan lebih besar dari 0.05.Artinya kontribusi terhadap persamaan = + + tidak signifikan +. Nilai F statistik adalah 22.68, sedangkan F3,n p 1,0.95 = Sehingga nilai F statistik lebih besar daripada F3,n p 1,0.95.Oleh karena itu j 0 ditolak. Sehingga persamaan model regresi liniernya menjadi = x x2 y Gambar Gambar Hasil analisis regresi dari Tabel 3.10 dengan program R ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 159

181 Tabel.3.14 Hasil keluaran regresi program R (Intercept) - Estimate Std. Error t value Pr(> ) *** e-05 *** Signif.codes: ***. **. *. 5.. Dengan menggunakan program SPSS juga didapati hasil yang sama sebagaimana ditunjukkan pada Tabel 3.15 Tabel Hasil keluaran dengan program SPSS Coefficients a Unstandardized Coefficients Standardized Coefficients Model T Std. Error B 1 (Constant) 95% Confidence Interval for B Sig. Lower Bound Beta Temperature (Celcius) Kelembaban Nisbi Upper Bound a. Tak bebast Variabel: Curah Hujan Hasil keluaran di atas sama dengan hasil yang diperoleh dengan program R yang sebelumnya telah dijalankan. Yaitu nilai parameter pada kolom B yang menunjukkan nilai 0, 1, 2 serta nilai Sig. adalah nilai pvalue. Hubungan tiap variabel Dari hasil Gambar 3.14 oleh program R kita juga dapat melihat hubungan variabel tak bebas 160 MULTIVARIAT REGRESI (curah hujan) dengan masing-masing

182 variabel intak bebas dan (suhu dan kelembaban udara). Dari gambar tersebut dapat disimpulkan ada hubungan linier variabel,namun tidak pada varibel dan dengan. Demikian pula hubungan antar variable dapat dilihat dari korelasi antar 2 variabel yang berbeda. Hasil uji korelasi menunjukkan bahwa berkorelasi dengan dan sedangkan tidak berkorelasi dengan. Variabel juga tidak berkorelasi. Perlu ditunjukkan dengan yang diperoleh adalah yang terbaik yang artinya meminimumkan R. Hal ini dilakukan dengan menghitung determinan A, error fungsi, menghitung Conditional Number A yang dapat dilihat pada Tabel 3.16 Tabel Sifat dari yang diperoleh Kondisi yang diamati Determinan Matriks A (Z T Z ) Hasil x Error 7.69 Conditional number x Sifat Hf positive semi definite Diperoleh determinan matriks A 0, sehingga sistem persamaan liniernya mempunyai penyelesaian tunggal. Error masih cukup besar yaitu 7.69% Dari conditional number yang diperoleh masih lebih kecil dari batas maksimumnya atau Conditional number < Kemudian diperoleh juga nilai eigen =[0 ; 533 ; 77634] yang artinya sifat adalah positive semi definite sehingga parameter yang diperoleh dinyatakan sebagai yang terbaik karena meminimumkan R. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 161

183 Kasus 2. Dengan menggunakan persamaan (11) yaitu = maka dilakukan perhitungan untuk memperoleh parameter. Dengan bantuan program R maka didapatlah model sebagai berikut: = Gambar Gambar hasil analisis regresi pada tabel 3 dengan program R Hasil yang diperoleh dengan program R didapat bahwa p-value untuk semua variable lebih besar dari 0.05 sehingga dapat dikatakan tidak signifikan. Nilai F statistik adalah 15.46, sedangkan F3,n p 1,0.95 = Sehingga nilai F statistik lebih besar daripada F3,n p 1,0.95.Oleh karena itu j 0 ditolak. 162 MULTIVARIAT REGRESI

184 Tabel Sifat sifat dari Kondisi yang diamati Determinan Matriks T A (W W ) Error Hasil x Conditional number Sifat Hf positive definite Dari hasil yang diperoleh determinan matrik A 0, kemudian Conditional number yang masih lebih kecil dari batas maksimumnya. Conditional number< , serta sifat Hf positive definite dapat dikatakan bahwa parameter yang diperoleh ada hanya saja belum yang terbaik dilihat dari error yang masih cukup besar yaitu %. Berdasarkan uraian pembahasan di atas dapat disimpulkan Data yang diolah yaitu rata-rata curah hujan, suhu serta kelembaban udara di daerah Boyolali tahun berdistribusi normal. Terdapat hubungan linier yang signifikan antara variabel tak bebas (curah hujan) dengan variabel intak bebas namun tidak dengan variabel (kelembaban udara), (suhu udara). Model regresi linier yang diperoleh adalah = = Hasil analisis autoregresi yang memperlihatkan curah hujan pada saat t (dimulai bulan ke-2 yaitu Februari) dipengaruhi tidaknya oleh curah hujan pada saat t-1, kelembaban udara pada saat t dan t-1 mendapatkan model adalah =. = ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 163

185 Hanya saja model yang didapat itu tidak menjadi model yang terbaik dilihat dari hasil setiap variabel yang tidak signifikan dan juga error yang masih terlalu besar pada sifat. Tabel Rata-rata Suhu Udara tahun Bulan Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember Tabel Rata-rata Kelembaban Udara tahun Bulan Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember MULTIVARIAT REGRESI

186 Tabel 3.20 Rata-rata Curah hujan tahun Bulan Januari Februari Maret April 5.05 Mei Juni Juli Agustus September Oktober November Desember Regresi GSTAR (Generalized Space Time Auto Regressive) Model Generalized Space Time Auto Regressive (GSTAR) pertama kali diperkenalkan oleh Borovkova, Lopuhaa, dan Ruchjana (2002) sebagai generalisasi dari model Space Time Autoregressive (STAR). Perbedaan yang cukup mendasar antara GSTAR dan STAR terletak pada asumsi karakteristik lokasi. Pada model STAR penyusunan model terbatas pada variabel dengan karakteristik lokasi yang seragam (homogen), sedangkan model GSTAR penyusunan model dapat dilakukan apabila memiliki karakteristik lokasi yang beranekaragam (heterogen). Mengingat bahwa model ini masih baru dalam dunia statistika maka dalam makalah ini akan ditunjukkan mengenai simulasi penyusunan model GSTAR untuk memperoleh model yang tepat dan apabila model tidak tepat akan ditunjukkan mengapa model tersebut dikatakan tidak tepat. Makalah ini hanya dibatasi pada model GSTAR tiga lokasi dengan bobot lokasi seragam. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 165

187 Data yang digunakan pada bagian ini merupakan data berdistribusi normal mutivariat. Data tersebut dibangkitkan dengan bantuan software matematika dengan harapan memiliki nilai korelasi yang tinggi antar variabelnya. (a) Uji Stasioneritas Dalam analisa data time series diperlukan asumsi stasioneritas dalam variansi dan dalam rata-rata. Artinya nilai variansi dan rata-rata tidak berubah (konstan) untuk semua waktu. Secara matematis dituliskan sebagai berikut: E( X t ) ; E( X t2 ) 2 Selanjutnya penjelasan stasioneritas (Wei, 2006:80) adalah sebagai berikut 1. Stasioneritas dalam variansi Suatu data time series dikatakan stasioner dalam variansi apabila struktur data dari waktu ke waktu mempunyai fluktuasi data yang tetap atau konstan dan tidak berubah-ubah. Stasioneritas dalam variansi dapat dilihat dari lambda estimate yang dihasilkan oleh grafik transformasi Box Cox. Jika nilai lambda estimate mendekati 1 maka data bisa dikatakan stasioner dalam variansi. 2. Stasioneritas dalam rata-rata Stasioneritas dalam rata-rata adalah fluktuasi data berada di sekitar suatu nilai rata-rata yang konstan, tidak tergantung pada waktu dan variansi dari fluktuasi tersebut. Dari bentuk plot data seringkali dapat diketahui bahwa data tersebut stasioner atau tidak stasioner. Dilihat dari hasil trend analysis, data dikatakan stasioner jika trend linear mendekati sejajar dengan sumbu horizontal, namun jika tidak sejajar dengan sumbu horizontal maka perlu dilakukan diffrensiasi pada data. 166 MULTIVARIAT REGRESI

188 (b) Proses White Noise Proses white noise dapat dideteksi menggunakan uji autokorelasi residual pada analisis error-nya. Uji korelasi residual digunakan untuk mendeteksi ada tidaknya korelasi residual antar lag. Langkah-langkah pengujian korelasi residual, yaitu: Ho : K 0 Hi : k 0, k 1,2,..., K dengan k bernilai 1 jika k = 0 dan bernilai 0 untuk k 0. Statistik uji yaitu Ljung Box Pierce dengan taraf signifikansi sebesar 5%. Rumus uji Ljung Box-Pierce (Wei,2006:153) didefinisikan sebagai berikut K QK T (T 2) k 1 ˆ k2 T k dengan, T : banyaknya data K : banyaknya lag yang diuji ˆ k2 : dugaan autokorelasi residual periode k 2 Kriteria keputusan yaitu tolak Ho jika Q-hitung > ( a, d, f ) tabel, dengan derajat kebebasan K dikurangi banyaknya parameter pada model atau pvalue < α, artinya t adalah barisan yang tidak memiliki korelasi Model GSTAR Secara matematis, notasi dari model GSTAR(p1) sama dengan notasi model STAR(p1). Perbedaan utamanya terletak pada nilai-nilai parameter pada lag spasial yang sama diperbolehkan tidak sama (Suhartono, Subanar, 2006). Model GSTAR dapat dituliskan sebagai berikut (Borovkova, Lopuhaa, Ruchjana, 2002) : ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 167

189 p Z (t ) ( k 0 k1w ) Z (t k ) e(t ) (15) k 1 dimana k 0 = diag ( k10,..., kn0 ) dan k1 = diag ( k11,..., kn1 ) W = bobot (weigth) yang dipilih untuk memenuhi wii 0 dan 1 j wij 1 Persamaan model GSTAR untuk orde waktu dan orde spasial 1 dengan menggunakan 3 lokasi yang berbeda adalah sebagai berikut (Faizah & Setiawan, 2013) Z (t ) 10 Z (t 1) 11W (1) Z (t 1) e(t ) (3.28) Dalam bentuk matriks, persamaan (3.28) dapat ditulis sebagai berikut, 0 Z1 (t 1) w12 Z1 (t ) 10 0 Z (t 1) 0 Z (t ) w Z3 (t ) Z3 (t 1) w31 w32 w13 Z1 (t 1) e1 (t ) w23 Z 2 (t 1) e2 (t ) 0 Z3 (t 1) e3 (t ) (3.29) Ada berbagai macam metode penentuan bobot lokasi pada model GSTAR tetapi metode yang paling umum digunakan adalah bobot lokasi seragam karena bersifat sederhana dan mudah untuk ditentukan (Ruchjana, 2002). Penentuan nilai bobot seragam adalah sebagai berikut : wij 1 ni (3.30) dengan ni merupakan banyaknya lokasi yang berdekatan dengan lokasi ke-i. Penaksiran Parameter pada Model GSTAR Estimasi parameter model GSTAR yaitu ( )' dapat diselesaikan dengan menggunakan metode kuadrat terkecil yang diformulasikan sebagai berikut, X ' X 1 X ' Y 168 MULTIVARIAT REGRESI (3.31)

190 dengan struktur data untuk estimasi parameter model GSTAR(11) di 3 lokasi dijabarkan sebagai berikut (Faizah & Setiawan,2013), F1 (t 1) Z 1 (t ) Z 1 (t 1) e1t 30 Z (t ) Z 2 (t 1) F2 (t 1) 2 e 2 t Z 3 (t ) Z 3 (t 1) F 3(t 1) 11 e3 t (3.32) Data Data yang digunakan dalam makalah ini adalah data berdistribusi normal multivariat yang dibangkitkan dengan bantuan software statistika. Variabel Terdapat tiga variabel yang digunakan dalam makalah ini, yaitu: C1 = Variabel pertama diasumsikan sebagai lokasi pertama C2 = Variabel kedua diasumsikan sebagai lokasi kedua C3 = Variabel ketiga diasumsikan sebagai lokasi ketiga Ketiga variabel ini diasumsikan memiliki jarak yang berdekatan sehingga dapat digunakan dalam penyusunan model GSTAR. Langkah-langkah yang dilakukan dalam makalah ini adalah : 1. Membangkitkan data berdistribusi normal multivariat dengan bantuan software statistika 2. Menguji korelasi antar variabel dengan uji korelasi Pearson 3. Mengidentifikasi data awal menggunakan plot time series 4. Menguji stasioneritas data dalam variansi dan rata-rata serta menguji residual white noise 5. Menentukan parameter dengan metode kuadrat terkecil untuk bobot lokasi seragam 6. Memperoleh model GSTAR. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 169

191 Kegiatan Penelitian 3.7 Diberikan data Curah hujan di Kecamatan Selo, Ampel, Cepogo Kabupaten Boyolali th yang sebagian dibangkitkan dengan simulasi untuk memenuhi banyaknya sampel >> dari banyaknya lokasi. Jadi diasumsikan bahwa banyaknya sampel menunjukkan waktu. Tabel 3.1 Data curah hujan yang dibangkitkan secara random berdasarkan rata-rata dari data sesungguhnya (disimpan pada file curahhujan.dat) Selo Ampel Cepogo MULTIVARIAT REGRESI

192 Selo Ampel Cepogo Selo Ampel Cepogo ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 171

193 MULTIVARIAT REGRESI

194 Kegiatan 1. Membangkitkan Data Normal Multivariat Langkah-langkah yang digunakan untuk membangkitkan data normal multivariat dari data asli yaitu lahan kritis di Boyolali pada tahun 2008 s.d 2010 dengan menggunakan Minitab 17 diringkas sebagai berikut: 1. Lakukan entry data ke dalam Minitab 17 pada kolom C1, C2 dan C3 2. Tampilkan analisis statistika deskriptif untuk mendapat rata-rata per kolom kemudian simpan pada kolom C4. Gambar Jendela Minitab untuk memulai analisa diskriptif 3. Simpan matriks kovariansi ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 173

195 Gambar Jendela Minitab untuk menyimpan matriks kovariansi 4. Bangkitkan data normal multivariat, simpan dalam kolom C6, C7, dan C8 Gambar Jendela Minitab untuk membangkitkan data normal 174 multivariate Setelah dilakukan langkah-langkah diatas maka tampilan akhir pada Minitab seperti berikut 174 MULTIVARIAT REGRESI

196 Gambar 3.27 Jendela minitab tampilan akhir Kegiatan 2. Menampilkan Grafik Transformasi Box-Cox Untuk mengetahui apakah data sudah stasioner dalam variansi dapat dilihat dari nilai estimasi lamda pada grafik transformasi Box-Cox. Apabila nilai estimasi lamba sudah mendekati 1 maka tidak perlu dilakukan transformasi Box-Cox. Gambar 3.20 menampilkan grafik transformasi Box-Cox. Gambar 3.28 Jendela minitab untuk transformasi Box -Cox ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 175

197 Kegiatan 3. Membuat Data Menjadi Stasioner Dalam Variansi Untuk membuat data menjadi stasioner dalam variansi dapat dilakukan transformasi Box-Cox. Disini akan diperlihatkan cara menstasionerkan data lahan kritis di Selo saja karena cara yang digunakan berlaku untuk semua data di tiap lokasi yang berbeda. Tampilan grafik Box-Cox untuk data lahan kritis di Selo ditunjukkan pada gambar berikut ini Gambar 3.29 Jendela minitab untuk transformasi Box -Cox Dari grafik transformasi Box-Cox tersebut bisa dilihat bahwa nilai estimasi lamda belum mendekati 1 yaitu sebesar 0.54, sehingga perlu dilakukan transformasi Box-Cox dengan nilai lamda Data hasil transformasi bisa disimpan pada kolom C10. Cara untuk melakukan transformasi ini bisa dilihat pada gambar 3.30 berikut 176 MULTIVARIAT REGRESI

198 Gambar 3.30 Jendela minitab untuk transformasi Box -Cox Sehingga tampilan akhir pada Minitab setelah data ditransformasi ditunjukkan pada Gambar Gambar Jendela minitab untuk transformasi Box -Cox ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 177

199 Kegiatan 4. Menampilkan Trend Analysis Trend Analysis disini digunakan untuk melihat apakah data sudah stasioner dalam rata-rata. pertama kali yang perlu dilakukan adalah menampilkan hasil Trend Analysis yaitu sebagai berikut Gambar 3.32 Jendela minitab untuk trend analysis Setelah dilakukan langkah-langkah seperti ditunjukkan pada gambar di atas maka akan muncul tampilan pada Gambar 3.33 Gambar 3.33 Jendela minitab untuk trend analysis 178 MULTIVARIAT REGRESI

200 Hasil Trend Analysis tersebut adalah hasil untuk data lahan kritis di Selo sedangkan untuk data lain dapat dilakukan dengan cara yang sama. Dari gambar tersebut bisa dikatakan hasil Trend Analysis sudah mendekati sumbu horizontal sehingga disimpulkan data sudah stasioner dalam ratarata. Apabila hasil Trend Analysis belum mendekati sumbu horizontal dapat dilakukan differencing dengan cara sebagai berikut Gambar 3.34 Jendela minitab untuk trend analysis dengan differencing Sehingga tampilan akhir minitab apabila dilakukan differencing untuk data lahan kritis di Selo ada pada gambar ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 179

201 Gambar 3.35 Jendela minitab untuk trend analysis dengan differencing Untuk selanjutnya analisa GSTAR perlu membuat program dengan MATLAB sebagaimana ditunjukkan pada langkah-langkah berikut. Kegiatan 5. Program boyolali.m pada MATLAB Untuk Mengestimasi Parameter Langkah-langkah beserta command untuk melaksanakan program boyolali.m adalah sebagai berikut 1. Simpan data dalam format.dat 2. Load data dan lakukan standarisasi dengan membagi data dengan mean load 'kritis.dat' D = [curahhujan(:,1)./mean(curahhujan(:,1))... %kolom 1 = Selo curahhujan(:,2)./mean(curahhujan(:,2))... %kolom 2 = Ampel curahhujan(:,3)./mean(curahhujan(:,3))]; %kolom 3 = Cepogo 3. Tentukan bobot lokasi - Bobot lokasi seragam W = [ ; ; ]; 180 MULTIVARIAT REGRESI

202 - Bobot lokasi normalisasi korelasi silang R = corrcoef(d); w12=r(1,2)/(r(2,1)+r(2,3)+r(3,1)+r(3,2)); w13=r(1,3)/(r(2,1)+r(2,3)+r(3,1)+r(3,2)); w21=r(2,1)/(r(3,1)+r(3,2)+r(1,2)+r(1,3)); w23=r(2,3)/(r(1,2)+r(1,3)+r(3,1)+r(3,2)); w12=r(1,2)/(r(2,1)+r(2,3)+r(3,1)+r(3,2)); w31=r(3,1)/(r(2,1)+r(2,3)+r(1,2)+r(1,3)); w32=r(3,2)/(r(2,1)+r(2,3)+r(1,2)+r(1,3)); W = [0 w12 w13; w21 0 w23; w31 w32 0]; 4. Beri nama data pada waktu ke-t dan pada waktu ke-(t-1) for i=1:length(d)-1 %menyusun data ke-t dan (t-1) Z1tm1(i)=D(i,1); %Data Selo waktu ke-(t-1) Z1t(i)=D(i+1,1); %Data Ampel waktu ke-(t-1) Z2tm1(i)=D(i,2); %Data Cepogo waktu ke-(t-1) Z2t(i)=D(i+1,2); %Data Selo waktu ke-t Z3tm1(i)=D(i,3); %Data Ampel waktu ke-t Z3t(i)=D(i+1,3); %Data Cepogo waktu ke-t end Z1tm1=Z1tm1'; %Data di transpose Z1t=Z1t'; Z2tm1=Z2tm1'; Z2t=Z2t'; Z3tm1=Z3tm1'; Z3t=Z3t'; 5. Hitung u dengan formula sebagai berikut u1=w(1,2)*z1tm1 + W(1,3)*Z2tm1; u2=w(2,1)*z1tm1 + W(2,3)*Z3tm1; u3=w(3,1)*z1tm1 + W(3,2)*Z2tm1; 6. Susun matriks Y, matriks MX1 dan MX2 tt=length(z1t); Y=[Z1t;Z2t;Z3t]; %matriks Y ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 181

203 %Susun matriks MX1 %MX1 = diagonalnya data ke-(t-1) MX1=[Z1tm1 zeros(tt,1) zeros(tt,1); zeros(tt,1) Z2tm1 zeros(tt,1); zeros(tt,1) zeros(tt,1) Z3tm1] %Susun matriks MX2 %MX2 = diagonalnya u(i) MX2=[u1 zeros(tt,1) zeros(tt,1); zeros(tt,1) u2 zeros(tt,1); zeros(tt,1) zeros(tt,1) u3] %Susun matriks MX MX=[MX1 MX2] 7. Hitung Q yaitu rumus untuk mengestimasi parameter Q=inv(MX'*MX)*MX'*Y %hitung Q 8. Hitung Ymodel yaitu Y dengan parameter yang telah diestimasi kemudian plot Ymodel=MX*Q nn=length(y); %plot Y asli dan Y model figure plot(1:nn,y,'*',1:nn,ymodel,'-o') 9. Plot data Selo dan Selo model Z1tmodel=Q(1)*Z1tm1+Q(4)*u1; figure plot(1:tt,z1t,'*',1:tt,z1tmodel,'-o') title('selo') errorz1=norm(z1t-z1tmodel)/norm(z1t)* Plot Ampel asli dan Ampel model Z2tmodel=Q(2)*Z2tm1+Q(5)*u2; figure plot(1:tt,z2t,'*',1:tt,z2tmodel,'-o') title('ampel') errorz2=norm(z2t-z2tmodel)/norm(z2t)* MULTIVARIAT REGRESI

204 11. Plot Cepogo asli dan Cepogo model Z3tmodel=Q(3)*Z3tm1+Q(6)*u3; figure plot(1:tt,z3t,'*',1:tt,z3tmodel,'-o') title('cepogo') errorz3=norm(z3t-z3tmodel)/norm(z3t)*100 Hasil analisa kegiatan Penelitian dengan MINITAB dan MATLAB dijelaskan berikut ini. Kegiatan 6. Hasil analisa Data Curah Hujan Boyolali Data yang dipakai merupakan data curah hujan di 19 kecamatan di Boyolali pada tahun 2008 s.d Dari 19 kecamatan tersebut akan diambil 3 kecamatan yaitu Selo, Ampel dan Cepogo yang dijadikan variabel untuk memperoleh model GSTAR. Variabel dalam GSTAR itu sendiri merupakan lokasi yang berdekatan dan memiliki keterkaitan antar lokasi. Data curah hujan di 3 kecamatan tersebut jelas memiliki keterkaitan karena curah hujan di kecamatan Selo dapat mempengaruhi curah hujan di Ampel dan Cepogo. Selain karena lokasinya yang berdekatan dapat juga dilihat dari nilai korelasi antar kecamatan yang cenderung mendekati 1. Hasil uji korelasi dengan uji Pearson disajikan pada Tabel Tabel Hasil uji korelasi Pearson untuk Kecamatan Selo, Ampel, dan Boyolali Variabel Selo Selo Ampel Cepogo Ampel Cepogo Nilai korelasi yang telah diuji dengan uji korelasi Pearson sudah menunjukkan bahwa nilai korelasi mendekati 1 sehingga data ini dapat dilanjutkan ke tahap selanjutnya yaitu membangkitkan data yang ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 183

205 berdistribusi normal multivariat. Data yang dibangkitkan dengan bantuan software Minitab 17 dilampirkan pada lembar lampiran. Selanjutnya akan diuji stasioneritas data dalam varian dan rata-rata. Untuk mengetahui apakah data telah stasioner dalam variansi digunakan grafik transformasi Box-Cox yang ditunjukkan pada Gambar Gambar Grafik Transformasi Box-Cox untuk Kecamatan Selo, Ampel, dan Cepogo Dari Gambar 3.35 bisa dilihat bahwa nilai estimasi lamda untuk Kecamatan Selo, Ampel, dan Cepogo berturut-turut sebesar 1.23, 1.41, dan Nilai estimasi tersebut sudah mendekati 1 sehingga tidak perlu dilakukan transformasi Box-Cox dan data dapat dikatakan stasioner dalam variansi. Kemudian untuk mengetahui apakah data telah stasioner dalam rata-rata akan dilihat hasil trends analysis yang ditunjukkan pada Gambar Gambar Hasil trend analysis untuk Kecamatan Selo, Ampel dan Cepogo (dari kanan ke kiri) Hasil trend analysis untuk Kecamatan Selo, Ampel, dan Cepogo menunjukkan bahwa trend linear sudah mendekati sejajar dengan sumbu horizontal. Hal ini berarti data tersebut dapat dikatakan stasioner dalam rata-rata sehingga tidak diperlukan proses differencing. Karena data sudah 184 MULTIVARIAT REGRESI

206 memenuhi asumsi stasioner dalam variansi dan rata-rata maka tahap selanjutnya adalah penaksiran parameter pada model GSTAR. Dalam proses penaksiran parameter digunakan 2 bobot lokasi yang dipakai yaitu bobot lokasi seragam dan bobot lokasi normalisasi korelasi silang. Hasil penaksiran parameter ini disajikan pada Tabel 3.22 untuk bobot lokasi seragam dan Tabel 3.23 untuk bobot lokasi normalisasi korelasi silang. Tabel Hasil penaksiran parameter dengan bobot lokasi seragam Parameter Hasil estimasi Tabel Hasil penaksiran parameter dengan bobot lokasi normalisasi korelasi silang Parameter Hasil estimasi Sedangkan perbandingan data asli dengan data hasil model ditunjukkan pada Gambar 3.37 untuk bobot lokasi seragam dan Gambar 3.38 untuk bobot lokasi normalisasi korelasi silang. Gambar 3.37 Hasil perbandingan data asli dengan data model dengan bobot lokasi seragam ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 185

207 Gambar Hasil perbandingan data asli dengan data model dengan bobot lokasi normalisasi korelasi silang Hasil menunjukkan bahwa pendekatan GSTAR masih belum bagus karena error masih sekitar lebih dari 15% untuk kedua jenis bobot yang berbeda. Latihan Soal 3.1 Hasil yang diperoleh pada Kegiatan di atas masih mempunyai error cukup besar. Oleh karena itu digunakan modifikasi GSTAR dalam bentuk : Z 1 (t ) 10 Z (t ) 0 2 Z 3 (t ) Z 1 (t ) Y1 (t ) e1 (t ). 23 Z 2 (t ) Y2 (t ) e2 (t ) 0 Z 3 (t ) Y3 (t ) e3 (t ) dimana tanaman padi (lihat file Padi.dat) merupakan fungsi dari produksi padi pada dua kecamatan yang lain dan curah hujan pada kecamatan tersebut dan 2 kecamatan di sekitarnya. Pendekatan ini menunjukkan error yang lebih kecil. Daftar Pustaka Borovkova, S.A, Lopuhaa, H. P. dan Ruchjana. B. N., Generalized STAR model with experimental weights. In M. Stasinopoulos and G. Tauloumi (Eds.). Proceedings of the 17th International Workshop on Statistical Modeling. China. Candiasa, I Made Statistik Multivariat Disertai Aplikasi dengan SPSS. Singaraja. Unit Penerbitan IKIP Negeri Singaraja. 186 MULTIVARIAT REGRESI

208 Dewi, V.P, Parhusip, H,A., Linawati, L., Analisa Hasil Panen Padi menggunakan Pemodelan Kuadratik, prosiding Seminar Nasional Matematika VII UNNES 26 Oktober 2013, ISBN , Semarang. Johnson, R.A., & Wichern, D Applied Multivariat Statistical Analysis.New Jersey:Prentice Hall. Faizah L.A dan Setiawan Pemodelan Inflasi di Kota Semarang, Yogyakarta, dan Surakarta dengan pendekatan GSTAR. Jurnal Sains Dan Seni Pomits Vol 2, No2, ( X Print). Horn R.A, Johnson CA Matrix Analysis.USA:Cambrig University Press. Kutner, M.H, Nachtsheim, C.J., Neter, J Applied Linear Regression Models, Fourth Edition, The McGraw-Hill/Irwin Series). Ruchjana. B. N, Pemodelan Kurva Produksi Minyak Bumi Menggunakan Model Generalisasi STAR. Forum Statistika dan Komputasi. IPB : Bogor. Parhusip, H.A dan Winarso, M.E, Analisa Data Iklim Boyolali dengan Regresi Klasik dan Metode GSTAR, dalam proses Prosiding Seminar Nasional Matematika dan Pendidikan Matematika, Tuban, 24 Mei 2014, Universitas PGRI Ronggolawe, Tuban. Peressini A.L, Sullivan F.E, Uhl J., The Mathematics of Nonlinear Programing, Springer Verlag, New York,Inc. Putranto, H.D. Analisis Ekuitas Merek Sepeda Motor Honda terhadap Keputusan Pembelian dan Perilaku Pasca Beli Menggunakan Structural Equation Modelling (SEM). Semarang. Unit Penerbitan Universitas Negeri Semarang Suwarno: Modul 9 Analisis Regresi Kinier Serderhana dan Korelasi. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 187

209 4 PCA (PRINCIPAL COMPONENT ANALYSIS) 4.1 Pendahuluan PCA telah digunakan oleh berbagai peneliti untuk memilih variabel yang dominan agar variabel yang banyak dapat tereduksi. Sebagai salah satu contoh adalah mencari variabel dominan pada berbagai jenis variabel pakan yang diberikan pada sapi untuk mengenali variabel yang dominan yang berpengaruh terhadap berat sapi optimum untuk memproduksi susu sapi (Parhusip dan Siska. 2009). Teori yang telah diulas pada literatur tersebut ditulis kembali pada makalah ini. Akan tetapi pada makalah ini ditambahkan penyusunan komponen prinsip dengan PCA untuk variabel yang telah distandarisasi. Secara aljabar PCA merupakan suatu kombinasi linear khusus untuk p variabel random X1,..., Xp. Secara geometri, kombinasi linear menyatakan pemilihan sistem koordinat baru yang diperoleh dari merotasi sistem mula-mula X1,..., Xp sebagai sumbu-sumbu koordinat. Sumbu koordinat yang baru sangat tergantung dari matriks kovariansi (atau matrik korelasi). Matriks kovariansi pada makalah ini disimbolkan dan haruslah positif tegas (positive definite). Istilah ini dijelaskan pada Definisi PCA (PRINCIPAL COMPONENT ANALYSIS)

210 4.2 Dasar-Dasar PCA Definisi 4.1 (Peressini,1988) Misalkan aij sebuah matriks simetri n n maka matriks aij positif (negatif) tegas (definite positive (negative)) jika dan hanya jika semua nilai eigennya positif (negatif). Sedangkan mattriks yang semi positif (semi negatif) tegas jika dan hanya jika semua nilai eigennya taknegatif (takpositif). Teorema 4.2 (Johnson, and Wichern, 2007) Sebutlah matriks X = [X1,..., Xp] adalah matriks yang vektorvektor kolomnya adalah vektor random (dianggap berdistribusi normal) yang mempunyai matriks kovariansi (simetris dan positif tegas (positive definite)) dengan nilai eigen p 0 dan sebutlah vektor eigen yang bersesuaian untuk setiap p 0 adalah e1,..., e p yang saling ortogonal. Komponen prinsip ke-i adalah T Yi ei X e1i X 1 e21 X 2... e pi X p, i= 1,2,...,p. (4.1) Dengan pemilihan ini (4.2) Var (Yi ) eit ei i, i =1,2,...,p, Cov( Yi, Yk )= eit ek 0, i k. (4.3) Perlunya e1,..., e p yang saling ortogonal adalah bahwa kita dapat menyusun kombinasi linear Yi dengan basis { e1,..., e p }. Jika beberapa i ada yang sama maka pemilihan vektor eigen ada yang sama. Sebenarnya dapat dipilih vektor eigen yang berbeda dengan menggunakan generalisasi vektor eigen (generalized eigenvector) tetapi tidak dibahas pada makalah ini. Oleh karena itu Yi tidak tunggal. Bukti : (Johnson and Wichern, 2002, hal.358). ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 189

211 Akibat 4.3. Sebutlah matriks X = [X1,..., Xp] adalah matriks yang vektorvektor kolomnya adalah vektor random yang mempunyai matriks kovariansi dengan nilai eigen p 0 dan sebutlah vektor eigen yang bersesuaian untuk setiap p 0 adalah e1,..., e p dan komponen-komponen prinsip ditentukan oleh persamaan (1.a). Maka p p i 1 i pp Var ( X i ) 1... p Var (Yi ) (4.4) ii menyatakan variansi populasi yang ke-ii. Bukti : Diketahui dari aljabar linear bahwa jumlahan elemen diagonal dari suatu matriks disebut sebagai trace (tr) matriks tersebut (Lay,2003). Dalam hal ini berarti pp tr ( ). Kita dapat menuliskan PDP T dengan D adalah matriks diagonal yang elemen diagonal adalah i dan P = [e1 e p ] adalah matriks yang vektor-vektor kolomnya merupakan vektor eigen dan saling ortogonal sehingga PP T PT P I (matriks identitas). Dari sifat tr bahwa tr dari perkalian matriks A dan B berlaku tr(ab) = tr(ba). Sehingga berlaku tr ( ) tr ( P( DPT )) tr ( DPT P) tr ( DI ) tr ( D) 1... p Jadi p p i 1 i 1 Var ( X i ) tr ( ) tr ( D) Var (Yi ). 190 PCA (PRINCIPAL COMPONENT ANALYSIS).

212 Akibat 4.3 menyatakan bahwa total variansi populasi = pp 1... p. Akibat 4.4. Proporsi variansi komponen prinsip ke-i didefinisikan sebagai k p, k =1,..., p. Nilai eki menyatakan ukuran pentingnya variabel ke-k terhadap komponen prinsip ke-i. Secara khusus, eki menyatakan korelasi antara komponen-komponen Yi dan variabel-variabel X k. Hal ini ditunjukkan pada Teorema 4.5 Teorema 4.5 Jika Y1 e1t X, Y2 e2t X,..., Y p e pt X adalah komponen prinsip yang diperoleh dari matriks kovariansi maka Y, X i k eki i kk i,k =1,2,...,p, (4.5) adalah koefisien korelasi antara komponen-komponen Yi dan variabel-variabel X k. Bukti : (Johnson and Wichern, 2007, hal. 360). Kita telah mempunyai informasi bahwa korelasi antara variabel mula-mula yang tidak memuat dimensi sehingga variansi data bebas dari variansi yang memuat dimensi yaitu dengan koefisien korelasi populasi ik yang didefinisikan sebagai ik ik ii kk. (4.6) Koefisien korelasi ini mengukur hubungan linear antara variabel random X i dan X k. Matriks korelasi merupakan matriks simetri p x p yaitu ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 191

213 p 11 pp p 22 pp 1p 1 11 pp = 12 2p 22 pp 1p pp pp pp p 1 p 2 p. (4.7) 1 Komponen prinsip secara geometri memenuhi persamaan ellipsoida c2 1 1 y y p y 2p, c : konstan. (4.8) Karena p 0, persamaan (4.8) menyatakan sistem koordinat dengan sumbu-sumbu y1,..., y p pada arah berturut-turut diberikan oleh e1,..., e p (yang telah saling ortonormal). Untuk selanjutnya akan ditentukan variabel dominan yang mempengaruhi nilai saham di berbagai sektor maka dapat digunakan PCA dengan menyusun matriks kovariansi terlebih dahulu dengan mengasumsikan bahwa data disimpan dalam sebuah vektor random X dimana elemen baris menyatakan N observasi X= [X1...Xp] dan banyaknya kolom menyatakan p variabel X1,..., Xp pada matriks p x N. Rata-rata untuk vektor X didefinisikan sebagai M 1 X 1... X p. p (4.9) Akan dicari X k untuk k=1...p, dimana: Xˆ k X k M. Sehingga kolom matriks N x p dapat ditulis sebagai: B = [ X 1 X 2... X p ] (4.10) dimana B merupakan bentuk deviasi rata-rata untuk setiap X yang diperoleh dari persamaan (4.1). Sedangkan matriks kovariansi matriks adalah p x p matriks S yang didefinisikan sebagai: 192 PCA (PRINCIPAL COMPONENT ANALYSIS)

214 S 1 BB T p 1 (4.11) BB T merupakan matriks positive definite (nilai eigen matriks tersebut semua positif) sesuai dengan Teorema 4.3. Total variansi didefinisikan sebagai jumlahan semua variansi sebagaimana ditunjukkan pada persamaan (4.3). Hal ini diperoleh dengan cara jumlahan dari elemen diagonal matriks S. Jumlahan dari semua diagonal matriks S yang dikuadratkan merupakan trace dari matriks S ( tr(s) ). Nilai eigen dari S harus diurutkan dari besar ke kecil agar diketahui variabel apa yang paling dominan yang mempengaruhi. Untuk selanjutnya perlu disusun matriks P = X Y dengan P adalah matriks yang terdiri dari vektor-vektor kolom dari setiap vektor eigen yang diperoleh. Vektor eigen ini diperoleh dengan menyelesaikan S i I e i 0, i = 1,...,p (4.12.a) dengan n banyaknya sampel saham. Sedangkan nilai eigen perlu diperoleh terlebih dahulu dengan menyelesaikan persamaan karakteristik yaitu det(s- I ) = 0 yang diperoleh dari Se e. (4.12.b) 4.3 PCA dengan standarisasi Variabel Variabel random dapat distandarisasi dengan cara Z1 X 1 1, 11 Z 2 X 2 2,..., Zp X p 22 p pp. (4.12.c) Dengan notasi matriks vektor persamaan (4.12.c) ditulis sebagai Z = (V1/2)-1 (X - ) (4.12.d) dengan (V1/2)-1 merupakan matriks diagonal yaitu ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 193

215 (V1/2)-1 = pp. (4.12.e). Dengan menggunakan persamaan (4.12.c) dan (4.12.e) dapat diperoleh = (V1/2)-1 (V1/2)-1. (4.12.f) Dengan variabel random yang sudah distandarisasi kita dapat menyusun komponen prinsip berdasarkan Teorema 4.6. Teorema 4.6 Komponen prinsip ke-i dari variabel standard ZT = [Z1, Z2,...,Zp], dengan Cov(Z) = diberikan oleh Yi eit Z = eit (V1/2)-1 (X - ), i =1,2,..., p. (4.12.g) Selain itu p p i 1 i 1 Var (Yi ) Var (Z i ) p dan Yi, Zk eki i, i,k = 1,2,..., p. (4.12.h) Pada Teorema ini nilai eigen dan vektor eigen diperoleh dari matriks korelasi. Agar PCA dapat diperkenalkan dengan jelas berikut ini diberikan contoh penggunaaannya dengan menggunakan bantuan MATLAB. Contoh 4.1 Misal data yang diperoleh saham dari sektor Pertanian, Industri Dasar, Aneka Industri dan Barang Konsumsi ditunjukkan pada Tabel PCA (PRINCIPAL COMPONENT ANALYSIS)

216 Tabel 4.1. Data pengukuran variabel untuk 4 sektor saham Tahun Akhir Periode Pertanian Industri Dasar Aneka Industri Barang Konsumsi September Oktober November Desember Januari Februari Maret April Mei Juni Juli Agustus September Oktober IV November I November II November III November IV Desember I Desember II Desember III Desember IV Januari I Januari II Januari III Januari IV ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 195

217 Tabel 4.2. Data pengukuran variabel untuk 4 sektor saham (tak berdimensi) Tahun Akhir Periode Pertanian Industri Dasar Aneka Industri Barang Konsumsi September Oktober November Desember Januari Februari Maret April Mei Juni Juli Agustus September Oktober IV November I November II November III November IV Desember I Desember II Desember III Desember IV Januari I Januari II Januari III Januari IV Data pada Tabel 4.2 perlu dinyatakan dalam bentuk tak berdimensi. Hal ini dilakukan dengan cara membagi data tiap baris dengan maksimum per baris yang ditunjukkan pada Tabel 4.2. Matriks kovariansi dari Tabel 4.2 dapat dicari dengan menghitung rata-rata data tiap baris yang disebut dalam vektor M dan dicari matriks 196 PCA (PRINCIPAL COMPONENT ANALYSIS)

218 deviasi B menggunakan bantuan MATLAB. Sehingga matriks kovariansinya adalah S = Setelah matriks kovariansi(s) diperoleh, maka dapat dicari nilai eigennya. yaitu harus memenuhi Sx x (persamaan 5b) dengan x [ x1 x2 x3 x4 ]T bukan vektor nol (dan disebut sebagai vektor eigen) yang harus dicari. Untuk itu berarti ( S I ) x 0, agar x [ x1 x2 x3 x4 ]T bukan vektor nol maka disyaratkan det (S I ) =0 (Lay,2003). Dengan menggunakan bantuan MATLAB maka dapat diperoleh 4 nilai eigen λ , λ λ , λ dan diperoleh nilai vektor eigen , e e1, e, e Dapat ditunjukkan bahwa ei, e j = 0 dan dengan i j dimana i, j 1,2,3,4. Hal ini berarti masing masing vektor saling tegak lurus dan mempunyai nilai 1, sehingga dapat digunakan sebagai basis untuk Yi. Oleh karena itu komponen prinsip adalah Y X X X X 4, Y X X X X 4, Y X X X X 4, Y X X X X 4. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 197

219 Untuk selanjutnya korelasi antara Y1 dan X i, i =1,,4 dapat ditunjukkan dengan mengikuti formula (4.12.h) yaitu berturut-turut Y, X 1 1 Y, X 1 3 e11 1 s11 e31 1 s33 = ; Y1, X 2 =0.3852; Y,X 1 4 e21 1 =0.0267; s 22 e41 1 = s 44 Karena nilai korelasi X 4 (barang konsumsi) dekat dengan 1 ( Y1, X 4 = ), maka variabel X 4 mempengaruhi nilai sahan Indonesia periode Januari 2008 Januari Kegiatan Penelitian 4.1 Data diunduh dari Badan Pusat Statistik Indonesia ( Data berasal dari 66 kota di Indonesia yang menjadi acuan dalam penghitungan indeks harga konsumen nasional. Dari data bulanan indeks harga konsumen dan inflasi pada 66 kota dicari korelasinya dan didapat 15 kota yang memiliki nilai korelasi lebih dari 0.5 (Gambar 4.1) Gambar 4.1. Grafik korelasi indeks harga konsumen dan inflasi 66 kota dalam diagram batang dan scatter plot 198 PCA (PRINCIPAL COMPONENT ANALYSIS)

220 Sedangkan nilai korelasi ke-15 kota tersebut disajikan pada Tabel 4.3 Tabel 4.3. Daftar 15 kota dengan nilai korelasi terbesar Kota Nilai korelasi BANDA ACEH SIBOLGA BANDUNG CIREBON BEKASI SURAKARTA JEMBER SUMENEP KEDIRI CILEGON MATARAM BIMA MANADO PARE-PARE SORONG Dari ke-15 kota tersebut diambil 5 kota dengan nilai indeks harga konsumen tertinggi, yang selanjutnya dilakukan pengolahan dengan metode regresi terhadap inflasi masing-masing kota tersebut. Diambil inflasi sebagai variabel terikat (Y) dan indeks harga konsumen sebagai variabel bebas (X). Pengolahan dengan regresi linier memberikan hasil regresi variabelvariabel bebas yang tidak signifikan. Koefisien regresi yang dihasilkan sangat lemah dan tidak memberikan hasil analisis yang mewakili pengaruh dari variabel bebas yang bersangkutan. Tetapi jika diregresikan secara terpisah, hasil yang didapat signifikan. Oleh karena itu, pengolahan dengan metode regresi linier dianggap kurang cocok karena hasil yang didapat tidak informatif. Untuk mendapatkan hasil yang lebih informatif, dilakukan pengolahan data dengan principal component analysis. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 199

221 Gambar 4.2. Histogram indeks harga konsumen 66 kota dengan principal component analysis Dengan menggunakan prosedur PCA yang sudah dijelaskan di atas, maka dari grafik dapat dilihat bahwa hanya ada satu kota yang mempunyai nilai korelasi yang lebih dari 0.5 yaitu kota Samarinda dengan nilai korelasi sedangkan kota yang lain mempunyai nilai korelasi yang kurang dari 0.5. Dari informasi tersebut dapat didapatkan informasi bahwa perhitungan indeks harga konsumen tiap daerah berbeda dan kurang informatif Gambar Histogram inflasi 66 kota dengan principal component analysis 200 PCA (PRINCIPAL COMPONENT ANALYSIS)

222 Dari grafik dapat dilihat bahwa 59 kota yang mempunyai nilai korelasi yang lebih dari 0.5. Kota yang mempunyai nilai korelasi paling tinggi adalah kota Bengkulu sedangkan Jakarta berada pada peringkat nomor 33 dengan nilai korelasi 0,7764.Terdapat 7 kota yaitu Tarakan, Torontalo, Banjarmasin, Maumere, Sorong, Ambon, Ternate yang mempunyai nilai korelasi yang kurang dari 0.5. Dari informasi tersebut dapat didapatkan informasi data inflasi sangat informatif. Dari hasil dan pembahasan di atas, dapat didapat informasi bahwa perubahan indeks harga konsumen satu kota tidak berpengaruh secara langsung terhadap inflasi kota lain. Beberapa faktor yang menjadi penyebab adalah keadaan daerah, tingkat harga, dan tingkat konsumsi masyarakat yang berbeda di tiap kota. Sehingga disimpulkan bahwa metode regresi linier kurang cocok digunakan dalam analisis permasalahan ini karena memunculkan hasil yang kurang informatif. Sedangkan dengan PCA dapat dicari kota yang paling dominan dalam pengaruhnya terhadap indeks harga konsumen dan inflasi dari kota-kota lain. Dengan PCA, didapat kota yang memiliki indeks harga konsumen paling dominan yaitu kota Samarinda dengan nilai korelasi Kota yang memiliki inflasi paling dominan dengan PCA didapat ada 59 kota dengan kota Bengkulu sebagai kota yang memiliki nilai korelasi paling tinggi. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 201

223 Tabel 4.4 Nilai Korelasi Indeks Harga Konsumen dan Inflasi dengan Metode Regresi KOTA NILAI KORELASI BANDA ACEH LHOKSEUMAWE SIBOLGA PEMATANG SIANTAR MEDAN PADANG SIDEMPUAN PADANG PAKANBARU DUMAI JAMBI PALEMBANG BENGKULU BANDAR LAMPUNG PANGKAL PINANG BATAM TANJUNG PINANG JAKARTA BOGOR SUKABUMI BANDUNG CIREBON BEKASI DEPOK TASIKMALAYA PURWOKERTO SURAKARTA SEMARANG TEGAL YOGYAKARTA JEMBER SUMENEP KEDIRI MALANG PROBOLINGGO MADIUN PCA (PRINCIPAL COMPONENT ANALYSIS)

224 KOTA NILAI KORELASI SURABAYA SERANG TANGERANG CILEGON DENPASAR MATARAM BIMA MAUMERE KUPANG PONTIANAK SINGKAWANG SAMPIT PALANGKARAYA BANJARMASIN BALIKPAPAN SAMARINDA TARAKAN MANADO PALU BONE MAKASAR PARE-PARE PALOPO KENDARI GORONTALO MAMUJU AMBON TERNATE MANOKWARI SORONG JAYAPURA ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 203

225 Tabel 4.5 Principal Component Analysis Inflasi di 66 Kota di Indonesia KOTA BENGKULU NILAI KORELASI MALANG JAMBI PAKANBARU DEPOK MADIUN SIBOLGA DUMAI MEDAN MATARAM CILEGON PADANG SIDEMPUAN PROBOLINGGO BANDA ACEH SAMPIT PEMATANG SIANTAR LHOKSEUMAWE TANGERANG PADANG JEMBER PANGKAL PINANG PURWOKERTO SEMARANG SUKABUMI SURABAYA YOGYAKARTA SURAKARTA MAKASAR SERANG BATAM PARE-PARE BEKASI JAKARTA KEDIRI BONE PCA (PRINCIPAL COMPONENT ANALYSIS)

226 KOTA PALEMBANG NILAI KORELASI BIMA SUMENEP SAMARINDA PONTIANAK CIREBON SINGKAWANG BANDAR LAMPUNG TASIKMALAYA PALOPO KENDARI TANJUNG PINANG PALANGKARAYA JAYAPURA DENPASAR TEGAL MANOKWARI BOGOR MANADO BANDUNG MAMUJU KUPANG PALU BALIKPAPAN TARAKAN GORONTALO BANJARMASIN MAUMERE SORONG AMBON TERNATE ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 205

227 Tabel 4.6 Principal Component Analysis Indeks Harga Konsumen di 66 Kota di Indonesia KOTA SAMARINDA NILAI KORELASI TANJUNG PINANG PADANG SIDEMPUAN PADANG BANDA ACEH LHOKSEUMAWE SERANG DUMAI JEMBER CILEGON SIBOLGA PAKANBARU SURAKARTA PARE-PARE SINGKAWANG PEMATANG SIANTAR DEPOK MEDAN JAMBI BENGKULU CIREBON TEGAL BANDAR LAMPUNG SEMARANG BEKASI MATARAM YOGYAKARTA MADIUN TASIKMALAYA PURWOKERTO TANGERANG MALANG PONTIANAK PANGKAL PINANG TARAKAN PCA (PRINCIPAL COMPONENT ANALYSIS)

228 KOTA KEDIRI NILAI KORELASI PROBOLINGGO SUKABUMI BATAM SURABAYA BANDUNG PALU AMBON SAMPIT JAKARTA MANOKWARI BIMA PALEMBANG PALANGKARAYA GORONTALO MAKASAR MAMUJU SUMENEP MAUMERE BONE BANJARMASIN KUPANG BOGOR MANADO PALOPO DENPASAR KENDARI JAYAPURA TERNATE BALIKPAPAN SORONG Kegiatan Penelitian 4.2 Pada (Parhusip dan Ayunani, 2009) telah ditunjukkan bahwa hijauan sebagai variabel dominan untuk berat sapi yang produktif menghasilkan susu. Hal ini dilakukan dengan menggunakan Principal Componen ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 207

229 Analysis. Selain hijauan terdapat beberapa variabel lain yang diukur seperti pupuk urea, lingkar dada, garam dapur, ketela untuk mempelajari berat sapi yang optimal dalam menghasilkan produksi susu sapi. Data diobservasi setiap hari selama 1.5 bulan, dari tanggal 15 Juli 2008 sampai dengan 30 Agustus Data diperoleh dari Peternakan Rakyat Dukuh Belon, Kelurahan Kumpulrejo, Kecamatan Argomulyo, Kota Salatiga. Sebagai salah satu bentuk data hasil survei ditunjukkan pada Tabel 4.7Tabel Tugas: Pilihlah variabel dominan dari data tersebut (file: Tabel4_7.datm Tabel4_8.dat, Tabel4_9_10.dat) Tabel 4.7 Contoh data lingkar dada, berat pupuk urea dan berat untuk sapi dari Peternakan Rakyat Dukuh Belon, Kel. Kumpulrejo, Kec. Argomulyo, Kota Salatiga dari tanggal 15 Juli 2008 s/d 30 Agustus 2008 (Parhusip dan Ayunani, 2009) Lingkar dada (cm) Pupuk urea (gr) Berat sapi (kg) PCA (PRINCIPAL COMPONENT ANALYSIS)

230 Tabel 4.8 Data pupuk urea yang diberikan sesuai dengan berat untuk sapi dari Peternakan Rakyat Dukuh Belon, Kel. Kumpulrejo, Kec. Argomulyo, Kota Salatiga dari tanggal 15 Juli 2008 s/d 30 Agustus 2008 (Parhusip dan Ayunani, 2009) (kg) (kg) (kg) (kg) (kg) (kg) > (kg) ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 209

231 Tabel 4.9. Data berbagai variabel yang diukur pada sapi dari Peternakan Rakyat Dukuh Belon, Kel. Kumpulrejo, Kecamatan Argomulyo, Kota Salatiga dari tanggal 15 Juli 2008 sampai dengan 30 Agustus 2008 (Parhusip dan Ayunani, 2009). Sapi 1 Sapi 2 Sapi 3 Sapi 4 Sapi 5 Sapi 6 Sapi 7 Sapi 8 Sapi 9 Sapi 10 Sapi 11 Sapi 12 Jumlah hijauan (kg) jumlah katul (kg) Variabel jumlah tela (kg) jumlah garam dapur (kg) Jumlah air/hari (liter) Tabel Data berbagai variabel yang diukur pada sapi (lanjutan Tabel 4.9) Sapi 13 Sapi 14 Sapi 15 Sapi 16 Sapi 17 Sapi 18 Sapi 19 Sapi 20 Sapi 21 Sapi 22 Sapi 23 jumlah hijauan (kg) jumlah katul(kg) jumlah tela(kg) jumlah garam dapur(kg) Jumlah air/hari(liter) Variabel 4.5 Bagaimana Memulai Analisa Data dengan Pemodelan Mahasiswa seringkali bermasalah untuk memulai analisa data dan mereka tidak tahu dengan metode apa mereka bisa mengolah data tersebut padahal mereka sudah mengenal berbagai metode statistika maupun matematika. Pada bagian ini ditunjukkan beberapa contoh data yang dibawa oleh mahasiswa dan tidak sedikitpun statistika dan matematika yang dilontarkan oleh mahasiswa untuk dapat digunakan pada mulanya. 210 PCA (PRINCIPAL COMPONENT ANALYSIS)

232 Contoh data 4.2: Kasus Kependudukan Tabel Data pengguna kontrasepsi pada tiap desa di Kecamatan Sidorejo KELURAHAN PUS (eliqible couple) METODE KONTRASEPSI JANGKA PANJANG AKDR IUD MOP Vasectomi MOW Tubectomi Susuk Implant I. SIDOREJO Blotongan Sidoreja Lor Salatiga Bugel Kauman Kidul Pulutan Sumber : Salatiga dalam Angka 2008 Data pada Tabel 4.11 menunjukkan banyaknya penduduk pengguna kontrasepsi jangka panjang pada penduduk Kecamatan Sidorejo di kota Salatiga pada tahun Kita perlu memformulasi permasalahan dalam membaca data ini. Untuk itu, maka kita perlu mengoleksi pertanyaan yang dapat dipakai dalam menyusun formulasi permasalahan atau model matematika. Beberapa pertanyaan yang muncul dapat didaftar untuk menunjukkan permasalahan yang dapat dibuat adalah sebagai berikut: 1. Bagaimana metode kontrasepsi ini berpengaruh terhadap laju pertumbuhan penduduk kecamatan Sidorejo?. 2. Jenis kontrasepsi apa yang paling disukai oleh penduduk kecamatan Sidorejo?. Jawaban dari pertanyaan tersebut dapat membantu pemerintah setempat untuk melakukan perencanaan kegiatan ekonomi dan sosial untuk kemajuan penduduk setempat ataupun juga akan menjadi bagian ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 211

233 perencanaan sosial dan ekonomi pada wilayah yang lebih luas (misal di seluruh Salatiga dan Jawa Tengah). Untuk memberikan jawaban terhadap pertanyaan yang pertama maka kita memerlukan data pendukung yaitu kepadatan penduduk untuk wilayah Sidorejo. Hal ini dapat ditunjukkan pada Tabel Tabel Data Kepadatan Penduduk Kota Salatiga pada tahun 2008 per km2 Kepadatan penduduk per km Kelurahan I. SIDOREJO Blotongan SidorejoLor Salatiga Bugel 0,876 0,898 0,907 0,905 0, Kauman Kidul Pulutan Sumber : Salatiga dalam Angka 2008 Data yang berkaitan dengan kecamatan yang lain tidak ditunjukkan pada bagian ini tetapi akan ditunjukkan pada hasil karya ilmiah yang sudah lengkap pada bagian selanjutnya. Kita dapat kembali menajamkan pertanyaan pertama dalam surat formulasi kalimat, misal: Kepadatan penduduk Sidorejo dinyatakan sebagai fungsi dari berbagai jenis kontrasepsi yang digunakan penduduk. Selanjutnya mahasiswa dapat mencari tipe fungsi dari berbagai fungsi yang dikenal di dalam kuliah (ada beberapa kata kunci misalnya : linear, eksponensial, periodik, polinomial, dan sebagainya). Hal ini berarti perlu suatu penyimbolan untuk banyaknya kepadatan penduduk Sidorejo 212 PCA (PRINCIPAL COMPONENT ANALYSIS)

234 pada masing-masing kelurahan dan banyaknya penduduk yang menggunakan suatu tipe kontrasepsi menurut Tabel Kita akan memulai dari fungsi yang sederhana yaitu linear. Artinya Kepadatan penduduk sebagai fungsi linear dari berbagai jenis kontrasepsi yang digunakan penduduk. Referensi terkait akan menjelaskan cara menyatakan fungsi linear dengan 4 variabel (karena ada 4 jenis kontrasepsi). Dengan memberikan penyimbolan yaitu Sebut Y:=variabel kepadatan penduduk, X 1 := variabel random jenis kontrasepsi IUD, X 2 :=variabel random jenis kontrasepsei MOP, X 3 := variabel random jenis kontrasepsi MOW, dan X 4 := variabel random jenis kontrasepsi susuk. Diasumsikan Y X1, X 2, X 3, X 4 a0 a1x1 a2 X 2 a3 X 3 a4 X 4 (a.1) dengan koefisien a1, a2, a3, a4 dicari berdasarkan data dan diasumsikan E ( ) 0 dan Var( )= 2. Agak membingungkan bagi matematikawan yang biasa menuliskan dengan Y a0 a1 X 1 a2 X 2 a3 X 3 a4 X 4 (a.2) dengan menyatakan X 1, X 2, X 3, X 4 sebagai variabel bebas dan Y sebagai variabel tak bebas dan tidak memperdulikan lanjutan asumsi tentang variansi error. Dalam hal ini perlu diperhatikan tata tulis matematika maupun statistika yang mempunyai beberapa kaidah dasar yang berbeda. Pada statistika, kita akan menuliskan hasil komputasi pendekatan linear setelah keempat parameter diperoleh dalam bentuk y( x1, x2, x3, x4 ) aˆ 0 aˆ1 x1 aˆ 2 x2 aˆ 3 x3 aˆ 4 x4. (a.3) Hingga saat ini, kita telah berhasil menyatakan data dari Tabel 1 dan Tabel 2 menjadi terkait dan terbentuk suatu formulasi matematika (a.1)-(a.3) dengan terlebih dahulu membuat suatu pertanyaan yang mungkin bisa menjadi dasar penyusunan formulasi matematika. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 213

235 Bagaimana dengan pertanyaan kedua?. Tanpa matematika ataupun statistika, sebagai orang umum kita dapat bernalar dengan memilih pengguna paling banyak menunjukkan jenis kontrasepsi yang paling disenangi. Pada Tabel 4.11 ditunjukkan bahwa IUD sebagai jenis yang paling banyak digunakan oleh kecamatan Salatiga. Secara matematika ataupun statistika maka harus dapat pula memberikan hasil yang sama. Mahasiswa dapat merujuk beberapa kata kunci yang analog dalam pustaka (misal Johnson dan Wichern, 2007) dengan yang dikehendaki pada pertanyaan. Pada statistika, dikenal metode principal component analysis. Dari penamaan, tampak bahwa metode ini memberikan cara dan pembahasan komponen prinsip (yang dianggap penting). Untuk selanjutnya data dapat diperbanyak sesuai dengan perhatian kita. Cara analisa dapat dilakukan untuk tiap kecamatan, ataupun dengan menggabungkan semua data sehingga menjadi masalah yaitu kepadatan penduduk Salatiga sebagai fungsi linear dari 4 jenis kontrasepsi yang digunakan. Hasil kajian ini ditunjukkan pada (Parhusip, 2010). Menurut statistik, seringkali kita berpikir data mempunyai suatu distribusi (Normal, Beta, dan sebagainya). Sebagai langkah awal dan sering digunakan kita berasumsi bahwa data berdistribusi normal atau kita perlu menguji terlebih dahulu apakah data berdistribusi normal Contoh 4.3 Kasus Perekonomian Data yang mudah diperoleh pada bidang ekonomi adalah data perencanaan subsidi kedelai pada pengusaha tempe dan tahu di Salatiga. Contoh data ditunjukkan pada Gambar PCA (PRINCIPAL COMPONENT ANALYSIS)

236 Gambar 4.4. Contoh daftar penerima subsidi kedelai perkecamatan kota Salatiga Oktober 2008 (Hanya ditunjukkan sebagian) Seringkali data harus diedit terlebih dahulu untuk dapat diolah dengan mudah, misalkan setelah dikoleksi maka dapat didaftar sebagaimana ditunjukkan pada Tabel ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 215

237 Tabel Daftar data banyaknya tenaga kerja tahu dan tempe berdasarkan wilayah di Salatiga Kelurahan jmlh tng kerja p.tahu jml tng kerja p.tempe Salatiga Sidorejo-Lor Kauman-Kidul Bugel Blotongan Pulutan Salatiga Sidorejo-Lor Kauman-Kidul Bugel Blotongan Pulutan TNG (orang) Total jml tenaga kerja P (orang) Subsidi (kg kedelai) Kita dapat menyusun suatu permasalahan yang dapat membantu pembuat keputusan dalam memberikan subsidi yaitu apakah perencanaan tersebut cukup optimal?. Bagaimana banyaknya pengusaha dan tenaga kerja dapat membantu sebagai pertimbangan tersebut?. Kita dapat menyatakan subsidi sebagai fungsi tenaga kerja dan pengusaha. Untuk selanjutnya kita akan mencari tenaga kerja dan banyaknya pengusaha yang optimal yang meminimumkan subsidi. Masalah ini berkaitan dengan optimasi yaitu menyusun fungsi tujuan dan meminimalkan fungsi tujuan itu. Jika hasil yang diperoleh ternyata berada pada interval data yang diberikan maka perencanaan subsidi yang diberikan baik. Sebaliknya, jika nilai optimal tidak berada pada interval data yang ada maka perencanaan subsidi tersebut tidak baik dan perlu dibenahi. Secara garis besar, maka kita dapat memformulasikan kajian data sebagai cara memilih data. Hasil analisa ini telah ditunjukkan pada (Parhusip, 2009, October). 216 PCA (PRINCIPAL COMPONENT ANALYSIS)

238 Selanjutnya akan ditunjukkan bagaimana data-data di atas dianalisa dengan bantuan pemrograman. 4.6 Kegiatan Penelitian Kasus Kependudukan Sebagaimana disebutkan pada Bab I, persamaan (a.3) akan dipakai untuk menyatakan kepadatan penduduk suatu wilayah sebagai fungsi linear jenis kontrasepsi yang digunakan (ada 4 macam). Pemrograman ditunjukkan dalam tahapan sebagai berikut. Kasus Sidorejo Tahap 1. Simpan data pengguna kontrasepsi kecamatan Sidorejo pada file *.dat, Sebutlah Sidorejo.dat dengan isi sebagai berikut Tahap 2. Buatlah program MATLAB yang juga memuat daftar kepadatan penduduk Sidorejo dan menentukan parameter persamaan (1d) sebutlah sebagai file padatsido.m dengan isi sebagai berikut. load 'Sidorejo.dat'; [m,p]=size(sidorejo); A=Sidorejo; padat=[ ] padat2=padat./max(padat) %berdimensi ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 217

239 X=[ones(m,1) A]; rankx=rank(x) atilde=inv(x'*x)*(x'*padat) Y1=atilde(1) + atilde(2)*x(:,2) + atilde(3)*x(:,3) atilde(4)*x(:,4) + atilde(5)*x(:,5) figure(2) plot(1:m,padat,'*',1:m,y1,'o') errorsido=norm(padat - Y1)/norm(padat)*100 + Tahap 3. Panggil program padatsido.m pada Command window MATLAB sbb : >> padatsido (ENTER) Keluaran ditunjukkan sebagai berikut >> padatsido padat = 1.0e+003 * padat2 = rankx = 5 atilde = 1.0e+003 * PCA (PRINCIPAL COMPONENT ANALYSIS)

240 Y1 = 1.0e+003 * errorsido = Adapun keluaran dalam Gambar ditunjukkan pada Gambar 4.6 dapat disimpan dengan formula umum sebagai berikut. >print dps namafile.eps Gambar 4.5. Kepadatan penduduk Sidorejo sebagai fungsi jenis kontrasepsi yang digunakan. Tanda (*) untuk data dan tanda o hasil pendekatan fungsi linear Dari hasil program diperoleh bahwa error sebesar %. Hal ini menunjukkan bahwa hasil asumsi bahwa kepadatan penduduk Sidorejo sebagai fungsi linear cukup baik. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 219

241 Latihan soal 4.1 Untuk data pengguna kontrasepsi metode Jangka Panjang pada penduduk pada tiap Kecamatan di Salatiga pada tahun 2008 ditunjukkan pada Tabel Tabel Daftar pengguna kontrasepsi pada penduduk pada tiap Kecamatan di Salatiga pada tahun 2008 KODE Kelurahan PUS (eliqible couple) 8126 Metode Kontrasepsi Jangka Panjang AKDR MOP MOW Susuk IUD Vasectomi Tubectomi Implant I. SIDOREJO Blotongan 2. Sidoreja Lor 3. Salatiga 4. Bugel 5. Kauman Kidul 6. Pulutan II. Tingkir 1. Kutowinangun 2. Gendongan 3. Sidorejo Kidul 4. Kalibening 5. Tingkir lor 6. Tingkir Tengah III. Argomulyo 1. Noborejo 2. Ledok 3. Tegalrejo 4. Kumpulrejo 5. Randuacir 6. Cebongan IV. Sidomukti 1. Kecandran 2. Dukuh 3.Mangunsari 4. Kalicacing Jumlah Sumber : Salatiga Dalam Angka 2009 Sedangkan kepadatan penduduk ditunjukkan pada Tabel PCA (PRINCIPAL COMPONENT ANALYSIS)

242 Tabel 4.15 Kepadatan Penduduk kota Salatiga tahun 2008 untuk tiap kecamatan dan kelurahan Kode Kelurahan I. SIDOREJO 1. Blotongan 2. Sidoreja Lor 3. Salatiga 4. Bugel 5. Kauman Kidul 6. Pulutan II. Tingkir 1. Kutowinangun 2. Gendongan 3. Sidorejo Kidul 4. Kalibening 5. Tingkir lor 6. Tingkir Tengah III. Argomulyo 1. Noborejo 2. Ledok 3. Tegalrejo 4. Kumpulrejo 5. Randuacir 6. Cebongan IV. Sidomukti 1. Kecandran 2. Dukuh 3.Mangunsari 4. Kalicacing 2 Kepadatan/km , Sumber: Salatiga Dalam Angka, 2008 Tugas: Nyatakan data pada Kecamatan Tingkir, Argomulyo dan Sidomukti sebagai fungsi linear dari jenis kontrasepsi yang digunakan. Jawab: 1. Untuk kecamatan Tingkir, maka program MATLAB disusun sebagai berikut. Adapun keluaran diyatakan dalam variabel Daftar_yang_berdimensi: load 'tingkir.dat'; [m,p]=size(tingkir); ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 221

243 A=tingkir; for i=1:p An(:,i)=A(:,i)/max(A(:,i)); end padat=[ ]; padat2=padat./max(padat); X=[ones(m,1) An]; rankx=rank(x) atilde=inv(x'*x)*(x'*padat2) Y1dim=atilde(1) + atilde(2)*x(:,2) + atilde(3)*x(:,3) + atilde(4)*x(:,4) + atilde(5)*x(:,5) ; figure(1) plot(1:m,padat2,'*',1:m,y1dim,'o') %berdimensi X=[ones(m,1) A]; rankx=rank(x); atilde=inv(x'*x)*(x'*padat) Y1=atilde(1) + atilde(2)*x(:,2) + atilde(3)*x(:,3) + atilde(4)*x(:,4) + atilde(5)*x(:,5) ; Daftar_yang_berdimensi=[padat Y1] figure(2) plot(1:m,padat,'*',1:m,y1,'o') errortingkir=norm(padat - Y1)/norm(padat)*100 Diperoleh keluaran program sbb : rankx = 5 atilde = atilde = 1.0e+003 * PCA (PRINCIPAL COMPONENT ANALYSIS)

244 Daftar_yang_berdimensi = 1.0e+003 * errortingkir = Daftar Pustaka Johnson, R.A. and Wichern, D. W Applied Multivariate Statistical Analysis. Third Edition. Prentice Hall. New Jersey. Parhusip, H. A., Evi, K., dan Dyah K., Uji Normalitas dan Fungsi Linear Kepadatan Penduduk Salatiga tahun 2008, Prosiding Seminar Nasional dan Pendidikan Sains FSM ISSN: , Vol.1 No.1, hal Parhusip H. A., dan Siska Ayunani, Principal Component Analysis (PCA) untuk Analisis Perlakukan Pemberian Pakan dan Mineral terhadap Produksi Susu Sapi, Prosiding Seminar Nasioanal Matematika UNPAR, Vol 4, hal.aa 42-51, ISSN Parhusip H. A., Data Selection with Hessian Matrix, Proceeding of IndoMS International Conference on Mathematics and Its Applications (IICMA), ISBN: , ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 223

245 5 ANOVA dan MANOVA 5.1 Latar Belakang Ketika kita melakukan pengulangan pengukuran, tentunya ada beberapa variasi data. Kadang-kadang variansi (dalam antar grup) membuat sulit dianalisis jika ada perubahan signifikan antara 2 grup yang diobservasi ulang. Statistik yang mengukur variansi dalam grup dan diantara 2 grup pada ANOVA dinamakan ANOVA dan dikatakan jumlah kuadrat (disingkat SS). Beberapa kata kunci yang nuncul pada metode ini adalah One-Way ANOVA, Repeated ANOVA, Two ways ANOVA. ANOVA adalah suatu model yang cukup komprehensif untuk mendeteksi perbedaan kelompok pada variabel terikat tunggal. Teknik yang lebih umum biasa dikenal sebagai multivariat analisis varians (MANOVA). MANOVA dapat dianggap sebagai ANOVA untuk situasi dimana ada beberapa variabel terikat. Pada Tabel 51.a dijelaskan perbedaan dari ANOVA dan MANOVA. Informasi lebih lengkap dapat dilihat di Field (2009) dan Stevens (2009). Tabel 5.1.a. Perbedaan ANOVA dan MANOVA ANOVA Hanya satu variabel terikat MANOVA Beberapa variabel terikat Menguji perbedaan mean pada Menguji perbedaan vektor mean variabel terikat untuk beberapa beberapa variabel terikat variabel bebas ANALISA DATA UNTUK ILMU SOSIAL & SAINS 224

246 Sedangkan perbedaan one-way repeated measures dan two-way repeated measures hanya pada variabel bebas. One-way repeated measures menggunakan satu variabel bebas dan two-way repeated measures menggunakan dua variabel bebas. 5.2 Repeated Measures (Pengukuran Berulang) ANOVA Repeated measures adalah pengukuran berulang terhadap sekumpulan obyek atau partisipan yang sama. Pada prinsipnya Repeated Measures ANOVA sama dengan paired t-test untuk membandingkan rata-rata dua sampel yang saling berhubungan. Perbedaannya dengan ANOVA adalah sampel uji ini adalah sampel pengukuran berulang, sementara ANOVA mensyaratkan sampel bebas. One-way repeated measures ANOVA biasanya digunakan untuk membandingkan nilai disain sebelum dan sesudah partisipan yang sama pada satu grup. Sedangkan two-way repeated measures ANOVA membandingkan pada dua grup. (Web 4) Dalam disain general linear model repeated measures, level dari within subject factor mewakili beberapa pengamatan dari skala waktu ke waktu dalam kondisi yang berbeda. Ada 3 jenis tes yang dilakukan jika within subject factor memiliki lebih dari dua level, yaitu standar univariat uji F, tes univariat alternatif, dan tes multivariat. Tiga jenis tes ini mengevaluasi hipotesis yang sama, rata-rata populasi sama untuk semua level pada faktor (Web 1). Standar uni variatuji F ANOVA tidak dianjurkan ketika within subject factor memiliki lebih dari dua level karena pada asumsi tersebut, asumsi Sphericity umumnya dilanggar dan uji F ANOVA menghasilkan p-value yangakurat sejauh asumsi ini dilanggar. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 225

247 Tes univariat alternatif memperhitungkan pelanggaran asumsi Sphericity. Tes ini menggunakan penghitungan statistik F yang sama dengan standar univariat tes.namun p-value berpotensi berbeda. Dalam menentukan pvalue, sebuah epsilon statistik dihitung berdasarkan data sampel untuk mengetahui derajat yang melanggar asumsi Sphericity. Pembilang dan penyebut derajat kebebasan uji standar dikalikan dengan epsilon untuk mendapatkan serangkaian derajat kebebasan yang sudah dikoreksi untuk membuat nilai F yang baru dan menentukan p-value. Tes multivariat tidak memerlukan asumsi Sphericity. Perbedaan nilai dihitung dengan membandingkan nilai-nilai dari berbagai level within subject factor.misalnya untuk within subject factor dengan tiga level, nilai perbedaan mungkin dihitung antara level pertama dengan kedua dan antara level kedua dengan ketiga. Tes multivariat kemudian akan mengevaluasi apakah rata-rata populasi untuk nilai perbedaan kedua pasangan secara simultan sama dengan nol. Tes ini tidak hanya mengevaluasi rata-rata terkait dengan dua pasangan nilai perbedaan, tetapi juga mengevaluasi apakah rata-rata dari nilai selisih antara level pertama dan ketiga faktor tersebut sama dengan nol sebagai kombinasi linier dari nilai perbedaan. Menurut Carey (1998), semua perhitungan statistik multivariat didasarkan pada akar-akar karakteristik dari matriks A yang dibentuk dari (5.1) dengan H : matriks varians-kovarians perlakuan pada MANOVA E : matriks varians-kovarians error pada MANOVA. 226 ANOVA dan MANOVA

248 Dalam tes multivariat sendiri ada beberapa uji yang digunakan, yaitu: Wilks Lamda Statistik uji digunakan jika asumsi homogenitas dipenuhi. Nilai Wilks Lamda berkisar antara 0-1. Statistik uji ini yang sering dipakai (Web 2). Statistik uji Wilks Lamda dirumuskan sebagai: (5.2) dengan : Wilks Lamda; : determinan dari matriks E; : banyaknya akar-akar karakteristik dari matriks A; : akar-akar karakteristik ke-i matriks A. Statistik Wilks Lamda di atas dapat ditransformasikan menjadi suatu statistik yang berdistribusi F. Khususnya Kasus 1:. (5.3) Kasus 2: (5.4) dengan : banyaknya variabel; : banyaknya grup; : banyaknya partisipan. Informasi lebih lanjut dapat dilihat pada Patel dkk (2013). Pillai s Trace Statistik uji ini paling cocok digunakan jika asumsi homogenitas tidak dipenuhi (Web 2). Statistik uji Pillai s Trace dirumuskan sebagai:. (5.5) Beberapa ahli statistik menganggapnya paling kuat dari 4 statistik yang lain. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 227

249 Adapun aturan pengujiannya adalah tolak ketika, dengan nilai diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004). Hotelling s Trace Statistik uji ini jarang digunakan oleh para ahli (Web 2). Berikut rumus dari Hotelling s Trace:. (5.6) Statistik Hotelling s Trace di atas dapat ditransformasikan menjadi suatu statistik yang berdistribusi F (Web 3). Khususnya, dimana (5.7), dengan p : akar-akar dan karakteristik dari matriks A; n : banyaknya partisipan. Adapun aturan pengujiannya adalah tolak dengan nilai ketika, diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004). Roy s Largest Root Roy s Largest Root digunakan jika asumsi dipenuhi dan berkorelasi dengan kuat. Tetapi uji ini harus hati-hati dalam penggunaanya (Web 2).. Adapun aturan pengujiannya adalah tolak dengan nilai (5.8) ketika, diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004). Keempat tes multivariat tersebut menggunakan uji statistik sebagai berikut: (tidak ada perbedaan antar perlakuan) (setidaknya ada perbedaan antar dua perlakuan). Kriteria pengujiannya tolak 228 ANOVA dan MANOVA jika p-value < 0.05 dan.

250 a. Sphericity Pada dasarnya, asumsi Sphericity mengacu padakesamaan varians dari perbedaan diantaralevel pada factor repeated measures.dengan kata lain, kita menghitung perbedaan antara setiap pasangan level faktor repeated measures dan kemudian menghitung varians dari nilai perbedaan. Sphericity mensyaratkan bahwa varians untuk setiap nilai perbedaan sama. Kita mengasumsikan bahwa hubungan antara tiap pasang kelompok adalah sama. Untuk menguji asumsi Sphericity dapat menggunakan tes Mauchly, uji Greenhouse Geisser dan tes Huynh Feldt. Hipotesis untuk Sphericity: (tidak ada perbedaan yang signifikan diantara varians perbedaan) (ada perbedaan yang signifikan diantara varians perbedaan) : perbedaan level 1 dengan level 2 pada faktor repeated dengan measure : perbedaan level 1 dengan level 3 pada faktorrepeated measure : perbedaan level 2 dengan level 3 pada faktorrepeated measure. Kriteria pengujiannya tolak jika hasil p-value dari Mauchly Tests< 0.05, yang artinya bahwa ada perbedaan yang signifikan diantara varians perbedaan, dengan kata lain bahwa kondisi Sphericity tidak ditemui (Field, 2012). Jika tes Mauchly dari Sphericity tidak signifikan, maka tes within-subjects effects dapat dilakukan. Sedangkan jika tes Mauchly dari Sphericity signifikan, tes multivariat yang digunakan (Ho, 2006). Jika data melanggar asumsi Sphericity, ada beberapa pembenaran yang dapat diterapkan untuk menghasilkan rasio F yang valid. SPSS membuat tiga pembenaran berdasarkan perkiraan Sphericity yang dianjurkan oleh Greenhouse Geisser dan Huynh Feldt. Kedua perkiraan ini ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 229

251 menimbulkan faktor koreksi yang diterapkan pada derajat kebebasan yang digunakan untuk menilai rasio F yang telah diteliti. Koreksi Greenhouse Geisser biasanya dilambangkan dengan dan 1, dimana k adalah jumlah kondisi repeated bervariasi antara measures. Semakin dekat ke 1, varians dari perbedaan semakin homogen. Ketika estimasi Greenhouse Geisser lebih besardari 0,75 maka hipotesis nol ditolak. Ketika perkiraan Sphericity lebih besar dari 0.75 maka koreksi Huynh Feldt harus digunakan, tetapi ketika perkiraan Sphericity kurang dari 0,75 atau Sphericity sama sekali tidak diketahui maka koreksi Greenhouse Geisser harus digunakan sebagai gantinya (Field, 2009). Pengukuran Pengaruh atau Dampak Ukuran pengaruh keseluruhan untuk pendekatan univariat adalah parsial eta kuadrat dan dapat dihitung menggunakan persamaan berikut:. (5.9) Ukuran pengaruh keseluruhan untuk uji multivariat terkait dengan Wilks Lamda adalah multivariat eta kuadrat dan dapat dihitung menggunakan persamaan berikut:. (5.10) Nilai parsial eta kuadrat dan multivariat eta kuadrat berkisar antara 0 sampai 1. Nilai 0 menunjukkan tidak ada hubungan antara faktor repeated measures dan variabel terikat, sedangkan nilai 1 menunjukkan adanya hubungan yang kuat. (Web 1) 5.3 One way-anova Apakah ada perbedaan signifikan antara 2 nilai rata-rata/tingkat dimana rata-rata dihitung dari observasi yang diulang?. 230 ANOVA dan MANOVA

252 Perbedaan signifikansi ditunjukkan jika (F hitung > F kritis ada level 95%). F statistik (F hitung) didefinisikan sebagai F MS between MS within dimana pembilang dan penyebut mempunyai derajat kebebasan. Derajat kebebasan (dfbetween) dari MS between ditentukan sebagai dfbetwen = k-1 dan dfwithin=n-k untuk derajat kebebasan Mswithin. Karena untuk menghitung tingkat signifikansi berdasarkan Fkritis dibandingkan dengan Fhitung (yang ditunjukkan SPSS) maka Fkritis juga dihitung pada derajat kebebasan yang sama yaitu dengan excel: =finv(0,05,dfbetween, dfwithin). (sebagai Fkritis) Tetapi ANOVA tidak dapat menunjukkan variabel mana yang menunjukkan perbedaan. Catatan: Fkritis adalah F yang diberikan tabel dengan derajat kebebasan perlu ditetapkan. Beberapa nama tidak diterjemahkan agar sesuai dengan penamaan pada SPSS sebagai software yang digunakan. Contoh 5.1 Misalkan ada k=3 level /grup perlakuan. Banyaknya sample tiap grup adalah n1=12, n2=11, dan n3 = 14. Oleh karena itu ukuran sampel N=n1 + n2 + n3 = 37. Variansi sampel dihitung dengan SS/df dimana SS (jumlah kuadrat deviasi terhadap rata-rata) dan SS/df dikatakan MS (mean squares). Pada One-Way ANOVA kita mempunyai 2 nilai MS yaitu MSwithin (means square di antara grup) dan Mswithin (means square diantara 1 grup). ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 231

253 5.3.1 Bagaimana ANOVA dengan SPSS Cara ANOVA dengan SPSS adalah Analyze -> Compare Means -> One-Way ANOVA. Tambahkan kuantitas variabel keluaran pada \Dependent List", dan categorical explanatory variable to the \Factor" box.-> OK Contoh 5.3 File EMKDEdit.xls Problem : Anggap BL1, BL2, BL3, BL4,BL5,BL6 merupakan pengukuran BL yang dilakukan 5 kali. Faktor yang diukur terhadap :KP1 Hasil keluaran SPSS ditunjukkan pada Tabel 5.1.b Tabel 5.1.b Keluaran ANOVA ANOVA Sum of Squares BL1 BL2 BL3 BL4 BL5 BL6 df Mean Square Between Groups Within Groups Total Between Groups Within Groups Total Within Groups Total Within Groups Total Between Groups Between Groups Between Groups Within Groups Total Within Groups Total Between Groups 232 ANOVA dan MANOVA F Sig

254 Kita membandingkan nilai F hitung (dari keluaran SPSS) dengan F kritis. Nilai F kritis dihitung sebagai berikut : dfbetween= 6-1=5 dan dfwithin=n-k=400-6=394 Fkritis dengan excel ditulis =finv(0.05;5;394)=2, Diperoleh bahwa tiap variabel mempunyai F hitung > F kritis pada level 95% tipe 1 error, atau p-value < Jadi ada perbedaan rata-rata yang signifikan antara 2 variabel dan antar variabel respon. Latihan soal 5.1 Selidiki one-way ANOVA antara KH1,KH2,KH3,KH4,KH5 terhadap KP1 1. Selidiki one-way ANOVA antara KH1,KH2,KH3,KH4,KH5 terhadap KP2 2. Selidiki one-way ANOVA antara KH1,KH2,KH3,KH4,KH5 terhadap KP3 3. Selidiki one-way ANOVA antara KH1,KH2,KH3,KH4,KH5 terhadap KP4 Catatan: KH1,...,KH5 dianggap sebagai pengukuran KH dengan pengulangan 5x Two Way-ANOVA Tes ini menguji signifikansi dari 2 eksperimen variabel (atau faktor atau perlakuan) terhadap variabel respon (keluaran instrumen). Jika terjadi pengulangan pengukuran kita juga dapat menguji apakah ada atau tidak interaksi signifikan antara 2 variabel. Interaksi dikatakan ada (signifikan) ketika jika p-value < 0.05 dan F hitung > F-kritis. Pertanyaan yang dipelajari adalah : 1. Apakah ada interaksi yang signifikan antara 2 faktor/2 variabel?. 2. Apakah perubahan pada salah satu faktor mempengaruhi hasil pengukuran yang lain? ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 233

255 Catatan : jawaban yang diberikan haruslah terurut sesuai pertanyaan tersebut. Interaksi ada secara signifikan jika p-value < 0.05 dan F hitung > F-kritis. Contoh 5.4. (Lebih khusus disebut Faktorial ANOVA) File : TWBAGUS1.sav Gender : variabel independent (1: laki, 2: perempuan JOB Kategori: variabel independent (1: manager, 2: pengajar, 3: pegawai pabrik) Disain problem: 2 x 3 factorial disain; yang akan dipelajari apakah gaji diperoleh dipengaruhi oleh gender, juga kategori pekerjaan dan interaksinya. Dengan SPSS dalah dengan cara mencari menu Analyze -> General Linear Model -> Dependent var (Gaji), Fixed Factor (Gender dan JobKategori) Options : perhatikan menu yang diklik 1. Options -> Klik Descriptive Stat, Estimates of Effect size, Homogeniety Test (ketiganya yang paling sering digunakan) 2. Demikian pula submenu Display Means for: pilih BL1 s/dbl6, dan BL1xBL2xBL3xBL4xBL5xBL6 3. Menu Plots : ketentuan : separate line diisi dengan faktor dengan paling sedikit kategori, sumbu horizontal diisi faktor dengan paling banyak kategori. Pada contoh soal: punya kategori sama. 4. Models: jika samples size tidak sama, Sum Square TypeIII menjelaskan unweighted mean approach. Biasanya jika ukuran sampel tidak sama, umumnya orang menggunakan Type III 234 ANOVA dan MANOVA

256 Jendela SPSS ditunjukkan pada Gambar 5.1 Gambar 5.1 Jendela SPSS untuk anova Cara membahas /analisa: Between-Subjects Factors N GENDER JOBKATEGORI Disini laki-laki lebih banyak sampel ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 235

257 Descriptive Statistics Dependent Variable:GAJI GENDER JOB KATEGORI 1 Mean Std. Deviation N E E E E Total E E E E E Total E E E E E E E E Total Total Demikian pula dari homogenitas data nampaknya dilanggar, karena varians juga sangat besar (standard deviasi yang berbeda). Hal ini juga ditunjukkan pada Tes Levene bahwa data tidak homogen. Levene's Test of Equality of Error Variances a Dependent Variable:GAJI F df1 df2 5 Sig Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept + GENDER + JOBKATEGORI + GENDER * JOBKATEGORI 236 ANOVA dan MANOVA

258 Dari Tabel: Tests of between subjects maka interpretasi yang dapat ditulis sebagai berikut: Catatan: Intercept biasanya tidak diperhatikan Gender secara statistik tidak signiftikan secara statistik (Sig 0.103) Sedangkan JobKategori secara statistik signifikan. Sedangkan Interaksi gender dan jobkategori tidak signifikan. Dari Partial Eta squared: 4,8% variabilitas gaji ditentukan oleh gender, 89,9% variabilitas gaji ditentukan oleh JOBKategori, dan 8,8% gaji variabilitas gaji ditentukan oleh interaksi antara gender dan jobkategori. Tests of Between-Subjects Effects Dependent Variable:GAJI Source Type III Sum of Squares Mean Square Df F Sig. Partial Eta Squared a E Intercept 6.472E E GENDER 1.916E E JOBKATEGORI 3.416E E GENDER * JOBKATEGORI 3.696E E Error 3.837E E11 Total 2.378E15 61 Corrected Total 7.976E14 60 Corrected Model 7.592E14 a. R Squared =,952 (Adjusted R Squared =,948) Contoh 5.6. File EMKDEdit.xls Problem : Anggap BL1, BL2, BL3, BL4,BL5,BL6 merupakan pengukuran BL yang dilakukan 6 kali. Karena setiap BL bernilai 3,4,5 maka anggaplah BL mempunyai 3 kategori. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 237

259 BL1, BL2,BL3,BL4,BL5,BL6 input pada Fixed Factors Respon (dependent) yang diukur terhadap : KP1 Hasil keluaran SPSS ditunjukkan pada Tabel 2. Data kita memuat : BL1,BL2, BL3 dalam data bernilai 3,4,5 oleh karena itu dianggap punya 3 kategori. Kita akan mengukur interaksi antar kategori Demikian pula KP1 dan KP2 bernilai 4 dan 5 dianggap punya 2 kategori. 5.4 Two Way ANOVA dengan SPSS Cara Two way ANOVA dengan SPSS dijelaskan dengan contoh berikut ini. Analize->General Linear Model ->Univariate-> var dependent (KP1 saja) dan Fixed factors (BL1 s/d BL6) ; Hasil Keluaran: Tabel 5.2.Between-Subjects Factors N BL1 BL2 BL3 BL4 BL5 BL6 238 ANOVA dan MANOVA

260 Analisa Tabel 5.1: Perhatikan bahwa banyaknya sampel sangat berbeda untuk tiap kategori (2,3,4,5) Kegiatan Penelitian 5.1 Peningkatan Curah Hujan Pertahun di Seluruh daerah indonesia ditunjukkan pada Tabel. Data curah hujan yang diperoleh dari Pusat data dan Informasi Sekretariat Jenderal Kementrian Perhubungan dari tahun 2006 hingga Data curah hujan sebanyak 30 daerah di seluruh Indonesia mulai dari Aceh hingga daerah sentani. Gambar 5.2 Lokasi dan distribusi curah hujan (sumber:web) Rata-rata curah hujan di Indonesia untuk setiap tahunnya tidak sama. Namun masih tergolong cukup banyak, yaitu rata-rata mm/tahun. Begitu pula antara tempat yang satu dengan tempat yang lain rata-rata curah hujannya tidak sama. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 239

261 Ada beberapa daerah yang mendapat curah hujan sangat rendah dan ada pula daerah yang mendapat curah hujan tinggi: 1. Daerah yang mendapat curah hujan rata-rata per tahun kurang dari 1000 mm, meliputi 0,6% dari luas wilayah Indonesia, di antaranya Nusa Tenggara, dan 2 daerah di Sulawesi (lembah Palu dan Luwuk). 2. Daerah yang mendapat curah hujan antara mm per tahun di antaranya sebagian Nusa Tenggara, daerah sempit di Merauke, Kepulauan Aru, dan Tanibar. 3. Daerah yang mendapat curah hujan antara mm per tahun, meliputi Sumatera Timur, Kalimantan Selatan, dan Timur sebagian besar Jawa Barat dan Jawa Tengah, sebagian Irian Jaya, Kepulauan Maluku dan sebagaian besar Sulawesi. 4. Daerah yang mendapat curah hujan tertinggi lebih dari 3000 mm per tahun meliputi dataran tinggi di Sumatera Barat, Kalimantan Tengah, dataran tinggi Irian bagian tengah, dan beberapa daerah di Jawa, Bali, Lombok, dan Sumba. Setelah menghitung rata-rata curah hujan tahun 2006 hingga 2010, selanjutnya dapat membuat pola curah hujan dalam bentuk gambar atau plot. Dengan tahun sebagai sumbu x dan daerah dengan sumbu y, maka dapat dibentuk gambar distribusi curah hujan sebagaimana ditunjukkan pada Gambar Gambar 5.3. yaitu gambar pola hujan daerah Aceh, Ambon, Ampenan, Bandung, Banjarmasin. 240 ANOVA dan MANOVA Gambar 5.4 yaitu gambar pola hujan daerah Bengkulu, Denpasar, Gorontalo, Jakarta, Jambi

262 Gambar 5.5 yaitu gambar pola hujan daerah Kendari, Kupang, Manado, Medan, Padang Gambar 5.6 yaitu gambar pola hujan daerah Palangkara, Palembang, Palu, Pangkal pinang, Pekan baru Gambar 5.7 yaitu gambar pola hujan daerah Pontianak, Samarinda, Semarang, Sentani, Serang Gambar 5.8 yaitu gambar pola hujan daerah Surabaya, Tanjung karang, Ternate, Ujung pandang, Yogyakarta. Kemudian data rata-rata curah hujan dicek normal dengan batas= chi2inv (0.95,p). Diperoleh gambar Gambar 5.9 Distribusi normal multivariate curah hujan di Indonesia ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 241

263 Dari data dapat disimpulakan bawah data normal dengan rata-rata Sedangkan variansi. Karena data berdistribusi Plausibility dari normal maka selanjutnya menentukan sebagai sebuah nilai untuk rata-rata populasi normal(uji Hotelling). Dengan menetapkan tahun sebagai variabel atau parameter. Data curah hujan dari 30 kota di Indonesia. Lima komponen, X1=tahun 2006, X2=tahun 2007, X3 = tahun 2008, X4 = tahun 2009, X5 = tahun 2010, telah diukur dan dinilai. Uji hipotesis vs dengan taraf signifikansi. Dari hasil perhitungan dengan program Matlab diperoleh : Sehingga akan diperoleh 242 ANOVA dan MANOVA pada

264 . Dengan membandingkan yang diamati Karena Kesimpulannya, maka dengan nilai kritisnya diterima pada taraf signifikansi 5%. merupakan suatu nilai plausible untuk. Dapat disusun interval konfidensi untuk nilai rata-rata yang diperoleh dengan menggunakan (5.24) dari pustaka yaitu xi s s (n 1) p (n 1) p Fp,n p ( ) ii i xi Fp,n p ( ) ii, i=1,...,p (n p) n (n p) n dimana untuk setiap i dengan data yang digunakan, diperoleh hasil sebagai berikut: Kita juga dapat melakukan regresi linear dengan menyatakan tiap variabel adalah tiap tahun 2006,2007,2008,2009 dimana y=2010 sebagai variabel tak bebas. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 243

265 Jadi. Dengan program R ditulis lm(formula = y ~ x1 + x2 + x3 + x4, data = vd) Hasil keluaran program R adalah sebagai berikut : Coefficients: (Intercept) x1 x2 x3 x summary(z1) Call: lm(formula = y ~ x1 + x2 + x3 + x4, data = vd) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) * x x * x x Signif. codes: 0 *** ** 0.01 * Residual standard error: on 25 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 4 and 25 DF, p-value: Anda dapat menganalisa hasil ini dengan mengikuti Bab Perbandingan Berpasangan (Paired Comparisons) Paired comparisons adalah teknik dimana responden menyatakan persepsi atau sikapnya dengan mengambil pilihan di antara dua obyek. Kegunaan teknik ini adalah mengukur relative importance, yaitu semacam pembobotan untuk menggambarkan kepentingan relatif beberapa obyek (Web 1). Menurut Sarwono (2012), penghitungan ini dilakukan dengan cara mencari 244 ANOVA dan MANOVA

266 perbedaan antara nilai-nilai dua variabel untuk masing-masing kasus dan kemudian mengujinya apakah terdapat perbedaan rata-rata di atas nilai 0. Pada kasus respon tunggal (univariat), menunjukkan respon untuk perlakuan 1 (atau respon sebelum perlakuan) dan menunjukkan respon setelah perlakuan 2 (atau respon setelah perlakuan) untuk percobaan ke-. Perbedaan ke- adalah,. (5.11) Penambahan notasi dibutuhkan dalam prosedur perbandingan berpasangan pada kasus multivariat (banyaknya variabel (p) lebih dari dua). Untuk menjelaskan metode ini, maka metode ini diperkenalkan dengan contoh yang diambil dari hasil penelitian (Pritasari,2013). Pola data yang digunakan dapat dilihat pada Gambar Kegiatan Penelitian 5.2 Masalah yang diangkat adalah mencari perbedaan respon mahasiswa kelas Listening antar dua minggu yang berbeda dalam tiga minggu. Adapun tujuan dari penelitian ini adalah mengetahui perbedaan respon mahasiswa kelas Listening terhadap pertanyaan yang diteliti dalam tiga minggu menggunakan paired comparisons. Program aplikasi R digunakan sebagai alat bantu untuk melakukan analisis data. Data yang digunakan adalah data hasil penyebaran kuesioner oleh Rahandika, A (2013) dengan 13 pertanyaan yang sama di setiap minggu untuk 29 mahasiswa pada 2 kelas Listening FBS-UKSW selama tiga kali pertemuan. Isi kuesioner mengenai persepsi mahasiswa tentang variasi latihan pada kelas Listening. Jenis data adalah data skala 1-5 (skala likert). ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 245

267 Gambar 5.10 Bagaimana dengan kesehatan dan usahamu? Skema pola data respon mahasiswa sebagai hasil survei oleh Rahandika A (Pritasari, dkk,2013) Misalkan ke-k dengan variabel respon ke-i pada pertanyaan ke-j pada perlakuan i = 1,, 29; j = 1,, 13; k = 1, 2, 3. dengan Definisikan,. (5.12) Misalkan pula dan serta 246 ANOVA dan MANOVA, (5.13)

268 dan. (5.14) Teorema 5.1. (Johnson and Wichern, 2007, hal.275) Jika merupakan sampel acak dari populasi normal maka berdistribusi sebagai sebuah variabel acak asalkan nilai besar, dan sudah diketahui.jika nilai didistribusikan chi-kuadrat dan. Nilai keduanya dikatakan besar jika lebih besar dari 25 atau 30. (Web 2) equivalen dengan tidak ada perbedaan rata-rata Kondisi antara 2 perlakuan. Untuk variabel ke-, secara tidak langsung menyatakan bahwa perlakuan rata-rata ke-2 lebih tinggi daripada perlakuan ke-1. Secara umum, kesimpulan tentang dapat digunakan menggunakan Teorema 5.1. Selanjutnya Teorema tersebut diaplikasikan pada data observasi., Vektor perbedaan yang diobservasi adalah. Uji statistik disusun sebagai berikut: (tidak ada perbedaan respon) dibandingkan dengan (ada perbedaan respon). Kriteria pengujiannya tolak jika. (5.15) ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 247

269 Daerah konfidensi 95% untuk yaitu:. (5.16) Langkah-langkah dalam analisis data 1. Menentukan perbedaan dari respon mahasiswa terhadap pertanyaan pada minggu ke-1 dengan minggu ke-2, minggu ke-1 dengan minggu ke-3, dan minggu ke-2 dengan minggu ke-3. Contoh Dengan melihat Gambar 5.12, untuk mencari perbedaan respon mahasiswa terhadap pertanyaan, misalkan akan menghitung untuk kelas A minggu ke-1 dengan minggu ke-2. Q1 minggu 1 setiap mahasiswa dikurangi Q1 minggu 2 setiap mahasiswa, sampai Q13 minggu 1 setiap mahasiswa dikurangi Q13 minggu 2 setiap mahasiswa. Minggu yang lain serta kelas B dapat dihitung secara analog. 2. Setelah diperoleh perbedaannya dan matriks kovarian 3. Menentukan statistik uji 4. Setelah nilai, mencari rata-rata dari perbedaan dengan menggunakan persamaan (4). berdasarkan persamaan (5.5). diperoleh, dibandingkan dengan dengan digunakan yaitu. = Menghitung daerah konfidensi menggunakan persamaan (5.16). 248 ANOVA dan MANOVA yang

270 Kasus 1: pengujian untuk kelas A untuk pengujian Statistik (tidak ada perbedaan respon mahasiswa terhadap semua pertanyaan di kelas A) dibentuk dari observasi pasangan perbedaan. Akan diuji perbandingan berpasangan untuk semua pertanyaan pada minggu pertama dengan minggu kedua, minggu pertama dengan minggu ketiga, dan minggu kedua dengan minggu ketiga. Jadi yang diobservasi adalah perbedaan nilai tiap mahasiswa untuk semua pertanyaan pada setiap minggu yang akan diuji. Dari perbedaan yang sudah diperoleh, kita menghitung dan sesuai dengan persamaan (5.4). Sehingga setelah diperoleh dan dapat menghitung nilai. Sehingga dapat diperoleh hasil pada Tabel 5.2. Tabel 5.2. Hasil analisa paired comparisons pada kelas A Yang diobservasi Analisa Respon minggu ditolak diterima ditolak ke-1 dan ke-2 Respon minggu ke-1 dan ke-3 Respon minggu ke-2 dan ke-3 Untuk respon minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3 ditolak karena, artinya ada perbedaan respon mahasiswa terhadap semua pertanyaan untuk minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3. Pada respon minggu ke-1 dengan minggu ke-3 =, maka diterima. Artinya tidak ada perbedaan respon mahasiswa terhadap semua pertanyaan untuk minggu ke-1 dan minggu ke-3. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 249

271 Langkah selanjutnya, dari persamaan (5.6) akan diperoleh daerah konfidensi 95% untuk perbedaannya. Daerah konfidensi ini ditunjukkan pada Tabel 5.3. Tabel 5.3. Daerah konfidensi 95% untuk Yang diobservasi Respon minggu ke-1 dan ke-2 Respon minggu ke-1 dan ke-3 Respon minggu ke-2 dan ke-3 Daerah konfidensi Analisa ditolak diterima ditolak Dari Tabel 5.3 menunjukkan bahwa daerah konfidensi 95% untuk respon minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3 menolak, artinya ada perbedaan respon mahasiswa terhadap semua pertanyaan untuk minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3. Sedangkan pada minggu ke-1 dengan minggu ke-3 diterima, artinya tidak ada perbedaan respon mahasiswa terhadap semua pertanyaan untuk minggu ke-1 dan minggu ke-3. Jadi hasil yang diperoleh konsisten dengan hasil pengujian yang sudah diperoleh pada Tabel 5.2 Kasus 2: pengujian untuk kelas B Statistik untuk pengujian (tidak ada perbedaan respon mahasiswa terhadap semua pertanyaan di kelas B) dibentuk dari observasi pasangan perbedaan. Akan diuji perbandingan berpasangan untuk semua pertanyaan pada minggu pertama dengan minggu kedua, minggu pertama dengan minggu ketiga, dan minggu kedua 250 ANOVA dan MANOVA

272 dengan minggu ketiga. Jadi yang diobservasi adalah perbedaan nilai tiap mahasiswa untuk semua pertanyaan pada setiap minggu yang akan diuji. Dari perbedaan yang sudah diperoleh, kita menghitung dan sesuai dengan persamaan (5.4). Sehingga setelah diperoleh dan dapat menghitung nilai. Sehingga dapat diperoleh hasil pada Tabel 5.4. Tabel 5.4. Hasil analisa paired comparisons kelas B Yang diobservasi Respon minggu ke-1 dan ke-2 Respon minggu ke-1 dan ke-3 Respon minggu ke-2 dan ke-3 Analisa ditolak ditolak diterima ditolak untuk pengujianrespon minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3 pada kelas B karena, artinya ada perbedaan respon mahasiswa terhadap semua pertanyaan untuk semua minggu. Tetapi pada respon minggu ke-2 dengan minggu ke-3 diterima karena maka tidak ada perbedaan respon mahasiswa terhadap semua pertanyaan untuk minggu ke-2 dengan minggu ke-3. Langkah selanjutnya, dari persamaan (5.16) akan diperoleh daerah konfidensi 95% untuk perbedaannya. Daerah konfidensi ini ditunjukkan pada Tabel 5.5. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 251

273 Tabel 5.5. Daerah konfidensi 95% untuk Yang diobservasi Daerah konfidensi Respon minggu ke-1 dan ke ditolak Respon minggu ke-1 dan ke ditolak Respon minggu ke-2 dan ke diterima Analisa Dari Tabel 5.5 dapat dilihat bahwa daerah konfidensi 95% untuk respon minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3 ditolak yang artinya ada perbedaan respon mahasiswa terhadap semua pertanyaan untuk minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3. Sedangkan pada respon minggu ke-2 dengan minggu ke-3 diterima, artinya tidak ada perbedaan respon mahasiswa terhadap semua pertanyaan untuk minggu ke-1 dan minggu ke-3. Jadi hasil yang diperoleh juga konsisten dengan hasil pengujian yang sudah diperoleh pada Tabel Kegiatan Penelitian 5.4 Repeated Measure untuk Studi Respon Mahasiswa Responden di setiap kelas mengisi kuesioner berdasarkan perlakuan yang diberikan. Isian tersebut menyatakan respon mahasiswa terhadap pertanyaan yang diajukan pada kuesioner mengenai persepsi mahasiswa tentang variasi latihan pada kelas Listening.Isian yang diberikan adalah dalam bentuk skala 1-5 dan tiap nilai menunjukkan rentang sangat tidak setuju hingga sangat setuju. 252 ANOVA dan MANOVA

274 Pada penelitian Rahandika A (2013), variasi latihan dalam mengajar kelas Listening yang digunakan dosen-dosen FBS merupakan sebuah kegiatan yang berulang pada setiap pertemuan. Ada tiga tahapan latihan dalam kelas Listening yaitu pre-task, during task dan yang terakhir posttask. Yang pertama untuk membuka kelas adalah pre-task. Pada pre-task mahasiswa diberi latihan yang sifatnya membuat mahasiswa berekspektasi tentang materi yang akan diajarkan hari itu. Pada pre-task, latihan-latihan yang digunakan sangat simpel dan mudah, seperti pelabelan gambar, membuat daftar kemungkinan, melengkapi sebuah kalimat, dll. Yang kedua adalah during task. Fungsi dari during task adalah untuk membantu mahasiswa mendeskripsikan pesan pada sesi Listening. Beberapa latihan yang digunakan pada during task adalah pilihan ganda, mengikuti petunjuk arah sesuai yang disampaikan, mengisi kata sesuai yang disampaikan, benar/salah, dll. Latihan yang terakhir adalah post-task. Post-task adalah latihan terakhir yang biasanya sebelum kelas usai. Fungsi post-task adalah untuk memperluas topik materi dan mentransfer materi yang telah dipelajari ke dalam konteks lain. Pada latihan ini biasanya dosen akan mengambil nilai untuk hasil belajar pada pertemuan tersebut. Contoh latihannya adalah menyimpulkan percakapan, mengidentifikasi hubungan pembicara, dll. Pada setiap minggunya, dosen-dosen FBS memberikan pola yang sama. Walaupun disetiap minggunya mahasiswa belajar materi yang berbeda, pola latihan-latihan yang digunakan selalu sama. Setelah itu responden memberikan respon pada daftar pertanyaan yang diberikan pada skala 1-5. Hal tersebut dilakukan secara sama pada tiap minggu setiap kelas. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 253

275 Jadi telah dibahas studi tentang respon mahasiswa dengan metode paired comparisons untuk dua kelas Listening FBS-UKSW. Berdasarkan statistik dapat disimpulkan bahwa: Pada kelas A minggu ke-1 dengan minggu ke-3 tidak ada perbedaan respon mahasiswa terhadap semua pertanyaan. Tetapi pada minggu ke1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3 ada perbedaan respon mahasiswa terhadap semua pertanyaan. Pada kelas B tidak ada perbedaan respon mahasiswa terhadap semua pertanyaan pada minggu ke-2 dengan minggu ke-3, tetapi pada minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3 ada perbedaan respon mahasiswa terhadap semua pertanyaan. Hal ini juga diperkuat dengan hasil analisa penghitungan daerah konfidensi 95%. b. Pairwise Comparisons Desain within-subjects direkomendasikan menggunakan pendekatan Bonferroni. Pendekatan ini harus digunakan terlepas dari apakah peneliti merencanakan untuk menguji semua perbandingan berpasangan atau hanya membuat keputusan untuk memeriksa data (Maxwell dkk, 2004) Uji statistik disusun sebagai berikut: (tidak ada perbedaan antar perlakuan) (ada perbedaan antar perlakuan). Kriteria pengujiannya tolak jika p-value < Prosedur a. Variabel Penelitian 1. Variabel terikat (level): banyaknya perlakuan, yaitu minggu pertama, minggu kedua dan minggu ketiga. 2. Variabel bebas (faktor repeated measures) : 254 ANOVA dan MANOVA

276 One-way repeated measures : rata-rata respon mahasiswa. Two-way repeated measures : kelas dan rata-rata respon mahasiswa. b. Langkah-langkah dalam Analisis Data 1. Menghitung rata-rata respon tiap mahasiswa pada tiap minggu. 2. Menganalisa hasil Sphericity. Jika signifikan (p-value< 0.05) dilanjutkan tes multivariat, sebaliknya jika tidak signifikan dilanjutkan tes within-subject effects. 3. Jika dilanjutkan tes multivariat, setelah itu menganalisa keempat uji pada tes multivariat. Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk memperkuat hasil tersebut, kemudian menghitung nilai-nilai dari keempat uji menggunakan persamaan (5.1), (5.2), (5.5), (5.6) dan (5.8). Statistik uji yang dianalisis adalah Wilks Lamda sehingga untuk menghitung penolakan Ho digunakan persamaan (5.3) dan (5.4). Tolak Ho saat dan sebaliknya. 4. Jika dilanjutkan tes within-subject effects, setelah itu menganalisa p-value dari Greenhouse Geisser dan Huynh-Feldt. Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk memperkuat hasil tersebut, kemudian membuat perubahan derajat kebebasan untuk pembilang dan penyebut yang baru. 5. Menghitung pengaruh faktor dari repeated measures menggunakan persamaan (5.9) atau (5.10). 6. Menganalisa hasil p-value dari Pairwise Comparisons. Tolak jika p-value < ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 255

277 Kasus 1 One-Way Repeated Measures Akan diuji apakah ada perbedaan yang signifikan pada Kelas A minggu pertama, minggu kedua dan minggu ketiga. Hasil dari analisis mengindikasikan bahwa tes Mauchly dari Sphericity signifikan (p-value = 0 < 0.05). Artinya bahwa ada perbedaan yang signifikan diantara varians perbedaan, dengan kata lain bahwa kondisi Sphericity tidak ditemui. Oleh karena itu, tes within-subject effects tidak dapat digunakan, tetapi yang dapat digunakan adalah tes multivariat. Dari Tabel 5.5 dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata minggu ketiga semakin meningkat, tetapi perbedaannya tidak terlalu jauh. Tabel 5.5.a Rata-rata dan standar deviasi Kelas A Tabel 5.5.b. Hasil dari tes multivariat untuk Kelas A minggu pertama, kedua dan ketiga Respon Mahasiswa Mean Minggu pertama Nama Uji p-value Minggu kedua Pillai s Trace Minggu ketiga Wilks Lamda Hotelling s Trace Roy s Largest Root Untuk mengetahui apakah rata-rata dari minggu pertama sampai minggu ketiga berbeda secara signifikan, dapat dilakukan tes multivariat dengan melihat Tabel 5.5.b. Dari semua uji diperoleh kesimpulan bahwa semua menolak Ho karena semua uji menghasilkan p-value yang sama yaitu < Maka ada perbedaan yang signifikan antara rata-rata respon mahasiswa pada minggu pertama sampai minggu ketiga. Pada tes multivariat yang meliputi uji Pillai s Trace, Wilks Lamda, Hotelling s Trace dan Roy s Largest Root, nilai-nilai dari keempat 256 ANOVA dan MANOVA

278 uji tersebut juga digunakan untuk memperkuat hasil hipotesis. Setiap uji dapat dihitung nilainya dengan menghitung akar-akar karakteristik terlebih dahulu. Dengan persamaan (5.1) dapat diperoleh:, dan Sehingga matriks karakteristik. dan didapatkan akar-akar. Setelah akar-akar karakteristik diperoleh maka uji- uji dalam tes multivariat dapat dihitung menggunakan persamaan (5.2), (5.5), (5.6) dan (5.8) sehingga diperoleh: ; ;. Dalam kasus ini yang dianalisis adalah 1 variabel dan 3 grup. Dari persamaan (5.3) diperoleh statistik F (hanya untuk Wilks Lamda karena uji yang lain tabel nilai kritis tidak diketahui). Dengan Jadi diperoleh nilai dari ditolak karena yaitu.. Artinya bahwa ada perbedaan yang signifikan antara rata-rata respon mahasiswa pada minggu pertama sampai minggu ketiga. Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan multivariat eta kuadrat sehingga diperoleh ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 257

279 . Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara ratarata respon mahasiswa dan perlakuan yang diberikan setiap minggunya. Tabel 5.5.c menunjukkan semua perbandingan berpasangan (dengan interval konfidensi Bonferroni) diantara 3 level. Dengan memban-dingkan respon setiap minggunya, kita dapat memasang-masangkan data rata-rata respon antar minggu pertama sampai minggu ketiga. Tabel 5.5.c Hasil analisa perbandingan berpasangan Kelas A Respon Mahasiswa Minggu ke-1 dan ke-2 Minggu ke-1 dan ke-3 Minggu ke-2 dan ke-3 p-value Analisa diterima diterima ditolak Dapat dilihat dari Tabel 5.5.c, dengan = 5% maka rata-rata respon mahasiswa minggu kedua dan minggu ketiga berbeda secara signifikan (p-value< 0.05). Rata-rata respon mahasiswa minggu pertama dengan minggu kedua dan rata-rata respon minggu pertama dengan minggu ketiga tidak berbeda secara signifikan (p-value> 0.05). Kasus 2 Akan diuji apakah ada perbedaan yang signifikan pada Kelas B minggu pertama, minggu kedua dan minggu ketiga. Dari hasil analisis mengindikasikan bahwa tes Mauchly dari Sphericity tidak signifikan (pvalue= > 0.05). Hasil tes within-subject effects mengindikasikan bahwa within-subjects variabel rata-rata respon mahasiswa tidak signifikan karena p-value = > Artinya, tidak ada perbedaan yang signifikan diantara varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga. 258 ANOVA dan MANOVA

280 Setelah hasil tes Mauchly dari Sphericity sudah diperoleh, kemudian dari tes within-subject effects dibuat sebuah perubahan derajat kebebasan untuk pembilang dan penyebut. Hal ini dapat diperoleh dengan mengalikan kedua nilai ini menggunakan Huynh-Feldt karena perkiraan Sphericity lebih dari Perubahan derajat kebebasan pembilangnya. Rasio F = harus dievaluasi dengan derajat adalah kebebasan yang baru ini. Setelah dihitung dengan derajat kebebasan yang baru diperoleh F yang sama yaitu dan p-value = > Ternyata setelah dievaluasi dengan derajat kebebasan yang baru tetap memperoleh kesimpulan yang sama dengan sebelumnya, yaitu tidak ada perbedaan yang signifikan diantara varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga. Dari Tabel 5.5.d dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata minggu ketiga perbedaannya tidak terlalu jauh. Tabel 5.5.d. Rata-rata dan standar deviasi Kelas B Respon Mahasiswa Mean Minggu pertama Minggu kedua Minggu ketiga Tabel 5.5.e Hasil analisa perbandingan berpasangan Kelas B Respon Mahasiswa Minggu ke-1 dan ke-2 Minggu ke-1 dan ke-3 Minggu ke-2 dan ke-3 pvalue Analisa diterima diterima diterima Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan parsial eta kuadrat sehingga diperoleh. Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara ratarata respon mahasiswa dan perlakuan yang diberikan setiap minggunya. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 259

281 Tabel 5.5.e menunjukkan semua pairwise comparisons (dengan interval konfidensi Bonferroni) diantara 3 level. Dengan membandingkan setiap minggunya, kita dapat memasang-masangkan data rata-rata antar minggu pertama sampai minggu ketiga. Dapat dilihat dari Tabel 5.5.e dengan = 5% maka rata-rata respon mahasiswa minggu pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05). Two-Way Repeated Measures Akan diuji apakah ada perbedaan yang signifikan interaksi respon dari mahasiswa pada Kelas A dan Kelas B pada minggu pertama, minggu kedua dan minggu ketiga.dari Tabel 5.5.f variabel Kelas menghasilkan hasil yang sangat signifikan untuk semua tes multivariat dengan p-value = 0 < Artinya ada perbedaan respon Kelas A dan Kelas B.Dari Tabel 5.5.g dapat dilihat bahwa pada respon Kelas A lebih besar daripada ratarata respon Kelas B. Tabel 5.5.f. Hasil tes multivariat Kelas A dan B untuk variabel Kelas Nama Uji Pillai s Trace Wilks Lamda Hotelling s Trace Roy s Largest Root p-value Tabel 5.5.g Perbedaan rata-rata respon Kelas A dan B untuk variabel Kelas Kelas A B Mean Selanjutnya diuji variabel Rata-rata respon mahasiswa. Pada tes Mauchly dari Sphericity menghasilkan nilai 0.731, dan signifikan karena p-value = < Asumsi Sphericity dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4cmenunjukkan bahwa variabel Rata-rata respon mahasiswa tidak 260 ANOVA dan MANOVA

282 signifikan. Hal ini dapat dilihat dari p-value = > 0.05 yang artinya tidak ada perbedaan rata-rata respon mahasiswa dari minggu pertama sampai minggu ketiga. Tetapi dari Tabel 5.5.i dapat dilihat bahwa rata-rata respon mahasiswa minggu pertama, minggu kedua dan minggu ketiga semakin meningkat. Tabel 5.5.h. Hasil tes multivariat ratarata respon mahasiswa Nama Uji p-value Pillai s Trace Wilks Lamda Hotelling s Trace Roy s Largest Root Tabel 5.5.i Rata-rata respon mahasiswa Respon Mahasiswa Mean Minggu ke Minggu ke Minggu ke Untuk interaksi Kelas dengan Rata-rata respon mahasiswa, tes Mauchly dari Sphericity menghasilkan nilai dan signifikan karena p-value = < Asumsi Sphericity juga dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4e menunjukkan bahwa efek interaksi signifikan karena p-value = < Hal ini menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Tabel 5.5.j Hasil tes multivariat dari interaksi Kelas dengan Ratarata respon mahasiswa Nama Uji p-value Pillai s Trace Wilks La da Hotelli g s Trace Roy s Largest Root Nilai-nilai dari keempat uji pada tes multivariat yang meliputi uji Pillai s Trace, Wilks Lamda, Hotelling s Trace dan Roy s Largest Root untuk interaksi Kelas dengan Rata-rata respon mahasiswa juga digunakan untuk memperkuat hasil hipotesis. Setiap uji dapat dihitung nilainya ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 261

283 dengan menghitung akar-akar karakteristik terlebih dahulu. Menggunakan persamaan (1) dapat diperoleh:, dan. Sehingga matriks karakteristik dan didapatkan akar-akar. Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat dihitung menggunakan persamaan (5.2), (5.5), (5.6) dan (5.8) sehingga diperoleh: ; ;. Dalam kasus ini yang dianalisis adalah 3 variabel dan 2 grup. Dari persamaan (5.4) diperoleh statistik F (hanya untuk Wilks Lamda karena uji yang lain tabel nilai kritis tidak diketahui). Dengan diperoleh. Jadi nilai ditolak karena dari yaitu. Hal ini menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. 262 ANOVA dan MANOVA

284 Kemudian mengukur pengaruh interaksi Kelas dengan Rata-rata respon mahasiswa tersebut menggunakan multivariat eta kuadrat sehingga diperoleh. Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara Kelas dengan Rata-rata respon mahasiswa terhadap perlakuan yang diberikan setiap minggunya. Gambar Grafik rata-rata respon mahasiswa pada Kelas A dan Kelas B Gambar 5.11 menunjukkan bahwa rata-rata respon mahasiswa yang diberikan pada 3 minggu tergantung pada perbedaan kelas. Pada kelas A, rata-rata respon mahasiswa semakin meningkat tetapi pada kelas B rata-rata respon mahasiswa meningkat dan mengalami penurunan lagi pada minggu ketiga. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 263

285 Tabel 5.5.k Hasil analisa perbandingan berpasangan minggu pertama sampai minggu ketiga Respon Mahasiswa p-value Analisa Minggu ke-1 dan ke-2 1 diterima Minggu ke-1 dan ke diterima Minggu ke-2 dan ke diterima Tabel 5.5.k menunjukkan semua perbandingan berpasangan antara dua kelas dan rata-rata respon mahasiswa tiga minggu dengan menggunakan interval konfidensi Bonferroni 95%. Dapat dilihat dari Tabel 5.5.k dengan = 5%, rata-rata respon mahasiswa di Kelas A dan Kelas B pada minggu pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05). Artinya tidak ada perbedaan rata-rata respon mahasiswa di minggu pertama sampai ketiga. Adapun sebagai kesimpulan kegiatan penelitian ini ditunjukkan sebagai berikut : One-wayRepeated Measures Pada kelas A Berdasarkan tes multivariat, ada perbedaan yang signifikan antara rata-rata respon mahasiswa pada minggu pertama sampai minggu ketiga. Tetapi varians dari minggu pertama, minggu kedua dan minggu ketiga tidak berbeda secara signifikan. Dari hasil parsial eta kuadrat menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan setiap minggunya. Dalam pengujian pairwise comparisons, respon minggu kedua dengan respon minggu ketiga berbeda secara signifikan sedangkan respon minggu pertama 264 ANOVA dan MANOVA

286 dengan minggu kedua dan respon minggu pertama dengan minggu ketiga tidak berbeda secara signifikan. Pada kelas B Berdasarkan tes within-subject effects, varians dari minggu pertama, minggu kedua dan minggu ketiga tidak berbeda secara signifikan. Dari hasil parsial eta kuadrat menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan setiap minggunya. Dalam pengujian pairwise comparisons, rata-rata respon mahasiswa minggu pertama, kedua dan ketiga juga tidak berbeda secara signifikan. Two-way Repeated Measures Berdasarkan uji yang dilakukan, dapat disimpulkan bahwa terdapat perbedaan respon Kelas A dengan Kelas B tetapi tidak ada perbedaan respon mahasiswa dari minggu pertama sampai minggu ketiga. Untuk interaksi Kelas dengan Rata-rata respon mahasiswa menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Pengujian Pairwise Comparisons yang dilakukan untuk dua kelas yang berbeda mengindikasikan tidak ada perbedaan antara respon mahasiswa di minggu pertama sampai ketiga. DAFTAR PUSTAKA Abbas N & Aslam M Are Certain Pain-Killers Equally Efficient? A Statiscal Study Through The Paired Comparison Models. Pakistan Journal of Statistics, Vol. 28(2), Carey, G Multivariate Analysis of Variance (MANOVA): I. Theory. Diakses tanggal 1 November 2013 pukul WIB dari ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 265

287 Ching A & Chang S Listening Strategies of L2 Learners With Varied Test Tasks. TESL Canada Journal, Vol. 25, No.2, Dittrich R, Francis B, Hatzinger R & Katzenbeisser W A Paired Comparison Approach for the Analysis of Sets of Likert-scale Responses. Statistical Modelling, Vol. 7(1), Field, A Discovering Statistics Using SPSS. (3thed.). India : Sage. Field, A Discovering Statistics Repeated Measures ANOVA. Diakses tanggal 29 Oktober 2013 dari www. Discoveringstatistics.com. Giri, N.C Multivariate Statistical Analysis. (2nded). New York : Marcel Dekker. Ho, R Handbook of Univariate and Multivariate Data Analysis and Interpretation with SPSS. New York: Chapman & Hall/CRC Taylor & Francis Group. Johnson RA & Wichern DW Applied Multivariate Statistical Analysis,6th ed. Prentice Hall. New Jersey. Mansyur Pengembangan Model Assessment for Learning pada Pembelajaran Matematika di SMP. Jurnal Penelitian dan Evaluasi Pendidikan, Vol. 15, No. 1, Maxwell, S.E. & Delaney, H.D , Designing Experiments And Analyzing Data A Model Comparison Perspective. (2nded.). London: Lawrence Erlbaum Associates. Patel, S. & Bhavsar, C.D Analysis of Pharmocokinetic Data by Wilk s Lamda (An Important Tool of Manova). International Journal of Pharmaceutical Science Invention, Vol. 2, Pritasari, N.F., Parhusip, H.A. & Susanto, B Analisis Respon Mahasiswa Kelas Listening Menggunakan Metode Paired Comparisons. Prosiding, Seminar Nasional Matematika VII yang diselenggarakan 266 ANOVA dan MANOVA

288 oleh Jurusan Matematika FMIPA dan Prodi Pendidikan Matematika Program Pascasarjana UNNES tanggal 26 Oktober Semarang: Universitas Negeri Semarang. Rahandika, A The Students Perceptions toward Different Task Types in Public Listening Class. Skripsi. Program Studi Pendidikan Bahasa Inggris, Fakultas Bahasa dan Sastra, Universitas Kristen Satya Wacana. Salatiga. Sarwono J Prosedur-Prosedur Populer Statistik Untuk Mempermudah Riset Skripsi. Jakarta: Elex Media Komputindo. Stevens, J.P Applied Multivariate Statistics For The Social Sciences. (5thed.). New York : Routledge Taylor & Francis Group. Xiao-lei D & Tajaroensuk S Effects of the Pre-Task Planning Mode on the Listening Comprehensions of Chinese EFL Learners. Sino-US English Teaching, Vol. 9, No.6, Pustaka WEB Web 1: Diakses tanggal 30 Oktober 2013 pukul WIB. Web 2: &cd=6&cad=rja&ved=0cfqqfjaf&url=http%3a%2f%2fwww.c hsbs.cmich.edu%2fk_han%2fpsy613%2fmanova1.doc&ei=4tz5u vzpoqzwiqfhocwaw&usg=afqjcnfocck9hrrvqczmgt0tsqx6al8z5q&sig 2=w5KyDbLxz-Ma-MqVVyntzA&bvm=bv ,d.aGc. Diakses tanggal 6 November 2013 pukul WIB. Web 3: Diakses tanggal 7 November 2013 pukul WIB. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 267

289 Web 4: Diakses tanggal 7 November 2013 pukul WIB. Web1: hod.htm.diakses tanggal 1 Maret 2013 pukul WIB. Web 2: Diakses tanggal 30 Agustus 2013 pukul WIB. 268 ANOVA dan MANOVA

290 6 METODE DISKRIMINAN 6.1 Pendahuluan Metode diskriminan adalah teknik statistika untuk mengelompokkan grupgrup ke dalam kelompok-kelompok yang saling bebas berdasarkan sekelompok variabel bebas. Proses klasifikasi grup-grup tersebut merupakan salah satu analisis statistika yang diperlukan, jika ada beberapa kelompok grup kemudian ingin diketahui apakah kelompok-kelompok tersebut memang berbeda secara statistika. Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk suatu fungsi diskriminan. Apabila dimensi data sangat besar, maka analisis diskriminan dapat dilakukan dengan melakukan pengelompokan data terlebih dahulu (clustering) atau dengan melakukan pemilihan variabel dominan seperti pada bab sebelum ini. 6.2 Dasar-Dasar Metode Diskriminan Pada tulisan ini akan ditekankan pada pengklasifikasian data multivariat dalam 2 kelompok grup dengan nilai gabungan kovariansi sama yaitu. Sebutlah f1 ( x) menyatakan fungsi densitas untuk 1 dan f 2 ( x) untuk 2. Misalkan data di setiap sampel dalam variabel (6.1) ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 269

291 Sedangkan nilai rata-rata sampel dan dan kovariansi untuk masing masing yaitu berturut-turut. (6.2) Diasumsikan kedua grup tersebut mempunyai matriks kovariansi grup sama, maka matriks kovariansi sampel S1 dan S2 berasal dari 1 grup, maka dapat diperoleh kovariansi grup tersebut melalui persamaan berikut (Johnson dan Wichern, 1987): (6.3) n1 x1 x2 S1 S2 1 2 =n2= banyaknya pengamatan pada populasi 1 dan 2 = vektor rata-rata populasi pertama = vektor rata-rata populasi kedua = kovariansi populasi pertama = kovariansi populasi kedua = kelompok pertama = kelompok kedua Dengan mensubtitusi nilai untuk, untuk dari persamaan (6.2) pada persamaan (6.4) maka dapat diperoleh aturan klasifikasi. Suatu sampel x 0 dalam grup 1 jika dipenuhi jika (6.4) Jika persamaan (6.4) terpenuhi, maka x 0 (sampel) masuk dalam grup 1 sedangkan jika tidak terpenuhi maka x 0 (sampel) masuk dalam grup 2. Pada literatur tidak ditunjukkan bagaimana x 0 diambil. Akan tetapi pada Bab ini akan ditunjukkan sesuai dengan data. 270 METODE DISKRIMINAN

292 6.2.1 Metode Fisher untuk Mendiskriminasi Beberapa Populasi Dalam metode Fisher s Discriminant tidak mensyaratkan tegas data harus berdistribusi normal multivariat, namun diasumsikan populasi memiliki matriks kovarian yang relatif sama. Secara ringkas pembentukan discriminant untuk p variabel pengamatan dari g populasi menurut Fisher adalah sebagai berikut: 1. Menduga kelompok populasi awal (ada sebanyak g populasi) 2. Merata-rata setiap variabel pembeda pada masing-masing populasi x1; x2 ; x3 ;...; xg 3. Merata-rata seluruh populasi ( x ) 4. Menyusun B yang diberikan sebagai berikut: k B xi x xi x T i 1 5. Membentuk W yang diberikan: W xij xi xij xi ' n1 n2... nk S pooled g ni i 1 j 1 dimana (n 1) S1 (n2 1)S 2... (nk 1)S k S pooled 1 (n1 1) (n2 1)... (nk 1) ni = banyak pengamatan pada populasi ke-i Si = kovariansi populasi ke-i i =1,2,3,..,g 6. Mencari nilai eigen dari W-1B sehingga didapat 1, 2,..., k Banyaknya variabel pengamatan = 1,2,3,...,k 7. Dari nilai eigen pada langkah 5 dapat diketahui vektor eigen sebanyak k, sebutlah ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 271

293 A [a1 a2... ak ]T 8. Vektor eigen inilah yang menjadi koefisien dari Fisher s Discriminant yang bentuknya mirip dengan fungsi regeresi. Fisher s Discriminant-nya adalah yˆ1 aˆ1 ' x yˆ 2 aˆ 2 ' x yˆ k aˆ k ' x Untuk x = vektor nilai tiap variabel pengamatan 9. Mencari nilai eigen dari W-1B sehingga didapat 1, 2,..., k Banyaknya variabel pengamatan= 1,2,3,...,k 10. Dari nilai eigen pada langkah 5 dapat diketahui vektor eigen sebanyak k A [a1 a2... ak ]T Vektor eigen inilah yang menjadi koefisien dari Fisher s Discriminant yang bentuknya mirip dengan fungsi regeresi. Fisher s Discriminant-nya adalah yˆ1 aˆ1 ' x yˆ 2 aˆ 2 ' x yˆ k aˆ k ' x Untuk x = vektor nilai tiap variabel pengamatan 6.3 Kegiatan Penelitian Kegiatan 1. Analisa data kemiskinan Pada bagian ini merupakan hasil penelitian (Parhusip dan Pertiwi, 2014) yang menunjukkan penerapan metode Diskriminasi dan Klasifikasi, 272 METODE DISKRIMINAN

294 khususnya aturan minimum estimasi dan metode diskriminan Fisher untuk mengelompokkan provinsi menurut tingkat kemiskinan. Data yang digunakan adalah jumlah penduduk miskin di kota dan desa pada tiap provinsi di Indonesia tahun Data tersebut merupakan data sekunder yang diunduh dari website resmi Badan Pusat Statistik (BPS). Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data jumlah penduduk miskin dan garis kemiskinan di kota dan desa seluruh provinsi Indonesia tahun 2013 yang telah dipublikasikan oleh Badan Pusat Statistik (BPS) dan dapat diperoleh melalui homepage Variabel Penelitian Variabel yang dipakai adalah jumlah penduduk miskin di kota dan desa serta garis kemiskinan di kota dan desa, di seluruh provinsi di Indonesia. Data mula-mula diuji normalitasnya secara multivariat, kemudian diuji kesamaan matriks kovariannya. Setelah asumsi normal multivariat dan setiap populasi memiliki matriks kovarian yang sama dipenuhi, maka dapat digunakan metode klasifikasi dengan aturan minimum ECM dengan dua populasi normal selanjutnya metode fisher untuk beberapa populasi. Pemantapan dilakukan dengan simulasi kemudian menerapkan metode Fisher untuk dua populasi. (a) Klasifikasi dengan Dua Populasi Normal Multivariat Klasifikasi ini bertujuan untuk mengelompokkan provinsi yang tergolong desa dengan provinsi yang tergolong kota untuk mengetahui cara yang tepat atau langkah yang dapat diambil pemerintah untuk memberantas kemiskinan. Pengamatan awal pada data kemiskinan tahun 2013 pada bulan maret diberikan oleh Tabel 6.1. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 273

295 (b) Menyelidiki Kenormalan Data secara Multivariat Sebelum mengklasifikasikan data, terlebih dahulu kita perlu menyelidiki kenormalan data. Dengan menggunakan uji Chi-square kenormalan data secara multivariat ditunjukkan kenormalan data oleh Gambar 6.1. Tabel 6.1. Data jumlah penduduk miskin dan garis kemiskinan di kota dan desa di seluruh provinsi di Indonesia pada bulan maret 2013 Kota Desa Jml penduduk miskin Garis kemiskinan Jml penduduk miskin Garis kemiskinan 156,37 654,04 119,53 146, ,77 91,91 233,01 22,73 99,67 354, ,21 315, ,46 363,8 96,35 391,4 113,57 71,75 33,23 52,05 90,42 63,81 59,79 147,97 31,72 17,84 27,14 48,75 9,19 14,21 51, ,34 685,12 287,94 322,98 166,15 725,6 235,44 930,05 46,49 26, , ,74 234, ,8 292,45 66,17 439,45 879,99 297,26 103,72 129,69 147,54 120,59 345,63 639,69 269,99 174,75 126,86 273,09 74,25 210,06 965, Aceh Sumut Sumbar Riau Jambi Sumatera Selatan Bengkulu Lampung Bangka Belitung Kepulauan Riau DKI Jakarta Jawa Barat Jawa Tengah DI Yogyakarta JawaTimur Banten Bali NTB NTT Kalbar Kalteng Kalsel Kaltim Sulut Sulteng Sulsel Sultra Gorontalo Sulbar Maluku Maluku Utara Papua Barat Papua 274 METODE DISKRIMINAN

296 Gambar 6.1 Sumbu horisontal menunjukkan indeks data (provinsi), sumbu vertikal menunjukkan quantile distribusi chisquare dengan signifikansi 5% Dari Gambar 6.1 dapat diketahui bahwa data yang diluar batas normal ada 3, namun data ini masih dianggap normal karena tingkat kenormalannya diatas 50%, yaitu 87,88%. Untuk itu tidak perlu transformasi untuk menormalkan data, langsung pada tahap kedua yaitu mengelompokkan data dengan metode diskriminan. (c) Mendiskriminasi Data dengan Aturan Minimum Estimasi untuk dua Populasi Normal Didefinisikan n1 =n2= banyak provinsi yang diamati x1 = vektor rata-rata dari jumlah penduduk miskin dan garis kemiskinan di kota x 2 = vektor rata-rata dari jumlah penduduk miskin dan garis kemiskinan di desa S1 = kovariansi antara jumlah penduduk miskin dengan garis kemiskinan di kota S2 = kovariansi antara jumlah penduduk miskin dengan garis kemiskinan di kota 1 = kelompok provinsi dengan kategori miskin kota ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 275

297 2 = kelompok provinsi dengan kategori miskin desa Dipilih x0, yang merupakan vektor kolom dari rata-rata matriks penduduk miskin dengan garis kemiskinan di kota serta matriks penduduk miskin dengan garis kemiskinan di desa. Penentuan batas pengelompokan menurut model di atas diterjemahkan ke dalam program MATLAB kemudian divisualisasikan dengan histogram sehingga dapat diketahui bahwa provinsi yang tergolong miskin kota hanya Jawa Timur dan Jawa Tengah. Hasil plot x0 dapat dilihat dari Gambar 6.2. Gambar Hasil plot x0 menurut pertidaksamaan (6.4): sumbu vertikal menunjuk- kan nilai ruas kiri dari pertidaksamaan (6.4), sumbu horisontal menunjukkan indeks x0 Dari hasil plot x0 juga dapat diketahui bahwa hanya Jawa Timur (indeks ke-15) dan Jawa Tengah (indeks ke-13) yang tergolong miskin kota ( 1 ) yaitu yang memenuhi batas pada petidaksamaan (6.4). Batas pertidaksamaan (6.4) ditunjukkan oleh garis pada Gambar. Tentu saja hasil di atas masih kurang memberikan informasi, sehingga untuk mendapatkan hasil yang lebih spesifik lagi digunakan 276 METODE DISKRIMINAN

298 metode lain yaitu Fisher s Discriminant untuk beberapa populasi dengan mengamati jumlah penduduk miskin dan garis kemiskinan di kota dan di desa secara terpisah. (d) Mendiskriminasi Data dengan Metode Fisher s Discriminant Untuk dugaan awalnya seluruh provinsi di Indonesia dibagi ke dalam tiga kelompok provinsi berdasarkan tiga tingkat kemiskinan, yaitu: cukup miskin, miskin, dan sangat miskin. 1. Miskin : Aceh, Sumatra Utara,Sumatra Barat,Riau,Jambi, Sumatra Selatan, Bengkulu, Lampung, Bangka Belitung, Kepulauan Riau, DKI Jakarta 2. Cukup Miskin: Jawa Barat, Jawa Tengah, DIY, Jawa Timur, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan 3. Sangat Miskin: Kalimantan Timur, Sulawesi Utara, Sulawesi Selatan, Sulawesi Tenggara,Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat, Papua Pengelompokan kemiskinan Provinsi di kota akan dipisahkan pengamatannya dengan pengelompokan kemiskinan Provinsi di desa, dengan tujuan untuk mempertajam analisis. Penerapan Metode Fisher s Discriminant untuk mengelompokkan Provinsi Berdasarkan Tingkat Kemiskinan di Kota Variabel pengamatan (p) sama dengan kasus sebelumnya yaitu Jumlah Penduduk Miskin dan Garis Kemiskinan, sehingga p 2 variabel dari tiga populasi (g=3). Dengan mengasumsikan bahwa populasi mem- ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 277

299 punyai matriks kovarian yang lazim, berlakulah Fisher s Discriminant. Data menjadi Tabel 6.2. Tabel 6.2. Data Pengamatan Tingkat Kemiskinan di Kota N Miskin : 1 ( n ,37 654,04 119,53 146, ,77 91,91 233,01 22,73 99,67 354,19 Cukup Miskin: 2 11) ( n ) ,21 315, ,46 363,8 96,35 391,4 113,57 71,75 33,23 52, Sangat Miskin: 3 ( n3 11 ) 90,42 63,81 59,79 147,97 31,72 17,84 27,14 48,75 9,19 14,21 51, Kemudian menghitung rata-rata tiap kolom pada matriks X, sehingga didapat: x1 ; x2 ; x yang kemudian dapat dihitung x ' x x x x B i i ; i 1 3 n ' W xij xi xij xi (n1 n2 n3 3)S pooled i 1 j W METODE DISKRIMINAN WB

300 Untuk menyelesaikan s min( g 1, p) min( 2,2) 2 merupakan nilai eigen yang tidak nol dari W-1B, maka W 1B I Sehingga didapat nilai eigen 1 dan 2, yang kemudian digunakan untuk menghitung vektor eigen a 1 dan a 2. Didapat dua discriminant sebagai berikut: x yˆ1 aˆ1 ' x [ ] x x2 x2 x yˆ 2 aˆ 2 ' x [ ] x x2 x2 Plot data yang sudah dimasukkan ke discriminant dapat dilihat pada Gambar 6.3 Gambar 6.3. Hasil plot data kemiskinan di kota dengan perhitungan Fisher s Discri i a t: sumbu horisontal menunjukkan nilai y1, sumbu vertikal menunjukkan nilai y2 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 279

301 a. Penerapan Metode Fisher s Discriminant untuk mengelompokkan Provinsi Berdasarkan Tingkat Kemiskinan di Desa Data Kemiskinan di Desa diberikan oleh Tabel 6.3. Tabel 6.3. Data Pengamatan Tingkat Kemiskinan di Desa Miskin : 1 N ( n ,34 685,12 287,94 322,98 166,15 725,6 235,44 930,05 46,49 26, ) Cukup Miskin: 2 ( n2 1796, ,74 234, ,8 292,45 66,17 439,45 879,99 297,26 103,72 129,69 11 ) Sangat Miskin: 3 ( n3 11 ) 147,54 120,59 345,63 639,69 269,99 174,75 126,86 273,09 74,25 210,06 965, Dengan cara yang sama pada bahasan sebelumnya didapat hasil substitusi data kemiskinan di desa ke diskriminant yang telah dihitung, dengan plot hasil pada Gambar 6.4. Gambar 6.4. Hasil plot data kemiskinan di desa dengan perhitungan Fisher s Discriminant: sumbu horisontal menunjukkan nilai y1, sumbu vertikal menunjukkan nilai y2 280 METODE DISKRIMINAN

302 Hasil pengamatan ini masih kurang memberikan pengelompokkan yang jelas, diduga kemiskinan di Indonesia merata maka dari itu pada bahasan selanjutnya akan dibuat simulasi untuk menguji dan membuktikan dugaan, apakah memang tingkat kemiskinan di Indonesia merata. Hasil ini juga membuktikan teori tentang kesamaan kovarianya yang harus dipenuhi karena sebelumnya belum diuji kesamaan kovarianya. e. Simulasi Mendiskriminasi Data Kemiskinan dengan Membangkitkan Bilangan Random Dari pembahasan sebelumnya diduga sebagian besar provinsi memiliki tingkat kemiskinan yang sama. Untuk itu dibangkitkan bilangan random berdistribusi normal multivariat dengan mean dan variansi yang lebih kecil dari data asli, yang berperan sebagai si Kaya dalam simulasi ini. Dengan menggunakan cara yang sama yaitu Fisher s Discriminant, diperoleh hasil plot data asli dengan si kaya sebagai berikut: a. Pada Kota Gambar 6.5. plot data asli dan data simulasi ( si Kaya ) di kota ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 281

303 b. Pada Desa Gambar 6.6 plot data asli dan data simulasi ( si Kaya ) di desa Dari plot ditunjukkan pengelompokan yang jelas antara data asli dengan data simulasi yang dianggap kaya, jadi dapat disimpulkan bahwa provinsi-provinsi di Indonesia memiliki tingkat kemiskinan yang sama. Perlu diselidiki lebih dalam keakuratan dan ketelitian perhitunganya. Karena berurusan dengan membangkitkan bilangan random hasil bisa berubah-ubah, namun tidak akan terlalu jauh. Dapat juga diteliti lebih dalam untuk permasalahan misklasifikasi dari pengelompokan provinsi yang sudah dibahas. Jadi diketahui bahwa kemiskinan di Indonesia cukup merata dan untuk pendiskriminasian yang lebih tajam peru diuji terlebih dahulu kesamaan matriks kovarianya. Provinsi Jawa Timur dan Jawa Tengah merupakan dua provinsi yang tingkat kemiskinannya lebih baik dibanding provinsi lainnya. Provinsi yang harus mendapat perlakuan lebih dari pemerintah adalah DKI Jakarta karena kemiskinan di kotanya paling buruk, mengingat DKI Jakarta tidak memiliki desa. Hal ini sangat memprihatinkan mengingat Jakarta merupakan Ibu Kota Negara, pusat pemerintahanamun 282 METODE DISKRIMINAN

304 memiliki tingkat kemiskinan paling tinggi. Untuk provinsi- provinsi lain memiliki tingkat kemiskinan yang relatif sama. Perlu analisis lebih dalam untuk menguji kesamaan matriks kovariansi. Untuk penelitian lebih lanjut jika data memiliki perbedaan kovariansi, perlu dicoba metode lain yang lebih cocok dan diperlukan pula evaluasi pada fungsi klasifikasinya. Diperlukan data yang lebih terperinci supaya pendiskriminasian lebih tegas dan jelas, misalnya data per-provinsi atau perkota dengan menambah field data yang diamati. Semoga dengan tulisan ini muncul tulisan-tulisan lain yang memberikan kontribusinya untuk membantu menyelesaikan permasalahan kemiskinan. Kegiatan 2. Analisa data peternakan Jawa Tengah adalah sebuah provinsi di Indonesia yang terletak di bagian tengah Pulau Jawa dimana setiap kabupaten dan kotanya memiliki jenis peternakan hewan yang berbeda-beda. Di Jawa Tengah juga dibagi dengan dua golongan yaitu peternakan hewan besar seperti Sapi Potong, Sapi Perah, kerbau, Kuda, Kambing, Domba dan Babi. Sedangkan, perternakan kecil seperti Kelinci, Ayam Buras, Ayam Ras Layer, Ayam Ras Broiler, Itik, Burung Puyuh, Entog dan Angsa. Dari data populasi ternak Jawa Tengah tahun 2010 terdapat 36 kabupaten dan kota yang memiliki jumlah populasi ternak yang berbeda-beda. Dari data tersebut dapat diklasifikasikan kabupaten dan kota penghasil ternak besar serta kabupaten dan kota penghasil ternak kecil dengan menggunakan Analisis Diskriminan dengan 2 Variabel Acak dan PCA. Sehingga dari hasil klasfikasi ini setiap daerah dapat mengetahui potensi peternakan yang ada didalam daerahnya dan dapat memaksimalkan populasi ternak yang menonjol tersebut. Data akan dipisahkan menjadi 2 grup dan misalkan ruang sampel ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 283

305 adalah suatu populasi P. Sebutlah grup sebagai ternak besar dan sebagai grup ternak kecil. Data yang telah diperoleh telah dicek kenormalan menggunakan matlab 7, sehingga diperoleh prosentase yang mengindikasikan bahwa data yang diperoleh adalah data yang normal. Sehingga langkah selanjutnya yaitu membagi data menjadi 2 kelompok data berdasarkan ternak besar ( ) yang terdiri dari 7 variabel dan ternak kecil ( ) yang terdiri dari 8 variabel Gambar 6.7. Grafik Cek Normal untuk data peternakan tiap kabupaten di Jawa Tengah Dengan menggunakan matlab kita mendapat rata-rata data yang telah di non dimensi kan sehingga untuk kelompok ternak besar adalah mean ( ) = = [ rata-rata data kelompok ternak kecil adalah mean ( ] dan ) = = [ ]. Dengan data yang ada lebih dulu dibuat takberdimensi, agar dalam melakukan perhitungan selanjutnya diharapkan lebih mudah. Ada beberapa cara yang dapat digunakan dalam melakukannya, salah satu cara 284 METODE DISKRIMINAN

306 yaitu dengan membagi masing-masing data pada tiap-tiap kolom dengan maksimal nilai data per kolomnya. Sehingga didapat data baru yang sudah bebas dimensi. Dicari matriks kovarians masing-masing grup data, diperoleh kovariansi matriks ternak besar adalah S Kovariansi ternak kecil: S Setelah didapat matriks kovarians untuk kedua grup data, dicari nilai eigen untuk masing-masing grup yang kemudian digunakan untuk mencari vektor eigen masing-masing grup data. Oleh karena itu perlu ditentukan satu nilai lambda yang diyakini mewakili setiap nilai eigen pada masingmasing grup data yakni maksimal nilai eigen tiap kelompok. Vektor eigen ternak besar Vektor eigen ternak kecil ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 285

307 Kemudian dicari koefisien korelasi diantara masing-masing grup data yang akan dipilih 3 data yang paling besar dari masing-masing kelompok yang dianggap menjadi data yang mewakili masing-masing kelompok tersebut, yaitu untuk ternak besar , dan untuk ternak kecil Data ini kemudian akan dipakai untuk mencari Spooled dengan terlebih dahulu mencari matriks kovarians masing-masing kelompok data. Spooled = Diasumsikan dalam kasus ini data. Dengan adalah rata-rata antara kelompok yang ada dicari hasil menggunakan persamaan (6.4) Apabila persamaan (6.4) dipenuhi maka kabupaten/kota tersebut termasuk ternak besar, apabila tidak memenuhi maka kabupaten/kota penghasil termasuk ternak kecil. Contoh Kabupaten Cilacap Dengan membagi masing-masing data pada tiap-tiap kolom dengan maksimal nilai data per kolomnya didapat data sebagai berikut: Ternak besar = Ternak kecil = dengan mencari rata-rata dari ternak besar dan Kemudian dapat dicari kecil berturut-turut = [( )/2 ( )/2 = [ ] 286 METODE DISKRIMINAN ( )/2]

308 Dengan mensubstitusi nilai untuk Kabupaten Cilacap pada persamaan (6.4) diperoleh hasil Karena hasilnya kurang dari 0 maka kabupaten Cilacap adalah kabupaten penghasil ternak kecil. Untuk semua data, hasil persamaan (6.4) ditunjukkan pada Tabel 6.4. Tabel 6.4. Tabel substitusi nilai Kab. Cilacap masing-masing Kab/Kota pada persamaan (6.4) Kab. Banyumas Kab. Purbalingga Kab. Banjarnegara Kab. Kebumen Kab. Purworejo Kab. Wonosobo Kab. Magelang Kab. Boyolali Kab. Klaten Kab. Sukoharjo Kab. Wonogiri Kab. Karanganyar Kab. Sragen Kab. Grobogan Kab. Blora Kab. Rembang Kab. Pati Kab. Kudus Kab. Jepara Kab. Demak Kab. Semarang Kab. Temanggung Kab. Kendal Kab. Batang Kab. Pekalongan Kab. Pemalang ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 287

309 Kab. Tegal Kab. Brebes Kota Magelang Kota Surakarta Kota Salatiga Kota Semarang Kota Pekalongan Kota Tegal Dari Tabel 6.4 dapat dilihat bahwa koefisien korelasi ada yang lebih dari satu disebabkan oleh karena adanya penggunaan metode numerik untuk menghitung nilai eigen dan vektor eigen. Gambar 6.8. Grafik Karakteristik Peternakan Kab/Kota di Jawa Tengah Dari Gambar 6.8 dapat dilihat bahwa ada beberapa Kabupaten yang tidak signifikan ke peternakan besar atau ke peternakan kecil seperti Kab. Cilacap, Kab. Banyumas, Kab. Purworejo, Kab. Wonosobo, Kab. Boyolali, Kab. Klaten, Kab. Jepara, Kab. Batang, Kab. Pemalang dan Kab.Tegal dengan batasan Dari grafik dapat dilihat bahwa penghasil ternak besar terbanyak adalah Kab. Wonogiri (1.934) dan setelah dilihat datanya ternyata memang benar bahwa Kab.Wonogiri memiliki jumlah popoulasi ternak besar terbanyak di Jawa Tengah pada tahun 2010 sebesar 288 METODE DISKRIMINAN

310 Menurut Gambar 6.8, penghasil ternak kecil terbanyak adalah Kab. Kendal ( ) sebesar Tabel 6.5 Pengelompokkan Kab/Kota penghasil ternak besar atau ternak kecil Kabupaten/Kota penghasil ternak besar 1. Kab. Purbalingga 2. Kab. Banjarnegara 3. Kab. Kebumen 4. Kab. Wonogiri 5. Kab. Sragen 6. Kab. Grobogan 7. Kab. Blora 8. Kab. Pati 9. Kab. Kudus 10. Kab. Semarang Kabupaten/Kota penghasil ternak kecil 1. Kab. Magelang 2. Kab. Sukoharjo 3. Kab. Karanganyar 4. Kab. Rembang 5. Kab. Demak 6. Kab. Temanggung 7. Kab. Kendal 8. Kab. Pekalongan 9. Kab. Brebes 10. Kota Magelang 11. Kota Surakarta 12. Kota Salatiga 13. Kota Semarang 14. Kota Pekalongan 15. Kota Tegal Dapat disimpulkan bahwa yang termasuk kota/kab penghasil ternak besar adalah Kab. Purbalingga, Kab. Banjarnegara, Kab. Kebumen, Kab. Wonogiri, Kab. Sragen, Kab. Grobogan, Kab. Blora, Kab. Pati, Kab. Kudus dan Kab. Semarang dengan Kab.Wonogiri sebagai penghasil ternak besar terbanyak. Sedangkan penghasil ternak kecil adalah Kab. Magelang, Kab. Sukoharjo, Kab. Karanganyar, Kab. Rembang, Kab. Demak, Kab. Temanggung, Kab. Kendal, Kab. Pekalongan, Kab. Brebes, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang, Kota Pekalongan dan Kota Tegal dengan Kab.Kendal sebagai penghasil ternak kecil terbanyak. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 289

311 Untuk penelitian selanjutnya kita dapat menggunakan metode lain untuk mencari x 0 yang mungkin dapat lebih mendekati dengan menggunakan cara manual. DAFTAR PUSTAKA Johnson, R. A. dan Winchern D. W Applied Multivariate Statistical Analysis. Prentice Hall, Englewood Cliffs. New Jersey. Parhusip, H.A dan Pertiwi, A.T., Studi Tingkat Kemiskinan di Indonesia dengan Analisa Diskriminan ECM dan Metode Fisher, dalam proses Prosiding Seminar Nasional Matematika dan Pendidikan Matematika, Tuban, 24 Mei 2014, Universitas PGRI Ronggolawe, Tuban. 290 METODE DISKRIMINAN

312 7 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT 7.1 Pendahuluan Pada Bab 3 telah dipelajari regresi klasik dan regresi GSTAR berkaitan dengan penelitian yang telah dilakukan (Parhusip dan Winarso, 2014). Dari hasil ditunjukkan bahwa pendekatan klasik GSTAR tidak tepat untuk data seperti curah hujan, lahan kritis, dan produksi panen padi. Untuk beberapa data yang saling terkait dengan masa sebelumnya maka pendekatan GSTAR standard cukup baik yaitu GSTAR merupakan kombinasi linear dari data waktu sebelumya dan pada lokasi persekitarannya. Data tersebut misalnya fluktuasi saham, perolahan minyak bumi dari suatu reservoir tergantung dari reservoir sekitarnya. Model GSTAR yang standard diulang di sini, yaitu 0 Z 1 (t 1) Z 1 (t ) 10 0 Z (t ) 0 0 Z 2 (t 1) w Z 3 (t 1) w31 Z 3 (t ) 0 w12 0 w32 w13 Z 1 (t 1) e1 (t ) w23 Z 2 (t 1) e 2 (t ) 0 Z 3 (t 1) e 3 (t ) (7.1) Persamaan (7.1) menjelaskan bahwa kuantitas Z 1 (t ) tergantung dari Z 2 (t 1) dan Z 3 (t 1). Artinya kuantitas ini regresi terhadap dirinya sendiri (autoregressive) pada waktu sebelumnya. Akan tetapi pendekatan ini tidak selalu tepat. Pada Bab ini penulis menunjukkan beberapa contoh modifikasi untuk data yang sama yang digunakan pada Bab 3 atau diambil dari Parhusip dan Winarso (2014). ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 291

313 7.2 Modifikasi GSTAR Model (7.1) dimodifikasi untuk Z1 (t ) dalam bentuk untuk Z1 (t ) 0 1Z1 (t 1) 2 Z 2 (t ) 2 Z 3 (t ). (7.2) Karena ada 3 lokasi maka secara sama, model untuk Z j (t ), j=1,2,3 0 Z 1 (t 1) 0 w12 Z 1 (t ) 10 0 Z (t ) 0 0 Z 2 (t 1) w Z 3 (t ) Z 3 (t 1) w31 w32 w13 Z 1 (t ) e1 (t ) w23 Z 2 (t ) e2 (t ). 0 Z 3 (t ) e3 (t ) (7.3) Contoh 7.1. Gunakan model 7.3 untuk data curah hujan dari kecamatan Selo, Ampel dan Cepogo yang ditunjukkan pada Gambar 7.1. Hasil ini memberikan kesalahan yang lebih kecil sebagaimana ditunjukkan pada Gambar 7.1. Jika mengganti model 7.2 pada ruas kanan dengan Z 2 (t 1), Z 3 (t 1) ternyata memberikan kesalahan/error lebih besar yaitu sekitar 80%. Sebaliknya dengan model (7.3) maka error terjadi pada sekitar 10 3 %. Demikian pula jika hal ini juga dilakukan untuk Z 2 (t ) and Z 3 (t ), maka diperoleh error yang serupa. Perhatikan pula bahwa Z k (t ) dan Z k (t 1) tidak beritnteraksi secara linear secara signifikan karena 1 mendekati 0 untuk semua lokasi. Jadi kita dapat menyimpulkan bahwa ketiga variabel berinteraksi pada waktu yang bersamaan. Oleh karena itu kita dapat meringkas model persamaan (7.2) menjadi Z 1 (t ) 0 2 Z 2 (t ) 2 Z 3 (t ). (7.4) Demikian pula model ini juga dapat diimplementasikan pada data yang memuat luas lahan dengn kekritisan di Boyolali sebagaimana akan ditunjukkan selanjutnya. 292 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

314 Contoh 7.2 Gunakan data lahan kritis tiap kritis untuk 3 lokasi di atas (Selo, Ampel Cepogo) dalam memodelkan besarnya lahan kritis tiap lokasi. Gambar 7.1. Pendekatan curah hujan dengan persamaan (7.2) pada Selo Horizontal : indeks, Vertikal: banyaknya curah (tak berdimensi, karena data sudah distasionerisasi) Lahan kritis pada ketiga lokasi juga dimodelkan dengan persamaan (7.3). Ternyata berturut =turut error adalah hanya %, %, % untuk Selo, Ampel dan Cepogo. Gambar 7.2 mengilustrasikan contoh pendekatan GSTAR untuk banyaknya curah hujan di Selo. Gambar 7.2. Regresi GSTAR untuk curah hujan di Selo. Data (*,o,dan model (*) ditunjukkan dengan garis ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 293

315 Koefisien bobot untuk setiap persamaan linear pada persamaan (7.3) ditunjukkan pada Tabel 7.1. Tabel 7.1. Parameter pada model modifikasi GSTAR (persamaan 7.2) untuk data luas lahan kritis pada Selo, Ampel dan Cepogo Selo Nilai parameter Ampel Cepogo Error (%) Selo Ampel Cepogo Untuk produktivitas padi, model yang sudah dimodifikasi tidak dapat digunakan karena error yang cukup besar berturut-turut untuk %, %, % untuk Selo, Ampel dan Cepogo. Salah satu hasil ditunjukkan pada Gambar 7.3. Oleh karena itu GSTAR harus dimodifikasi lagi. Gambar 7.3. Pendekatan dan data hasil produksi padi di Selo sebagai model produksi padi yang tergantung produksi padi di Selo pada waktu sebelumnya, dan produksi padi dari Ampel dan Cepogo Contoh 7.3 Area lahan kritis dianggap bergantung pada banyaknya curah hujan disekitarnya juga area lahan kritis sekitarnya. Z 1 (t ) 0 2 Z 2 (t ) 2 Z 3 (t ) 3Y1 (t ) 4 Y2 (t ) 5 Y3 (t ) dimana 294 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT (7.5)

316 Z 1 (t ) : area lahan kritis lokasi ke-1 pada waktu t, Z 2 (t ) : area lahan kritis lokasi ke-2 pada waktu t, Z 3 (t ) : area lahan kritis dari lokasi ke-3 pada waktu t, Y1 (t ) : banyaknya curah hujan pada lokasi ke-1 pada waktu t, Y2 (t ) : banyaknya curah hujan pada lokasi ke-2 pada waktu t, Y3 (t ) : banyaknya curah hujan pada lokasi ke-3 pada waktu t. Model (7.5) memberikan error % dengan nilai parameter adalah T. Dari sisi aljabar linear, det X ' X mendekati 0 yang artinya matriks mendekati singular. Karena error cukup kecil, kita dapat membuat pendekatan model persamaan (7.5) untuk lokasi yang lain (Ampel dan Cepogo). Jadi model persamaan (7.5) dapat ditulis dalam bentuk umum: Z 1 (t ) Y1 (t ) e1 (t ) Z 1 (t ) Z (t ) Z 2 (t ) Y2 (t ) e2 (t ) Z 3 (t ) Y3 (t ) e3 (t ) Z 3 (t ) 0 (7.6) Vektor pertama pada ruas kanan menyatakan parameter konstan pada regresi. Vektor kedua mengilustrasikan kuantitas yang sama (missal lahan kritis) dari 2 lokasi sekitarnya. Sedangkan vektor ketiga menyatakan kuantitas yang lain (missal curah hujan). Jika dibandingkan dengan GTAR yang standard, model GSTAR dari persamaan (7.6) lebih valid. Contoh 7.4 Produksi padi dengan modifikasi GSTAR Modifikasi pertama Model persamaan (7.6) menggunakan juga dapat digunakan untuk memodelkan produksi padi. Hasil modifikasi ditunjukkan pada Tabel 7.2. Demikian pula untuk area kritis dapat dimodelkan dan hasil parameter ditunjukkan pada Tabel 7.3. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 295

317 Tabel 7.2. Model modifikasi GSTAR untuk banyaknya produksi padi Selo Parameters Ampel Cepogo Error (%) Selo Ampel Cepogo Tabel 7.3 Parameter untuk model modifikasi GSTAR untuk produksi padi yang tergantung pada area lahan kritis Parameters Selo Ampel Cepogo Error (%) Selo Ampel Cepogo Jadi sistem persamaan linear untuk ketiga lokasi dengan parameter pada Tabel 7.3 adalah 0 0 Z 1 (t ) Z (t ) Z 3 (t ) Z 1 (t ) Z 2 (t ) 0 Z 3 (t ) Y1 (t ) Y2 (t ) Y3 (t ) Perhatikan bahwa GSTAR yang standard menggunakan kombinasi linear dari data pada waktu sebelumnya. Sedangkan GSTAR yang dimodifikasi menggunakan data pada waktu yang sama dari 2 lokasi persekitarannya. Untuk selanjutnya kita dapat memodifikasi GSTAR dengan mengganggap bahwa padi yang dihasilkan pada lokasi Selo tergantung 296 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

318 dari hasil pada dari kedua lokasi persekitarannya pada waktu yang sama, lahan kritisnya dari ketiga lokasi pada waktu yang sama, curah hujan pada lokasi ketiganya pada waktu sebelumnya dan pada waktu yang sama. Hal ini ditunjukkan dalam model dalam bentuk Z 1 (t ) 10 Z (t ) 0 2 Z 3 (t ) Z 1 (t ) Y1 (t ) Z 2 (t ) Y2 (t ) Z 3 (t ) Y3 (t ) 0 W (t 1) W1 (t ) e1 (t ) W (t 1) W2 (t ) e2 (t ). (7.7) W (t 1) W3 (t ) e3 (t ) Model (7.7) lebih melibatkan aspek natural bahwa hasil panen tergantung pada karakteristik tanah (yaitu lahan kritis) dan banyaknya curah hujan. Akan tetapi dapat terjadi matriks untuk menentukan parameter singular sehingga kita juga masih dapat mereduksi model (7.7). Akan tetapi karena error yang diberikan model (7.7) hampir sama dengan model sebelumnya, maka model (7.7) masih bisa digunakan. Parameter pada persamaan (7.7) ditunjukkan pada Tabel 7.4. Tabel 7.4. Parameter dari produksi panen padi (tak berdimensi) yang dimodelkan dengan persamaan (7.7) Selo Parameter Ampel Cepogo Selo Error (%) Ampel Cepogo ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 297

319 Kita dapat menguji hasil parameter dengan program R (pembaca supaya mencoba). Hasil menunjukkan bahwa variabel padi dari kedua lokasi yang lain lebih kontribusi secara signifikan dengan toleransi 95% atau 0.05 pvalue. Hasil persamaan (7.7) untuk produksi padi pada Selo ditunjukkan pada Gambar 7.4. Gambar 7.4. Model GSTAR (disimbolkan -o ) dan data (disimbolkan * ) untuk produksi panen padi sebagai fungsi lahan kritis dan curah hujan pada waktu yang sama Untuk selanjutnya kita dapat melakukan optimasi untuk hasil panen padi. Artinya, bagaimana kita dapat membuat keputusan berapakah panen padi yang optimal untuk Selo, Ampel dan Cepogo. Hal ini ditunjukkan pada subbab selanjutnya. 7.3 Masalah optimasi padi dan modifikasi GSTAR Model (7.6) diasumsikan merupakan fungsi tujuan dengan kendala fungsi linear dari lokasi 2 lokasi disekitarnya. Jadi masalah optimasi menjadi min f (Z k ) dengan kendala g (Z i, Y1, Y2, Y3 ) b dimana k=indeks untuk menyatakan lolasi ke-k, dan i k 1,2,3 Masalah optimasi produksi padi di Selo dapat ditulis dengan koefisien dari Tabel LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

320 Z1 (t ) Z 2 (t ) Z 3 (t ) 1.043Y1 (t ) Y2 (t ) Y3 (t ) W1 (t ) W2 (t ) W3 (t ) (P.1) dengan kendala Z 2 (t ) Z 3 (t ) Y1(t ) Y2 (t ) Y3 (t ) W1(t ) W2 (t ) W3 (t ) max( Z 2 (t )) Z 2 (t ) Z 3 (t ) Y1 (t ) Y2 (t ) Y3 (t ) W1 (t ) 0.14W2 (t ) W3 (t ) max( Z 3 (t )) (P.2) (P.3) dimana tiap variabel pada ruas kanan dibatasi oleh minimum dan maksimum dari data. Untuk lokasi yang lain maka disain masalah optimasi dapat dilakukan dengan cara serupa. Kita tidak akan membahas secara detail bagian ini untuk sementara waktu karena ada modifikasi yang dapat dilakukan untuk mengurangi banyaknya variabel pada ruas kanan Modifikasi GSTAR untuk produksi padi Model optimasi di atas jika dikerjakan masih belum memberikan hasil optimal yang diharapkan, dapat pula karena mungkin tidak ada solusi. Hal ini dapat diuji dengan menyelidiki Hessian dari fungsi Lagrange yang dibentuk untuk problem (P.1)-(P.3). Untuk hal ini dipelajari dari teori optimasi (lihat Parhusip,2014, Bab 1). Pada paragraph selanjutnya akan ditunjukkan bagaimana model GSTAR kembali dimodifikasi. Misalkan luas lahan kritis dan curah hujan untuk masig-masing lokasi dimodelkan dalam bentuk Z 1 (t ) 0 2 Z 2 (t ) 2 Z 3 (t ). Kemudian banyaknya padi yang dipanen merupakan fungsi linear lahan kritis dan curah hujan. Jadi model GSTAR menjadi ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 299

321 Z 1 (t ) 0 2 Z 2 (t ) 2 Z 3 (t ) (model lahan kritis pada lokasi ke-1) (P.1) Y1 (t ) 0 1Y2 (t ) 2Y3 (t ) (model banyaknya curah hujan untuk pada ke-1) (P.2) P1 (t ) 0 1 P2 (t ) 2 P3 (t ) 3 Z 1 (t ) w1y1 (t ) (model banyaknya padi pada lokasi ke-1 ) (P.3) Jadi untuk 3 lokasi model modifikasi GSTAR untuk panen padi memuat 3 sistem persamaan linear yaitu Z 1 (t ) Z 1 (t ) 10 0 Z (t ) Z 2 (t ) Z 3 (t ) Z 3 (t ) Y1 (t ) Y1 (t ) 10 0 Y (t ) Y2 (t ) 20 2 Y3 (t ) Y3 (t ) (P.4) (P.5) P1 (t ) P1 (t ) 10 0 P (t ) P2 (t ) P3 (t ) P3 (t ) 0 0 Z 1 (t ) w Z 2 (t ) Z 3 (t ) w Y1 (t ) 0 Y2 (t ) w33 Y3 (t ) (P.6) Dibandingkan dengan model-model sebelumnya, model (P.6) memuat lebih sedikit variabel. Demikian pula untuk optimasi, model ini lebih menguntungkan. Kegiatan penelitian 7.1 Data yang digunakan terdiri data banyaknya padi, banyaknya curah hujan, dan banyaknya luas lahan kritis yang semuanya sudah distasionerkan dan tidak berdimensi. File data diberi nama berturut-turut adalah Padi.dat, Hujan.dat, dan Kritis.dat. 300 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

322 Tahap 1. Loading data sebagai berikut clear close all load 'Padi.dat'% ini data produksi padi load 'kritis.dat' %data lahan kritis load 'curahhujan.dat' %data hujan Tahap 2. Data diskala dengan membagi masing-masing dengan rata-rata tiap kolom D1 = [kritis(:,1)./mean(kritis(:,1))... kritis(:,2)./mean(kritis(:,2)) kritis(:,3)./mean(kritis(:,3))]; %data padi produksi D2 = [Padi(:,1)./mean(Padi(:,1))... Padi(:,2)./mean(Padi(:,2)) Padi(:,3)./mean(Padi(:,3))]; %data hujan D3 = [curahhujan(:,1)./mean(curahhujan(:,1))... curahhujan(:,2)./mean(curahhujan(:,2)) curahhujan(:,3)./mean(curahhujan(:,3))]; Tahap 3. Kita akan menyusun data untuk waktu ke-t dan waktu ke t-1 untuk masing-masing variabel for i=1:length(d1)-1 Z1tm1k(i)=D1(i,1); Z1tk(i)=D1(i+1,1); Z2tm1k(i)=D1(i,2); Z2tk(i)=D1(i+1,2); Z3tm1k(i)=D1(i,3); Z3tk(i)=D1(i+1,3); end Z1tm1k=Z1tm1k'; Z1tk=Z1tk'; Z2tm1k=Z2tm1k'; Z2tk=Z2tk'; Z3tm1k=Z3tm1k'; Z3tk=Z3tk'; ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 301

323 nt=length(z1tk); for i=1:length(d2)-1 Z1tm1p(i)=D2(i,1); Z1tp(i)=D2(i+1,1); Z2tm1p(i)=D2(i,2); Z2tp(i)=D2(i+1,2); Z3tm1p(i)=D2(i,3); Z3tp(i)=D2(i+1,3); end Z1tm1p=Z1tm1p'; Z1tp=Z1tp'; Z2tm1p=Z2tm1p'; Z2tp=Z2tp'; Z3tm1p=Z3tm1p'; Z3tp=Z3tp'; nt=length(z1tp); figure plot(1:nt,z1tp) %data hujan for i=1:length(d3)-1 Z1tm1h(i)=D3(i,1); Z1th(i)=D3(i+1,1); Z2tm1h(i)=D3(i,2); Z2th(i)=D3(i+1,2); Z3tm1h(i)=D3(i,3); Z3th(i)=D3(i+1,3); end Z1tm1h=Z1tm1h'; Z1th=Z1th'; Z2tm1h=Z2tm1h'; Z2th=Z2th'; Z3tm1h=Z3tm1h'; Z3th=Z3th'; nt=length(z1th); Tahap 4. Kita akan meregresikan lahan kritis menurut persamaan (P.1) dan curah hujan juga menurut persamaan (P.1) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %hubungan antara lahan kritis 302 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

324 %selo Xp1k=[ones(nt,1) Z2tk Z3tk]; beta1k=inv(xp1k'*xp1k)*xp1k'*z1tk figure plot(1:nt,z1tk,'ko') Z1modelk=Xp1k*beta1k; hold on plot(1:nt,z1modelk,'r*') hold off error1k=norm(z1tk-z1modelk)/norm(z1tk)*100 %curahhujan Selo Xp1h=[ones(nt,1) Z2th Z3th]; beta1h=inv(xp1h'*xp1h)*xp1h'*z1th figure plot(1:nt,z1th,'ko') Z1modelh=Xp1h*beta1h; hold on plot(1:nt,z1modelh,'r*') hold off error1h=norm(z1th-z1modelh)/norm(z1th)*100 Tahap 5. Kemudian hasil tersebut diregresikan untuk memodelkan padi sebagai fungsi curah hujan dan lahan kritis, khusus untuk Selo. %padi di Selo sebagai model curah hujan dan lahan kritis hasil regresi Xp1p=[ones(nt,1) Z2tp Z3tp Z1modelk Z1modelh]; beta1p=inv(xp1p'*xp1p)*xp1p'*z1tp figure plot(1:nt,z1tp,'ko') Z1modelp=Xp1p*beta1p; hold on plot(1:nt,z1modelp,'-r*') hold off error1p=norm(z1tp-z1modelp)/norm(z1tp)*100 Jika semua langkah di atas dijalankan maka kita mendapatkan bahwa lahan kritis Selo merupakan fungsi luas lahan kritis Ampel dan Cepogo dengan error % dengan koefisien pada persamaan (P.1) berturut-turut adalah [ ] Demikian pula curah hujan Selo dengan model (P.2) mempunyai koefisien ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 303

325 [ ] dengan error %. Kemudian persamaan padi pada model (P.3) dapat diperoleh dengan koefisien [ ] dan error %. Ilustrasi untuk masing-masing ditunjukkan pada Gambar Gambar 7.5 Luas lahan kritis di Selo sebagai fungsi luas lahan kritis di Ampel dan Cepogo pada waktu yang sama Gambar 7.6 Banyaknya curah hujan di Selo sebagai fungsi curah hujan di Ampel dan Cepogo pada waktu yang sama dimana data tak berdimensi 304 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

326 Gambar 7.7 Banyaknya panen padi di Selo sebagai fungsi lahan kritis dan curah hujan menurut model (P.4)-(P.6) Secara sama, kita dapat melakukan pemrograman untuk ketiga daerah dengan menggunakan persamaan (P.4)-(P.6). Hasil komputasi ditunjukkan pada Tabel 7.5. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 305

327 Tabel 7.5. Nilai tiap parameter pada model (P.4)-(P.6) Error fungsi padi (%) [Selo Ampel Cepogo] ] [ No Nama parameter w w Nilai parameter w x [ ] [ ] Secara keseluruhan program untuk itu ditunjukkan berikut ini (Tahap 1-5 digabung dan dilanjutkan dengan optimasi banyaknya padi. Nama file adalah Reg22.m clear close all load 'Padi.dat'% ini data produksi padi load 'kritis.dat' %data lahan kritis load 'curahhujan.dat' %data hujan D1 = [kritis(:,1)./mean(kritis(:,1))... kritis(:,2)./mean(kritis(:,2)) kritis(:,3)./mean(kritis(:,3))]; for i=1:length(d1) LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

328 Z1tm1k(i)=D1(i,1); Z1tk(i)=D1(i+1,1); Z2tm1k(i)=D1(i,2); Z2tk(i)=D1(i+1,2); Z3tm1k(i)=D1(i,3); Z3tk(i)=D1(i+1,3); end Z1tm1k=Z1tm1k'; Z1tk=Z1tk'; Z2tm1k=Z2tm1k'; Z2tk=Z2tk'; Z3tm1k=Z3tm1k'; Z3tk=Z3tk'; nt=length(z1tk); %data padi produksi D2 = [Padi(:,1)./mean(Padi(:,1))... Padi(:,2)./mean(Padi(:,2)) Padi(:,3)./mean(Padi(:,3))]; %newvalue =( 1 + 2*(rand(1) - 0.5) * 0.01)* D ; %D=newValue; for i=1:length(d2)-1 Z1tm1p(i)=D2(i,1); Z1tp(i)=D2(i+1,1); Z2tm1p(i)=D2(i,2); Z2tp(i)=D2(i+1,2); Z3tm1p(i)=D2(i,3); Z3tp(i)=D2(i+1,3); end Z1tm1p=Z1tm1p'; Z1tp=Z1tp'; Z2tm1p=Z2tm1p'; Z2tp=Z2tp'; Z3tm1p=Z3tm1p'; Z3tp=Z3tp'; nt=length(z1tp); figure plot(1:nt,z1tp) %data hujan D3 = [curahhujan(:,1)./mean(curahhujan(:,1))... curahhujan(:,2)./mean(curahhujan(:,2)) curahhujan(:,3)./mean(curahhujan(:,3))]; ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 307

329 %newvalue =( 1 + 2*(rand(1) - 0.5) * 0.01)* D ; %D=newValue; for i=1:length(d3)-1 Z1tm1h(i)=D3(i,1); Z1th(i)=D3(i+1,1); Z2tm1h(i)=D3(i,2); Z2th(i)=D3(i+1,2); Z3tm1h(i)=D3(i,3); Z3th(i)=D3(i+1,3); end Z1tm1h=Z1tm1h'; Z1th=Z1th'; Z2tm1h=Z2tm1h'; Z2th=Z2th'; Z3tm1h=Z3tm1h'; Z3th=Z3th'; nt=length(z1th); %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%hubungan antara lahan kritis %selo Xp1k=[ones(nt,1) Z2tk Z3tk]; beta1k=inv(xp1k'*xp1k)*xp1k'*z1tk figure plot(1:nt,z1tk,'ko') Z1modelk=Xp1k*beta1k; hold on plot(1:nt,z1modelk,'r*') hold off error1k=norm(z1tk-z1modelk)/norm(z1tk)*100 %curahhujan Selo Xp1h=[ones(nt,1) Z2th Z3th]; beta1h=inv(xp1h'*xp1h)*xp1h'*z1th figure plot(1:nt,z1th,'ko') Z1modelh=Xp1h*beta1h; hold on plot(1:nt,z1modelh,'r*') hold off error1h=norm(z1th-z1modelh)/norm(z1th)* LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

330 %padi di Selo sebagai model curah hujan dan lahan kritis hasil regresi Xp1p=[ones(nt,1) Z2tp Z3tp Z1modelk Z1modelh]; beta1p=inv(xp1p'*xp1p)*xp1p'*z1tp figure plot(1:nt,z1tp,'ko') Z1modelp=Xp1p*beta1p; hold on plot(1:nt,z1modelp,'-r*') hold off error1p=norm(z1tp-z1modelp)/norm(z1tp)*100 %Tahap optimasi k=1; nb=length(beta1p);[mx,nx]=size(xp1p); f=beta1p(2:nb,k)'; lb = min(xp1p(:,2:nx)); ub = max(xp1p(:,2:nx)); [x,fval1,exitflag,output,lambda] = linprog(f,[],[],[],[],lb,ub); %cari dimensi berdasarkan data saja Padi Selo=[ ] Ampel=[ ] Cepogo=[ ] PadiSelonodim=-fval1+beta1p(1) Datanodimpadiselo=[min(Z1tp) max(z1tp)] PadiSelodim=max(Selo)/max(Z1tp)*PadiSelonodim xoptimal=x %n dimensi %Ampel %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %hubungan antara lahan kritis %Ampel Xp2k=[ones(nt,1) Z1tk Z3tk]; beta2k=inv(xp2k'*xp2k)*xp2k'*z2tk figure plot(1:nt,z2tk,'ko') Z2modelk=Xp2k*beta2k; hold on plot(1:nt,z2modelk,'r*') hold off error2k=norm(z2tk-z2modelk)/norm(z2tk)*100 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 309

331 %curahhujan Ampel Xp2h=[ones(nt,1) Z1th Z3th]; beta2h=inv(xp2h'*xp2h)*xp2h'*z2th figure plot(1:nt,z2th,'ko') Z2modelh=Xp2h*beta2h; hold on plot(1:nt,z2modelh,'r*') hold off error2h=norm(z2th-z2modelh)/norm(z2th)*100 %padi di Ampel sebagai model curah hujan dan lahan kritis hasil regresi Xp2p=[ones(nt,1) Z1tp Z3tp Z2modelk Z2modelh]; beta2p=inv(xp2p'*xp2p)*xp2p'*z2tp figure plot(1:nt,z2tp,'ko') Z2modelp=Xp2p*beta2p; hold on plot(1:nt,z2modelp,'-r*') hold off error2p=norm(z2tp-z2modelp)/norm(z2tp)*100 k=2; nb2=length(beta2p);[mx,nx]=size(xp2p); f=beta2p(2:nb2)'; lb = min(xp2p(:,2:nx)); ub = max(xp2p(:,2:nx)); [x2,fval2,exitflag,output,lambda] = linprog(f,[],[],[],[],lb,ub); %cari dimensi berdasarkan data saja Padi Selo=[ ] Ampel=[ ] Cepogo=[ ] PadiAmpelnodim=-fval2+beta2p(1) DatanodimpadiAmpel=[min(Z2tp) max(z2tp)] PadiAmpeldim=max(Ampel)/max(Z2tp)*PadiAmpelnodim xoptimal2=x2 %n dimensi %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %Cepogo %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 310 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

332 %hubungan antara lahan kritis %Cepogo Xp3k=[ones(nt,1) Z1tk Z2tk]; beta3k=inv(xp3k'*xp3k)*xp3k'*z3tk figure plot(1:nt,z3tk,'ko') Z3modelk=Xp3k*beta3k; hold on plot(1:nt,z3modelk,'r*') hold off error3k=norm(z3tk-z3modelk)/norm(z3tk)*100 %curahhujan Ampel Xp3h=[ones(nt,1) Z1th Z2th]; beta3h=inv(xp3h'*xp3h)*xp3h'*z3th figure plot(1:nt,z3th,'ko') Z3modelh=Xp3h*beta3h; hold on plot(1:nt,z3modelh,'r*') hold off error3h=norm(z3th-z3modelh)/norm(z3th)*100 %padi di Ampel sebagai model curah hujan dan lahan kritis hasil regresi Xp3p=[ones(nt,1) Z1tp Z2tp Z1modelk Z2modelh]; beta3p=inv(xp3p'*xp3p)*xp3p'*z3tp figure plot(1:nt,z3tp,'ko') Z3modelp=Xp3p*beta3p; hold on plot(1:nt,z3modelp,'-r*') hold off error3p=norm(z3tp-z3modelp)/norm(z3tp)*100 nb3=length(beta3p);[mx,nx]=size(xp3p); f3=beta3p(2:nb3)'; lb = min(xp3p(:,2:nx)); ub = max(xp3p(:,2:nx)); [x3,fval3,exitflag,output,lambda] = linprog(f3,[],[],[],[],lb,ub); %cari dimensi berdasarkan data saja Padi ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 311

333 Selo=[ ] Ampel=[ ] Cepogo=[ ] PadiCepogonodim=-(-fval3+beta3p(1)) DatanodimpadiCepogo=[min(Z3tp) max(z3tp)] PadiCepogodim=max(Cepogo)/max(Z3tp)*PadiCepogonodim xoptimal3=x3 %n dimensi Tahap optimasi Dengan menggunakan fungsi linprog.m dari MATLAB maka hasil optimasi ditunjukkan pada Tabel 7.6. Tabel 7.6. Hasil optimasi produksi panen padi dari tiap daerah Lokasi Nilai optimal model Min (data) (takberdimensi) Maximum (data) (takberdimensi) Data dalam 3 tahun [ ] (ton) Hasil optimasi (model dalam ton) Selo Ampel Cepogo [ ] [ ] [ ] Hasil Tabel 7.6 menunjukkan pendekatan optimasi menunjukkan bahwa ada kurang lebih 1 ton yang masih dapat dihasilkan secara optimal untuk Selo dan Ampel. Sedangkan hasil optimasi Cepogo sudah dalam interval data yang sesungguhnya. Jadi hasil ini dapat memberikan usulan bagaimana pemerintah Boyolali dapat mencermati hasil padi yang diperoleh secara optimal. 7.4 Visualisasi GSTAR dengan Menggunakan R Untuk dapat memperlihatkan peta hasil dari perhitungan menggunakan metode GSTAR dan menggunakan tools R, maka diperlukan pemanggilan paket-paket seperti berikut ini : (a) library ("maptools") 312 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

334 paket maptools adalah library yang digunakan unutk memanipulasi dan membaca data geografi, dalam hal ini file data ESRI, paket ini juga menyedikan antarmuka untuk berkerjasama dan bertukar data informasi dengan paket lain seperti PBSmapping, spatstat, maps, RArcInfo, Stata tmap, WinBUGS, Mondrian, dan lain-lain. (b) library ("rgdal") paket rgdal akan mengikat 2 library utama untuk menampilkan data dan memproyeksikan kedalam data peta, kedua paket itu adalah paket Frank Warmerdam's Geospatial Data Abstraction Library (GDAL) (>= 1.6.3) dan untuk memproyeksikan/ mentransformasikan dari library PROJ.4. Baik keduanya (GDAL raster dan vector data peta OGR)dapat diimport kedalam R, dan sebaliknya data raster GDAL dan data vector peta OGR akan di ekspor. (c) library ("RColorBrewer") Paket ini menyediakan palett untuk menggambar peta yang baik dengan warna yang sesuai dengan variable yang diberikan. (d) library ("classint") Sebuah paket untuk memilih interval kelas unvariate untuk keperluan pemetaan atau tujuan grafis lain. (e) library ("sp") Adalah paket yang menyediakan kelas-kelas dan metode untuk data spasial. Dokumen dibagi menjadi kelas-kelas dimana informasi lokasi spasial berada, baik untuk data 2D atau 3D. Fungsi utilitas telah disediakan, misalnya untuk merencanakan data seperti peta, seleksi spasial, serta metode untuk mengambil koordinat, untuk subsetting, mencetak, ringkasan, dll. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 313

335 (f) library ("spdep") Merupakan koleksi fungsi untuk menciptakan bobot spasial matriks objek dari poligon contiguities, dari pola titik dari jarak dan tessellations, untuk mendapatkan ringkasan sebuah objek, dan untuk memungkinkan penggunaannya pada analisa data spasial, termasuk regional agregasi dengan minimum planning tree; koleksi tes autocorrelation tata ruang/spasial, seperti Global Moran s I, APLE, Geary s C, Hubert/Mantel, Getis/Ord G, Local Moran s I dan Getis/Ord G, SAR, CAR, GM SAR, dll. Setelah dilakukan pemanggilan Library diatas, langkah berikutnya adalah degan memanggil file.shp. boyolali <- readshapepoly("d:/r_lat/map/peta/batas kec.shp",proj4string=crs("+proj=longlat")) boyolali <- adalah nama varibel yang menampung isi dari file batas kec.shp, readshapepoly( D:/ ) adalah cara untuk membaca file.shp dalam tools R. proj4string=crs( +proj=longlat )) adalah mengambil detail dari proyeksi berdasarkan CRS ( Coordinate Reference System) yang ada pada file shp. CRS dalam R CRS menyediakan sebuah standar cara untuk menggambarkan lokasi. Banyak CRS yang digunakan untuk menggambarkan data geografis. CRS yang dipilih tergantung pada saat data tersebut didapat, geografis yang luas dari data, tujuan dari data, dll. Dalam R, ketika data dengan berbagai CRS digabungkan, hal yang penting adalah untuk mengubah CRS yang berbeda itu menjadi CRS umum sehingga CRS-CRS yang berbeda tadi menjadi sejajar dengan satu sama lain. Tujuan dari 314 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

336 menyamakan CRS adalah memastikan bahwa dalam pengukuran (volume/jarak/dll) nantinya menggunakan unit yang sama. Projection longitude latitude Lokasi pada bentuk permukaan tiga-dimensi bola bumi direferensikan menggunakan garis lintang (latitude) dan garis bujur (longitude). Koordinat garis lintang dan bujur untuk lokasi tertentu akan berbeda tergantung pada CRS dan kapan pengukuran diambil. finddata1 <- read.csv("d:/r_lat/map/data/bataskec.csv", header=t, dec=",", sep=";") perintah di atas digunakan untuk membaca file csv, dengan opsi file header dibaca, pengaturan tanda decimal menggunakan koma (,) dan pemisah antar data menggunakan tanda semi-colon (;) dan semua data ditampung dalam variable finddata1 var <- finddata1$lembab variable var digunakan untuk menampung data finddata1 terkhususnya untuk kolom data LEMBAB boyolali.q.nb <- poly2nb(boyolali,queen=true) Poly2nb(spdep) Fungsi tersebut membangun sebuah daftar tetangga berdasarkan pada daerah berdekatan dengan daerah-daerahnya, yang berbagi satu atau lebih batas titik. Berikutnya Fungsi akan menafsirkan satu daerah dan secara perlahan-lahan ke daerah yang lain (jika banyak daerah atau batas-batas yang di berikan terlalu rinci, mengingat satu polygon dapat saja bibangun dari banyak koordinat ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 315

337 batas, jadi dapat saja proses ini lambat dikarenakan kekurangan memory) Queen=TRUE Jika bernilai TRUE, maka titik batas tunggal bersama memenuhi kondisi persentuhan, jika FALSE, lebih dari satu titik bersama diperlukan; Catatan bahwa lebih dari satu titik perbatasan bersama tidak selalu berarti garis batas bersama. boyolali.b <- nb2listw(boyolali.q.nb,style="b") nb2listw(spdep) Fungsi tambahan pada daftar tetangga yang sudah didapatkan dari fungsi sebelumya (Poly2nb) dengan bobot spasial untuk skema pengkodean yang dipilih. globalg.test(var, boyolali.b) globalg.test(spdep) Global G statistik untuk autokorelasi spasial, spatial autocorrelation, melengkapi lokal Gi LISA dengan pengukuran: localg antara data kelembaban dengan daftar tetangga yang sudah didapat. G <- localg(var, boyolali.b) Gs <- localg(var, nb2listw(include.self(boyolali.q.nb),style="b")) localg(spdep) Statistik spasial lokal G dihitung untuk setiap zona yang didasarkan pada bobot objek spasial yang digunakan. Nilai kembali adalah nilai-z, dan dapat digunakan sebagai alat diagnostik. Nilai-nilai 316 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

338 positif yang tinggi menunjukkan kemungkinan kluster lokal bernilai tinggi dari variabel yang sedang dianalisis, demikian sebaliknya. Variable G menampung perhitungan statisitik spasial local G antara data kelembaban dengan data boyolali. Variable Gs menampung perhitungan G local kelembaban dengan Boyolali dengan masing-masing kecamatan pada boyolali. brks <- seq(-4,4,1) variable brks akan menyimpan nilai batas atas dan batas bawah digunakan untuk membantu pemilihan warna yang berbeda pada peta, sesuai dengan nilai yang dida pat dari perhitungan local G. cm.col <- cm.colors(length(brks)-1) cm.colors menciptakan vektor template warna cm.col akan memberikan luaran warna sesuai dengan nilai yang dihasilkan dari perhitungan. plot(boyolali,border="lightgray",col=cm.col[findinterval(g,brks,all.inside=true)]) text(coordinates(boyolali)[,1],coordinates(boyolali)[,2], round(g, digits=1), cex=0.5) title("g Test") Perintah tersebut menampilkan peta boyolali dengan ketentuan batas-batas kecamatan diberi warna lightgray, dengan warna sesuai dengan nilai interval yang sudah diberikan serta menampilkan teks hasil perhitungan didalam masing-masing polygon atau area kecamatan dan judul dari peta G Test. Sehingga jika dijalankan akan menghasilkan gambar peta seperti di bawah ini: ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 317

339 Gambar 7.8 Gambar peta Boyolali berdasarkan zona arkeologi dengan pembobotan plot(boyolali,border="lightgray",col=cm.col[findinterval(gs,brks,all.insid e=true)]) text(coordinates(boyolali)[,1], coordinates(boyolali)[,2], round(gs, digits=1), cex=0.5) title("g Stat Test") menampilkan peta Boyolali dengan ketentuan batas-batas kecamatan diberi warna lightgray, dengan warna sesuai dengan nilai interval yang sudah diberikan serta menampilkan teks hasil perhitungan didalam masing-masing polygon atau area kecamatan dan judul dari peta G Stat Test. 318 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

340 Sehingga jika dijalankan akan menghasilkan gambar peta seperti dibawah ini : Gambar 7.9 Hasil pemrograman untuk peta Boyolali dengan pembobotan dengan data simulasi Latihan soal 7.1 Berikut ini adalah soal-soal dan jawab yang diambil dari Johnson and Wichern (2007), dan soal didisain untuk buku terbuka. Artinya beberapa jawaban langsung merujuk pada buku tersebut. Pembaca diharapkan menggunakan buku acuan untuk dapat mengerjakan soal-soal berikut dimana beberapa sudah ada jawabannya. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 319

341 BAGIAN A 1. Data Tabel 1 menyatakan data pengukuran panjang, berat dan tinggi dari kura-kura untuk betina (sebut sebagai variable random F) (3 kolom pertama ) dan panjang, berat dan tinggi dari kura-kura untuk jantan (sebut sebagai variable random M) (kolom ke 4 hingga terakhir). Sebutlah X1: variable random panjang; X2:var random berat; dan X3:variable random tinggi. Carilah (i).95% interval konfidensi untuk rata-rata masing-masing variable Petunjuk : Johnson and Wichern (2007, hal 194) ' 1 (ii)sebutlah d1 = x j x S x j x untuk j=1,2,,n1 dengan n1: ' banyaknya sampel betina dengan x j x1 j, x2 j dan hitunglah (iii) Apakah variabel F berdistribusi normal (?). Jelaskan. %Data tabel 6.5 %Female MALE %Length Width height length Width Height %(x1) (x2) (x3) (x1) (x2) (x3) LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT d1

342 Anggaplah bahwa berat merupakan variabel respon dari variabel predictor panjang dan tinggi dan merupakan regresi linear. Bagaimana anda dapat menunjukkan hal ini untuk variabel M. Petunjuk: Tuliskan jawaban anda dalam bentuk laporan yang berkesinambungan ( makalah pendek) a. Tuliskan bentuk persamaan regresi yang anda peroleh b. Gambarlah fungsi regresi dan datanya c. Tuliskan covariansi dari parameter regresi (tuliskan alasan/ rujukan yang anda gunakan) d. Berapakah nilai harapan jumlah kuadrat residu (tuliskan alasan/rujukan yang anda gunakan) e. Berapakah interval konfidensi setiap parameter untuk 0.05?. f. Tuliskan kesimpulan anda 3. Data Tabel 1 menyatakan data pengukuran panjang, berat dan tinggi dari kura-kura untuk betina (sebut sebagai variable F) (3 kolom pertama ) dan panjang, berat dan tinggi dari kura-kura untuk jantan (sebut sebagai variable random M) (kolom ke 4 hingga terakhir). (i). Sebutlah X1: variabel random panjang; X2:var random berat; dan X3:variabel random tinggi. Carilah (i). 95% interval konfidensi untuk rata-rata masing-masing variable Petunjuk: hal 194 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 321

343 ' (ii) Sebutlah d1 = x j x S 1 x j x untuk j=1,2,, n1 dengan n1 : banyaknya sampel jantan hitunglah dengan x 'j x1 j, x2 j dan d1 (iii) Apakah variabel M berdistribusi normal (?). Jelaskan. 4. Anggaplah bahwa berat merupakan variabel respon dari variabel prediktor panjang dan tinggi dan merupakan regresi linear. Bagaimana anda dapat menunjukkan hal ini untuk variabel F. Petunjuk: Tuliskan jawaban anda dalam bentuk laporan yang berkesinambungan (makalah pendek) a. Tuliskan bentuk persamaan regresi yang anda peroleh b. Gambarlah fungsi regresi dan datanya c. Tuliskan covariansi dari parameter regresi (tuliskan alasan/ rujukan yang anda gunakan) d. Berapakah nilai harapan jumlah kuadrat residu (tuliskan alasan/ rujukan yang anda gunakan) e. Berapakah interval konfidensi setiap parameter untuk 0.05?. f. Tuliskan kesimpulan anda. BAGIAN B. 1. (Johnson and Wichern,2007,hal 210) (a) Hitunglah T 2 untuk test hipotosis H 0 : [7,11]' dengan menggunakan data X (b) Tentukan distribusi T 2 untuk situasi pada (a) (c) Dengan hasil (a) dan (b), test H 0 pada Kesimpulan ada yang diperoleh?. 322 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

344 2. (Johnson and Wichern,2007, hal 175 no 4.16): Diketahui X 1, X 2,..., X 75 merupakan suatu vektor-vektor sample random dari suatu populasi dengan rata-rata yang tiap sample vektor sebanyak n dan matriks kovariansi. Distribusi apa yang tepat untuk (a) X ' (b) n X S 1 X 3. Hal (Result 7.5). Diketahui persamaan regresi var predictor Z dan vari respon Z memenuhi Y Z, dengan punya rank penuh (full rank) dan adalah N n (0, 2 I ). Interval konfindensi 100(1- )% untuk adalah ( )' Z ' Z ( ) (r 1)s 2 Fr 1,n r 1 ( ) dimana Fr 1,n r 1 ( ) adalah batas atas presentil ke-100 dari distribusi F dengan derajat kebebasan r 1 dan n r 1. Selain itu interval konfidensi 100(1- )% untuk setiap i adalah i Vˆar ( i ) (r 1) Fr 1,n r1 ( ), i=1,,r dimana Vˆar ( i ) adalah elemen diagonal s 2 (Z ' Z ) 1. Catatan : (i) Perhatikan bahwa sepanjang pembuktian akan ditulis ( )' Z ' Z ( ) = ( )' Z ' Z ( ). (ii) Tulis notasi vektor dengan panah diatasnya Misal : merupakan vektor parameter beta populasi Sedangkan merupakan vektor parameter beta hasil komputasi (estimasi). ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 323

345 Pertanyaan: (i) Dengan menuliskan V = (Z ' Z )1/ 2 ( ) buktikan E(V)= 0. (ii) Buktikan Cov(V ) 2 I ( r 1,r 1) (berikan alasan tiap tahap) (iii) Buktikan interval konfidensi 100(1- )% untuk setiap i di atas. Petunjuk :Jika ada rujukan hasil sebelumnya, gabungkanlah sehingga menjadi alasan yang lengkap dalam penjelasan anda. Jawaban No.1 Jawab : mengikuti prosedur pada halaman : Perhatikan bahwa tiap baris adalah setiap vektor sehingga X 6 10 ', dan diperoleh S dan S Sedangkan berdasarkan persamaan (5-4) hal 180 diperoleh 1 S T ( X 0 ) ' ( X 0 ) n( X 0 ) ' S 1 ( X 0 ) n 2 (a) Berdasarkan formula (5.5), T 2 ~ (n 1) p Fp,n p sehingga untuk (n p) soal tersebut diperoleh T2~ (n 1) p (4 1)(2) Fp,n p F2, 4 2 3F2, 2. (n p) 2 (b) H 0 : [7,11]' pada 0.05 diperoleh (mudah). No.2 (Hal 175 no 4.16) : Diketahui X 1, X 2,..., X 75 merupakan suatu sample random dari suatu populasi dengan rata-rata dan matriks kovariansi. Distribusi apa yang tepat untuk 324 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

346 (a). X ' 1 (b). n X S X Jawab (a) Karena tidak diberitahukan distribusinya maka kita menganggap X 1, X 2,..., X 75 berdistribusi normal N 75 (, ). Menggunakan Result 4.2 hal 134 menyatakan bahwa: Jika X berdistribusi N p (, ) maka sembarang kombinasi, linear variabel a ' X a1 X 1 a2 X 2... a p X p berdistribusi N (a ', a ' a ) dan sebaliknya berlaku pula. 1 Cara 1. Oleh karena itu diketahui bahwa X X 1... X 75, n merupakan kombinasi linear dari X 1, X 2,..., X 75 dengan bobot masingmasing dalam vektor 1 1 a '... n n. Sehingga jelas bahwa X X 1... X 75 ~ N (a ', a ' a ) dengan a '.... n n n Cara 2. Berdasarkan Central Limit Theorem dinyatakan bahwa (hal 152) untuk data multivariat: Diketahui X 1, X 2,..., X n observasi yang saling bebas dari sembarang populasi dengan rata-rata dan matriks kovariansi berhingga, maka n X mempunyai pendekatan distribusi N p (0, ) dan n( X )' S 1 ( X ) mendekati p2 untuk sample besar. Disini n dianggap cukup relatif besar terhadap p. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 325

347 Oleh karena itu untuk mengatakan distribusi X, kita menggantikannya n X yaitu N p (0, ) dan dengan menyatkan distribusi n( X )' S 1 ( X ) mendekati p2 untuk sample besar.. No.3 (hal 298) : Hal 298. Interval konfidensi parameter regresi Diketahui persamaan regresi Y Z, dengan punya rank penuh (full rank) dan adalah N n (0, 2 I ). Interval konfindensi 100(1- )% untuk adalah (i) ( )' Z ' Z ( ) (r 1)s 2 Fr 1,n r 1 ( ) dimana Fr 1,n r 1 ( ) adalah batas atas presentil ke-100 dari distribusi F dengan derajat kebebasan r 1 dan n r 1. Selain itu interval konfidensi 100(1- )% untuk setiap i adalah i Vˆar ( i ) (r 1) Fr 1,n r1 ( ), i=1,,r (ii) dimana Vˆar ( i ) adalah elemen diagonal s 2 (Z ' Z ) 1. Catatan : Perhatikan bahwa sepanjang pembuktian akan ditulis ( )' Z ' Z ( ) = ( )' Z ' Z ( ). Pertanyaan : (i) Dengan menuliskan V = (Z ' Z )1/ 2 ( ) buktikan E(V)= 0. (ii) Buktikan Cov(V ) 2 I ( r 1,r 1) (berikan alasan tiap tahap) (iii) Buktikan interval konfidensi 100(1- )% untuk setiap i di atas. Petunjuk: Jika ada rujukan hasil sebelumnya, gabungkanlah sehingga menjadi alasan yang lengkap dalam penjelasan anda. 326 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

348 Bukti : Selama ini kita mengetahui bahwa suatu solid eillipsoid x yang memenuhi ( x )' 1 ( x ) p ( ) (0) punya probabilitas 1- (hal 132). Demikian pula kita akan menggunakan fakta bahwa bentuk akar matriks ( A1 / 2 )' A1 / 2 (bentuk simetrik).. Jadi kita menuliskan ( )' Z ' Z ( ) = ( )' Z ' Z ( ) = ( )' (Z ' Z )1 / 2 (Z ' Z )1 / 2 ( ). Sebut V = (Z ' Z )1/ 2 ( ). Berdasarkan (2.45) bahwa jika Z=CX (Z merupakan kombinasi linear dari variable random X, C matriks ) maka E(Z ) E(CX ) CE ( X ). Sehingga menggunakan hasil tersebut diperoleh (a) E(V) = E( (Z ' Z )1 / 2 ( ) ) =. (Z ' Z )1/ 2 E ( ) = ( Z ' Z )1/ 2 ( E ( )-E( )) = ( Z ' Z )1/ 2 ( - )= 0 (dari result 7.2 E ( )=. (b). Cov(V ) Cov( (Z ' Z )1/ 2 ( ) )=?. Dengan menggunakan hasil (2.45) bahwa untuk kombinasi linear variable random ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 327

349 Z=CX makacov(z)=cov(cx)= C X C '. (*) Sehingga Cov(V ) Cov( (Z ' Z )1 / 2 ( ) ) = ( Z ' Z )1/ 2 Cov( )( (Z ' Z )1/ 2 ) (berdasarkan (*) = (Z ' Z )1/ 2 Cov( )( (Z ' Z )1/ 2 ) (sifat simetri (Z ' Z )1/ 2 ) = (Z ' Z )1/ 2 Cov( )( (Z ' Z )1/ 2 ) (?) = 2 (Z ' Z )1/ 2 ( Z ' Z ) 1 ( (Z ' Z )1/ 2 ) (dengan hasil 7.2 bahwa Cov( ) = 2 ( Z ' Z ) 1 ) = 2 ( Z ' Z )1/ 2 ( Z ' Z ) 1 / 2 ( Z ' Z ) 1/ 2 ( ( Z ' Z )1/ 2 )= 2 I ( r 1,r 1). dan V berdistribusi normal karena terdiri dari kombinasi linear ˆi. Sehingga V 'V ( )' ( Z ' Z )1/ 2 ( Z ' Z )1/ 2 ( ) = = ( )' (Z ' Z ) ( ) berdistribusi normal 2 r 1 (menggunakan (0)) Selain itu ingat definisi distribusi F (lihat Wikipedia) Jika X ~ 21 dan Y ~ 22 saling bebas maka X / 1 ~ F 1, 2 Y / 2 Sehingga dengan menerapkan (1) pada V 'V ~ r 1 berlaku 328 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT (1)

350 r 1 /( r 1) V 'V /( r 1) ~ F( r 1, ( n r 1). s2 n r 1 /( n r 1) Diketahui : V 'V ~ 2 r 1 atau V 'V /(r+1) ~ 2 r 1 /(r+1) (n-r-1) s 2 ~ 2 n r 1 atau s 2 ~ 2 n r 1 /(n-r-1) r 1 /( r 1) n r 1 /( n r 1) V 'V /( r 1) ~ F( r 1,( n r 1) s2 Atau ( )' ( Z ' Z ) ( ) /(r+1) ~ s 2 F( r 1,( n r 1) Atau ( )' ( Z ' Z ) ( ) (r 1)s 2 Fr 1,n r 1. (i) terbukti. (ii) Untuk mencari interval konfidensi parameter : Kita menggunakan proyeksi ellipsoid untuk ( ) dengan hasil 5A.1 (hal 208) yaitu : Diberikan konstan c > 0, dan matriks A positive definite p x p menentukan ellipsoida z : z ' A 1 z c 2. Untuk suatu vektor l 0 dan z pada ellipsoid, maka Proyeksi (bayangan) l ' Al = c l 1 2 l 'l z ' A z c pada l yang memperluas dari 0 sepanjang l dengan panjang (2) l ' Al. l 'l ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 329

351 Dengan hasil 5A.1 tersebut kita gunakan A 1 Z ' Z / s dan c 2 (r 1) Fr 1,n r 1 ( ) dan l [0,...,0,1,0,...,0]' sehingga c (r 1) Fr 1,n r 1 ( ) dan A s(z ' Z ) 1 Proyeksi (bayangan) l ' Al = c l i 1 2 ' pada z A z c l l 'l ( ˆi i ) = (r 1) Fr 1, n r 1 ( ) s(z ' Z ) 1 (r 1) Fr 1, n r 1 ( ) Var ( i ) dengan Var ( i ) merupakan elemen diagonal s 2 (Z ' Z ) 1 yang berkaitan dengan i. DAFTAR PUSTAKA Johnson, R.A., & Wichern, D Applied Multivariat Statistical Analysis. New Jersey: Prentice Hall. Parhusip, H.A dan Winarso, M.E, Analisa Data Iklim Boyolali dengan Regresi Klasik dan Metode GSTAR, dalam proses Prosiding Seminar Nasional Matematika dan Pendidikan Matematika, Tuban, 24 Mei 2014, Universitas PGRI Ronggolawe, Tuban. Parhusip, H.A, Optimasi Taklinear, ISBN , Tisara Grafika Salatiga, 221 hlm. 330 LEBIH LANJUT DENGAN GSTAR dan HASIL PENELITIAN TERKAIT

352 8 BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN Materi ini sebenarnya merupakan materi dasar yang diperlukan dalam memahami makna geometris dari fungsi kepadatan normal pada Bab III. Jadi bab ini dapat dibaca terlebih dahulu jika diperlukan. Kegiatan penelitian teori dengan pemrograman dengan menggunakan bahasa MATLAB. 8.1 Jarak Statistik Hampir semua masalah teknik multivariat berkaitan dengan jarak : garis atau jarak Euclid dianggap sama dan ingat hukum Phytagoras yang menyatakan jarak antara 2 titik. Untuk selanjutnya dikembangkan jarak statistik (istilah ini digunakan untuk membedakan perkataan jarak pada jarak Euclid). Suatu ukuran jaran dari pusat O ke suatu titik P = ( x1, x 2,..., x p ) didefinisikan sebagai berikut. Anggap ada n-pengukuran dari 2 variabel x1 dan x 2. Diasumsikan pengukuran x1 bervariasi secara indenpenden terhadap pengukuran x 2. Demikian pula variabiabilitas pengukuran x1 lebih besar daripada variabilitas pengukuran x 2. Jika digambar, maka tampak sumbu panjang pada ellips berada pada sumbu x1. Untuk melibatkan variabilitas, maka koordinat perlu distandarisasi. Kita akan menstadarisasi koordinat dengan menyatakan ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 331

353 x1* x1 / s11 dan x 2* x 2 / s 22. (8.1) Jarak statisitik antara 2 yaitu titik P = ( x1, x 2 ) dari titik O = (0, 0) dapat dihitung dari koordinat yang sudah distandarisasi yaitu d (O, P) ( x1* ) 2 ( x 2* ) 2 x1 s 11 = x1 x1 x 2. s s11 s Dengan menggunakan persamaan (8.2) (8.2) semua titik yang mempunyai koordinat ( x1, x 2 ) mempunyai jarak konstan c 2 dari O yang harus memenuhi x12 x 22 c2. s11 s 22 (83) Perhatikan bahwa persamaan (8.3) memerlukan besarnya c. Berarti hingga saat ini,kita dapat mendefinisikan secara bebas. Demikian pula variabel x1 dan x 2 merupakan variabel bebas dalam persamaan tersebut. Dengan data tersebut persamaan ellips yang diperoleh merupakan jarak P terhadap titik O yaitu x12 x 22 c 2 yaitu s11 s x1 x2 1. c s ) c s ) Perhatikan bahwa cos 2 (t ) sin 2 (t ) 1 (8.4) sehingga kita dapat membuat persamaan parametrik ellips untuk menggambar yaitu cos t = x1 x2 x1 c s11 cos t dan sin t = c s11) c s 22 ) x2 c s22 sin t 332 BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN (8.5)

354 Persamaan inilah yang digunakan untuk menggambar ellips pada pemrograman. Sekarang akan didefinisikan jarak statistik antara 2 sembarang titik P = ( x1, x 2 ) dan Q = ( y1, y 2 ). Jika kedua koordinat variabel dianggap bervariasi indenpenden maka jarak dari P dan Q didefinisikan sebagai 2 x y1 x 2 y 2 d ( P, Q) 1 s s ( x1 y1 ) ( x 2 y 2 ). (8.5) s11 s 22 Sebagai perluasan persamaan (8.5) adalah jarak statistik antara 2 dimensi. Dianggap P dan Q adalah p-koordinat yaitu P = ( x1, x 2,..., x p ) dan Q = ( y1, y 2,..., y p ). Dianggap Q yang fixed (tetap) dan variabel koordinat bervariasi secara independen satu dengan yang lain. Misal s11, s 22,..., s pp adalah variansi sampel yang dikonstruksi dari n pengukuran yaitu x1, x 2,..., x p. Jarak statistik dari P ke Q adalah d ( P, Q) (x p y p ) 2 ( x1 y1 ) 2 ( x 2 y 2 ) s11 s 22 s pp (8.6) Dapat dikatakan semua titik P berjarak konstant dari Q pada suatu hyperellipsoid yang berpusat pada Q yang sumbu minor dan sumbu mayor pararel dengan sumbu koordinat. Jarak pada persamaan (8.5) masih belum memuat hal terpenting karena perlu adanya asumsi bahwa koordinat bervariasi independen (tidak berkorelasi). Berikut ini akan ditunjukkan jika kedua variabel berkorelasi. Misal kita merotasi sistem koordinat sebesar dengan tiap data fixed (tidak berubah). Oleh karena itu jarak statistik terhadap sumbu x dan ~ x terhadap titik asal O = (0,0) sebagai referensi yang baru yaitu ~ 1 2 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 333

355 d ( P, Q) ~ x12 ~ x 22 ~ s11 ~ s 22 (8.7) yang mana ~ s11 dan ~s 22 menyatakan variansi sampel dihitung dengan pengukuran ~ x1 dan ~ x2. Hubungan antara koordinat mula-mula ( x1, x 2 ) dan koordinat rotasi ( ~ x1, ~ x 2 ) dinyatakan sebagai ~ x1 x1 cos( ) x2 sin( ), ~ x2 x1 sin ( ) x2 cos( ). (8.8) Atau dalam notasi matriks dan vektor dapat ditulis x1 cos( ) sin( ) x1 ~ ~. x2 sin( ) cos( ) x2 Dengan relasi persamaan (8.8) kita dapat menyatakan kembali jarak statistik dalam koordinat mula-mula. Yaitu dalam bentuk d ( P, Q) a11 x12 2a12 x1 x 2 a 22 x 22 dengan nilai a ditentukan oleh dan s11, s12 dan (8.9) s 22 yang dihitung dari data mula-mula. Bentuk a11, a12 dan a 22 tidak penting untuk saat ini. Yang penting adalah adanya perkalian 2a12 x1 x 2 menyatakan adanya korelasi yang tidak nol untuk r12. Jika persamaan (8.9) dan (8.2) dibandingkan maka diperoleh a11 1 / s11, a 22 1 / s 22 dan a12 0. Secara umum, jarak statistik antara titik P=( x1, x 2 ) dari suatu titik tetap Q = ( y1, y 2 ) dan kedua variabel berkorelasi maka diperoleh bentuk umum d ( P, Q) a11 ( x1 y1 ) 2 2a12 ( x1 y1 )( x2 y 2 ) a 22 ( x2 y 2 ) BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN (8.9)

356 Selain itu koordinat semua titik P= ( x1, x 2 ) berjarak konstan kuadrat c 2 dari Q memenuhi a11 ( x1 y1 ) 2 2a12 ( x1 y1 )( x2 y 2 ) a22 ( x2 y 2 ) 2 c 2. (8.10) Dari literature ditunjukkan bahwa a11 a 22 a12 cos2 ( ) cos2 ( ) s11 2 sin( ) cos( ) s12 sin2 ( ) s 22 sin2 ( ) cos2 ( ) s11 2 sin( ) cos( ) s12 sin2 ( ) s 22 cos( ) sin( ) 2 2 cos ( ) s11 2 sin( ) cos( ) s12 sin ( ) s 22 sin2 ( ) cos2 ( ) s 22 2 sin( ) cos( ) s12 sin2 ( ) s11 cos2 ( ) cos2 ( ) s 22 2 sin( ) cos( ) s12 sin2 ( ) s11 sin( ) cos( ) 2 2 cos ( ) s 22 2 sin( ) cos( ) s12 sin ( ) s11 Kegiatan Penelitian 8.1 Misal titik P = ( x1, x 2,..., x p ) yang menyatakan koordinat variabel yang berkorelasi dengan suatu titk tetap Q = ( y1, y 2,..., y p ) dan O = (0,0,...,0) meyatakan koordinat titik asal. Tentukan rumus umum jarak statistik P ke O dan dari P ke Q.Diberikan data ditunjukkan Tabel 8.1. Tabel 8.1 Data kegiatan penelitian 8.1 x x Tahap 1. Gunakan data untuk tugas tersebut dan lakukan scatter plot, dengan MATLAB sebagai berikut x1=[ ]; x2=[ ]; scatter(x1,x2) ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 335

357 Tahap 2. Run program Diperoleh keluaran Gambar 8.1. Gambar 8.1. Scatter plot data Tabel 8.1. Tahap 3. Lanjutkan program di atas untuk menghitung kovariansi matriks X=[x1' x2'] S=cov(X) Keluaran sbb : S= Pembahasan hasil program : Dengan data tersebut persamaan ellips yang diperoleh merupakan jarak P terhadap titik O yaitu x12 x 22 c 2 yaitu s11 s 22 x12 x22 c c x ) c 2 x ) 336 BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN 2 1.

358 2 2 x1 x2 1. c ) c ) Perhatikan bahwa cos 2 (t ) sin 2 (t ) 1 sehingga kita dapat membuat persamaan parametrik ellips untuk menggambar yaitu menggunakan persamaan (8.5). cos t = x1 x2 x1 c cos t dan sin t = c s11) c s 22 ) x2 c sin t. Tahap 4. Menggambar ellips dengan MATLAB Lanjutkan program di atas dengan isi berikut %menggambar ellips c = 2; %konstantanta sembarang t=linspace(0,2*pi,100); x1sumbu=sqrt(c*s(1,1))*cos(t); x2sumbu=sqrt(c*s(2,2))*sin(t); figure(2) plot(x1sumbu,x2sumbu,'-') hold on plot(x1,x2,'*') hold off Tahap 5. Menata tampilan dengan subplot Kadang kita ingin ada 2 gambar dalam 1 layar, kita gunakan perintah subplot Simpanlah file dalam bentuk bab8b.m dengan isi sbb clear close all x1=[ ]; x2=[ ]; X=[x1' x2'] S=cov(X) %menggambar ellips ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 337

359 t=linspace(0,2*pi,100); c = 2; %konstantanta sembarang x1sumbu=sqrt(c*s(1,1))*cos(t); x2sumbu=sqrt(c*s(2,2))*sin(t); subplot(2,1,1),scatter(x1,x2,'o') %axis([ ]) subplot(2,1,2),plot(x1sumbu,x2sumbu,'-') hold on plot(x1,x2,'*') hold off Tahap 6. Keluaran program ditunjukkan pada Gambar 2. Gambar 8.2. Data dalam ellips untuk c = 2. Tampak bahwa tidak semua data dalam ellips. Kita dapat memvariasi c sehingga berada dalam ellips. Misal ditunjukkan pada program bab8c.m clear close all x1=[ ]; x2=[ ]; X=[x1' x2'] S=cov(X) %menggambar ellips 338 BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN

360 t=linspace(0,2*pi,100); c = 2; %konstantanta sembarang x1sumbu=sqrt(c*s(1,1))*cos(t); x2sumbu=sqrt(c*s(2,2))*sin(t); subplot(2,1,1),scatter(x1,x2,'o') %axis([ ]) subplot(2,1,2),plot(x1sumbu,x2sumbu,'-') hold on plot(x1,x2,'*') hold on c = 4; %konstantanta sembarang x1sumbu=sqrt(c*s(1,1))*cos(t); x2sumbu=sqrt(c*s(2,2))*sin(t); subplot(2,1,2),plot(x1sumbu,x2sumbu,'r.') hold off Keluaran ditunjukkan pada Gambar 3. Gambar 8.3. Data dalam ellips untuk c = 4 tanda. dan untuk c=2 (tanda - ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 339

361 Dari hasil ditunjukkan bahwa nampaknya ellips tersebut perlu dirotasikan dengan Tugas penelitian 8.1 Buatlah program dengan mengedit bagian akhir dari bab8c..m dengan hold on dan lanjutkan dengan isi program berikut (dan simpan file dengan nama bab8d.m) Perhatikan bahwa MATLAB menghitung fungsi trigonometri dalam radian sehingga sudut harus dinyatakan dalam radian. %%%%%%%%%%%bagian baru%%%%%%hal30_1_9d.m%%%%%%%% %sudut rotasi harusdalam radian %theta=26 derajat artinya theta= 26/360*2*pi thetarad=(26/360)*2*pi; A=[cos(thetarad) sin(thetarad); -sin(thetarad) cos(thetarad)]; nx=length(x1sumbu); Mxtilda=zeros(nx,2); for i=1:nx xtilda=a*[x1sumbu(i);x2sumbu(i)]; Mxtilda(i,1)=xtilda(1); Mxtilda(i,2)=xtilda(2); figure(1) subplot(2,1,2),plot( Mxtilda(i,1), Mxtilda(i,2),'.-') end Diperoleh keluaran program sebagaimana ditunjukkan pada Gambar BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN

362 Gambar 8.4. Grafik ellips yang dirotasikan Hasil keluaran program tidak menunjukkan yang diharapkan bahwa data dalam sebaran dalam ellips. Untuk itu sudut rotasi dipilih 260. Maka diperoleh bahwa ellips lebih melingkupi data yang sebenarnya sebagaimana ditunjukkan pada Gambar 8.5. Gambar Hasil rotasi ellips dengan c = 4 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 341

363 8.2 Dekomposisi Spektral untuk matriks Kovariansi Pada bagian ini dipelajari matriks kovariansi dan dekomposisi spektral secara geometri yang mengacu pada (Johnson and Wichern, 2002, hal.2002). Latar belakang Dekomposisi spektral meyatakan bahwa matriks simetris A, k x k diberikan oleh Akxk 1e1e1' 2e2e2'... k ek ek', dimana k adalah nilai eigen ke-k dan ek adalah vektor eigen (k x 1) normal yang bersesuaian. Perhatikan bahwa ek ' ek 1, i=1,2,,k dan ei e j' 0, i j. Perlu diketahui bahwa matriks A simetris dan definite positive (nilai eigen semua positif). Matriks yang dibahas dalam kelas teori dapat merupakan (i) matriks kovariansi (ii) matriks harapan dari variable random X yaitu E(X) dengan X merupakan variable random (p x n), p: banyaknya variable, n : banyaknya observasi (bentuk untuk diskrit dan kontinu pada halaman 54-55) (iii) Matriks korelasi bertipe p x p p 11 pp p 22 pp 1p 1 11 pp = 12 2p 22 pp 1p pp pp pp 12 1 p 1 2 p 2 p 342 BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN 1

364 (iv) Matriks standard deviasi V 1/ pp Jelas bahwa (perlu dibuktikan) V 1/ 2 V 1/ 2 (V 1/ 2 ) 1 (V 1/ 2 ) 1. Matriks-matriks variabel random dapat dipartisi menjadi berbagai bentuk submatriks/subvektor (hal 64) sehingga perlu didiskusikan bagaimana pengaruh partisi terhadap rata-rata, terhadap hasil kovariansi setiap partisi dan keseluruhan variabel, bagaimana rata-rata, variansi, kovariansi antara kombinasi linear dari tiap variabel hasil partisi (Johnson and Wichern, 2007, hal 60-64). Demikian pula jika antara variabel (hasil partisi ataupun yang bukan) perlu diukur variabilitas antar mereka. Karena yang memberikan informasi yang signifikan adalah variabilitas antar variabel yang terbesar maka dicari variabilitas maksimum dengan menggunakan pertidaksamaan Chauchy-Schwarz (jika antar vektor). Jika antara matriks dan vektor maka digunakan Lemma Maksimum (hal.6). Beberapa hukum aljabar linear yang diperlukan dirujuk (hal ). Kegiatan 1 : Misalkan diberikan matriks kovariansi A Kita akan melakukan dekomposisi spektral yang berarti kita perlu mencari nilai eigen dan eigen vektor. Misalkan program untuk melakukan hal ini ditunjukkan berikut ini. ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 343

365 Tahap 1. A=[25-2 4; ; 4 1 9] Lamda=eig(A) %cari eigenvektor lam1=lamda(1); %cari eigvektor 1 e1=null(a-lam1*eye(3)) %cari eigvektor 2 lam2=lamda(2); e2=null(a-lam2*eye(3)) %cari eigvektor 3 lam3=lamda(3); e3=null(a-lam3*eye(3)) Tahap 2. Adapun keluaran program ditunjukkan berikut ini. A= Lamda = e1 = e2 = e3 = BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN

366 Pembahasan hasil program : Dekomposisi spektral meyatakan bahwa matriks simetris A, 3x3 diberikan oleh A3 x3 1e1e1' 2e2e2' 3e3e3', dengan , , dan e , e , e Latihan soal/kumpulan soal : (Anda dapat menggunakan MATLAB, MAPLE atau software yang mendukung) Sumber : Hal 87 No merupakan matriks orthogonal. 1. Selidikilah apakah Q Misal diberikan A 2 6 (a). Apakah A matriks simetris?. (b) Tunjukkan bahwa A positive definite. 3. Misalkan A adalah matriks yang diberikan oleh soal no.2. (a) Tentukan nilai eigen dan vektor eigen untuk matriks A. (b) Tulislah dekomposisi spektral matriks A. (c) Tentukan A 1 (d) Tentukan nilai eigen dan vektor eigen A 1 4. Perhatikan matriks-matriks berikut ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 345

367 dan B A Matriks-matriks tersebut identik kecuali pada perbedaan kecil pada posisi (2,2). Lagipula setiap kolom A dan B hampir tak bebas linear. Tunjukkan bahwa A 1 3B 1. Sebagai akibatnya, perubahan kecil (mungkin karena pembulatan) dapat menyebabkan perbedaan yang cukup substansial pada invers matriks. Tugas di rumah : Sketsalah ellips untuk x x ' S 1 x x 1 dimana ,, S S S Uji statistik untuk hasil parameter dari model modifikasi GSTAR Pada Bab 7, kita belum melakukan uji statistik untuk parameter yang dihasilkan dengan modifikasi GSTAR untuk data yang digunakan. Untuk itu pada bagian ini sedikit diperkenalkan bagaimana hasil modifikasi GSTAR dilakukan uji statistik. Kegiatan 1. Misalkan diberikan data pada file Koleksi.dat berturut turut tiap kolom adalah: #Z1tm1k : luas lahan kritis dari daerah Selo pada waktu t-1 #Z2tk : luas lahan kritis dari daerah Ampel pada waktu t #Z3tk :luas lahan kritis dari daerah Cepogo pada waktu t #Z1tm1p : panen padi Selo pada waktu t-1 #Z1tp : panen padi Selo pada waktu t #Z2tp : panen padi Ampel pada waktu t 346 BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN

368 #Z3tp : panen padi Cepogo pada waktu t Akan dilakukan regresi GSTAR dan uji statistic bahwa lahan kritis Selo merupakan fungsi lahan kritis Ampel dan Cepogo (lihat file kritisku.txt). Dengan R maka kita dapat menuliskan program pada Notepad sebagai berikut : #data dibuat dalam 1 matriks Kdata.dat <-read.table("koleksi.dat")[,] Kd<-Kdata.dat x1 <- Kd[,2] x2 <- Kd[,3] y <- Kd[,1] vd=data.frame(x1,x2,y=y) plot(vd) jpeg(file = "myplot1.jpg") #untuk dicetak pada directory yang sama plot(vd) dev.off() #Fit full model least suare linear with 5 variabel lm1 <-lm(y ~ x1 + x2, data = vd) lm1 summary(lm1) p <-2 n <- length(x1) qf(0.95, p, n-p-1) Adapun keluaran program ditunjukka n sebagai berikut : Call: lm(formula = y ~ x1 + x2, data = vd) ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 347

369 Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-06 *** x x Signif. codes: 0 *** ** 0.01 * Residual standard error: on 96 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 96 DF, p-value: > p <-2 > n <- length(x1) > qf(0.95, p, n-p-1) [1] Cara menganalisa program telah ditunjukkan pada Bab 3. Secara garis besar sebagai berikut: Uji t pada kedua variabel tidak signifikan untuk variabel X 1, X 2 karena yang signifikan hanyan intercept. Untuk p-value intercept di bawah 0.05 Oleh karena itu y tidak linear terhadap kedua variabel sehingga H 0 ( j 0 ) diterima. Karena R 2 adalah % dari variansi y maka model tidak cukup baik untuk digunakan sebagai fitting. Nilai F statistik adalah Sedangkan F5,n p 1,0.95 = 3, Sehingga nilai F statistik lebih kecil daripada F5,n p 1,0.95. Oleh karena itu j 0 diterima Hal ini juga dapat disimpulkan oleh nilai p yang cukup besar untuk semua variabel. Jadi 348 BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN

370 kita dapat menyimpulkan bahwa model linear tidak bisa kita buat. Artinya lahan kritis untuk Selo bukan merupakan fungsi linear dari 2 lahan kritis yang lain. Kegiatan 2. Kita akan menyelidiki bagaimana dengan curah hujan di Selo apakah merupakan fungsi linear curah hujan dari kedua daerah yang lain. Program untuk itu ditulis dalam Hujanku.txt sedangkan file data adalah curahhujan.dat #data dibuat dalam 1 matriks Kdata.dat <-read.table("curahhujan.dat")[,] Kd<-Kdata.dat x1 <- Kd[,2] x2 <- Kd[,3] y <- Kd[,1] vd=data.frame(x1,x2,y=y) plot(vd) jpeg(file = "myplot1.jpg") #untuk dicetak pada directory yang sama plot(vd) dev.off() #Fit full model least suare linear with 5 variabel lm1 <-lm(y ~ x1 + x2, data = vd) lm1 summary(lm1) p <-2 n <- length(x1) qf(0.95, p, n-p-1) Keluaran program ditunjukkan berikut ini. Call: lm(formula = y ~ x1 + x2, data = vd) Residuals: Min 1Q Median 3Q Max e e e e e-05 ANALISA DATA PEMODELAN UNTUK ILMU SOSIAL & SAINS 349

371 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e <2e-16 *** x e e <2e-16 *** x e e <2e-16 *** --Signif. codes: 0 *** ** 0.01 * Residual standard error: 8.325e-06 on 97 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 4.341e+11 on 2 and 97 DF, p-value: < 2.2e-16 > p <-2 > n <- length(x1) > qf(0.95, p, n-p-1) [1] Analisa Program: Anda dapat menginterpretasikan bahwa curah hujan di Selo merupakan dapat sebagai fungsi linear dari curah hujan di Ampel dan Cepogo. DAFTAR PUSTAKA Johnson, R. A. dan Winchern D. W Applied Multivariate Statistical Analysis. Prentice Hall, Englewood Cliffs. New Jersey. 350 BERBAGAI KEGIATAN PENELITIAN TEORI DENGAN PEMROGRAMAN

372 9 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL 9.1 Pendahuluan Perkembangan awal analisis spasial dimulai dengan pengembangan bidang kuantitatif dan statistika geografi pada tahun Definisi analisis spasial adalah pengembangan aplikasi yang menyediakan metode statistik untuk data spasial, dan definisi tersebut diperluas dengan memasukkan model matematika. Analisis spasial adalah analisis kuantitatif dalam representasi geografi yang membahas pola titik, garis, area dan permukaan dalam suatu peta sesuai dengan koordinat dalam keruangan dua atau tiga dimensi (Openshaw,1991). Pada definisi tersebut termasuk di dalamnya pendekatan prosedural dan metodologi kuantitatif (khususnya statistik) yang diterapkan untuk menyelesaikan persoalan dalam analisis karakteristik suatu lokasi. Unwin (1981) lebih menekankan definisi pada tipe data untuk pemetaan yang meliputi titik, garis, area dan permukaan. Arah dan perkembangan awal area penelitian spasial pada dasarnya dapat dikelompokkan dalam tiga tahap, yaitu : 1. Kebutuhan kehandalan proses manipulasi spasial data geografis sederhana seperti interpolasi dan tumpang tindih data (overlay) dan fungsi statistik menjadi sangat penting dalam sistem informasi geografis. 2. Perluasan konsep statistik melalui penyediaan substansi teoritik statistik data spasial yang belum dapat dijabarkan dalam sains geografi, seperti estimasi kepadatan populasi, kriging dan KANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 351

373 function. Fungsi tersebut dikembangkan pada tahun 1980 dengan tujuan untuk penanganan data spasial. Pada tahap ini disebut sebagai revolusi kuantitatif. 3. Data spasial dengan resolusi sangat tinggi tersedia, permasalahan komputasi dan pemetaan dapat diselesaikan melalui penyediaan strategi dan mekanisme eksplorasi, analisis dan visualisasi sejak tahun 1950 (Unwin, 1981). Visualisasi data spasial dalam suatu peta memainkan peranan yang sangat penting dalam menyampaikan ide kepada orang lain atau untuk mengeksplorasi data spasial. Data spasial umunya dinyatakan dalam bentuk peta tematik seperti peta titik,choropleth, simbol proporsional, dan isarithmic. Setiap data spasial membutuhkan metode pemetaan tematik yang cocok untuk merepresentasikan informasi secara tepat (Tanimura, 2006). Peta adalah salah satu bentuk dokumen yang memuat informasi tentang hubungan spasial unsur - unsur yang ada di permukaan bumi, menggambarkan dunia nyata di atas suatu bidang datar dalam bentuk simbol-simbol yang mudah dipahami oleh semua orang dan pada ukuran atau skala tertentu yang dapat dipertanggungjawabkan kebenarannya secara matematis. Peta digital adalah suatu peta tematik yang disimpan dalam format digital. Persyaratan yang harus dipenuhi oleh suatu peta sehingga menjadi peta yang ideal adalah: 1. Jarak antara titik-titik Jarak antara titik-titik yang terletak di atas peta harus sesuai dengan jarak aslinya di permukaan bumi (dengan memperhatikan faktor skala tertentu). 352 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

374 2. Luas Luas suatu unsur yang direpresentasikan di atas peta harus sesuai dengan luas sebenarnya (juga dengan mempertimbangkan skalanya). 3. Sudut atau arah Sudut atau arah suatu garis yang direpresentasikan di atas peta harus sesuai dengan arah yang sebenarnya (seperti di permukaan bumi). 4. Bentuk Bentuk suatu unsur yang direpresentasikan di atas peta harus sesuai dengan bentuk yang sebenarnya (juga dengan mempertimbangkan faktor skalanya). Pada kenyataannya di lapangan merupakan hal yang tidak mungkin menggambarkan sebuah peta yang dapat memenuhi semua kriteria di atas, karena permukaan bumi itu sebenarnya melengkung. Sehingga pada saat melakukan proyeksi dari bentuk permukaan bumi yang melengkung tersebut ke dalam bidang datar (kertas) akan terjadi distorsi terutama pada bagian kutub (pelebaran wilayah). Berdasarkan jenisnya beda dikelompokkan menjadi beberapa kategori, yaitu : 1. Peta titik (dot map) merepresentasikan kepadatan spasial dalam interval tinggi, medium dan rendah. 2. Peta simbolik (symbolic map), areal/titik unit spesifik yang merepresentasikan lokasi aktual, centroid dalam interval nilai tinggi/rendah. 3. Peta jaringan (network map), garis merepresentasikan data jaringan jalan dan sungai. 4. Peta isarithmic, merepresentasikan kontur permukaan. 5. Peta Cartogram, data disajikan berdasarkan unit area yang bersifat continuous (antar unit data memiliki keterhubungan) dan bersifat discontinuous. ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 353

375 6. Peta Choropleth, data disajikan dalam unit area, pemetaan data dilakukan dalam bentuk mean, median dan mode. Saat ini peta choropleth banyak digunakan untuk mengklasifikasikan data menggunakan pola warna peta. Terdapat 3 metode klasifikasi data yang umum digunakan yaitu: equal interval, equal frequencies, dan statistical optimal (Tanimura dkk., 2006). Peta choropleth dapat dibedakan menjadi tiga jenis, yaitu: peta choropleth dengan mengacu pada struktur administratif misalnya batas wilayah kecamatan, kabupaten atau provinsi. Peta dasymetric yang mengacu pada representasi data dalam dunia nyata. Peta choropleth map dengan raster, menggunakan bentuk geometrik sebagai referensi interpretasi data. Peta dasar untuk representasi data penyakit meliputi peta titik untuk titik kejadian, peta choropleth untuk data area dan peta isopleth untuk data geostatistik (hasil pengukuran) yang merupakan fenomena spasial kontinu pada sejumlah lokasi pengambilan sampel (Barke, 2004). Epidemiologi spasial berkaitan dengan analisis jenis data kejadian, ringkasan data dan identifikasi faktor risiko penyakit menggunakan peta isopleth. Meskipun saat ini sudah digunakan secara meluas dan di berbagai bidang namun peta choropleth memiliki beberapa keterbatasan. Keterbatasan peta choropleth adalah sebagai berikut: Pertama, penyajian nilai secara absolut di setiap wilayah spasial dalam peta, padahal pada kenyataannya terdapat variasi nilai di setiap wilayah observasi. Solusi yang diterapkan untuk mengatasi permasalahan ini adalah dengan menghitung nilai proporsi dan rasio. Kedua, adalah setiap unit spasial memiliki kebijakan dan standard yang berbeda sesuai dengan kepentingannya. Wilayah yang lebih luas umumnya mendominasi tampilan visual jika dibandingkan dengan wilayah yang kecil meskipun tingkat densitasnya lebih tinggi. Solusi yang 354 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

376 dipilih adalah menggunakan kartogram untuk mengubah ukuran setiap unit spasial. Ketiga, adalah tingkat akurasi data, yang mana merupakan hal mendasar terkait dengan klasifikasi data dalam pemetaan menggunakan choropleth Sains Informasi Geografis Sains Informasi Geografis secara umum didefinisikan sebagai ilmu yang mempelajari berbagai metodologi untuk menganalisis data spasial. Umumnya sains informasi geografis didefinisikan sebagai pengambilan, penyimpanan, integrasi, manajemen, visualisasi, analisis,dan pemodelan data spasial. Pengertian umum data spasial adalah suatu data yang mengacu pada posisi, obyek dan interelasinya dalam ruang bumi. Data spasial merupakan salah satu item dari informasi, dimana di dalamnya terdapat informasi mengenai bumi termasuk permukaan bumi, dibawah permukaan bumi, perairan, kelautan dan bawah atmosfir. Karakteristik utama dari data spasial adalah bagaimana mengumpulkan data dan memanfaatkannya untuk tujuan spesifik. Istilah lain yang memiliki pengertian sama adalah Geokomputasi dan Geoinformatika. Berdasarkan pada definisi tersebut, keilmuan ini merupakan subjek yang sangat luas dan terkait dengan berbagai aspek apapun untuk mendapatkan informasi dari data spasial. Berbagai bidang yang berasosiasi dengan sistem informasi geografis adalah sebagai berikut (Goodchild, 2010) : 1. Analisis spasial statistik, area ini membahas pemanfaatan metode statistik untuk menyelesaikan persoalan dalam bentuk pola titik, garis, area dan permukaan suatu peta sesuai dengan koordinat keruangan. 2. Struktur basisdata yang berelasi dengan data spasial, area ini membahas pemrosesan dan penyimpanan data di dalam basisdata. ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 355

377 3. Kecerdasan buatan dan sistem pakar, area ini membahas sistem cerdas dan sistem pakar yang diperluas fungsinya dengan kemampuan untuk melakukan identifikasi lokasi. 4. Visualisasi, area ini membahas bagaimana menyediakan bagi pengguna tampilan atau visualisasi objek data dalam pola keruangan secara informatif sesuai dengan keadaan sesungguhnya. 5. Isu potensial lokal seperti sosial dan ekonomi, area ini membahas bagaimana memanfaatkan analisis spasial untuk menyelesaikan persoalan dalam masyarakat di berbagai bidang seperti sosial dan ekonomi. Citra Satelit penginderaan jauh merupakan data spasial yang bersumber dari satelit yang dilengkapi dengan sensor untuk dapat merekam kondisi atau gambaran dari permukaan bumi. Umumnya diaplikasikan dalam kegiatan yang berhubungan dengan pemantauan sumber daya alam di permukaan bumi, dan pemantauan perubahan lahan dan lingkungan. Kelebihan dari teknologi ini adalah kemampuan dalam merekam cakupan wilayah yang luas dan tingkat resolusi dalam merekam obyek yang sangat tinggi. Data yang dihasilkan dari citra satelit kemudian diturunkan menjadi data tematik dan disimpan dalam bentuk basis data untuk digunakan dalam berbagai macam aplikasi. Contoh citra satelit dari penginderaan jauh adalah sebagaimana pada Gambar 9.1. Pada gambar ini disajikan contoh pemanfaatan citra satelit dalam sistem pranatamangsa baru versi 1 yang di desain dan dibangun atas fasilitasi Direktorat Pendidikan Tinggi Kementerian Pendidikan Nasional RI melalui Hibah Bersaing tahun Citra satelit ini menggambarkan wilayah Kabupaten Boyolali. 356 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

378 Gambar 9.1. Citra satelit dalam sistem pranatamangsa baru versi 1 Kabupaten Boyolali (Prasetyo dkk., 2008). Pada Gambar 9.1. menunjukkan besaran curah hujan wilayah Kabupaten Boyolali yang ditentukan menggunakan pendekatan Learning Vector Quantification. Semakin gelap visualisasi warna suatu garis atau wilayah menunjukkan semakin tingginya curah hujan wilayah tersebut. Peta Analog, merupakan perkembangan tahap awal dari data spasial. Peta Analog merupakan bentuk tradisional dari data spasial, yang ditampilkan dalam bentuk kertas atau film. Peta analog modern sudah di salin menggunakan scanning menjadi format digital untuk kemudian disimpan dalam basis data.contoh peta analog Kabupaten Boyolali Jawa Tengah adalah sebagaimana pada Gambar 9.3. Peta ini bersumber dari Dinas Pekerjaan Umum Kabupaten Boyolali. Foto Udara (Aerial Photographs), sumber data yang banyak digunakan untuk menghasilkan data spasial selain dari citra satelit. Foto udara direkam menggunakan pesawat udara. Proses perekama data sama dengan citra satelit. Kamera yang digunakan dapat menggunakan kamera ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 357

379 konvensional dan hasilnya disimpan dalam bentuk film negative atau dengan kamera digital yang hasilnya disimpan dalam bentuk basisdata. Contoh foto udara adalah sebagaimana pada Gambar 9.4. Foto udara ini diambil dari Badan Nasional Penanggulangan Bencana pada saat erupsi Gunung Merapi Jawa Tengah pada tanggal 15 November Gambar 9.2. Peta analog Kabupaten Boyolali (Anonim.a, 2013) Gambar 9.3.Foto udara erupsi Gunung Merapi (Anonim.b,2010) Data LIDAR, singkatan dari Light Detection And Ranging merupakan teknologi untuk menyediakan data spasial dengan cepat dan akurat. LiDAR bekerja melalui penembakan gelombang aktif dari pesawat ke permukaan bumi, gelombang tersebut akan kembali setelah mengenai objek di permukaan bumi. Setiap objek-objek yang memantulkan gelom358 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

380 bang tersebut akan diperoleh koordinat x,y dan z. Contoh citra Lidar adalah sebagaimana pada Gambar 9.4. Contoh ini merupakan data LIDAR DSM (Digital Surface Model) Sumatera Selatan (Anonim.c, 2014). Gambar 9.4. LIDAR DSM (Digital Surface Model) Sumatera Selatan Sumber : Seluruh data yang dihimpun akan disimpan dalam basisdata dan diproses menggunakan database manajemen system (DBMS) seperti Oracle, SQL Server, MySQL dan Postgre. Keseluruhan data tersebut akan disimpan dalam bentuk raster atau vektor. Data raster menyediakan informasi spasial permukaan bumi dalam bentuk gambaran yang di generalisasi. Representasi dunia nyata disajikan sebagai elemen matriks atau piksel yang membentuk grid. Pada setiap piksel mewakili setiap obyek yang terekam dan ditandai dengan nilai-nilai tertentu. Secara konseptual, model data raster merupak model data spasial yang paling sederhana. Tingkat keakurasian model ini ditentukan oleh ukuran piksel atau biasa disebut resolusi. Contoh bentuk data raster adalah sebagai berikut Gambar 9.5. ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 359

381 Pada Gambar 9.5. merupakan contoh data raster yang diambil dari citra satelit erupsi Gunung Merapi 15 November Pembesaran bagian kecil dari citra menunjukkan bentuk piksel (picture element) sebagai penyusun citra satelit (kotak kuning). Data vektor merupakan model data yang umum digunakan dalam mempelajari sains informasi geografis. Model ini berbasiskan pada titik (points) dengan nilai koordinat (x,y) untuk membangun obyek spasialnya. Gambar 9.5. Data raster (Sumber : Obyek yang dibangun terbagi menjadi tiga bagian lagi yaitu berupa titik (point), garis (line) dan area (polygon). 1. Titik (point) Titik merupakan representasi grafis yang paling sederhana pada suatu obyek. Titik tidak mempunyai dimensi tetapi dapat ditampilkan dalam bentuk symbol baik pada peta maupun dalam layar monitor. Sifat data jenis titik adalah : a. Satu dimensional. b. Direpresentasikan posisi x and y. c. Kurang bisa digunakan sebagai indikator. 360 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

382 d. Tidak dapat digunakan untuk penentuan wilayah, luasan dan kalkulasi lain Data vektor titik dapat dilihat sebagai pada Gambar 9.7. Pada contoh ini menunjukkan garis batas wilayah Kabupaten Boyolali dengan titik-titik dalam setiap wilayah yang lebih kecil (polygon) dalam konteks peta merupakan wilayah administratif kecamatan. Titik merupakan elemen spasial yang dapat direpresentasikan sebagai posisi kantor kecamatan, kejadian penyakit, posisi pengambilan sampel dan sebagainya. Setiap titik memiliki nilai koordinat tertentu yang menggambarkan posisinya dari muka bumi. Data ini umumnya memiliki format file shape. Gambar 9.6.Data dalam bentuk titik (Prasetyo, dkk., 2010). Gambar 9.6. merupakan data vektor dalam bentuk titik yang merepresentasikan posisi koordinat kantor kecamatan di wilayah Kabupaten Boyolali Jawa Tengah. 2. Garis (line) Garis merupakan bentuk linear yang menghubungkan dua atau lebih titik dan merepresentasikan obyek dalam satu dimensi, contoh: jalan atau sungai. Sifat data jenis garis adalah: ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 361

383 a. Satu dimensional. b. Representasi posisi dan arah. c. Bermanfaat untuk pengukuran panjang Contoh bentuk data garis adalah sebagai berikut Gambar 9.9. Gambar 9.7. Data dalam bentuk garis (Prasetyo, dkk., 2010). Gambar 9.7. merupakan data vektor dalam bentuk garis yang merepresentasikan jaringan sungai di wilayah Kabupaten Boyolali Jawa Tengah. 3. Area (polygon) Polygon merupakan representasi obyek dalam dua dimensi, contoh : danau, persil tanah, dll. Contoh bentuk data titik adalah sebagai berikut Gambar Sifat data jenis area adalah: a. Dua dimensional. b. Fitur Area. c. Representasi posisi dan area. 362 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

384 Gambar 9.8. Data dalam bentuk area, (Prasetyo, dkk., 2010) Analisis Data Spasial Secara umum data spasial dikelompokkan dalam enam kategori yaitu: 1. Queries, kategori data spasial sederhana yang digunakan untuk mengetahui informasi melalui sederhana tanpa adanya perubahan pada sistem dan basisdata. Sistem yang menggunakan kategori ini umum bertujuan untuk proses pencarian dan visualisasi data suatu wilayah yang ada dalam basisdata. 2. Measurements, kategori data spasial sederhana yang sudah menggunakan nilai numerik untuk memberikan gambaran beberapa data geografi wilayah. Sebagai contoh adalah pengukuran panjang jalan atau sungai, pengukuran luas wilayah atau penentuan kepadatan penduduk. 3. Transformations, kategori data spasial yang digunakan untuk perubahan himpunan data melalui proses kombinasi atau perbandingan sehingga diperoleh himpunan data baru. Metode ini menggunakan geometri, aritmetika atau aturan logika sederhana. ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 363

385 4. Descriptive summaries, kategori data spasial untuk perangkuman himpunan data berdasarkan pada kesamaan atribut spasial menggunakan metode statistik dan secara deskriptif. 5. Optimization techniques, kategori data spasial yang telah menggunakan metode optimasi untuk pemilihan satu data atribut dari sekumpulan atau himpunan data atribut. 6. Hypothesis testing, kategori data spasial yang digunakan untuk menguji hipotesis dan menyusun pola spesifik suatu sampel sebagai upaya menggeneralisasi keseluruhan populasi. Berbagai bidang keilmuan yang telah memanfaatkan metode analisis data spasial dalam memecahkan berbagai persoalan adalah: 1. Analisis spasial pada bidang epidemiologi, menentukan distribusi dan sebaran suatu penyakit dalam wilayah geografis tertentu membentuk pola spesifik yang akan berulang dalam jangka waktu tertentu. 2. Analisis spasial pada bidang kriminologi, menentukan distribusi pemusatan spasial untuk kasus kejahatan pada suatu wilayah dan kaitannya dengan sosial, ekonomi atau budaya tertentu. 3. Analisis spasial pada bidang Geologi, melakukan proses mengestimasi, dari beberapa sampel, adanya tambahan cadangan (deposit) mineral pada suatu wilayah. 4. Analisis spasial pada bidang pertanian, menyusun zonasi agroekologi Agroekologi adalah pengelompokan suatu wilayah berdasarkan keadaan fisik lingkungan yang hampir sama dimana keragaman tanaman dan hewan dapat diharapkan tidak akan berbeda nyata. 5. Analisis spasial pada bidang Agrometeorologi, teknologi spasial dan temporal merupakan salah satu solusi penting dalam bidang agrometeorologi. Hal ini disebabkan oleh beberapa faktor, yaitu: 364 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

386 1. Besarnya eksploitasi terhadap sumberdaya air dan sumberdaya lahan menuntut diperlukannya pengelolaan secara bijak. 2. Kebutuhan sistem peramalan dalam proses budidaya (jenis komoditas, penyakit, cuaca, kebakaran dsb). Untuk menggambarkan kondisi sebagaimana di dunia nyata maka diperlukan semua informasi yang tersedia di wilayah, yaitu ketersediaan air, jenis tanah, hutan dan padang rumput, data iklim, geologi, populasi, penggunaan lahan, batas administrasi dan infrastruktur (jalan raya, kereta api, listrik atau sistem komunikasi). Setiap informasi tersebut akan dapat memberikan peluang terhadap perubahan hasil akhir, sehingga diperlukan berbagai fungsi matematis atau model untuk mereproduksi informasi sesuai dengan kebutuhan. Sebagai contoh di Tuscany untuk melakukan pemantauan terhadap potensi dan risiko kebakaran hutan dilakukan integrasi antara SIG dengan citra penginderaan jauh yang bersumber dari satelit. Tujuannya adalah untuk mendapatkan gambaran secara utuh tataguna lahan, awal titik api, jarak dengan jalan, elevasi wilayah, kemiringan lahan dan aspek-aspek lainnya (Maracchi dkk, 2000) Metode Eksplorasi dan Analisis Data Spasial Secara umum data spasial tersusun atas dua komponen utama yaitu objek atribut dan objek lokasi, dalam beberapa literatur disebut sebagai data georeferensi. Objek lokasi pada data spasial direpresentasikan sebagai titik tunggal (point) dan wilayah (area) dan divisualisasikan dalam dua dimensi atau peta. Pola titik dalam visualisasi dua dimensi dapat dikelompokkan menjadi tiga pola yaitu: ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 365

387 1. pola reguler, apabila jarak antar titik sama dan membentuk objek grid yang teratur, 2. pola acak, apabila posisi setiap titik tersebar secara acak di seluruh wilayah dan bersifat independen satu sama lain, dan 3. pola agregat atau cluster, apabila posisi titik memiliki kecenderungan berkelompok. Eksplorasi dan analisis data spatial atau dikenal sebagai exploratory spatial data analysis (ESDA) adalah bagian dari proses eksplorasi dan analisis data (EDA) yang difokuskan untuk karakterisasi data geografis khususnya spatial autocorrelation (spatial autocorrelation) dan heterogenitas spasial (spatial heterogeneity) (Anselin,1996). EDA terdiri dari kumpulan metode statistik yang bertujuan untuk mencari pola data, menyediakan hipotesis baik dalam bentuk deskriptif maupun bentuk grafis dinamis yang memungkinkan interaksi pengguna untuk memanipulasi dan visualisasi data dalam model histogram, boxplot, q-q plot, dot plot dan scatterplot. ESDA didefinisikan sebagai kumpulan teknik untuk menggambarkan dan memvisualisasikan distribusi spasial, mengidentifikasi lokasi atipikal atau pencilan (outliers), representasi pola asosiasi spasial, identifiksi klaster spasial atau hotspot, coldspot dan memberikan rezim spasial sebagai heterogenitas spasial (Anselin,1994). Ide dasar konsep ini menurut adalah gagasan tentang spatial autocorrelation atau asosiasi spasial, yakni kesamaan nilai atribut dalam suatu wilayah berdasarkan observasi sesuai dengan kesamaan nilai atribut berdasarkan nilai korelasi atribut tersebut (Anselin, 1996). Exploratory Spatial Data Analysis (ESDA) merupakan bagian dari Exploratory Data Analysis (EDA) yang fokus pada pengenalan karakteristik dari data geografis dan lebih spesifik lagi pada spatial autocorrelation dan spatial heterogeneity (Anselin 1996). Menurut Anselin, 366 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

388 ESDA merupakan suatu kumpulan teknik untuk menggambarkan dan memvisualisasikan distribusi spasial, mengidentifikasi lokasi yang sejenis atau pencilan spasial, menemukan pola dari spatial association, klaster atau hot spots dan menduga pola lain dari heterogenitas spasial. Dalam hubungannya dengan dengan keruangan, terdapat empat jenis teknik sebagaimana disajikan pada Tabel 2.1., yaitu: (1) Visualisasi distribusi spasial, (2) Visualisasi asosiasi spasial, (3) Local indicators of spatial association, (4) Multivariate indicators of spatial association. Pola asosiasi spasial dalam data geografis terdiri dari dua metode, yaitu Global dan Local. Metode Global adalah analisis pola asosiasi spasial pada skala yang luas untuk melihat distribusi data, apakah terbentuk pengelompokan (cluster), terdispersi (dispersed) dan acak (random) dalam suatu keruangan. Metode ini disebut sebagai Indeks Moran s I dan Getis Ord. Luaran yang dihasilkan dengan metode ini adalah signifikasi secara statistik tinggi (hot spots) dan signifikasi secara statistik rendah (cold spots). Metode local adalah kuantifikasi autokorelasi spasial dalam wilayah yang lebih kecil dibandingkan global. Metode yang digunakan adalah Getis Ord Gi statistic dan local Morans I atau Local Indicator Spatial Association (LISA). Fokus dalam ESDA adalah menentukan global dan local spatial autocorrelation yang ditentukan dengan fungsi Moran s I statistic. Fungsi Moran s I statistic digunakan untuk menentukan tingkat kesamaan/kemiripan nilai atribut suatu variabel tertentu (Ma & Pei, 2007). Ditinjau dari model data maka spatial autocorrelation dapat dianalisis dalam dua kategori, yaitu, pertama didasarkan pada data dalam bentuk titik sebagai sampel yang terdistribusi secara kontinyu (disebut sebagai perspektif geostatistik), dan kedua didasarkan pada data dalam bentuk poligon (perspektif lattice) (Ma & Pei, 2007). ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 367

389 Analisis spasial dikelompokkkan dalam tiga kategori mendasar, yaitu jarak, konektivitas dan arah. Analisis spasial umumnya hanya menggunakan jarak dan konektivitas saja dalam merepresentasikan objek secara geografis. Pengertian jarak awalnya adalah hasil pengukuran tunggal dari satu centroid menuju centroid lainnya (antar poligon), namun pengertian tersebut diperluas menjadi hasil pengukuran antara dua objek spasial (Miller, 2000). Konektivitas merupakan keterhubungan secara topologis antara titik, garis dan area dalam keruangan. Topologi pada konteks konektivitas didefinisikan sebagai hubungan spasial antara fitur yang berdekatan atau bertetangga atau properti yang menentukan hubungan relatif antara elemen spasial. Pada topologi tersimpan fitur spasial dan struktur data konektivitas spasial (Theobald, 1999). Secara teoritik peta merupakan layer yang tersusun atas himpunan objek spasial pada skala tertentu dan tersimpan dalam suatu basisdata atau peta. Objek spasial tersebut meliputi empat kategori dasar, yaitu titik, garis, area, dan volume. Sebagai contoh adalah peta (P) memiliki anggota objek spasial (o) P = { o1, o2,o3,o4 on }. Dalam konteks spasial topologi (T) didefinisikan sebagai himpunan bagian dari produk Cartesian dua layer peta dan dinotasikan sebagai T=P x S (S merupakan layer peta). Derajad keterhubungan dalam topologi spasial ditentukan melalui pasangan objek antara layer peta (P) dan layer peta (S) (Jiang & Omer, 2007). Klasifikasikan konektivitas spasial dalam tiga kategori (Eliss dkk., 2010): 1. Konektivitas struktural, keterhubungan secara fisik pada atribut lanskap seperti jarak tetangga wilayah terdekat. 2. Konektivitas potensial, keterhubungan secara fisik pada atribut lanskap dan distribusi objek seperti frekuensi distribusi dan penyebaran penyakit pada suatu wilayah dengan skala tertentu. 3. Konektivtas aktual, keterhubungan secara fisik pada atribut 368 PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

390 lanskap dan distribusi objek sampai pada ukuran (jarak) detail distribusi. Ketiga bentuk konektivitas tersebut merupakan fitur yang digunakan untuk beberapa pendekatan yaitu, (1) Menggambarkan derajad keterhubungan antar lokasi, (2) mengidentifikasi ukuran konektivitas terbaik untuk situasi yang berbeda, (3) pengujian perubahan dalam konfigurasi lansekap, (4) perubahan konektivitas akibat penyebaran organisme. Penentuan detail konektivitas spasial dapat dilakukan dengan Moran s I, Uji Mantel dan Korrelogram (Eliss dkk.,2010). Analisis data spasial sering terjadi bahwa hasil pengukuran suatu objek spasial yang berada pada minimal dua titik dengan jarak tertentu menunjukkan adanya karakteristik pola spasial sehingga diperlukan analisis spatial autocorrelation. Derajad konektivitas antara dua atau lebih nilai objek spasial akan dapat dijelaskan melalui kemiripan nilai variabel tersebut. Sebagai gambaran, untuk menjelaskan fenomena hotspot dalam spasial statistik maka metode spatial autocorrelation dapat digunakan untuk tujuan ini dan menghasilkan luaran yang sesuai dengan tujuan analisis dalam berbagai bidang seperti ilmu biologi, ekonomi, urban dan epidemiologi (Chen dan Jiang, 2010). Metode dalam spatial autocorrelation yang dapat digunakan untuk menjelaskan derajad konektvitas adalah Moran s I. Metode Moran s I terdiri dari atribut-atribut data spasial dan spatial weight matrix yang dapat menggambarkan relasi antara area (poligon) satu dengan area (poligon) yang berada di sekitarnya (Chen & Jiang, 2010) Visualisasi Data Spasial Visualisasi data spasial dalam suatu peta memainkan peranan yang sangat penting dalam menyampaikan ide kepada orang lain atau untuk mengeksplorasi data spasial. Data spasial umunya dinyatakan dalam ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 369

391 bentuk peta tematik seperti peta titik,choropleth, simbol proporsional, dan isarithmic. Setiap data spasial membutuhkan metode pemetaan tematik yang cocok untuk merepresentasikan informasi secara tepat (Tanimura, 2006). Berdasarkan jenisnya beda dikelompokkan menjadi beberapa kategori, yaitu: (1) Peta titik (dot map) merepresentasikan kepadatan spasial dalam interval tinggi, medium dan rendah. (2) Peta simbolik (symbolic map), areal/titik unit spesifik yang merepresentasikan lokasi aktual, centroid dalam interval nilai tinggi/rendah. (3) Peta jaringan (network map), garis merepresentasikan data jaringan jalan dan sungai. (4) Peta isarithmic, merepresentasikan kontur permukaan. (5) Peta Cartogram, data disajikan berdasarkan unit area yang bersifat continuous (antar unit data memiliki keterhubungan) dan bersifat discontinuous. (6) Peta Choropleth, data disajikan dalam unit area, pemetaan data dilakukan dalam bentuk mean, median dan mode. Saat ini peta choropleth banyak digunakan untuk mengklasifikasikan data menggunakan pola warna peta. Terdapat 3 metode klasifikasi data yang umum digunakan yaitu: (1) equal interval, (2) equal frequencies, dan (3) statistical optimal (Andrienko, 2002). Contoh choropleth map adalah sebagaimana pada Gambar 2.2. Pada Gambar ini direpresentasikan serangan wereng batang coklat di wilayah Lab.PHP V Surakarta bulan Januari Desember PENELITIAN BERBASIS KONSEP DAN PENDEKATAN SPASIAL

392 Gambar 9.9. Representasi serangan wereng batang coklat di wilayah Lab.PHP V Surakarta bulan Januari Desember Peta choropleth dapat dibedakan menjadi tiga jenis, yaitu: (1) peta choropleth dengan mengacu pada struktur administratif misalnya batas wilayah kecamatan, kabupaten atau provinsi. (2) Peta dasymetric yang mengacu pada representasi data dalam dunia nyata. (3) Peta choropleth map dengan raster, menggunakan bentuk geometrik sebagai referensi interpretasi data. Peta dasar untuk representasi data penyakit meliputi peta titik untuk titik kejadian, peta choropleth untuk data area dan peta isopleth untuk data geostatistik (hasil pengukuran) yang merupakan fenomena spasial kontinu pada sejumlah lokasi pengambilan sampel (Chen & Jiang, 2010). Epidemiologi spasial berkaitan dengan analisis jenis data kejadian, ringkasan data dan identifikasi faktor risiko penyakit menggunakan peta isopleth. Meskipun saat ini sudah digunakan secara meluas dan di ANALISA DATA DAN PEMODELAN UNTUK ILMU SOSIAL & SAINS 371

DISAIN AWAL PROTOTYPE G2A UNTUK ANALISA DATA PERTANIAN DAN PEDESAAN

DISAIN AWAL PROTOTYPE G2A UNTUK ANALISA DATA PERTANIAN DAN PEDESAAN DISAIN AWAL PROTOTYPE G2A UNTUK ANALISA DATA PERTANIAN DAN PEDESAAN Hanna Arini Parhusip 1 dan Ramos Somnya 2 Pusat Studi Simitro, Fakultas Teknologi Informasi Universitas Kristen Satya Wacana ABSTRAK.

Lebih terperinci

ANALISA DATA IKLIM BOYOLALI DENGAN REGRESI KLASIK DAN METODE GSTAR

ANALISA DATA IKLIM BOYOLALI DENGAN REGRESI KLASIK DAN METODE GSTAR Prosiding Seminar Nasional Matematika dan Pendidikan Matematika Tuban, 4 Mei 14 ANALISA DATA IKLIM BOYOLALI DENGAN REGRESI KLASIK DAN METODE GSTAR H.A Parhusip 1) dan Winarso, M.E ) Pusat Penelitian SIMITRO

Lebih terperinci

Distribusi Frekuensi dan Statistik Deskriptif Lainnya

Distribusi Frekuensi dan Statistik Deskriptif Lainnya BAB 2 Distribusi Frekuensi dan Statistik Deskriptif Lainnya Misalnya seorang penjaga gudang mencatat berapa sak gandum keluar dari gudang selama 15 hari kerja, maka diperoleh distribusi data seperti berikut.

Lebih terperinci

STATISTIKA TERAPAN Disertai Contoh Aplikasi dengan SPSS

STATISTIKA TERAPAN Disertai Contoh Aplikasi dengan SPSS STATISTIKA TERAPAN Disertai Contoh Aplikasi dengan SPSS Penulis: Dr. Bambang Suharjo, M.Si. Edisi Pertama Cetakan Pertama, 2013 Hak Cipta 2013 pada penulis, Hak Cipta dilindungi undang-undang. Dilarang

Lebih terperinci

STUDI TINGKAT KEMISKINAN DI INDONESIA DENGAN ANALISA DISKRIMINAN ECM DAN METODE FISHER

STUDI TINGKAT KEMISKINAN DI INDONESIA DENGAN ANALISA DISKRIMINAN ECM DAN METODE FISHER Prosiding Seminar Nasional Matematika dan Pendidikan Matematika Tuban, 4 Mei 4 STUDI TINGKAT KEMISKINAN DI INDONESIA DENGAN ANALISA DISKRIMINAN ECM DAN METODE FISHER Hanna Arini Parhusip*) Angelita Titis

Lebih terperinci

STUDI SIMULASI GRAFIK PENGENDALI BERDASARKAN ESTIMASI FUNGSI DENSITAS KERNEL BIVARIAT

STUDI SIMULASI GRAFIK PENGENDALI BERDASARKAN ESTIMASI FUNGSI DENSITAS KERNEL BIVARIAT Prosiding Seminar Nasional Penelitian, Pendidikan dan Penerapan MIPA, Fakultas MIPA, Universitas Negeri Yogyakarta, Juni 0 STUDI SIMULASI GRAFIK PENGENDALI BERDASARKAN ESTIMASI FUNGSI DENSITAS KERNEL BIVARIAT

Lebih terperinci

BAB 3 PENGOLAHAN DATA

BAB 3 PENGOLAHAN DATA BAB 3 PENGOLAHAN DATA 3.1 Menentukan Model Persamaan Regresi Linier Berganda Data yang dikumpulkan dalam penelitian ini adalah jumlah kecelakaan lalu lintas dan faktor-faktor yang mempengaruhinya yaitu

Lebih terperinci

MODUL V REGRESI, KORELASI, ANALISIS VARIAN, VALIDITAS DAN RELIABILITAS

MODUL V REGRESI, KORELASI, ANALISIS VARIAN, VALIDITAS DAN RELIABILITAS REGRESI, KORELASI, ANALISIS VARIAN, VALIDITAS DAN RELIABILITAS A. TUJUAN PRAKTIKUM Dengan adanya Praktikum Statistika Industri Modul V tentang Regresi, Korelasi, Analisis Varian, Validitas dan Reliabilitas

Lebih terperinci

SKRIPSI JURUSAN STATISTIKA PERAMALAN INDEKS HARGA KONSUMEN 4 KOTA DI JAWA TENGAH MENGGUNAKAN MODEL GENERALIZED SPACE TIME AUTOREGRESSIVE (GSTAR)

SKRIPSI JURUSAN STATISTIKA PERAMALAN INDEKS HARGA KONSUMEN 4 KOTA DI JAWA TENGAH MENGGUNAKAN MODEL GENERALIZED SPACE TIME AUTOREGRESSIVE (GSTAR) PERAMALAN INDEKS HARGA KONSUMEN 4 KOTA DI JAWA TENGAH MENGGUNAKAN MODEL GENERALIZED SPACE TIME AUTOREGRESSIVE (GSTAR) SKRIPSI Disusun Oleh : LINA IRAWATI NIM : 24010211140072 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

BAB III METODE PENELITIAN. ilmiah untuk mendapatkan data dengan tujuan dan kegunaan tertentu. Dalam

BAB III METODE PENELITIAN. ilmiah untuk mendapatkan data dengan tujuan dan kegunaan tertentu. Dalam BAB III METODE PENELITIAN 3.1 Desain Penelitian Menurut Sugiyono (2009: 3) metode penelitian dapat diartikan sebagai cara ilmiah untuk mendapatkan data dengan tujuan dan kegunaan tertentu. Dalam penelitian

Lebih terperinci

A. 1 Repeated Measures untuk Studi Respon Mahasiswa

A. 1 Repeated Measures untuk Studi Respon Mahasiswa yang digunakan tidak hanya satu jenis latihan, akan tetapi sejumlah latihan yang berhubungan satu latihan dengan latihan yang lain. Penelitian ini akan mencari opini mahasiswa tentang variasi latihan-latihan

Lebih terperinci

S 10 Studi Simulasi Tentang Penerapan Grafik Pengendali Berdasarkan Analisis Komponen Utama (Principal Component Analysis)

S 10 Studi Simulasi Tentang Penerapan Grafik Pengendali Berdasarkan Analisis Komponen Utama (Principal Component Analysis) PROSIDING ISBN : 978 979 6353 6 3 S 0 Studi Simulasi Tentang Penerapan Grafik Pengendali Berdasarkan Analisis Komponen Utama (Principal Component Analysis) Wirayanti ), Adi Setiawan ), Bambang Susanto

Lebih terperinci

RESAMPLING BERDASARKAN ESTIMASI DENSITAS KERNEL BIVARIAT

RESAMPLING BERDASARKAN ESTIMASI DENSITAS KERNEL BIVARIAT RESAMPLING BERDASARKAN ESTIMASI DENSITAS KERNEL BIVARIAT Adi Setiawan Program Studi Matematika Fakultas Sains dan Matematika Universitas Kristen Satya Wacana Jl. Diponegoro 52-60 Salatiga 50711 e-mail

Lebih terperinci

Analisis Komponen Utama (Principal component analysis)

Analisis Komponen Utama (Principal component analysis) Analisis Komponen Utama (Principal component analysis) A. LANDASAN TEORI Misalkan χ merupakan matriks berukuran nxp, dengan baris-baris yang berisi observasi sebanyak n dari p-variat variabel acak X. Analisis

Lebih terperinci

STUDI SIMULASI UJI KOEFISIEN KORELASI SPEARMAN DAN KENDALL DARI SAMPEL YANG DIBANGKITKAN BERDASARKAN ESTIMASI DENSITAS KERNEL MULTIVARIAT

STUDI SIMULASI UJI KOEFISIEN KORELASI SPEARMAN DAN KENDALL DARI SAMPEL YANG DIBANGKITKAN BERDASARKAN ESTIMASI DENSITAS KERNEL MULTIVARIAT STUDI SIMULASI UJI KOEFISIEN KORELASI SPEARMAN DAN KENDALL DARI SAMPEL YANG DIBANGKITKAN BERDASARKAN ESTIMASI DENSITAS KERNEL MULTIVARIAT Studi Kasus: Beberapa Kurs Mata Uang Asing Terhadap Rupiah Rangga

Lebih terperinci

BAB IV ANALISIS KORELASI ANTARA NILAI BTQ DENGAN PRESTASI BELAJAR MAPEL PAI DI SD KANDANG PANJANG 01 PEKALONGAN

BAB IV ANALISIS KORELASI ANTARA NILAI BTQ DENGAN PRESTASI BELAJAR MAPEL PAI DI SD KANDANG PANJANG 01 PEKALONGAN BAB IV ANALISIS KORELASI ANTARA NILAI BTQ DENGAN PRESTASI BELAJAR MAPEL PAI DI SD KANDANG PANJANG 01 PEKALONGAN A. Analisis Data tentang Nilai BTQ SD Kandang Panjang 01 Pekalongan Setelah dikumpulkan dengan

Lebih terperinci

Selamat Datang.. Dalam zona

Selamat Datang.. Dalam zona Selamat Datang.. Dalam zona ANALISIS PEUBAH GANDA 334H1203 (oleh M. Saleh AF) DEPARTEMEN MATEMATIKA PRODI STATISTIKA FMIPA UNHAS 2014 Deskripsi Matakuliah APG : Konsep dasar analisis multivariate, vektor,

Lebih terperinci

Signifikansi Kolmogorov Smirnov

Signifikansi Kolmogorov Smirnov UJI NORMALITAS Rumus Kolmogorov Smirnov Rumus Kolmogorov Smirnov Langkah-langkah penyelesaian dan penggunaan rumus sama, namun pada signifikansi yang berbeda. Signifikansi metode Kolmogorov-Smirnov menggunakan

Lebih terperinci

Resume Regresi Linear dan Korelasi

Resume Regresi Linear dan Korelasi Rendy Dwi Ardiansyah Putra 7410040018 / 2 D4 IT A Statistika Resume Regresi Linear dan Korelasi 1. Regresi Linear Regresi linear merupakan suatu metode analisis statistik yang mempelajari pola hubungan

Lebih terperinci

SILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE :

SILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE : SILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE : JURUSAN PENDIDIKAN MATEMATIKA FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN INDONESIA 2005-2006 MATAKULIAH

Lebih terperinci

DAFTAR ISI. ABSTRAK... iii. ABSTRACT... iv. KATA PENGANTAR... v. DAFTAR ISI... viii. DAFTAR TABEL... xv. DAFTAR GAMBAR... xvii

DAFTAR ISI. ABSTRAK... iii. ABSTRACT... iv. KATA PENGANTAR... v. DAFTAR ISI... viii. DAFTAR TABEL... xv. DAFTAR GAMBAR... xvii DAFTAR ISI HALAMAN PERSETUJUAN PEMBIMBING HALAMAN PERNYATAAN SARJANA ABSTRAK... iii ABSTRACT... iv KATA PENGANTAR... v DAFTAR ISI... viii DAFTAR TABEL... xv DAFTAR GAMBAR... xvii DAFTAR LAMPIRAN... xviii

Lebih terperinci

BAB IV DESKRIPSI DAN ANALISIS DATA

BAB IV DESKRIPSI DAN ANALISIS DATA BAB IV DESKRIPSI DAN ANALISIS DATA A. Deskripsi Data Hasil Penelitian 1. Deskripsi Data Umum Deskripsi data umum berisi mengenai gambaran umum tempat penelitian yakni di MTs N 1 Kudus. MTs N 1 Kudus beralamatkan

Lebih terperinci

BAB I STATISTIK DESKRIPTIF

BAB I STATISTIK DESKRIPTIF ANALISIS DATA PENELITIAN (Menggunakan Program SPSS) BAB I STATISTIK DESKRIPTIF Analisis deskripsi merupakan analisis yang paling mendasar untuk menggambarkan keadaan data secara umum. Analisis deskripsi

Lebih terperinci

STATISTIKA DESKRIPTIF

STATISTIKA DESKRIPTIF STATISTIKA DESKRIPTIF 1 Statistika deskriptif berkaitan dengan penerapan metode statistika untuk mengumpulkan, mengolah, menyajikan dan menganalisis data kuantitatif secara deskriptif. Statistika inferensia

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Regresi Linier Sederhana Dalam beberapa masalah terdapat dua atau lebih variabel yang hubungannya tidak dapat dipisahkan karena perubahan nilai suatu variabel tidak selalu terjadi

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1 BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. Gambaran Umum Subjek Penelitian Penelitian dilaksanakan di SMP Kristen Satya Wacana yang terletak di Jalan Diponegoro, Salatiga. Populasi penelitian adalah semua

Lebih terperinci

STATISTIKA TERAPANNYA PADA BIDANG INFORMATIKA

STATISTIKA TERAPANNYA PADA BIDANG INFORMATIKA STATISTIKA TERAPANNYA PADA BIDANG INFORMATIKA BUSTAMI, S.Si., M.Si., M.Kom DAHLAN ABDULLAH, ST., M.Kom FADLISYAH, S.Si., MT STATISTIKA TERAPANNYA PADA BIDANG INFORMATIKA BUSTAMI, S.Si., M.Si., M.Kom DAHLAN

Lebih terperinci

DAFTAR ISI. Pengantar Daftar isi Daftar Tabel Daftar Gambar BAB 1 PENDAHULUAN... 1 BAB 2 STATISTIK DAN PENELITIAN 12 BAB 3 DATA DAN PENELITIAN..

DAFTAR ISI. Pengantar Daftar isi Daftar Tabel Daftar Gambar BAB 1 PENDAHULUAN... 1 BAB 2 STATISTIK DAN PENELITIAN 12 BAB 3 DATA DAN PENELITIAN.. DAFTAR ISI Pengantar Daftar isi Daftar Tabel Daftar Gambar BAB 1 PENDAHULUAN... 1 A. Sejarah dan Perkembangan Statistik.. 1 B. Tokoh-tokoh Kontributor Statistika... 3 C. Definisi dan Konsep Statistika

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Himpunan Fuzzy Tidak semua himpunan yang dijumpai dalam kehidupan sehari-hari terdefinisi secara jelas, misalnya himpunan orang miskin, himpunan orang pandai, himpunan orang tinggi,

Lebih terperinci

ANALISIS KORELASI KANONIK PERILAKU BELAJAR TERHADAP PRESTASI BELAJAR SISWA SMP (STUDI KASUS SISWA SMPN I SUKASARI PURWAKARTA)

ANALISIS KORELASI KANONIK PERILAKU BELAJAR TERHADAP PRESTASI BELAJAR SISWA SMP (STUDI KASUS SISWA SMPN I SUKASARI PURWAKARTA) Prosiding Seminar Matematika dan Pendidikan Matematika ISBN: 978-60-61-0-9 hal 693-703 November 016 ANALISIS KORELASI KANONIK PERILAKU BELAJAR TERHADAP PRESTASI BELAJAR SISWA SMP (STUDI KASUS SISWA SMPN

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Populasi dan Sampel Populasi adalah kelompok besar individu yang mempunyai karakteristik umum yang sama atau kumpulan dari individu dengan kualitas serta ciri-ciri yang telah ditetapkan.

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMABAHASAN

BAB IV HASIL PENELITIAN DAN PEMABAHASAN BAB IV HASIL PENELITIAN DAN PEMABAHASAN Bab IV ini menyajikan hasil penelitian dan pembahasan berdasarkan data yang telah diperoleh penulis di lapangan. 4.1 Gambaran Umum Responden Penelitian ini dilakukan

Lebih terperinci

Materi Kuliah Metode Penelitian. Uji Asumsi

Materi Kuliah Metode Penelitian. Uji Asumsi Materi Kuliah Metode Penelitian Uji Asumsi Uji Normalitas Uji normalitas dimaksudkan untuk memperlihatkan bahwa sampel dari populasi yang berdistribusi normal. Ada beberapa teknik yang dapat digunakan

Lebih terperinci

BAB IV DESKRIPSI DAN ANALISI DATA

BAB IV DESKRIPSI DAN ANALISI DATA BAB IV DESKRIPSI DAN ANALISI DATA A. Deskripsi Data Hasil Penelitian 1. Deskripsi Data Umum Penelitian Deskripsi data umum berisi mengenai gambaran umum tempat penelitian yakni di SMP N 1 Pamotan. SMP

Lebih terperinci

Pemodelan Inflasi di Kota Semarang, Yogyakarta, dan Surakarta dengan pendekatan GSTAR

Pemodelan Inflasi di Kota Semarang, Yogyakarta, dan Surakarta dengan pendekatan GSTAR JURNAL SAINS DAN SENI POMITS Vol., No., (0) 7-0 (0-X Prin D-7 Pemodelan Inflasi di Kota Semarang, Yogyakarta, dan Surakarta dengan pendekatan GSTAR Laily Awliatul Faizah dan Setiawan Jurusan Statistika,

Lebih terperinci

BAB III ANALISIS SPEKTRAL PADA RUNTUN WAKTU MODEL ARIMA. Analisis spektral adalah metode yang menggambarkan kecendrungan osilasi

BAB III ANALISIS SPEKTRAL PADA RUNTUN WAKTU MODEL ARIMA. Analisis spektral adalah metode yang menggambarkan kecendrungan osilasi BAB III ANALISIS SPEKTRAL PADA RUNTUN WAKTU MODEL ARIMA Analisis spektral adalah metode yang menggambarkan kecendrungan osilasi atau getaran dari sebuah data pada frekuensi tertentu. Analisis spektral

Lebih terperinci

2.11. Penduduk Yang Bekerja di Sektor Pertanian Pengangguran... 40

2.11. Penduduk Yang Bekerja di Sektor Pertanian Pengangguran... 40 2.11. Penduduk Yang Bekerja di Sektor Pertanian... 38 2.12. Pengangguran... 40 BAB III DASAR TEORI... 42 3.1. Analisis Regresi Linier Berganda... 42 3.2. Penaksiran Koefisien Regresi Menggunakan Matriks...

Lebih terperinci

Regresi Linier Berganda

Regresi Linier Berganda Regresi Linier Berganda Regresi Berganda Contoh Menguji hubungan linier antara variabel dependen (y) dan atau lebih variabel independen (x n ) Hubungan antara suhu warehouse dan viskositas cat dengan jumlah

Lebih terperinci

BAB II. REGRESI LINIER BERGANDA DENGAN VARIABEL DUMMY

BAB II. REGRESI LINIER BERGANDA DENGAN VARIABEL DUMMY BAB II. REGRESI LINIER BERGANDA DENGAN VARIABEL DUMMY Membuka program SPSS kemudian memilih tab sheet Variable View. Melakukan input variabel yang akan diteliti pada sheet Variable View. Input dilakukan

Lebih terperinci

MODUL 2 UJI DATA NORMALITAS, HOMOSEDASTISITAS, & LINIERITAS

MODUL 2 UJI DATA NORMALITAS, HOMOSEDASTISITAS, & LINIERITAS TUJUAN PRAKTIKUM Tujuan dari praktikum modul 2 ini adalah : 1. Mahasiswa mampu menilai kualitas data yang hendak digunakan dalam penelitian; 2. Mahasiswa mampu menelaah apakah data yang dimiliki memenuhi

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN digilib.uns.ac.id BAB III METODE PENELITIAN A. Tempat dan Waktu Penelitian Penelitian ini dilakukan di SMA Negeri 1 Mojolaban. Adapun alasan pemilihan tempat tersebut sebagai lokasi penelitian karena tingkat

Lebih terperinci

1.0 Distribusi Frekuensi dan Tabel Silang

1.0 Distribusi Frekuensi dan Tabel Silang ANALISIS DESKRIPTIF 1.0 Distribusi Frekuensi dan Tabel Silang 1.1 Pengantar Statistik deskriptif Statistika deskriptif adalah bidang statistika yang mempelajari tatacara penyusunan dan penyajian data yang

Lebih terperinci

BAB IV HASIL PENELITIAN

BAB IV HASIL PENELITIAN BAB IV HASIL PENELITIAN A. Penyajian Data Hasil Penelitian Penjelasan dari setiap variabel yang diperoleh dari penelitian dalam data akan dijelas secara rinci pada tiap-tiap variabel. Hasil penelitian

Lebih terperinci

BAB 3 METODOLOGI PENELITIAN. Obyek dari penelitian yang akan diteliti dalam penelitian ini adalah besarnya

BAB 3 METODOLOGI PENELITIAN. Obyek dari penelitian yang akan diteliti dalam penelitian ini adalah besarnya BAB 3 METODOLOGI PENELITIAN 3.1 Obyek Penelitian Obyek dari penelitian yang akan diteliti dalam penelitian ini adalah besarnya yield to maturity (YTM) dari obligasi negara seri fixed rate tenor 10 tahun

Lebih terperinci

ESTIMASI PARAMETER REGRESI RIDGE MENGGUNAKAN ITERASI HOERL, KENNARD, DAN BALDWIN (HKB) UNTUK PENANGANAN MULTIKOLINIERITAS

ESTIMASI PARAMETER REGRESI RIDGE MENGGUNAKAN ITERASI HOERL, KENNARD, DAN BALDWIN (HKB) UNTUK PENANGANAN MULTIKOLINIERITAS ESTIMASI PARAMETER REGRESI RIDGE MENGGUNAKAN ITERASI HOERL, KENNARD, DAN BALDWIN (HKB) UNTUK PENANGANAN MULTIKOLINIERITAS (Studi Kasus Pengaruh BI Rate, Jumlah Uang Beredar, dan Nilai Tukar Rupiah terhadap

Lebih terperinci

REGRESI LINEAR SEDERHANA

REGRESI LINEAR SEDERHANA REGRESI LINEAR SEDERHANA DAN KORELASI 1. Model Regresi Linear 2. Penaksir Kuadrat Terkecil 3. Prediksi Nilai Respons 4. Inferensi Untuk Parameter-parameter Regresi 5. Kecocokan Model Regresi 6. Korelasi

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Jenis dan Desain Penelitian Jenis penelitian ini merupakan jenis penelitian yang menggunakan eksperimen. Metode penelitian eksperimen merupakan metode penelitian yang digunakan

Lebih terperinci

Perbandingan Karakteristik Inflasi Kota-Kota Di Indonesia Bagian Timur Sebelum Dan Sesudah Krisis Moneter 1998

Perbandingan Karakteristik Inflasi Kota-Kota Di Indonesia Bagian Timur Sebelum Dan Sesudah Krisis Moneter 1998 Perbandingan Karakteristik Inflasi Kota-Kota Di Indonesia Bagian Timur Sebelum Dan Sesudah Krisis Moneter 1998 Adi Setiawan Program Studi Matematika, Fakultas Sains dan Matematika Universitas Kristen Satya

Lebih terperinci

MATLAB UNTUK STATISTIKA & TEKNIK OPTIMASI Aplikasi untuk Rekayasa & Bisnis

MATLAB UNTUK STATISTIKA & TEKNIK OPTIMASI Aplikasi untuk Rekayasa & Bisnis MATLAB UNTUK STATISTIKA & TEKNIK OPTIMASI Aplikasi untuk Rekayasa & Bisnis Oleh : Budi Santosa Edisi Pertama Cetakan Pertama, 2008 Hak Cipta 2008 pada penulis, Hak Cipta dilindungi undang-undang. Dilarang

Lebih terperinci

UJI NONPARAMETRIK. Gambar 6.1 Menjalankan Prosedur Nonparametrik

UJI NONPARAMETRIK. Gambar 6.1 Menjalankan Prosedur Nonparametrik 6 UJI NONPARAMETRIK Bab ini membahas: Uji Chi-Kuadrat. Uji Dua Sampel Independen. Uji Beberapa Sampel Independen. Uji Dua Sampel Berkaitan. D iperlukannya uji Statistik NonParametrik mengingat bahwa suatu

Lebih terperinci

BAB 2 LANDASAN TEORI. dangkal, sehingga air mudah di gali (Ruslan H Prawiro, 1983).

BAB 2 LANDASAN TEORI. dangkal, sehingga air mudah di gali (Ruslan H Prawiro, 1983). BAB 2 LANDASAN TEORI 2.1 Pengertian Air Minum Semua makhluk hidup membutuhkan air, maka tempat yang tersedia air tentu penuh dengan makhluk hidup, kecuali air tersebut sudah sangat tercemar. Manusia juga

Lebih terperinci

BAB III METODE PENELETIAN

BAB III METODE PENELETIAN 35 BAB III METODE PENELETIAN A. Lokasi dan Waktu Penelitian Lokasi penelitian dilaksanakan di SMK Negeri 6 Bandung yang beralamatkan di Jalan Soekarno Hatta (Riung Bandung) Kota Bandung, pada tes Uji Kompetensi

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN A. Jenis dan Pendekatan Penelitian Penelitian yang digunakan adalah penelitian kuantitatif, yaitu penelitian yanng digunakan unntuk meneliti pada populasi atau sampel tertentu.

Lebih terperinci

JMP : Volume 6 Nomor 1, Juni 2014, hal REGRESI LINEAR BIVARIAT SIMPEL DAN APLIKASINYA PADA DATA CUACA DI CILACAP

JMP : Volume 6 Nomor 1, Juni 2014, hal REGRESI LINEAR BIVARIAT SIMPEL DAN APLIKASINYA PADA DATA CUACA DI CILACAP JMP : Volume 6 Nomor 1, Juni 014, hal. 45-5 REGRESI LINEAR BIVARIAT SIMPEL DAN APLIKASINYA PADA DATA CUACA DI CILACAP Saniyah dan Budi Pratikno Program Studi Matematika Fakultas Sains dan Teknik Universitas

Lebih terperinci

ANOVA (analisis varians), sering disebut juga dengan uji F, mempunyai tujuan yang sama dengan uji t, yakni: o

ANOVA (analisis varians), sering disebut juga dengan uji F, mempunyai tujuan yang sama dengan uji t, yakni: o Uji Beda: ANOVA ANOVA (analisis varians), sering disebut juga dengan uji F, mempunyai tujuan yang sama dengan uji t, yakni: o o Menguji apakah rata-rata lebih dari dua sampel berbeda secara signifikan

Lebih terperinci

METODOLOGI PENELITIAN

METODOLOGI PENELITIAN 22 III. METODOLOGI PENELITIAN 3.1 Kerangka Pemikiran Penelitian Bank merupakan lembaga keuangan yang memiliki fungsi sebagai penghimpun dana dari masyarakat dan menyalurkannya kembali dalam bentuk kredit

Lebih terperinci

BAB 3 GAMBARAN UMUM DINAS TANAMAN PANGAN DAN HORTIKULTURA PROVINSI SUMATERA UTARA. 3.1 Sejarah Singkat Dinas Pertanian Provinsi Sumatera Utara

BAB 3 GAMBARAN UMUM DINAS TANAMAN PANGAN DAN HORTIKULTURA PROVINSI SUMATERA UTARA. 3.1 Sejarah Singkat Dinas Pertanian Provinsi Sumatera Utara BAB 3 GAMBARAN UMUM DINAS TANAMAN PANGAN DAN HORTIKULTURA PROVINSI SUMATERA UTARA 3.1 Sejarah Singkat Dinas Pertanian Provinsi Sumatera Utara 3.1.1 Sebelum Kemerdekaan Pemerintahan Hindia Belanda mencoba

Lebih terperinci

aljabar geo g metr me i

aljabar geo g metr me i Pertemuan 12 & 13 ANALIS KOMPONEN UTAMA & FUNGSI DISCRIMINAN Obyektif : Reduksi variabel Interpretasi Aplikasi AKU dalam Anls Regresi Discrimination Fisher and Classification Classification with two Multivariate

Lebih terperinci

ANALISA SAHAM MENGGUNAKAN TRANSFORMASI FOURIER STOKASTIK

ANALISA SAHAM MENGGUNAKAN TRANSFORMASI FOURIER STOKASTIK ANALISA SAHAM MENGGUNAKAN TRANSFORMASI FOURIER STOKASTIK Kharisma Yusea Kristaksa ) Hanna Arini Parhusip ), dan Bambang Susanto 3) ) Mahasiswa Program Studi Matematika ) 3) Dosen Program Studi Matematika

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. GAMBARAN UMUM OBJEK PENELITIAN. perbankan terdiri dari Bank Umum dan Bank Perkreditan Rakyat

BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. GAMBARAN UMUM OBJEK PENELITIAN. perbankan terdiri dari Bank Umum dan Bank Perkreditan Rakyat BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. GAMBARAN UMUM OBJEK PENELITIAN Dijelaskan dalam UU Pokok perbankan nomor 7 tahun 1992 dan ditegaskan lagi dengan keluarnya undang-undang RI nomor 10 tahun 1998

Lebih terperinci

STATISTIK untuk PENELITIAN

STATISTIK untuk PENELITIAN Prof. Dr. Sugiyono STATISTIK untuk PENELITIAN Penerbit CV ALFABETA Bandung Dilarang menfotocopy/memperbanyak isi buku tanpa seizin penerbit. Hak Cipta dilindungi Undang-Undang Cetakan kesepuluh 2006 Judul

Lebih terperinci

BAB III METODOLOGI PENELITIAN. eksperimen adalah melakukan pengukuran sebagai hasil eksperimen terhadap

BAB III METODOLOGI PENELITIAN. eksperimen adalah melakukan pengukuran sebagai hasil eksperimen terhadap BAB III METODOLOGI PENELITIAN A. Metode dan Desain Penelitian Metode yang digunakan dalam penelitian ini adalah metode eksperimen. Hal ini disebabkan tujuan penelitian adalah melihat hubungan sebab akibat

Lebih terperinci

BAB IV HASIL PENELITIAN

BAB IV HASIL PENELITIAN BAB IV HASIL PENELITIAN A. DESKRIPSI DATA Data hasil penelitian terdiri dari dua variabel bebas yaitu variabel gaya belajar siswa (X1) dan variabel minat belajar siswa (X2) serta satu variabel terikat

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 4.1 Deskripsi Data 4.1.1 Layanan Bimbingan Kelompok Data variabel Layanan Bimbingan Kelompok menunjukkan bahwa skor tertinggi adalah 120 dan skor terendah adalah

Lebih terperinci

S - 19 UJI NORMALITAS BERDASARKAN METODE ANDERSON- DARLING, CRAMER-VON MISES DAN LILLIEFORS MENGGUNAKAN METODE BOOTSTRAP

S - 19 UJI NORMALITAS BERDASARKAN METODE ANDERSON- DARLING, CRAMER-VON MISES DAN LILLIEFORS MENGGUNAKAN METODE BOOTSTRAP S - 19 UJI NORMALITAS BERDASARKAN METODE ANDERSON- DARLING, CRAMER-VON MISES DAN LILLIEFORS MENGGUNAKAN METODE BOOTSTRAP Janse Oktaviana Fallo 1, Adi Setiawan 2, Bambang Susanto 3 1,2,3 Program Studi Matematika

Lebih terperinci

BAB III METODE PENELITIAN. Penelitian ini bertujuan untuk menelaah apakah terdapat perbedaan

BAB III METODE PENELITIAN. Penelitian ini bertujuan untuk menelaah apakah terdapat perbedaan 56 BAB III METODE PENELITIAN A. Desain penelitian Penelitian ini bertujuan untuk menelaah apakah terdapat perbedaan kemampuan dan peningkatan pemahaman konsep dan penalaran matematis antara siswa yang

Lebih terperinci

Kegiatan Belajar 1 menerangkan konsep chi square. Kegiatan Belajar 2 menerangkan uji kepatutan (goodness of fit). Kegiatan Belajar 3 menerangkan tes

Kegiatan Belajar 1 menerangkan konsep chi square. Kegiatan Belajar 2 menerangkan uji kepatutan (goodness of fit). Kegiatan Belajar 3 menerangkan tes ix S Tinjauan Mata Kuliah tatistika merupakan ilmu yang sangat diperlukan di segala bidang. Kegunaannya untuk memecahkan suatu permasalahan dengan menggunakan analisis kuantitatif. Dengan berkembangnya

Lebih terperinci

Analisis Data kategorik tidak berpasangan skala pengukuran numerik

Analisis Data kategorik tidak berpasangan skala pengukuran numerik Analisis Data kategorik tidak berpasangan skala pengukuran numerik Uji t dengan 2 kelompok Uji t Tidak Berpasangan Uji t dikembangkan oleh William Sealy Gosset. Dalam artikel publikasinya, ia menggunakan

Lebih terperinci

BAB V ANALISIS TENTANG PENGARUH MENGIKUTI PENGAJIAN. Dalam bab ini diuraikan tentang data-data Pengaruh Mengikuti

BAB V ANALISIS TENTANG PENGARUH MENGIKUTI PENGAJIAN. Dalam bab ini diuraikan tentang data-data Pengaruh Mengikuti 66 66 BAB V ANALISIS TENTANG PENGARUH MENGIKUTI PENGAJIAN THARĪQAT TERHADAP PENGALAMAN SPIRITUAL PADA LANSIA Dalam bab ini diuraikan tentang data-data Pengaruh Mengikuti Pengajian Tharīqat, dan juga data-data

Lebih terperinci

BAB IV METODE PENELITIAN. Pada penelitian ini, jenis disain penelitian yang adalah kausalitas. Kausalitas

BAB IV METODE PENELITIAN. Pada penelitian ini, jenis disain penelitian yang adalah kausalitas. Kausalitas BAB IV METODE PENELITIAN 4.1. Jenis Disain Penelitian Pada penelitian ini, jenis disain penelitian yang adalah kausalitas. Kausalitas merupakan prinsip sebab akibat. Ruang lingkup dari penelitian ini adalah

Lebih terperinci

PROBLEM SOLVING STATISTIKA LANJUT

PROBLEM SOLVING STATISTIKA LANJUT PROBLEM SOLVING STATISTIKA LANJUT 1. Ujilah validitas dan reliabilitas hasil koesioner gaya kepemimpinan yang terdiri dari 12 item dan diisi oleh 44 responden dalam data pada file Excel. 2. Berikan gambaran

Lebih terperinci

BAB III METODE PENELITIAN. Salah satu komponen dari penelitian adalah menggunakan metode yang

BAB III METODE PENELITIAN. Salah satu komponen dari penelitian adalah menggunakan metode yang BAB III METODE PENELITIAN 3.1 Desain Penelitian Salah satu komponen dari penelitian adalah menggunakan metode yang ilmiah, agar metode yang ilmiah ini dapat dilaksanakan dengan relatif lebih mudah dan

Lebih terperinci

BAB IV ANALISIS DAN PEMBAHASAN

BAB IV ANALISIS DAN PEMBAHASAN BAB IV ANALISIS DAN PEMBAHASAN 4.1 Gambaran Umum Perusahaan PT.Asuransi Staco Mandiri adalah suatu perusahaan yang bergerak dibidang asuransi kerugian didukung dengan permodalan yang jumlahnya meningkat

Lebih terperinci

LANGKAH-LANGKAH PENGOLAHAN DATA PENELITIAN. Oleh: Bambang Avip Priatna Martadiputra

LANGKAH-LANGKAH PENGOLAHAN DATA PENELITIAN. Oleh: Bambang Avip Priatna Martadiputra LANGKAH-LANGKAH PENGOLAHAN DATA PENELITIAN Oleh: Bambang Avip Priatna Martadiputra PERSIAPAN PENELITIAN 1) Menyusun instrumen penelitian berdasarkan dimensi dan indikator yang dirujuk. 2) Uji validitas

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. Gambaran Subyek Penelitian Penelitian ini dilakukan di SMK Negeri 1 Salatiga pada semester 2 tahun ajaran 2011/ 2012. Kelas XII terdiri dari 12 yang terdiri dari

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN 28 BAB III METODE PENELITIAN Metode Penelitian yang digunakan peneliti yaitu metode penelitian pengembangan (Research and Development) dengan kategori eksperimental. 3.1. Desain Penelitian Desain penelitian

Lebih terperinci

BAB III METODE PENELITIAN. Jenis penelitian yang digunakan adalah Quasi Experiment atau Penelitian

BAB III METODE PENELITIAN. Jenis penelitian yang digunakan adalah Quasi Experiment atau Penelitian BAB III METODE PENELITIAN A. Jenis Penelitian Jenis penelitian yang digunakan adalah Quasi Experiment atau Penelitian Semu. Jenis penelitian ini dilakukan untuk menguji hipotesis tentang efektif atau tidaknya

Lebih terperinci

DISTRIBUSI PROBABILITAS KONTINYU. Nur Hayati, S.ST, MT Yogyakarta, Maret 2016

DISTRIBUSI PROBABILITAS KONTINYU. Nur Hayati, S.ST, MT Yogyakarta, Maret 2016 DISTRIBUSI PROBABILITAS KONTINYU Nur Hayati, S.ST, MT Yogyakarta, Maret 2016 DISTRIBUSI PELUANG KONTINYU Berbeda dengan variabel random diskrit, sebuah variabel random kontinyu adalah variabel yang dapat

Lebih terperinci

BAB III ANALISIS FAKTOR. berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal

BAB III ANALISIS FAKTOR. berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal BAB III ANALISIS FAKTOR 3.1 Definisi Analisis faktor Analisis faktor adalah suatu teknik analisis statistika multivariat yang berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal

Lebih terperinci

RANCANGAN D-OPTIMAL UNTUK REGRESI POLINOMIAL DERAJAT 3 DENGAN HETEROSKEDASTISITAS

RANCANGAN D-OPTIMAL UNTUK REGRESI POLINOMIAL DERAJAT 3 DENGAN HETEROSKEDASTISITAS RANCANGAN D-OPTIMAL UNTUK REGRESI POLINOMIAL DERAJAT 3 DENGAN HETEROSKEDASTISITAS SKRIPSI Oleh : NAOMI RAHMA BUDHIANTI J2E 007 021 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO

Lebih terperinci

BAB IV STUDI KASUS. Indeks merupakan daftar harga sekarang dibandingkan dengan

BAB IV STUDI KASUS. Indeks merupakan daftar harga sekarang dibandingkan dengan BAB IV STUDI KASUS 4.1 Indeks Harga Konsumen Indeks merupakan daftar harga sekarang dibandingkan dengan sebelumnya menurut persentase untuk mengetahui turun naiknya harga barang. Indeks Harga Konsumen

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. analisis, (c) hasil pengujian hipotesis penelitian, (2) pembahasan, dan (3) keterbatasan penelitian.

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. analisis, (c) hasil pengujian hipotesis penelitian, (2) pembahasan, dan (3) keterbatasan penelitian. BAB IV HASIL PENELITIAN DAN PEMBAHASAN Pada bab ini akan disajikan berturut-turut (1) hasil penelitian yang meliputi (a) hasil pengujian analisis deskriptif data penelitian untuk memperoleh gambaran tentang

Lebih terperinci

BAB IV ANALISIS HASIL DAN PEMBAHASAN. analisis statistik yang menggunakan persamaan regresi berganda. Analisis data

BAB IV ANALISIS HASIL DAN PEMBAHASAN. analisis statistik yang menggunakan persamaan regresi berganda. Analisis data BAB IV ANALISIS HASIL DAN PEMBAHASAN A. Analisis Hasil 1. Statistik Deskriptif Metode analisis data yang digunakan dalam penelitian ini adalah metode analisis statistik yang menggunakan persamaan regresi

Lebih terperinci

BAB IV ANALISA DAN PEMBAHASAN

BAB IV ANALISA DAN PEMBAHASAN BAB IV ANALISA DAN PEMBAHASAN A. Statistik Deskriptif. Statistik deskriptif adalah ilmu statistik yang mempelajari cara-cara pengumpulan, penyusunan dan penyajian data suatu penilaian. Tujuannya adalah

Lebih terperinci

PERBANDINGAN KINERJA BEBERAPA METODE KLASIFIKASI HASIL REDUKSI DATA BERDIMENSI TINGGI

PERBANDINGAN KINERJA BEBERAPA METODE KLASIFIKASI HASIL REDUKSI DATA BERDIMENSI TINGGI ISSN 1858-4667 JURNAL LINK Vol 16/No. 1/Februari 212 PERBANDINGAN KINERJA BEBERAPA METODE KLASIFIKASI HASIL REDUKSI DATA BERDIMENSI TINGGI Ronny Susetyoko 1, Elly Purwantini 2 1,2 Departemen Teknik Elektro,

Lebih terperinci

DIKTAT MATA KULIAH STATISTIKA PENELITIAN PENDIDIKAN MATEMATIKA

DIKTAT MATA KULIAH STATISTIKA PENELITIAN PENDIDIKAN MATEMATIKA DIKTAT MATA KULIAH STATISTIKA PENELITIAN PENDIDIKAN MATEMATIKA Oleh : Wahyu Hidayat, S.Pd., M.Pd. NIDN. 0404088402 PROGRAM STUDI PENDIDIKAN MATEMATIKA SEKOLAH TINGGI KEGURUAN DAN ILMU PENDIDIKAN (STKIP)

Lebih terperinci

BAB IV HASIL PENELITIAN

BAB IV HASIL PENELITIAN BAB IV HASIL PENELITIAN A. Penyajian Statistik Deskripsi Hasil Penelitian 1. Kemampuan Awal Siswa Dalam penelitian ini seperti telah dijelaskan pada bab III, analisis tentang data kemampuan awal digunakan

Lebih terperinci

STATISTIK DESKRIPTIF. Abdul Rohman, S.E

STATISTIK DESKRIPTIF. Abdul Rohman, S.E LOGO STATISTIK DESKRIPTIF Konsep Statistika STATISTIKA : Kegiatan untuk : mengumpulkan data menyajikan data menganalisis data dengan metode tertentu menginterpretasikan hasil analisis KEGUNAAN? Melalui

Lebih terperinci

MODUL 3 ANALISIS FAKTOR

MODUL 3 ANALISIS FAKTOR TUJUAN PRAKTIKUM Tujuan dari praktikum modul 3 ini adalah : 1. Mahasiswa memahami apa yang dilakukan dalam proses Analisis Faktor; 2. Mahasiswa dapat menjalankan prosedur Analisis Faktor dalam SPSS; 3.

Lebih terperinci

BAB I PENDAHULUAN. bidang kehidupan sehari-hari, baik di bidang ekonomi, psikologi, sosial,

BAB I PENDAHULUAN. bidang kehidupan sehari-hari, baik di bidang ekonomi, psikologi, sosial, BAB I PENDAHULUAN A. Latar Belakang Statistika seringkali digunakan untuk memecahkan masalah dalam berbagai bidang kehidupan sehari-hari, baik di bidang ekonomi, psikologi, sosial, kedokteran, kesehatan,

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. yang terdaftar dalam LQ-45 di Bursa Efek Indonesia periode

BAB IV HASIL DAN PEMBAHASAN. yang terdaftar dalam LQ-45 di Bursa Efek Indonesia periode BAB IV HASIL DAN PEMBAHASAN A. Gambaran Umum Sampel penelitian yang digunakan dalam penelitian ini ialah perusahaan yang terdaftar dalam LQ-45 di Bursa Efek Indonesia periode 2013-2015. Teknik yang digunakan

Lebih terperinci

BAB I. REGRESI LINIER BERGANDA

BAB I. REGRESI LINIER BERGANDA BAB I. REGRESI LINIER BERGANDA Membuka program SPSS kemudian memilih tab sheet Variable View. Melakukan input variabel yang akan diteliti pada sheet Variable View. Input dilakukan dengan memperhatikan

Lebih terperinci

Studi Simulasi Grafik Pengendali Non Parametrik Berdasarkan Fungsi Distribusi Empirik

Studi Simulasi Grafik Pengendali Non Parametrik Berdasarkan Fungsi Distribusi Empirik Studi Simulasi Grafik Pengendali Non Parametrik Berdasarkan Fungsi Empirik S 6 Jantini Trianasari Natangku 1), Adi Setiawan ), Lilik Linawati ) 1) Mahasiswa Program Studi Matematika FSM-UKSW Email : n4n4_00190@yahoo.co.id

Lebih terperinci

BAB IV ANALISA DAN PEMBAHASAN. syarat, jika harga koefisien rhitung 0,300 (Riduwan, 2005:109;

BAB IV ANALISA DAN PEMBAHASAN. syarat, jika harga koefisien rhitung 0,300 (Riduwan, 2005:109; BAB IV ANALISA DAN PEMBAHASAN 4.1 Uji Validitas dan Realiabilitas Hasil uji coba instrumen dilakukan pada 25 responden. Suatu instrument/angket atau bahan test dinyatakan valid atau dianggap memenuhi syarat,

Lebih terperinci

BAB III METODE WEIGHTED LEAST SQUARE

BAB III METODE WEIGHTED LEAST SQUARE BAB III METODE WEIGHTED LEAST SQUARE 3.1 Uji White Salah satu asumsi dari model regresi linear klasik adalah varian error ε i pada setiap nilai variabel bebas adalah sama (konstan). Asumsi ini disebut

Lebih terperinci

Statistika Penelitian. dengan SPSS 24

Statistika Penelitian. dengan SPSS 24 Statistika Penelitian dengan SPSS 24 Statistika Penelitian dengan SPSS 24 Getut Pramesti PENERBIT PT ELEX MEDIA KOMPUTINDO Statistika Penelitian dengan SPSS 24 Getut Pramesti 2017, PT Elex Media Komputindo,

Lebih terperinci

BAB IV DESKRIPSI DAN ANALISIS DATA

BAB IV DESKRIPSI DAN ANALISIS DATA BAB IV DESKRIPSI DAN ANALISIS DATA A. Deskripsi Data Setelah melakukan penelitian, peneliti memperoleh hasil studi lapangan berupa data tentang kebiasaan membaca Al- Qur an dan minat belajar pendidikan

Lebih terperinci

Yudi Agustius, Adi Setiawan, Bambang Susanto

Yudi Agustius, Adi Setiawan, Bambang Susanto Prosiding Seminar Nasional Penelitian, Pendidikan dan Penerapan MIPA, Fakultas MIPA, Universitas Negeri Yogyakarta, 18 Mei 2013 PENERAPAN METODE BOOTSTRAP PADA UJI KOMPARATIF NON PARAMETRIK 2 SAMPEL Studi

Lebih terperinci

KATA PENGANTAR. Penulis

KATA PENGANTAR. Penulis Statistika: Terapannya di Informatika, oleh Bustami, S.Si., M.Si., M.Kom.; Dahlan Abdullah, S.T., M.Kom.; Fadlisyah, S.Si., M.T. Hak Cipta 2014 pada penulis GRAHA ILMU Ruko Jambusari 7A Yogyakarta 55283

Lebih terperinci

MEMBACA HASIL ANALISIS DENGAN SPSS

MEMBACA HASIL ANALISIS DENGAN SPSS MEMBACA HASIL ANALISIS DENGAN SPSS Oleh : Teguh Wahyono, S.Kom Staff Pengajar Teknik Informatika UKSW 1. ANALISA TABEL FREKUENSI Berikut adalah contoh data hasil penelitian tentang tinggi badan 20 orang

Lebih terperinci