BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Analisis regresi merupakan komponen penting dalam menggambarkan hubungan antara dua variabel atau lebih, sehingga salah satu variabel dapat diduga dari variabel lainnya. Hubungan antara variabel prediktor (independen) dan variabel respon (dependen) dinyatakan dengan persamaan estimasi yang disebut model regresi. Untuk melihat hubungan antara variabel respon (dinotasikan dengan Y) dan sejumlah variabel prediktor (dinotasikan dengan X) secara simultan dapat digunakan analisis regresi linear dengan variabel respon diukur dalam skala interval dan mempunyai distribusi normal. Analisis regresi linear terbagi menjadi dua tipe, yaitu analisis regresi linear sederhana dan analisis regresi linear ganda. Yang membedakan keduanya hanya terletak pada jumlah variabel prediktornya. Regresi linear sederhana hanya memuat satu variabel prediktor, sedangkan regresi lienar berganda memuat lebih dari satu variabel prediktor. Akan tetapi dalam kehidupan sehari-hari dapat kita temui analisis regresi dengan variabel respon yang lebih dari satu, untuk menyelesaikan permasalahan tersebut kita gunakan analisis regresi linear multivariat. Analisis regresi linier multivariat adalah model regresi linier dengan q buah variabel respon Y 1, Y 2,, Y q yang saling berkorelasi dan satu atau beberapa variabel prediktor X 1, X 2,, X p. Analisis regresi linier univariat diasumsikan bahwa variabel respon Y 1, Y 2,, Y q adalah saling bebas, sedangkan pada analisis regresi linier multivariat mempertimbangkan adanya hubungan ketergantungan di antara Y 1, Y 2,, Y q. Pada analisis regresi linier multivariat pemilihan model terbaik merupakan hal yang penting. Hal ini dikarenakan tidak semua variabel prediktor berpengaruh nyata terhadap model. Pemilihan model terbaik pada 1
analisis regresi linier multivariat tergantung banyaknya variabel prediktor yang terlibat dalam model. Dewasa ini, terdapat beberapa kriteria dalam pemilihan model terbaik yang sudah umum digunakan dan salah satunya adalah AIC. AIC (Akaike Information Criterion) merupakan estimator tak bias dari ekspektasi Jarak Kullback-Leibler yang dibentuk berdasarkan jarak antara densitas model sebenarnya dengan densitas model sementara untuk setiap model (Akaike, 1973). Dalam perkembangannya, kriteria informasi AIC masih memiliki beberapa kekurangan yaitu AIC tidak bekerja baik pada sampel kecil. Hal tersebut menjadi pacuan untuk memperbaiki AIC, sehingga diformulasikan koreksi dari AIC yang dikenal dengan nama AICC (Akaike Information Criterion Correction). AICC untuk regresi multivariat dikembangkan oleh Bedrick dan Tsai pada tahun 1994 Seiring berkembangnya ilmu pengetahuan, Hafidi dan Khadri (2006) memperkenalkan KICC (Kullback s Information Criterion Correction). Mereka menjelaskan tentang bagaimana kriteria koreksi AICC dan AIC memiliki ketepatan prediksi yang lebih rendah jika dibandingkan KICC (Kullback s Information Criterion Correction) saat diterapkan pada sampel kecil. KICC merupakan penyempurnaan dari kriteria AIC dan AICC, apabila AIC dan AICC menggunakan Jarak Kullback-Leibler sebagai dasar pembentukan kriteria uji, maka KICC menggunakan jumlahan jarak Kullback-Leibler atau yang biasa disebut Jarak Simetris Kullback-Leibler. Hal-hal tersebut diataslah yang mendorong penulis untuk mengangkat bahasa tentang penggunaan KICC (Kullback s Information Criterion Correction) dalam regresi linear multivariat untuk menentukan variabel bebas apa saja yang dapat dijadikan indikator dalam model regresi multivariat yang terbentuk. 1.2 Tujuan Penelitian Tujuan yang ingin dicapai dari penulisan skripsi ini adalah: 1. Sebagai salah satu syarat untuk memperoleh gelar sarjana pada Program Studi Statistika, Jurusan Matematika, Universitas Gadjah Mada. 2
2. Mempelajari model regresi linear multivariat. 3. Mempelajari KICC (Kullback s Information Criterion Correction) sebagai metode untuk memperoleh model terbaik pada analisis regresi linear multivariat. 1.3 Manfaat Penelitian Dari hasil penulisan skripsi ini diharapkan dapat memberikan informasi kepada pembaca tentang KICC (Kullback s Information Criterion Correction) sebagai salah satu metode untuk mendapatkan model terbaik pada analisis regresi linear multivariat. 1.4 Perumusan dan Pembatasan Masalah Berdasarkan latar belakang dan kajian-kajian pendukung lainnya, maka penulis hanya membatasi penulisan skripsi ini. Bahwa metode seleksi model menggunakan KICC (Kullback s Information Criterion Correction) pada skripsi ini digunakan pada kasus regresi linear multivariat 1.5 Tinjauan Pustaka Penulisan penelitian ini berangkat dari beberapa penelitian dengan tema serupa yang telah dilakukan oleh pada tahun 2003 yang memperkenalkan KICC untuk regresi linear sederhana. Selanjutnya Bedrick dan Tsai pada tahun 1994 membahas kriteria uji AICC (Akaike Information Criterion Correction) yang merupakan koreksi terhadap AIC, karena dalam penelitiannya ditemukan kenyataan bahwa AIC tidak bekerja baik pada sampel kecil. Sehingga dibentuklah formulasi AICC sebagai penyempurnaan terhadap AIC. Selain itu, Cavanaugh (1999) juga membentuk kriteria uji KIC (Kullback Information Criterion) sebagai penyempurnaan AIC pada sampel besar. Seiring berkembangnya ilmu pengetahuan, Hafidi dan Khadri (2006) memperkenalkan kriteria seleksi dengan menggunakan KICC (Kullback s Information Criterion 3
Correction). Mereka merumuskan KICC yang diterapkan dalam regresi berganda, regresi linear multivariat dan juga data runtun waktu. KICC merupakan estimator tak bias dari ekspektasi Jarak Simetris Kullback-Leibler yang dibentuk berdasarkan jarak antara densitas model sebenarnya dengan densitas model sementara untuk setiap model. 1.6 Metode Penulisan Metode penulisan yang digunakan dalam karya tulis ini adalah berdasarkan studi literatur yang didapatkan dari perpustakaan serta jurnal-jurnal dan buku-buku yang berhubungan dengan tema dari tugas akhir ini. Sumber lainnya juga diperoleh melalui situs-situs pendukung yang tersedia di internet. Pengerjaan karya tulis ini juga ditunjang dengan beberapa perangkat lunak yaitu Microsoft Excel 2010, dan R versi 3.2.2 1.7 Sistematika Penulisan Sistematika penulisan tugas akhir ini terdiri dari lima bab, yaitu sebagai berikut: BAB I Pendahuluan Bab ini membahas tentang latar belakang dan permasalahan, tujuan, manfaat penulisan, perumusan dan batasan masalah, tinjauan pustaka, metode penulisan dan sistematika penulisan. BAB II Dasar Teori Bab ini membahas tentang teori-teori yang berhubungan dengan tema tugas akhir ini, khususnya teori-teori yang berhubungan dengan kriteria pemilihan model dan analisis regresi linear multivariat BAB III KICC (Kullback s Information Criterion Correction) dalam Analisis Regresi Linear Multivariat. Bab ini membahas tentang pembentukan kriteria KICC dalam pemilihan model terbaik pada regresi linear multivariat. 4
BAB IV Studi Kasus Bab ini membahas tentang aplikasi KICC (Kullback s Information Criterion Correction) sebagai kriteria pemilihan model pada Analisis Regresi Multivariat Indikator Kesehatan di Provinsi dan Kota di Jawa Timur dengan menggunakan software R. BAB V Penutup Bab ini membahas tentang kesimpulan yang diperoleh dari hasil pembahasan pada bab-bab sebelumnya. Bab ini juga membahas saran-saran yang diberikan penulis atas permasalahan yang terjadi. 5