BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan Regresi adalah suatu metode yang digunakan untuk menganalisis hubungan antara variabel respon dengan variabel penjelas. Pada umumnya, variabel respon tersebut berjenis kontinu, namun tidak jarang pula ditemukan variabel respon yang berjenis diskrit. Variabel respon diskrit dapat berupa data cacah yaitu data dengan nilai non negatif. Analisis regresi count yang pertama digunakan adalah regresi poisson (Hilbe, 2011). Namun, regresi poisson mensyaratkan keadaan ekuidispersi, dimana rata-rata variabel respon harus sama dengan variansinya. Padahal dalam kenyataannya, data count memiliki variansi yang lebih besar daripada rata-rata. Keadaan ini disebut overdispersi (McCullagh dan Nelder, 1989). Untuk mengatasi keadaan overdispersi tersebut, regresi binomial negatif dapat digunakan sebagai alternatif dari regresi poisson (Cameron dan Trivedi, 2005). Model regresi binomial negatif juga digunakan untuk menganalisis hubungan antara variabel respon yang berupa data cacah dengan satu atau lebih variabel penjelas. Jika melibatkan beberapa variabel penjelas, maka asumsi klasik seperti tidak adanya multikolinearitas juga harus dipenuhi seperti halnya pada regresi linear. Multikolinearitas terjadi jika terdapat hubungan linear antara beberapa atau bahkan semua variabel penjelas. Konsep multikolinearitas pertama kali dikenalkan oleh Frisch pada tahun 1934 untuk menunjukkan keadaan dimana variabel penjelas dalam model regresi linear ganda saling berhubungan linear. Masalah multikolinearitas dapat mengakibatkan koefisien regresi menjadi tidak signifikan sehingga akan sulit dalam penginterpretasian estimasi koefisien. Metode regresi ridge yang pertama kali dikenalkan oleh Hoerl dan Kennard pada tahun 1970 dapat menjadi metode yang efektif dan efisien untuk menangani masalah multikolinearitas (Mansson, 2012). Kelebihan dari metode 1

2 regresi ridge tersebut adalah dapat mengurangi besarnya rata-rata kuadrat galat karena penambahan parameter ridge. Telah banyak penelitian yang mengaplikasikan regresi ridge dengan berbagai metode dalam mengestimasi parameter ridge untuk menangani multikolinearitas pada model regresi linear, dimana variabel responnya berjenis kontinu. Namun, penanganan multikolinearitas pada model regresi yang variabel responnya berjenis diskrit masih sedikit mendapat perhatian. Beberapa yang terkait dengan topik tersebut dikemukakan oleh Nyquist (1991) yang berfokus pada estimator regresi ridge dalam generalized linear models serta Mansson dan Shukur (2011) tentang estimator regresi ridge pada model regresi poisson. Namun, seperti yang dikemukakan sebelumnya bahwa model regresi poisson bukan merupakan pemodelan yang umum digunakan karena mensyaratkan kondisi ekuidispersi. Sehingga, dalam skripsi ini akan dibahas tentang estimator regresi ridge pada model regresi binomial negatif sebagai alternatif dari regresi poisson dalam penanganan multikolinearitas. 1.2. Batasan Masalah Berdasarkan latar belakang masalah dan kajian-kajian pendukung lain, penulis memberikan pembatasan masalah sehubungan dengan kompleksnya masalah yang akan muncul dalam pembahasan. Dalam skripsi ini, penyimpangan asumsi klasik yang dibahas adalah terbatas pada masalah multikolinearitas. Penelitian akan difokuskan pada cara penanganan masalah multikolinearitas pada model regresi binomial negatif dengan menggunakan analisis regresi ridge binomial negatif beserta sifat dari rata-rata kuadrat galat (Mean Squared Error). Pemilihan nilai sebagai parameter ridge dilakukan berdasarkan perhitungan estimator ridge klasik seperti metode yang dikemukakan oleh Alkhamisi et al. (2006) dan Muniz dan Kibria (2009). Sebagai pembanding, akan dibahas pula estimator maksimum likelihood pada regresi binomial negatif untuk dibandingkan dengan estimator ridge binomial negatif dalam keakuratannya menangani masalah multikolinearitas. Estimator yang lebih baik akan ditunjukkan melalui nilai MSE yang lebih kecil.

3 1.3. Tujuan Penulisan 1. Mempelajari dan mengetahui pemodelan data banyak penganggur di Kota Semarang menggunakan model regresi binomial negatif. 2. Mengaplikasikan estimator ridge pada regresi binomial negatif untuk menangani masalah multikolinearitas. 3. Membandingkan nilai Mean Squared Error pada estimator maksimum likelihood dengan estimator ridge binomial negatif. 1.4. Tinjauan Pustaka Dalam skripsi ini, penulis menggunakan berbagai sumber pustaka. Metode ridge sebagai penanganan masalah multikolinearitas pada regresi linear dikenalkan oleh Hoerl dan Kennard (1970). Astrini (2013) dalam skripsinya yang berjudul Analisis Regresi Ridge Dua Tahap untuk Permasalahan Multikolinearitas membahas tentang gabungan antara metode regresi kuadrat terkecil dua tahap dengan metode regresi ridge. Kemudian Maulizar (2014) dalam skripsinya yang berjudul Implementasi Metode Directed Ridge Regression dalam Pemodelan Faktor yang Mempengaruhi Produk Domestik Regional Bruto membahas tentang metode directed ridge regression dimana hanya akan mengganti elemen diagonal yang bersesuaian dengan nilai eigen yang relatif kecil. Beberapa jurnal lain juga membahas tentang perkembangan estimator ridge yang digunakan untuk menentukan nilai seperti Kibria (2003), Alkhamisi et al. (2006), Muniz dan Kibria (2009), Al-Hassan (2010), dan Dorugade (2014). Seiring berkembangnya ilmu pengetahuan dan penelitian, regresi ridge tidak hanya digunakan untuk menangani multikolinearitas pada regresi linear, namun juga untuk regresi logistik seperti yang dilakukan oleh Schaefer (1986) dalam jurnalnya yang berjudul Alternative Estimators in Logistic Regression when Data are Collinear. Penggunaan regresi ridge juga dikembangkan pada model regresi dengan variabel respon berupa data cacah seperti regresi poisson oleh Mansson dan Shukur (2011) dan regresi binomial negatif oleh Mansson (2012).

4 Sebagai sumber pustaka utama adalah jurnal yang ditulis oleh Mansson (2012) dengan judul On Ridge Estimators for the Negative Binomial Regression Model yang membahas tentang estimator ridge dalam model regresi binomial negatif untuk permasalahan multikolinearitas. Pemilihan nilai pada regresi ridge binomial negatif tersebut dilakukan berdasarkan perhitungan estimator ridge klasik seperti pada regresi linear. Sementara tentang analisis model regresi binomial negatif bersumber dari buku yang ditulis oleh Hilbe (2011) berjudul Negative Binomial Regression dan buku pendukung lain seperti yang ditulis oleh Cameron dan Trivedi (2005) berjudul Microeconometrics, Methods and Applications. 1.5. Metode Penulisan Metode yang digunakan dalam skripsi ini lebih kepada studi literatur seperti buku dan jurnal, baik itu diperoleh dari perpustakaan, maupun yang diperoleh melalui situs-situs jurnal online yang tersedia di internet. Selain itu, juga ditunjang dengan beberapa perangkat lunak untuk menganalisis data, diantaranya software EasyFit versi 5.5, R versi 2.13.2, dan SPSS 17. 1.6. Sistematika Penulisan Skripsi ini terdiri dari lima bab, yang disusun sebagai berikut: BAB I PENDAHULUAN Berisi latar belakang permasalahan, batasan masalah, tujuan penulisan, tinjauan pustaka, metode penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Bab ini berisi berbagai teori yang melandasi penelitian ini, antara lain tentang variabel random, ekspektasi, variansi, kovariansi, matriks, metode maksimum likelihood, distribusi gamma, distribusi poisson, distribusi binomial negatif, metode iterasi Newton- Raphson, Fisher scoring, IWLS, overdispersi pada data count, asumsi regresi binomial negatif, uji ketepatan model regresi

5 BAB III BAB IV BAB V binomial negatif, multikolinearitas, regresi ridge, uji Kolmogorov- Smirnov, dan uji Anderson-Darling. ESTIMATOR RIDGE PADA MODEL REGRESI BINOMIAL NEGATIF Bab ini berisi tentang pembahasan estimator ridge pada model regresi binomial negatif dalam penanganan masalah multikolinearitas. STUDI KASUS Bab ini membahas tentang contoh penerapan model regresi binomial negatif menggunakan estimator ridge. Selain itu, akan digunakan estimator maksimum likelihood. MSE dari kedua estimator tersebut akan dibandingkan untuk mendapatkan kesimpulan manakah estimator yang lebih baik. PENUTUP Bab ini berisi kesimpulan tentang hasil yang telah dibahas dan saran untuk pengembangan dalam penelitian selanjutnya.