BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan Analisis regresi merupakan salah satu analisis yang paling populer dan luas pemakaiannya. Analisis regresi dipakai secara luas tak hanya oleh seorang statistisi, namun juga oleh para ilmuwan, ekonom, psikolog, sosiolog dan profesi lainnya yang selalu berkepentingan dengan masalah prediksi dan peramalan. Analisis regresi adalah suatu analisis yang dilakukan terhadap dua variabel yaitu variabel independen (prediktor) dan variabel dependen (respon) untuk mengetahui apakah ada pengaruh variabel prediktor terhadap variabel respon sehingga variabel respon dapat diduga berdasarkan variabel prediktornya. Berdasarkan jumlah variabel independennya, analisis regresi linear dibagi menjadi dua macam yaitu, analisis regresi linear sederhana dan analisis regresi linear ganda. Pada, analisis regresi linear sederhana, jumlah variabel independen yang digunakan sebagai penduga variabel dependen hanya satu, sedangkan pada analisis regresi linear ganda, jumlah variabel independennya lebih dari satu. Saat ini, analisis regresi yang lebih sering digunakan adalah analisis regresi linear ganda. Dapat dilihat dari berbagai kejadian yang terjadi dalam kehidupan sehari-hari yaitu suatu peristiwa dapat disebabkan oleh berbagai faktor yang mempengaruhinya. Contohnya, harga produk hasil olahan pabrik dipengaruhi oleh harga impor pasaran, harga impor komoditas, dan harga bahan pokok. Istilah regresi ini dikemukakan pertama kali oleh Francis Galton, seorang antropolog dan ahli meteorologi Perancis dalam artikelnya Family Likeness in Stature. Tetapi ada pula yang menyatakan istilah regresi muncul pada pidato Francis Galton di depan Section H of The British Association di Aberdeen 1855 dan dimuat dalam makalah Regression Toward Mediocrity in Hereditary Stature (Draper and Smith, 1922). Galton membandingkan tinggi badan anak laki-laki dengan tinggi badan ayahnya. Ia menunjukkan bahwa tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (regressed) mendekati nilai tengah populasi. Sekarang istilah regresi diterapkan pada semua 1
2 jenis peramalan, dan tidak harus berimplikasi suatu regresi mendekati nilai tengah populasi. Pada awal abad XIX, Carl Friederich Gauss mempopulerkan metode kuadrat terkecil (Least Square Method) yang menjadi dasar analisis regresi klasik. Metode kuadrat terkecil adalah salah satu metode penaksiran parameter yaitu metode untuk menduga koefisien regresi. Pada era 1960-an, serangkaian studi yang dikembangkan oleh para statistisi berhasil menunjukkan bahwa dalam banyak kasus, regresi menggunakan teknik kuadrat terkecil (khususnya teknik Ordinary Least Square) sering memberikan hasil yang kurang tepat. Oleh sebab itu, banyak bermunculan teknik regresi modern yaitu regresi yang digunakan pada kondisi dimana asumsi-asumsi klasik tidak terpenuhi. Beberapa asumsi regresi klasik yang harus dipenuhi ialah : 1. E(ε i ) = 0, i = 1,2,3,, n 2. Var(ε i ) = σ 2, i = 1,2,3,, n 3. Cov(ε i, ε j ) = 0, i j 4. Tidak terjadi multikolinearitas. Pendugaan koefisien regresi menggunakan metode kuadrat terkecil terkadang tidak bisa dilakukan karena salah satu asumsi regresi di atas tidak terpenuhi, dalam hal ini adalah asumsi tidak terjadinya multikolinearitas. Multikolinearitas terjadi jika terdapat hubungan linear antar beberapa atau bahkan semua variabel independen. Penanganan masalah multikolinearitas ini dapat dilakukan dengan berbagai cara, antara lain dengan mengeluarkan variabel X, analisis komponen utama (PCA), dan juga dengan regresi ridge. Dalam analisis regresi ridge ini, penduga atau estimator yang diperoleh merupakan penduga yang bias. Untuk mendapatkan estimasi model pada analisis regresi ridge dapat ditempuh dengan beberapa metode, salah satunya menggunakan Directed Ridge Regression yang akan dibahas dalam skripsi ini. 1.2. Pembatasan Masalah Batasan masalah sangat diperlukan untuk menjamin keabsahan dalam kesimpulan yang diperoleh. Berdasarkan latar belakang masalah dan kajian-kajian
3 pendukung lain, penulis dapat memberikan rumusan dan batasan masalah sehubungan dengan kompleksnya masalah yang akan muncul dalam pembahasan. Dalam penelitian ini, penyimpangan asumsi klasik yang dibahas adalah terbatas pada permasalahan multikolinearitas. Penelitian ini difokuskan pada cara penanganan masalah multikolinearitas dengan menggunakan Regresi Ridge dan memusatkan metode yang digunakan dalam Regresi Ridge ini terbatas pada Metode Directed Ridge Regression sampai dengan mendapatkan penduga parameter regresi dan menganggap asumsi klasik yang lain terpenuhi. 1.3. Tujuan dan Manfaat Penelitian Tujuan penelitian ini adalah memperkenalkankan sebuah metode dalam Regresi Ridge yaitu metode Directed Ridge Regression dalam mengatasi masalah multikolinearitas. Manfaat dari penelitian ini adalah: 1. Memperoleh model persamaan yang menunjukkan adanya hubungan antara variabel dependen dengan variabel independen yang memenuhi salah satu asumsi klasik regresi yaitu no multikolinearitas. 2. Agar selanjutnya dapat dilakukan pengembangan metode dalam regresi Ridge untuk penanganan kasus multikolinearitas pada analisis regresi. 1.4. Tinjauan Pustaka Penulisan penelitian ini berangkat dari beberapa penelitian dengan tema serupa yang telah dilakukan. Penelitian tersebut salah satunya adalah Perbandingan Beberapa Metode untuk Menentukan Nilai k pada Regresi Ridge (Tarigan, 2010) yang membandingkan beberapa metode untuk memilih parameter ridge atau bias konstan. Metode-metode tersebut antara lain metode Hoerl, Kennard dan Baldwin, metode McDonald dan Galarneau, Mallows, serta Lawless dan Wang. Metode-metode tersebut masih seputar analisis Ordinary Ridge Regression, yang menambahkan nilai k yang sama ke dalam matriks korelasi X X. El-Dereny dan Rashwan (2011) dalam jurnalnya Solving Multicolinearity Problem Using Ridge Regression Models menjelaskan beberapa jenis metode yang
4 berbeda dari regresi ridge, antara lain dengan Generalized Ridge Regression (GRR), Ordinary Ridge regression (ORR), dan Directed Ridge Regression (DRR). Studi yang dilakukan menunjukkan bahwa estimator dari regresi ridge lebih baik dibanding estimator OLS saat ditemukannya kasus multikolinearitas. Kemudian Puri (2014) dalam skripsinya yang berjudul Aplikasi Generalized Ridge Regression untuk Menangani Masalah Multikolinearitas membahas pengembangan terhadap regresi ridge dengan modifikasi yaitu penambahan nilai k yang berbeda ke dalam matriks korelasi X X. Gulkey dan Murphy (1975) dalam jurnalnya Directed Ridge Regression Technique in Cases of Multicollinearity memperkenalkan metode yang dikenal dengan Directed Ridge Regression yang juga akan penulis angkat menjadi tema dalam skripsi ini dimana dilakukan penambahan nilai k yang berbeda ke dalam matriks korelasi X X, namun hanya memilih mengubah elemen diagonal matriks X X yang memiliki nilai eigen kecil daripada mengganti semua elemennya. 1.5. Metode Penulisan Metode penulisan yang digunakan dalam penulisan skripsi ini adalah berdasarkan studi literatur menggunakan sumber-sumber resmi seperti buku-buku, jurnal, dan artikel-artikel yang mendukung tema penelitian baik yang diperoleh di perpustakaan maupun di situs-situs internet. Pengerjaan penulisan skripsi ini juga ditunjang dengan beberapa perangkat lunak untuk analsis data diantaranya software R dan SPSS. 1.6. Sistematika Penulisan Penulisan skripsi ini disusun dengan sistematika penulisan sebagai berikut : BAB I PENDAHULUAN Bab ini berisikan latar belakang dan permasalahan, pembatasan masalah, tujuan dan manfaat penelitian, tinjauan pustaka, metode penulisan, dan sistematika penulisan. BAB II DASAR TEORI
5 BAB III BAB IV BAB V Bab ini membahas beberapa teori yang berkaitan dengan pembahasan pokok permasalahan seperti variabel random, ekspektasi, variansi, kovariansi, korelasi, matriks,operasi matriks, transpose matriks, invers matriks, matriks identitas, nilai eigen dan vektor eigen, diagonalisasi, regresi linear, estimasi kuadrat terkecil, multikolinearitas, serta regresi ridge. DIRECTED RIDGE REGRESSION Bab ini membahas tentang konsep metode Directed Ridge Regression sebagai salah satu metode dalam regresi ridge yang dapat digunakan dalam mengatasi permasalahan multikolinearitas. STUDI KASUS Bab ini berisi tentang aplikasi metode Directed Ridge Regression dalam mengestimasi koefisien regresi yang bias pada data. PENUTUP Bab ini berisi kesimpulan yang diperoleh dari pembahasan pada bab sebelumnya dan saran untuk pengembangan dalam penelitian selanjutnya.