BAB I PENDAHULUAN 1.1. Latar Belakang Regresi merupakan salah satu teknik analisis statistika yang paling banyak digunakan. Banyak sekali teknik analisis statistika yang diturunkan atau didasarkan pada prinsip-prinsip regresi. Adanya analisis regresi sangat menguntungkan bagi banyak pihak, baik bidang sains, sosial, industri, maupun bisnis. Istilah regresi pertama kali diperkenalkan pada tahun 1886 oleh Sir Francis Galton dalam penelitian biogenetisnya (Supranto, 2005:35). Namun, dalam interpretasi modern terhadap regresi agak berlainan dengan regresi versi Galton. Secara umum, analisis regresi pada dasarnya adalah studi mengenai ketergantungan satu variabel dependen (terikat) dengan satu atau lebih variabel independen (bebas) dengan tujuan untuk mengestimasi atau memperkirakan rata-rata populasi atau nilai rata-rata variabel dependen berdasarkan nilai variabel independen yang diketahui (Gujarati, 1995:16). Hasil dari analisis regresi berupa koefisien regresi untuk masing-masing variabel independen. Koefisien ini diperoleh dengan cara memprediksi nilai variabel dependen dengan suatu persamaan. Koefisien regresi dihitung dengan dua tujuan sekaligus. Pertama, meminimumkan penyimpangan antara nilai aktual dan nilai estimasi variabel dependen. Kedua, mengoptimalkan korelasi antara nilai aktual dan nilai estimasi variabel dependen berdasarkan data yang ada. Salah satu tujuan dalam analisis regresi adalah mendapatkan suatu model regresi yang akan digunakan untuk mencari nilai estimasi dari variabel dependen. Untuk mendapatkan model regresi yang baik diperlukan data yang baik pula. Suatu data dikatakan baik apabila data tersebut berada di sekitar garis regresi. Namun terkadang terdapat data yang terletak jauh dari garis regresi atau pola data keseluruhan. Data tersebut dikenal dengan istilah pencilan atau outlier. Outlier
merupakan suatu keganjilan dan menandakan suatu titik data yang sama sekali tidak tipikal dibanding data lainnya (Draper dan Smith,1992). Metode regresi robust cocok digunakan pada sebagian besar data, jika data tidak mengandung pencilan maka metode robust memberikan hasil yang sama seperti metode klasik (Maronna, 2006). Estimasi robust M adalah salah satu bentuk estimasi yang digunakan pada data yang memuat outlier. Estimasi M dipilih karena merupakan suatu teknik robust yang paling pupular dan paling umum serta mudah dalam pengaplikasiannya dibandingkan dengan metode regresi robust yang lain. Hubungan fungsional kedua variabel tersebut dijelaskan dalam sebuah kurva yang dinamakan kurva regresi. Regresi spline adalah salah satu model regresi dengan pendekatan nonparametrik yang sangat sering digunakan untuk melakukan estimasi terhadap kurva regresi. Salah satu keunggulannya yaitu dapat mengatasi pola data yang menunjukkan naik atau turun yang tajam dengan bantuan titik-titik knot, serta kurva yang dihasilkan relatif mulus. Selain itu, dalam regresi spline, langkah awal yang dilakukan adalah menentukan knot dengan nilai Generalized Cross Validation (GCV) yang minimum. Selain itu, kriteria lain yang dapat digunakan adalah dengan melihat nilai Mean Square Error (MSE) (Lee,2002). Belakangan ini, regresi spline terpenalti menjadi pendekatan yang popular untuk pemulusan data noisy karena kemudahan dan keefektifannya dalam menangani masalah pemulusan nonparametrik. Oleh karena itu, pada skripsi ini dibahas tentang analisis regresi spline terpenalti dengan menggunakan M robust untuk estimasi parameternya serta menggunakan 2 fungsi pembobot yaitu Tukey dan Huber. 1.2. Tujuan Penulisan Beberapa tujuan yang ingin dicapai dari penulisan skripsi ini antara lain: 1. Sebagai syarat untuk memperoleh gelar strata 1 pada Program Studi Statistika Universitas Gadjah Mada.
2. Mempelajari dan memahami tentang Regresi Spline Terpenalti 3. Memahami salah satu metode estimasi robust yaitu estimasi-m dengan fungsi pembobot Tukey dan Huber 4. Mengaplikasikan dan membandingkan estimasi robust tipe-m terpenalti dengan metode kuadrat terkecil terpenalti pada regresi spline dengan menggunakan data riil. 5. Mengaplikasikan GCV dalam menentukan parameter pemulus regresi spline M-terpenalti. 1.3. Pembatasan Masalah Dalam penulisan skripsi ini, pembahasan teori dan analisis data dibatasi mengenai pemodelan estimasi Regresi Spline Terpenalti dengan menggunakan metode esitmasi tipe-m robust serta penggunaan GCV untuk memilih parameter pemulus dan mendapatkan model regresi spline terbaik berdasarkan nilai GCV yang minimum. Studi kasus menggunakandata riil yaitu data lalu lintas internet. Selanjutnya dilakukan perbandingan dengan Estimasi Kuadrat Terkecil Terpenalti menggunakan program pengolahan data R 3.4.3. 1.4. Tinjauan Pustaka Acuan yang digunakan penulis untuk skripsi ini adalah jurnal yang berjudul Robust penalized regression spline fitting with application to additive mixed model yang ditulis oleh Lee dan Oh (2007). Dalam jurnal ini dijelaskan estimator tipe-m untuk model regresi spline terpenalti dengan mengganti metode estimasi kuadrat terkecil dengan metode estimasi-m yang bersesuaian dengan tetap menjaga bentuk dari spline dan parameter terpenaltinya. Sehingga diperoleh estimasi yang robust dan cukup fleksibel untuk menangkap trend non-linear dalam data.
Beberapa refrensi lain yang diacu diantaranya, Estimasi S robust untuk Regresi Spline Terpenalti (Pratika, 2014), Estimasi Parameter Regresi Robust dengan Fungsi Huber dan Fungsi Bisquare (Rameshwari, 2014), Analisis Bayesian untuk Regresi Spline Terpenalti (Fitriani 2013). Jurnal lainnya yaitu Comparative Analysis for Robust Penalized Spline Smoothing Methods (Wang et al, 2014) serta perbandingan antara estimasi M, estimasi S, dan estimasi MM dalam regresi robust telah dibahas dalam paper yang berjudul M Estimation, S Estimation, and MM Estimation in Robust Regression (Susanti et al, 2014). 1.5. Metode Penulisan Metode yang digunakan dalam penulisan skripsi ini adalah studi literatur berupa buku, jurnal, dan ebook yang didapat dari perpustakaan maupun internet. Untuk studi kasus, data yang digunakan penulis adalah data inflasi di Indonesia. Pengolahan data menggunakan software SPSS 17.0, Microsoft Excel, dan R versi 3.4.3. 1.6. Sistematika Penulisan Sistematika dalam penulisan skripsi ini adalah sebagai berikut. BAB I PENDAHULUAN Bab ini membahas latar belakang permasalahan, tujuan, pembatasan masalah, tinjauan pustaka, metode dan sistematika penulisan dalam skripsi ini. BAB II DASAR TEORI Pada bab ini dibahas landasan teori dari metode estimasi tipe-m robust pada model regresi spline terpenalti diantaranya, Pencilan, Matriks, Ruang Vektor dan Vektor, Kalkulus Matriks, Variabel Random dan Ekspektasi, Regresi Nonparametrik, Estimasi Kuadrat Terkecil (OLS estimator), Robust, Regresi Robust, Model Regresi Spline, Pemilihan Model Spline Terbaik BAB III Bab ini membahas mengenai pengertian estimasi tipe-m robust, pengertian Regresi Spline Terpenalti, metode kuadrat terkecil terpenalti, fungsi pembobot
Tukey dan Huber, penerapan estimasi tipe-m pada model Regresi Spline Terpenalti, dan pemilihan parameter penghalus dengan GCV. BAB IV STUDI KASUS Bab ini membahas aplikasi regresi spline dengan metode kuadrat terkecil terpenalti dan metode estimasi-m terpenalti dengan menggunakan data riil. BAB V PENUTUP Bab ini membahas kesimpulan dan saran yang diperoleh dari pembahasan teori dan studi kasus mengenai metode estimasi M robust pada model Regresi Spline Terpenalti dengan dua fungsi pembobot yaitu Tukey dan Huber.