BAB I PENDAHULUAN 1.1 Latar Belakang Analisis Regresi adalah metode statistika yang digunakan untuk mengetahui hubungan antara variabel terikat (dependen, respon, YY) dengan satu atau lebih variabel bebas (independen, prediktor, XX). Apabila banyaknya variabel bebas hanya ada satu maka disebut regresi linier sederhana, sedangkan apabila terdapat lebih dari satu variabel bebas maka disebut sebagai regresi linier berganda. Salah satu metode penduga parameter dalam regresi linier yang sering digunakan adalah metode kuadrat terkecil (MKT) atau ordinary least squares (OLS). Penggunaan metode ini membutuhkan beberapa asumsi klasik yang harus dipenuhi untuk menghasilkan penduga linier tidak bias terbaik atau best linier unbiased estimator. Menurut Cahyawati dkk (2009) salah satu penyebab tidak terpenuhinya asumsi klasik tersebut adalah adanya pencilan (outlier) pada data amatan. Metode kuadrat terkecil tidak dapat digunakan jika asumsinya tidak terpenuhi oleh karena itu selanjutnya diperlukan alternatif metode penduga parameter lain yang dapat mengatasi adanya pencilan dalam data amatan. Metode Robust dapat menjadi alternatif pilihan untuk menghasilkan model yang lebih baik dari hasil metode kuadrat terkecil berdasarkan kriteria mean square error (MSE) bagi masing-masing model. Menurut Chen (2002) regresi robust merupakan alat yang penting untuk menganalisis data yang terkontaminasi oleh pencilan. Regresi robust digunakan untuk mendeteksi pencilan dan memberikan hasil terhadap adanya pencilan. Regresi robust terdiri dari 5 metode penduga, yaitu penduga-m, penduga-least 1
2 median of square (LMS), penduga least trimmed squares (LTS), penduga-s dan penduga-mm. Dari ke-5 metode di atas, Penulis akan berfokus pada metode estimasi parameter dengan menggunakan metode penduga robust least trimmed square (LTS) dan penduga-s, di mana kedua metode ini memiliki nilai breakdown point yang tinggi yaitu hampir 50% (Rousseeuw, 1987). Berdasarkan uraian di atas maka penulis memilih judul tugas akhir Perbandingan Metode Least Trimmed Squares dan Penduga-S dalam Mengatasi Data Pencilan dengan Simulasi Data. 1.2 Perumusan Masalah Perumusan masalah yang akan diteliti dalam tulisan ini adalah bagaimana perbandingan dua regresi robust yakni metode penduga least trimmed squares (LTS) dan penduga-s dapat mengatasi data pencilan berdasarkan letak pencilan yang dibandingkan dengan suatu simulasi dalam empat posisi yakni di ujung bawah, ujung atas, tengah atas dan tengah bawah dalam model garis regresi sederhana. 1.3 Pembatasan Masalah Agar pembatasan masalah lebih jelas, maka penulis memberikan batasan yang akan dilakukan yaitu: 1. Simulasi data yang diambil penulis adalah 4 model data bangkitan dari program R yang terdiri dari 20 observasi dengan ketentuan letak pencilan pada garis regresi yang berbeda-beda setiap model data. 2. Penulis menggunakan regresi robust dalam mengatasi data pencilan yaitu dengan metode penduga least trimmed squares (LTS) dan penduga-s. 3. Pengolahan data dengan software.
3 1.4 Tinjuan Pustaka Analisis regresi digunakan untuk mengetahui hubungan antara variabel terikat (YY) dengan satu atau lebih variabel bebas (XX). Model regresi linier yang memuat satu variabel terikat (YY) dan satu variabel bebas (XX) adalah model regresi linier sederhana. Metode kuadrat terkecil (MKT) atau ordinary least squares (OLS) merupakan salah satu penduga parameter model regresi linier sederhana. Metode kuadrat terkecil membutuhkan asumsi klasik yang harus dipenuhi untuk menghasilkan penduga linier tidak bias terbaik atau best linier unbiased estimator. Adapun asumsi klasik yang harus dipenuhi adalah homokedastisitas, nonautokorelasi, nonmultikorelasi, distribusi kesalahan normal dengan rata-rata sama dengan nol, dan variabel nonstokastik (Hasan, 1999). Metode kuadrat terkecil merupakan metode yang meminimumkan jumlah kuadrat sisa (selisih antara data yang sebenarnya dengan data dugaan dari model regresi yang terbentuk, yang dinyatakan sebagai berikut (Sembiring, 1995): nn 2 YY ii YY ii = ii=1 εε ii 1.1 Pencilan (Outlier) adalah data yang tidak mengikuti pola umum (Sembiring, 1995, hal. 72). Jika dalam data amatan ditemukan suatu pencilan, maka alternatif penolakan begitu saja bukanlah prosedur yang bijaksana. Ada kalanya pencilan memberikan informasi yang tidak bisa diberikan oleh titik data lainnya (Drafer dan Smith, 1992). Menurut Soemartini (2007), pencilan dapat dideteksi menggunakan beberapa metode yakni metode Grafis, Boxplot, Internal studenzation (residu yang distudentkan), berdasarkan nilai Leverage, DfFITS, Cook s Distance, dan DfBETA(s). Metode yang akan dipakai penulis untuk mendeteksi pencilan yaitu metode Scatterplot dan metode berdasarkan nilai DfFITS. Regresi robust merupakan alat yang penting untuk menganalisis data yang terkontaminasi oleh pencilan. Regresi robust digunakan untuk mendeteksi
4 pencilan dan memberikan hasil terhadap adanya pencilan (Chen, 2002). Metode regresi robust yang diketahui tahan terhadap pencilan terus berkembang dan banyak digunakan dalam meneliti berbagai permalasahan, seperti: pengoptimalan kekuatan torque pada lampu TL yaitu menggunakan metode penduga parameter LTS, dengan alasan terdapat pencilan pada data kekuatan torque (Akbar dan Maftukhah, 2007) dan penelitian pada estimasi parameter produksi jagung di Indonesia tahun 2010 dengan metode penduga-s (Sahari R. J., 2012 ). 1.5 Tujuan Penelitian Tujuan penelitian ini adalah untuk membandingkan regresi robust metode penduga least trimmed squares (LTS) dan penduga-s dalam melakukan pendugaan parameter model regresi sehingga didapatkan pendugaan yang terbaik berdasarkan rataan kuadrat sisa (mean square error). 1.6 Kontribusi Penelitian Manfaat yang diperoleh dari penelitian ini adalah sebagai bahan referensi dalam hal pendugaan parameter model regresi yang memiliki pencilan. 1.7 Metodologi Penelitian Adapun metodologi penelitian dalam tulisan ini adalah sebagai berikut: 1. Membangkitkan data dengan program R. 2. Melakukan pendugaan parameter regresi dengan metode kuadrat terkecil. 3. Melakukan pendeteksian pencilan pada data amatan dengan metode scatterplot dan berdasarkan nilai DfFITS. 4. Mengatasi pencilan dengan menggunakan dua metode regresi robust yakni penduga least trimmed squares (LTS) dan penduga-s.
5 5. Mengolah data menggunakan bantuan program Macro MINITAB. 6. Membandingkan hasil penyelesaian dan pengolahan data dari kedua metode. 7. Membuat kesimpulan.