PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENDUGA-S DALAM MENGATASI DATA PENCILAN DENGAN SIMULASI DATA SKRIPSI ANDOS NIKI S. M. SEMBIRING 090803032 DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2015
PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENDUGA-S DALAM MENGATASI DATA PENCILAN DENGAN SIMULASI DATA SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains ANDOS NIKI S. M. SEMBIRING 090803032 DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2015
PERSETUJUAN Judul : Perbandingan Metode Least Trimmed Squares dan Penduga-S dalam Mengatasi Data Pencilan dengan Simulasi Data Kategori : Skripsi Nama : Andos Niki S. M. Sembiring Nomor Induk Mahasiswa : 090803032 Program Studi : Sarjana (S1) Matematika Departemen : Matematika Fakultas : Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera Utara Disetujui di Medan, April 2015 Komisi Pembimbing: Pembimbing 2, Pembimbing 1, Asima Manurung, S.Si, M.Si NIP. 19730315 199903 2 001 Dr. Open Darnius, M.Sc NIP. 19641014 199103 1 004 Diketahui oleh: Departemen Matematika FMIPA USU Ketua, Prof. Dr. Tulus, M.Si. NIP. 196209011988031 002 i
PERNYATAAN PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENDUGA-S DALAM MENGATASI DATA PENCILAN DENGAN SIMULASI DATA SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri. Kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya. Medan, April 2015 ANDOS NIKI S. M. SEMBIRING 090803032 ii
PENGHARGAAN Pujian dan syukur penulis panjatkan kepada Tuhan Yesus atas kasih dan penyertaannya yang dirasakan penulis dalam menyelesaikan penyusunan skripsi ini dengan judul Perbandingan Metode Least Trimmed Squares dan Penduga-S dalam Mengatasi Data Pencilan dengan Simulasi Data. Terimakasih penulis sampaikan kepada Bapak Dr. Open Darnius, M.Sc selaku pembimbing 1 dan Ibu Asima Manurung, S.Si, M.Si selaku pembimbing 2 yang telah dengan sabar meluangkan waktunya untuk membimbing penulis selama penulisan skripsi ini. Penulis juga mengucapkan terima kasih kepada Bapak Dr. Faigiziduhu Bu ulolo, M.Si dan Bapak Dr. Pasukat Sembiring, M.Si selaku dosen penguji penulis yang telah memberikan kritik dan saran yang sangat penting dalam penyempurnaan penulisan skripsi ini. Terimakasih kepada Bapak Prof. Dr. Tulus, M.Si dan Ibu Dr. Mardiningsih, M.Si selaku ketua dan Sekretaris Departemen Matematika FMIPA USU, kepada Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU, Pembantu Dekan FMIPA USU, seluruh Staf dan Dosen Matematika FMIPA USU, Pegawai FMIPA USU dan rekan-rekan kuliah khususnya Matematika 2009. Penulis mengucapkan terimakasih yang teristimewa kepada kedua orang tua tercinta Bapak N. Sembiring dan Ibu R. Br. Ginting beserta keluarga atas dukungan doa, dukungan moril dan materil, yang menjadi motivasi bagi penulis dalam penulisan skripsi ini. Tuhan yang membalas atas segala bantuan yang telah diberikan kepada penulis. iii
PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENDUGA-S DALAM MENGATASI DATA PENCILAN DENGAN SIMULASI DATA ABSTRAK Analisis regresi digunakan untuk mengetahui hubungan antar variabel. Salah satu metode penduga parameter dalam model regresi adalah metode kuadrat terkecil (OLS). Dalam penelitian ini digunakan empat model kelompok data dengan letak pencilan berbeda-beda dengan lima kali perulangan setiap modelnya. Kemudian tulisan ini bertujuan untuk membandingkan dua metode regresi robust yaitu penduga least trimmed squares (LTS) dan penduga-s. Pada pencilan yang terletak di tengah garis regresi regresi robust penduga-lts memberikan hasil yang lebih baik dari pada penduga-s, sebaliknya penduga-s lebih baik pada pencilan yang berada di ujung. Kriteria pembandingannya menggunakan rata-rata kuadrat sisa. Kata kunci: Pencilan, Metode Kuadrat Terkecil, Regresi Robust, Least Trimmed Squares, Penduga-S. iv
THE COMPARISON OF ROBUST REGRESSION LEAST TRIMMED SQUARES AND S-ESTIMATORS OVERCOMING OUTLIERS WITH SIMULATION OF DATA ABSTRACT Regression analysis was used to determine the relationship between variables. One of method parameter estimator in the regression model is ordinary least squares (OLS). In this study used four groups of data models with different outlier layout with five repetitions of each model. Then, this paper aims to compare the two methods, namely robust regression of least trimmed squares (LTS) and S- estimators. In the outliers are located amid robust regression line regression LTSestimators provides better results than the S-estimators, otherwise S-estimators is better at outliers are located end. The comparison criteria using the average squared residual. Keywords: Outliers, Ordinary Least Squares, Robust Regression, Least Trimmed of Squares, S-estimators. v
DAFTAR ISI PERSETUJUAN PERNYATAAN PENGHARGAAN ABSTRAK ABSTRACT DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN Halaman i ii iii iv v vi viii x xi BAB 1 Pendahuluan 1 1.1. Latar Belakang 1 1.2. Perumusan Masalah 2 1.3. Pembatasan Masalah 2 1.4. Tinjauan Pustaka 3 1.5. Tujuan Peneletian 4 1.6. Kontribusi Peneletian 4 1.7. Metodologi Peneletian 4 BAB 2 Landasan Teori 6 2.1. Regresi Linier 6 2.2. Metode Kuadrat Terkecil 7 2.3. Rataan Kuadrat Sisa (Mean Square Error) 8 2.4. Pencilan 9 2.4.1. Pengertian Pencilan 9 2.4.2. Dampak Pencilan 9 2.4.3. Pendeteksian Pencilan 10 2.5. Regresi Robust 12 2.5.1. Regresi Robust Penduga-S 13 2.5.2. Regresi Robust Penduga Least Trimmed Square (LTS) 17 BAB 3 Pembahasan 18 3.1. Data 18 3.2. Pendeteksian Pencilan/ Outlier 21 3.3. Metode Kuadrat Terkecil 24 3.4. Regresi Robust Penduga Least Trimmed Square (LTS) 27 3.4.1. Rataan Kuadrat Sisa (Mean Square Error) untuk Penduga-LTS 31 3.5. Regresi Robust Penduga-S 36 vi
3.5.1. Rataan Kuadrat Sisa (Mean Square Error) untuk Penduga-S 43 BAB 4 Kesimpulan dan Saran 50 4.1. Kesimpulan 50 4.2. Saran 50 FTAR PUSTAKA 51 vii
DAFTAR TABEL Nomor Judul Halaman Tabel 2.1 Fungsi Objektif, Fungsi Influence dan Fungsi Pembobot untuk Least Square, Huber, dan Tukey Bisquare 16 3.1 Data 1 19 3.2 Data 2 19 3.3 Data 3 20 3.4 Data 4 20 3.5 Nilai DfFITS dan DfFITS 23 3.6 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 1 25 3.7 Sisaan Kuadrat Semua Data dengan Metode Kuadrat Terkecil 26 3.8 Sisaaan Kuadrat yang Diurutkan 28 3.9 Data yang Terbentuk dari Sisaan Kuadrat Sudah 29 Diurutkan 3.10 Perkalian Variabel untuk Data 1 dengan Penduga-LTS 30 3.11 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Menggunakan Penduga-LTS untuk Data 1 31 3.12 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Menggunakan Penduga-LTS untuk Data 2 32 3.13 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Menggunakan Penduga-LTS untuk Data 3 34 3.14 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Menggunakan Penduga-LTS untuk Data 4 35 3.15 Hasil Perhitungan Koefisien Regresi Iterasi ke-1 37 3.16 Hasil Perhitungan Koefisien Regresi Iterasi ke-2 37 3.17 Nilai Koefisien Regresi Penduga-M 38 3.18 Sisaan dari Persamaan Penduga-M 39 3.19 Hasil Perhitungan Koefisien Regresi Iterasi ke-1 40 3.20 Hasil Perhitungan Koefisien Regresi Iterasi ke-2 41 3.21 Nilai Koefisien Regresi Penduga-S 42 3.22 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Menggunakan Penduga-S untuk Data 1 43 3.23 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Menggunakan Penduga-S untuk Data 2 44 3.24 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Menggunakan Penduga-S untuk Data 3 45 3.25 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Menggunakan Penduga-S untuk Data 4 47 3.26 Hasil Estimasi Koefisien Regresi dan Rata-rata Kuadrat Sisa 48 viii
3.27 Hasil Estimasi Koefisien Regresi dan Rata-rata Kuadrat Sisa Data Perulangan 49 ix
DAFTAR GAMBAR Nomor Judul Halaman Gambar 2.1 ma Identifikasi Data Pencilan dengan IQR atau Box Plot 11 2.2 Kriteria Pengambilan Keputusan Adanya Pencilan atau Tidak 12 3.1 Scatterplot Data 1 21 3.2 Scatterplot Data 1 22 3.3 Scatterplot Data 1 22 3.4 Scatterplot Data 1 23 x
DAFTAR LAMPIRAN Nomor Judul Halaman Lampiran 1 mbangkitkan Data dengan Program R 53 2 amaan dengan Metode Kuadrat Terkecil dan Mendeteksi Pencilan dengan MINITAB 53 3 amaan Penduga-LTS dengan Metode Kuadrat Terkecil 54 4 gram Macro MINITAB Regresi Robust dengan Pembobot Fungsi Huber (dengan r=1) 55 5 il Output Program macro MINITAB Data 1, Data 2, Data 3 dan Data 4 56 6 amaan Penduga-S Data 1, Data 2, Data 3 dan Data 4 dengan 70 R 7 ulangan Data Simulasi 76 xi