BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini

BAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan

(R.14) METODE MINIMUM COVARIANCE DETERMINANT PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN

BAB III ANALISIS KORELASI KANONIK ROBUST DENGAN METODE MINIMUM COVARIANCE DETERMINAN

Metode Minimum Covariance Determinan Pada Analisis Regresi Linier Berganda Dengan Kasus Pencilan

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

, dengan. Karakteristik dari vektor peubah acak X dan Y sebagai berikut:

BAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah

PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Judul : Perbandingan Metode MCD Bootstrap dan. Analisis Regresi Linear Berganda. Pembimbing : 1. Dra. Ni Luh Putu Suciptawati,M.Si

BAB I PENDAHULUAN. lebih variabel independen. Dalam analisis regresi dibedakan dua jenis variabel

BAB I PENDAHULUAN. 1.1 Latar Belakang

(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN

Azzakiy Fiddarain ABSTRACT

BAB I PENDAHULUAN. untuk membentuk model hubungan antara variabel dependen dengan satu atau

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA

PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT (LMS-MCD) DALAM REGRESI KOMPONEN UTAMA

BAB 2 TINJAUAN PUSTAKA = (2.2) =

BAB III MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST. Pada bab ini akan dikaji bahasan utama yaitu pencilan dan analisis

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

KAJIAN TELBS PADA REGRESI LINIER DENGAN KASUS PENCILAN

KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD)

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:

PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN

SKRIPSI. Disusun Oleh: Ana Kartikawati NIM. J2E009024

BAB I PENDAHULUAN. 1.1 Latar Belakang

METODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER

PENDETEKSIAN OUTLIER PADA CAPITAL ASSET PRICING MODEL (CAPM) MENGGUNAKAN LEAST TRIMMED SQUARES (LTS) Elis Ratna Wulan 1, Enung Nurhayati 2

TINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan

BAB 1 PENDAHULUAN. Perkembangan dunia teknologi berkembang sangat pesat di dalam kehidupan

BAB III KAJIAN SIMULASI

Pengaruh Outlier Terhadap Estimator Parameter Regresi dan Metode Regresi Robust

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

ANALISIS KOMPONEN UTAMA DENGAN MENGGUNAKAN MATRIK VARIAN KOVARIAN YANG ROBUST

ANALISIS REGRESI ROBUST ESTIMASI-S MENGGUNAKAN PEMBOBOT WELSCH DAN TUKEY BISQUARE

PENERAPAN ESTIMATOR ROBUST RMCD PADA GRAFIK PENGENDALI T 2 HOTELLING UNTUK PENGAMATAN INDIVIDUAL BIVARIAT DAN TRIVARIAT

REGRESI ROBUST MM-ESTIMATOR UNTUK PENANGANAN PENCILAN PADA REGRESI LINIER BERGANDA

BAB I PENDAHULUAN. hubungan ketergantungan variabel satu terhadap variabel lainnya. Apabila

Jurnal EKSPONENSIAL Volume 7, Nomor 2, Nopember 2016 ISSN

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

UJM 3 (2) (2014) UNNES Journal of Mathematics.

FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS)

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN KELOMPOK BAHAN MAKANAN DI JAWA TENGAH

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

KAJIAN TERHADAP TINGKAT PEMERATAAN PENDIDIKAN MENGGUNAKAN ANALISIS BIPLOT KLASIK DAN BIPLOT KEKAR

ABSTRAK. Kata kunci: model regresi linier, pencilan (outlier), regresi robust, M-estimator

BAB I PENDAHULUAN. 1.1 Latar Belakang

Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November

PERBANDINGAN TINGKAT EFISIENSI ANTARA METODE KUADRAT TERKECIL DENGAN METODE MINIMUM COVARIANCE DETERMINANT

Forum Statistika dan Komputasi, Oktober 2009 p : ISSN :

BAB I PENDAHULUAN. Analisis regresi merupakan metode analisis yang menjelaskan tentang

PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENAKSIR M DALAM MENGATASI PERMASALAHAN DATA PENCILAN

KAJIAN METODE ROBUST LEAST TRIMMED SQUARE (LTS) DALAM MENGESTIMASI PARAMETER REGRESI LINEAR BERGANDA UNTUK DATA YANG MENGANDUNG PENCILAN SKRIPSI

ANALISIS REGRESI ROBUST PADA DATA MENGANDUNG PENCILAN DENGAN METODE LEAST MEDIAN SQUARE

PERBANDINGAN METODE KEKAR BIWEIGHT MIDCOVARIANCE DAN MINIMUM COVARIANCE DETERMINANT DALAM ANALISIS KORELASI KANONIK FREZA RIANA

BAB III CONTOH KASUS. Pada bab ini akan dibahas penerapan metode robust dengan penaksir M

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST UNTUK DATA INFLASI KELOMPOK BAHAN MAKANAN DI JAWA TENGAH

Perbandingan Metode Robust Least Trimmed Square Dengan Metode Scale

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 1, Tahun 2014, Halaman 1-10 Online di:

MODEL REGRESI KANDUNGAN BATUBARA MENGGUNAKAN METODE LEAST MEDIAN OF SQUARES

Sarimah. ABSTRACT

REGRESI ROBUST DENGAN METODE CONSTRAINED M ESTIMATION PADA PRODUKSI PADI SAWAH DI JAWA TENGAH. oleh IDA YUSWARA DYAH PITALOKA M

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

1. PENDAHULUAN PADA PRODUKSI JAGUNG DI JAWA TENGAH

PENDUGA PENCILAN BOGOR 2013

TINJAUAN PUSTAKA. Gambar 1 Plot jenis pengamatan pencilan.

MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO

BAB I PENDAHULUAN. suatu metode yang disebut metode kuadrat terkecil (Ordinary Least Square OLS).

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA

BAB I PENDAHULUAN. dependen disebut dengan regresi linear sederhana, sedangkan model regresi linear

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

PERBANDINGAN REGRESI ROBUST DENGAN OLS PADA PRODUKSI UBI JALAR PROVINSI JAWA TENGAH TAHUN 2015

BAB I PENDAHULUAN. 1.1 Latar Belakang

ESTIMASI DATA HILANG MENGGUNAKAN REGRESI ROBUST S

EFISIENSI ESTIMASI SCALE (S) TERHADAP ESTIMASI LEAST TRIMMED SQUARES (LTS) PADA PRODUKSI PADI DI PROVINSI JAWA TENGAH

PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENDUGA-S DALAM MENGATASI DATA PENCILAN DENGAN SIMULASI DATA SKRIPSI

BAB 2 LANDASAN TEORI

ANALISIS KETEGARAN REGRESI ROBUST TERHADAP LETAK PENCILAN: STUDI PERBANDINGAN

BAB I PENDAHULUAN Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1. Latar Belakang

REGRESI ROBUST MM-ESTIMATOR UNTUK PENANGANAN PENCILAN PADA REGRESI LINIER BERGANDA

REGRESI RIDGE-MM UNTUK MENGATASI MULTIKOLINIERITAS DAN PENCILAN : STUDI KASUS PADA DATA INDEKS PEMBANGUNAN MANUSIA

viii METODE REGRESI LEAST TRIMMED SQUARES PADA DATA YANG MENGANDUNG PENCILAN ANNI FITHRIYATUL MAS UDAH

METODE PENDUGAAN MATRIKS RAGAM-PERAGAM DALAM ANALISIS REGRESI KOMPONEN UTAMA (RKU) YANI SURYANI

PENERAPAN DAN STUDI SIMULASI GRAFIK PENGENDALI T

BAB I PENDAHULUAN Latar Belakang Masalah

ESTIMASI REGRESI ROBUST M PADA FAKTORIAL RANCANGAN ACAK LENGKAP YANG MENGANDUNG OUTLIER

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

ESTIMAS) PARAMETER REGRES) LINtER BERGANDA DENGAN METODE ROBUST BERDASARKAN LEAST TRIMMED SQUARES SKRIPSI

MENGATASI MASALAH MULTIKOLINEARITAS DAN OUTLIER DENGAN PENDEKATAN ROBPCA (STUDI KASUS ANALISIS REGRESI ANGKA KEMATIAN BAYI DI JAWA TIMUR)

Tingkat Efisiensi Metode Regresi Robust dalam Menaksir Koefisien Garis Regresi Jika Ragam Galat Tidak Homogen

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PERBANDINGAN METODE COEFFICIENT OF DETERMINATION RATIO DAN REGRESI DIAGNOSTIK DALAM MENDETEKSI OUTLIER PADA ANALISIS REGRESI LINIER BERGANDA

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Analisis regresi merupakan suatu metode yang digunakan untuk mengetahui hubungan satu arah antara variabel prediktor dan variabel respon yang umumnya dinyatakan dalam bentuk persamaan matematik. Cara untuk mengetahui hubungan antara variabel respon dan prediktor tersebut dapat dilihat melalui bentuk pola hubungan pada scatter plot. Apabila titik-titik data pada scatter plot mengelompok mendekati pola garis lurus, maka hubungan antara variabel prediktor dan respon dapat dikatakan linier, sehingga model regresi yang digunakan adalah model regresi linier. Berdasarkan banyaknya variabel yang dianalisis, analisis regresi linier dikelompokkan menjadi tiga kelompok, yaitu regresi linier sederhana, regresi linier berganda, dan regresi linier multivariat. Regresi linier sederhana merupakan analisis regresi yang menggunakan satu variabel prediktor dan respon. Apabila banyaknya variabel respon satu variabel dan banyaknya variabel prediktor lebih dari satu variabel, maka disebut regresi linier berganda. Regresi linier multivariat merupakan pengembangan regresi linier sederhana dan berganda yang menggunakan variabel prediktor dan respon lebih dari satu variabel. Selain untuk mengetahui pola hubungan antara variabel respon dan prediktor, tujuan lain dari analisis regresi adalah untuk mengestimasi parameter model yang menyatakan hubungan antara variabel prediktor dan variabel respon. Salah satu metode yang sering digunakan untuk mengestimasi parameter model regresi adalah metode kuadrat terkecil (least square method). Akan tetapi metode kuadrat terkecil bukan metode yang robust terhadap adanya outlier (Rousseeuw dan Leroy [1987]). Metode robust adalah metode yang tidak terpengaruh oleh adanya outlier sehingga memberikan hasil yang terpercaya walaupun terdapat outlier pada data. 1

2 Hasil estimasi parameter dari metode kuadrat terkecil menjadi tidak sesuai meskipun hanya terdapat satu outlier dalam data, sehingga metode kuadrat terkecil bukan metode robust untuk mengestimasi parameter model regresi apabila terdapat outlier pada data. Menurut Ferguson [1961], definisi dari outlier adalah suatu data yang menyimpang dari sekumpulan data yang lain. Demikian pula menurut Barnett dan Lewis [1980] yang mendefinisikan outlier sebagai observasi yang tidak mengikuti sebagian besar pola dan terletak jauh dari pusat data. Salah satu cara untuk mendeteksi adanya outlier pada data adalah menggunakan diagnostik plot. Selain untuk mendeteksi outlier, diagnostik plot juga digunakan untuk memeriksa ketepatan model linier yang digunakan dan menganalisis adanya titik leverage (titik tertentu dari variabel prediktor yang memiliki efek yang besar terhadap nilai estimator dari parameter pada model regresi). Plot yang dimaksud untuk beberapa tujuan tersebut adalah residual plot dan respon plot yang digunakan untuk mengetahui ketepatan model linier yang digunakan dan plot jarak Mahalanobis dari variabel prediktor versus jarak Mahalanobis dari residual untuk mengetahui adanya outlier dari regresi dan titik leverage. Jarak Mahalanobis yang dihitung menggunakan estimator klasik akan menimbulkan adanya masking dan swamping, sehingga digunakan estimator robust untuk menghitung jarak Mahalanobis robust. Terdapat berbagai macam estimator robust untuk lokasi multivariat dan dispersi yang digunakan untuk menghitung jarak Mahalanobis. Salah satunya adalah estimator minimum covariance determinant (MCD) dari Rousseeuw yang merupakan estimator robust lokasi multivariat dan dispersi dengan high breakdown. Untuk meningkatkan efisiensi, digunakan versi reweighted dari estimator minimum covariance determinant (RMCD) untuk mencari estimator robust. Perhitungan estimator MCD membutuhkan waktu yang lama dan terbatas untuk sampel kecil, maka estimator MCD dihitung menggunakan algoritma C-step (Rousseeuw dan Driessen [1999]). Estimator MCD yang menggunakan C-step disebut dengan estimator fast minimum covariance determinant (FMCD). Untuk data kecil, estimator FMCD mampu menemukan estimator MCD secara te-

3 pat dan untuk data besar memberikan hasil yang lebih akurat. Akan tetapi menurut Olive dan Hawkins [2010] estimator FMCD bukan estimator high breakdown dan estimator tersebut hanya menggunakan satu kriteria untuk menentukan attractors yang digunakan yaitu kriteria dari MCD dispersi, sehingga dikembangkan estimator yang menggunakan dua kriteria yaitu kriteria dari dispersi dan lokasi yang disebut estimator reweighted multivariate normal (RMVN). Estimator reweighted multivariate normal (RMVN) adalah estimator yang berguna untuk mengestimasi matriks kovariansi ketika data berasal dari distribusi nomal multivariat, walaupun terdapat outlier dalam data. Oleh karena itu, estimator reweighted multivariate normal (RMVN) merupakan estimator robust. Jadi, untuk mengatasi masalah masking dan swamping yang disebabkan oleh estimator klasik pada pendeteksian outlier digunakan estimator reweighted multivariate normal (RMVN). Selain digunakan pada pendeteksian outlier, estimator reweighted multivariate normal (RMVN) juga digunakan dalam regresi linier multivariat untuk memperoleh hasil estimasi parameter apabila terdapat outlier pada data sebagai alternatif untuk mengatasi metode kuadrat terkecil yang tidak robust terhadap adanya outlier. Berdasarkan permasalahan tersebut, tesis ini membahas diagnostik plot pada regresi linier multivariat untuk memeriksa ketepatan model linier yang digunakan dan mendeteksi outlier serta penggunaan estimator reweighted multivariate normal (RMVN) untuk mengestimasi parameter regresi linier multivariat. 1.2 Tujuan dan Manfaat Penelitian Berdasarkan latar belakang masalah yang telah dijelaskan di atas, maka tujuan penulisan tesis ini adalah: 1. Mengetahui model regresi linier multivariat beserta estimasinya menggunakan metode kuadrat terkecil. 2. Melakukan diagnostik plot pada model regresi linier multivariat untuk memeriksa ketepatan model linier yang digunakan dan mendeteksi outlier.

4 3. Menghitung estimasi parameter pada model regresi linier multivariat dengan menggunakan estimator reweighted multivariate normal (RMVN). Selanjutnya penelitian ini diharapkan dapat memberikan manfaat pada pembaca dan penulis untuk menambah pengetahuan mengenai diagnostik plot pada regresi linier multivariat untuk memeriksa ketepatan model linier yang digunakan dan mendeteksi adanya outlier, serta mengetahui penerapan estimator reweighted multivariate normal (RMVN) pada model regresi linier multivariat untuk memperoleh estimasi parameter yang robust terhadap adanya outlier. Penelitian ini juga diharapkan dapat dijadikan sebagai bahan referensi untuk peneliti lain yang akan melakukan penelitian lebih lanjut. 1.3 Pembatasan Masalah Pada penelitian ini, batasan masalah sangat diperlukan supaya tidak terjadi penyimpangan dari tujuan awal penelitian. Oleh karena itu, pembahasan hanya difokuskan pada diagnostik plot pada model regresi linier multivariat untuk memeriksa ketepatan model linier yang digunakan dan pendeteksian outlier serta estimasi parameter model regresi linier multivariat menggunakan estimator reweighted multivariate normal (RMVN). 1.4 Tinjauan Pustaka Pembahasan mengenai regresi linier multivariat, penulis menggunakan referensi buku dan jurnal, antara lain Robust Multivariate Regression (Rousseeuw, Aelst, dan Agullo [2003]), Robust Covariance Matrix Estimation with Canonical Correlation Analysis (Olive, Ye, dan Zhang [2012]), Methods of Multivariate Analysis (Rencher [2002]), Linear Models in Statistics (Rencher dan Schaalje [2008]), Introduction to Probability and Mathematical Statistics (Bain dan Engelhardt [1992]), Visualizing and Testing the Multivariate Linear Regression Model (Don, Olive, dan Watagoda [2015]), dan Robust Multivariate Linear Regression (Olive [2013]). Selain itu, penulis juga menggunakan referensi tesis dari Universitas Gadjah Mada terkait penulisan tesis ini seperti tesis yang berjudul Mendeteksi

5 Outlier pada Data Multivariat dalam Beberapa Populasi oleh Noeryanti (2000) dan tesis berjudul Perbandingan Metode MVV dan FMCD dalam mendeteksi pencilan pada suatu observasi data Multivariat Normal oleh Moch. Faruk (2008). 1.5 Metode Penelitian Metode yang digunakan dalam penelitian adalah studi literatur. Dalam menganalisis diagnostik plot pada regresi linier multivariat dan penggunaan estimator reweighted multivariate normal (RMVN) untuk pendeteksian outlier serta estimasi parameter regresi linier multivariat yang dilakukan dalam penelitian ini digunakan referensi jurnal-jurnal dan buku-buku penunjang yang berhubungan dengan hal tersebut. Selanjutnya dilakukan studi kasus untuk model regresi linier multivariat yang meliputi diagnostik plot untuk memeriksa ketepatan model linier yang digunakan dan identifikasi adanya outlier, serta mencari estimasi parameter model regresi linier multivariat menggunakan estimator reweighted multivariate normal (RMVN). 1.6 Sistematika Penulisan Sistematika penulisan pada tesis ini terdiri dari lima Bab, yaitu BAB I PEN- DAHULUAN, BAB II LANDASAN TEORI, BAB III ESTIMASI REGRESI LI- NIER MULTIVARIAT, BAB IV STUDI KASUS, BAB V PENUTUP. Berikut ini uraian dari masing-masing bab. BAB I PENDAHULUAN Bab ini berisi Latar Belakang Masalah, Tujuan dan Manfaat Penelitian, Pembatasan Masalah, Tinjauan Pustaka, Metode Penelitian, dan Sistematika Penulisan. BAB II LANDASAN TEORI Bab ini berisi mengenai teori dasar yang menunjang dalam pembahasan penelitian ini, meliputi matriks dan vektor, distribusi kontinu, analisis regresi, pencilan (outlier), metode kuadrat terkecil, estimasi robust, breakdown point, ukuran kebaikan dan efisiensi estimator.

6 BAB III ESTIMASI REGRESI LINIER MULTIVARIAT Bab ini membahas mengenai estimasi regresi linier multivariat menggunakan metode estimasi kuadrat terkecil dan estimasi regresi linier multivariat menggunakan estimator reweighted multivariate normal (RMVN) apabila terdapat outliers pada data, uji diagnostik plot model regresi linier multivariat yang meliputi residual plot, respon plot, dan plot jarak Mahalanobis dari variabel prediktor versus jarak Mahalanobis dari residual menggunakan estimator reweighted multivariate normal (RMVN), dan uji overall model regresi linier multivariat. BAB IV STUDI KASUS Pada bab ini dibahas mengenai hasil penelitian yang telah dilakukan berupa studi kasus menggunakan data simulasi dan data asli dengan bantuan program R. Studi kasus ini menunjukkan bahwa estimator reweighted multivariate normal (RMVN) merupakan metode estimasi yang robust terhadap adanya outliers, membandingkan hasil estimasi parameter menggunakan metode estimasi kuadrat terkecil dan estimator reweighted multivariate normal (RMVN) pada regresi linier multivariat apabila terdapat outliers pada data dengan menggunakan data simulasi, serta pengaplikasian estimator reweighted multivariate normal (RMVN) tersebut untuk mendeteksi adanya outliers dan mengestimasi parameter regresi linier multivariat pada data asli. BAB V PENUTUP Pada bab ini berisi kesimpulan dari hasil penelitian dan saran.