TINJAUAN PUSTAKA. Model Regresi Linier Ganda

dokumen-dokumen yang mirip
PENDETEKSIAN PENGAMATAN PENCILAN DAN BERPENGARUH DENGAN METODE PENGARUH LOKAL GOSEN SITANGGANG

II. TINJAUAN PUSTAKA 2.1 Metode Regresi 2.2 Model Aditif Terampat ( Generalized additive models , GAM)

TINJAUAN PUSTAKA. Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan

BAB III METODE PENELITIAN. September). Data yang dikumpulkan berupa data jasa pelayanan pelabuhan, yaitu

TINJAUAN PUSTAKA. Analisis regresi merupakan suatu teknik statistika untuk menyelidiki dan

JURNAL MATEMATIKA DAN KOMPUTER Vol. 4. No. 2, 71-81, Agustus 2001, ISSN :

HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN. Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan

BAB II TINJAUAN PUSTAKA. Hal ini sangat membantu dalam proses pembuktian sifat-sifat dan perhitungan

Analisis Regresi 2. Multikolinier & penanganannya

MODEL-MODEL LEBIH RUMIT

BAB 2 TINJAUAN PUSTAKA = (2.2) =

Bab 2 LANDASAN TEORI

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA. Tatik Widiharih Jurusan Matematika FMIPA UNDIP

= parameter regresi = variabel gangguan Model persamaan regresi linier pada persamaan (2.2) dapat dinyatakan dalam bentuk matriks berikut:

BAB 2 LANDASAN TEORI

Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENAKSIR M DALAM MENGATASI PERMASALAHAN DATA PENCILAN

BAB II LANDASAN TEORI. Analisis regresi (regressison analysis) merupakan suatu teknik untuk membangun persamaan

TINJAUAN PUSTAKA. Gambar 1 Diagram kotak garis

BAB. IX ANALISIS REGRESI FAKTOR (REGRESSION FACTOR ANALYSIS)

Analisis Regresi 1. Pokok Bahasan Pengujian pada Regresi Ganda

BAB 2 TINJAUAN PUSTAKA

TINJAUAN PUSTAKA. Gambar 1 Plot jenis pengamatan pencilan.

BAB 2 LANDASAN TEORI

BAB II KAJIAN PUSTAKA. dicatat, atau diobservasi sepanjang waktu secara berurutan. Periode waktu dapat

BAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah

Analisis Regresi 2. Pokok Bahasan : Asumsi sisaan dan penanganannya

III. METODE PENELITIAN

BAB II LANDASAN TEORI. Data merupakan bentuk jamak dari datum. Data merupakan sekumpulan

REGRESI LINIER GANDA. Fitriani Agustina, Math, UPI

VI. ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI USAHA PEMBESARAN LELE DUMBO DI CV JUMBO BINTANG LESTARI

BAB 2 LANDASAN TEORI

III. METODE PENELITIAN. Penelitian dilakukan di Provinsi Lampung yang terdiri dari 14 kabupaten/kota

METODOLOGI HASIL DAN PEMBAHASAN

BAB 2 LANDASAN TEORI. Analisis regresi (regression analysis) merupakan suatu teknik untuk membangun

IV. METODOLOGI PENELITIAN. Penelitian ini dilakukan di Kecamatan Tanjungpinang Timur,

Regresi Linier Berganda

BAB II KAJIAN TEORI. Sebuah Matriks adalah susunan segi empat siku-siku dari bilangan-bilangan.

BAB 2 LANDASAN TEORI

BAB III CONTOH KASUS. Pada bab ini akan dibahas penerapan metode robust dengan penaksir M

Analisis Regresi 2. Pokok Bahasan : Review Regresi Linier Sederhana dan Berganda

BAB 2 LANDASAN TEORI. 1. Analisis Korelasi adalah metode statstika yang digunakan untuk menentukan

BAB II TINJAUAN PUSTAKA. Dalam bab ini dibahas tentang matriks, metode pengganda Lagrange, regresi

STK 511 Analisis statistika. Materi 7 Analisis Korelasi dan Regresi

Analisis Regresi 2. Multikolinier & penanganannya

REGRESI LINIER BERGANDA. Debrina Puspita Andriani /

BAB III ANALISIS FAKTOR. berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal

Analisis Regresi 1. Pokok Bahasan : Regresi Linier dengan Dua Peubah Penjelas

(R.14) METODE MINIMUM COVARIANCE DETERMINANT PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN

III. METODOLOGI PENELITIAN

BAB 2 LANDASAN TEORI. 1. Analisis korelasi adalah metode statistika yang digunakan untuk menentukan

BAB II. Tinjauan Pustaka. kali dikenalkan oleh Francis Galton melalui artikelnya yang berjudul Regression

Regresi Linier Sederhana dan Korelasi. Pertemuan ke 4

STUDI KOMPARATIF METODE KUADRAT TERKECIL DENGAN METODE REGRESI ROBUST PEMBOBOT WELSCH PADA DATA YANG MENGANDUNG PENCILAN

BAB 2 LANDASAN TEORI

BAB III METODOLOGI PENELITIAN. Rancangan penelitian diperlukan agar penelitian yang dilakukan dapat

BAB 2 LANDASAN TEORI. Analisis Komponen Utama (AKU, Principal Componen Analysis) bermula dari

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

BAB III LANDASAN TEORI

ORTHOGONALISASI PEUBAH BEBAS YANG BERKORELASI DALAM SUATU MODEL REGRESI ABSTRACT

MA5283 STATISTIKA Bab 7 Analisis Regresi

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. Perubahan nilai suatu variabel dapat disebabkan karena adanya perubahan pada

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

HASIL DAN PEMBAHASAN

BAB ΙΙ LANDASAN TEORI

TINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan

PENERAPAN METODE REGRESI GULUD DAN REGRESI KOMPONEN UTAMA DALAM MENGATASI PENYIMPANGAN MULTIKOLINEARITAS PADA ANALISIS REGRESI LINEAR BERGANDA

BAB 2 TINJAUAN TEORITIS. penjelasan tentang pola hubungan (model) antara dua variabel atau lebih.. Dalam

BAB III METODE PENELITIAN. di peroleh dari Website Bank Muamlat dalam bentuk Time series tahun 2009

METODE PENELITIAN. A. Variabel Penelitian dan Definisi Operasional. Untuk memperjelas dan memudahkan pemahaman terhadap variabelvariabel

PENERAPAN METODE GENERALIZED RIDGE REGRESSION DALAM MENGATASI MASALAH MULTIKOLINEARITAS

BAB II TINJAUAN PUSTAKA. level, model regresi tiga level, penduga koefisien korelasi intraclass, pendugaan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN. karakteristik tertentu (Indriantoro dan Supomo, 2003). Populasi dalam penelitian

BAB lll METODE PENELITIAN

PERBANDINGAN METODE COEFFICIENT OF DETERMINATION RATIO DAN REGRESI DIAGNOSTIK DALAM MENDETEKSI OUTLIER PADA ANALISIS REGRESI LINIER BERGANDA

BAB III REGRESI TERSENSOR (TOBIT) Model regresi yang didasarkan pada variabel terikat tersensor disebut

homogen jika titik-titik tersebar secara merata atau seimbang baik di atas maupun dibawah garis, dengan maksimum ragam yang kecil.

BAB II LANDASAN TEORI

MODUL TEORI ESTIMASI ATAU MENAKSIR TEORI ESTIMASI ATAU MENAKSIR

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

DATA DAN METODE. Data

BAB IV ANALISA DAN PEMBAHASAN

III. HASIL DAN PEMBAHASAN

METODE PENELITIAN Sumber Data

pendekatan dalam penelitian ini dinilai cukup beralasan.

III. METODE PENELITIAN. Berdasarkan sifat penelitiannya, penelitian ini merupakan sebuah penelitian

MENGATASI MULTIKOLINEARITAS MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS (PCA)

MA2081 Statistika Dasar

BAB 2 LANDASAN TEORI

ANALISIS FAKTOR (FACTOR ANALYSIS)

III. METODE PENELITIAN. topik penelitian secara keseluruhan. Dalam kaitannya dengan hal ini, metode

BAB 2 LANDASAN TEORI. Bentuk umum persamaan regresi linier berganda adalah

BAB III METODE PENELITIAN

Transkripsi:

TINJAUAN PUSTAKA Model Regresi Linier Ganda Hubungan antara y dan X dalam model regresi linier umum adalah y = X ß + e () dengan y merupakan vektor pengamatan pada peubah respon (peubah tak bebas) berukuran (n x ) dan X adalah matriks berukuran (n x p) dengan p peubah bebas dan n pengamatan, ß adalah vektor koefisien regresi (parameter) berukuran (p x ) dan e adalah vektor sisaan berukuran (n x ). Model regresi linier umum memiliki asumsi baha: () ε i merupakan suatu peubah acak, ε i ~ N(0, σ ), () ε i dan ε j tidak berkorelasi, sehingga ragam-peragam ( ε i, ε j ) = 0, dengan i j (Draper & Smith 98). Metode kuadrat terkecil sering digunakan untuk menduga parameter. Penduga yang dihasilkan metode kuadrat terkecil tidak berbias, terbaik dan konsisten. Ragam penduganya bernilai minimum dibandingkan dengan ragam penduga tak bias lainnya. Penggunaan metode kuadrat terkecil ini peka terhadap penyimpangan asumsi-asumsi yang diperlukan, sehingga adanya pengamatan pencilan dalam data dapat mengakibatkan persamaan regresi yang diperoleh memiliki penduga yang tidak tepat (Aunuddin 989) Kolinieritas Kolinieritas pada regresi linier ganda terjadi karena adanya korelasi yang cukup tinggi di antara peubah bebas. Suatu metode formal untuk mendeteksi adanya kolinieritas adalah Variance Inflation Factors (VIF). VIF merupakan faktor yang mengukur seberapa besar kenaikan ragam koefisien regresi dugaan b k dibandingkan terhadap peubah bebas lainnya yang saling ortogonal. VIF diformulasikan dalam bentuk : VIF k = (Fox dan Monette 99) ( R k )

5 dengan R k adalah koefisien determinasi dari peubah bebas X k diregresikan terhadap semua peubah bebas X yang lainnya di dalam model. Nilai VIF yang lebih besar dari 0 mengindikasikan baha terjadi kolinieritas dalam data (Neter et al. 990). Pendeteksian Pencilan Pendeteksian pengamatan pencilan terhadap nilai-nilai X dapat digunakan matriks H (hat matrix) yang didefinisikan sebagai : H = X(X X) - X () Unsur ke- i pada diagonal utama matriks H dinamakan dalam matriks H dapat diperoleh dari nilai h ii = ' x i (X X) - n h ii berkisar antara 0 dan, dan h ii i= h ii. Unsur diagonal h ii di x i (3) = p, dengan p adalah banyaknya koefisien regresi di dalam fungsi termasuk konstanta (intercept) (Neter et al. 990). Unsur diagonal h ii dinamakan leverage ke-i yang merupakan ukuran jarak antara nilai X untuk pengamatan ke-i dan rataan X untuk semua pengamatan. Nilai h ii yang lebih besar dari p/n dinyatakan sebagai pengamatan pencilan dan berpengaruh. Nilai h ii yang semakin besar menunjukkan semakin besar potensinya untuk berpengaruh (Aunuddin 989). Pendeteksian pencilan juga dapat dilakukan dengan menggunakan nilai R- student (externally studentized residual) yang didefinisikan sebagai : t i = s y yˆ i i ( i ) dengan y i adalah nilai peubah respon pada pengamatan ke-i, h ii (4) ŷ i adalah nilai dugaan y pada pengamatan ke-i, s (-i) merupakan dugaan simpangan baku tanpa pengamatan ke-i. R-student menyebar mengikuti sebaran t-student dengan derajat bebas (n-p-). Suatu pengamatan dikatakan pencilan jika t > t (n-p-;α/) dalam taraf nyata α (Myers 990).

6 Pendeteksian Pengamatan Berpengaruh Pendeteksian pengamatan berpengaruh ditentukan berdasarkan nilai DFFITS dan Cook s D. Nilai DFFITS i merupakan suatu ukuran pengaruh yang ditimbulkan oleh pengamatan ke-i terhadap nilai dugaan ke-i dihapus. Nilai DFFITS i diperoleh dari rumus berikut : (DFFITS) i = yˆ i s ( i) yˆ i, i hii ŷ i apabila pengamatan (5) dengan ˆ adalah nilai dugaan y i tanpa pengamatan ke i. Suatu pengamatan yi, i dikatakan berpengaruh apabila nilai / p DFFITS i > (Myers 990). Cook s D merupakan suatu ukuran pengaruh pengamatan ke-i terhadap semua koefisien regresi dugaan. Pada Cook s D, pengaruh pengamatan ke-i diukur n oleh jarak D i. Jarak tersebut diperoleh dari rumus berikut : D i = ( b b ) ' ( X' X )( b b ) ps dengan b -i adalah vektor koefisien regresi dugaan tanpa pengamatan ke-i, b adalah vektor koefisien regresi dugaan termasuk pengamatan ke-i, p merupakan banyaknya parameter regresi di dalam model termasuk konstanta. Suatu pengamatan merupakan pengamatan berpengaruh apabila mempunyai nilai D > F (p; n-p; α) dengan taraf nyata α (Myers 990). (6) Pengaruh Lokal Teknik pengaruh lokal diperkenalkan oleh Cook (986) sebagai alat diagnosis umum untuk metode kemungkinan maksimum. Pada regresi linier ganda, metode pengaruh lokal berbeda dengan metode penghapusan (Cook s D). Metode pengaruh lokal digunakan untuk menaksir dampak pembobotan di titik pengamatan tertentu dalam suatu model, sedangkan Cook s D menaksir dampak pengahapusan di titik pengamatan tertentu dalam suatu model. Metode pengaruh lokal menyatakan baha pengamatan yang pembobotnya lebih besar adalah pengamatan paling berpengaruh.

7 Misalkan βˆ merupakan penduga kemungkinan maksimum dari model regresi linier ganda dari persamaan (), yang diperoleh dari fungsi kemungkinan maksimum L (β;y). Misalkan W adalah matriks pembobot berukuran n x p dituliskan sebagai berikut : W = M n n+ n + n O n + L 3n L L L p( n ) + p( n ) + Pembobot W dimasukkan ke dalam model sehingga model regresi linier ganda menjadi M pn y = (X+ W) ß + e (7) Misalkan βˆ merupakan penduga kemungkinan maksimum dari persamaan (7) yang diperoleh dari kemungkinan maksimum L (β;y). Misalkan dalam ruang pembobot terdapat pembobot yang tidak berarti 0 (pembobot nol) sehingga L 0 (β;y) = L (β;y), dengan demikian pembobot dapat ditulis sebagai = 0 + a v (8) dengan v meakili arah vektor dan a meakili jarak dari 0. Ukuran dari pembobot dinyatakan sebagai 0 = a (9) Ukuran dari pembobot pada pendugaan kemungkinan maksimum adalah perpindahan kemungkinan (LD) : LD () = [L ( βˆ ;y) L ( βˆ ; y)] (0) fungsinya mencapai nilai minimum nol pada pembobot nol. Penerapan pendekatan deret taylor orde kedua pada persamaan 0 menghasilkan dengan A & = LD() ½ a v A & v () L( βˆ ; y) ' 0, dengan 0 dinotasikan evaluasi pada β = βˆ, = 0 v A & v adalah matriks kuadrat yang menyatakan kurva normal dari grafik pengaruh di 0 mengarah ke v yang merupakan ukuran pembobot. Jika kurva mengarah ke v, t kali lebih besar mengarah ke v, maka pembobot = 0 + av, t kali lebih besar dibandingkan pembobot = 0 + av, oleh karena itu suatu

8 pembobot dikatakan berpengaruh jika pembobot pengamatan tersebut lebih besar dibandingkan pembobot pengamatan lainnya. terbesar yang bersesuaian dengan arah C yang merupakan kurva v, dapat dicari dengan menggunakan vektor ciri (eigenvector) dan akar ciri (eigenvalue) dari matriks A &. Matriks A & mempunyai r minimum (p,q) akar ciri λ λ... λ r 0 yang tidak nol, yang bersesuaian dengan vektor ciri v, v,..., v r dengan p adalah banyaknya peubah bebas dan q = n x p. Kurva terbesar adalah bersesuaian dengan arah C = λ, yang v = v. Kurva terbesar kedua adalah λ yang bersesuaian dengan arah v, atau dapat ditulis kurva terbesar ke-r adalah λ r yang bersesuaian dengan arah v r. matriks Untuk memperoleh pengaruh pada βˆ, Cook (986) menunjukkan baha A & yang berukuran np x np adalah : A & = (I p r - βˆ X) ((X X) - r - βˆ (X X) - X ) / σ () dengan menunjukkan perkalian kronecker. Matriks A & mempunyai p akar ciri yang tidak nol yaitu : λ j = (n/δ p-j+ + βˆ / σ ), j =,,, p (3) dengan δ j adalah akar ciri ke-j dari X X. Untuk j = diperoleh λ j = C C = (n/δ j + βˆ / ˆσ ) (4) Matriks didefinisikan sebagai berikut : A & mempunyai p vektor ciri yang bersesuaian dengan akar ciri [ ß] v ϕ p-j+ r - βˆ X ϕ p-j+, dengan j =,,, p (5) j dengan j j adalah vektor ciri ke-j dari X X dan vektor Z j = Xϕ j merupakan komponen utama ke-j. Komponen ini menjelaskan bagian terbesar dari keragaman yang dikandung oleh data. Komponen Z yang lain menjelaskan proporsi keragaman yang semakin kecil sampai semua keragaman datanya terjelaskan. Untuk j = maka v = j v v ϕ p r - ߈ Z p (6)

9 plot v terhadap nomor pengamatan akan mengidentifikasi x ij yang paling berpengaruh terhadp ߈ berdasarkan pencaran data yang jauh dari titik nol. Misalkan W dinotasikan sebagai ukuran pembobot dengan definisi : W [ϕ p r - βˆ Z p ϕ p r - βˆ Z p. ϕ pp r - p β Z p ] (7) ij dari W berpengaruh jika pengamatan ke-i sebuah pencilan ( r i besar) atau mempunyai leverage yang besar ( z pi besar). Pembobot yang ditambahkan pada data dapat mengubah penduga koefisien regresi linier ganda (Lesaffre & Verbeke 998). Nilai Pendeteksian Peubah Berpengaruh v digunakan untuk mendeteksi adanya peubah bebas berpengaruh. Nilai x ij pada v yang semakin besar menunjukkan semakin besar potensi peubah bebas ke-j untuk berpengaruh. Suatu peubah bebas dikatakan berpengaruh apabila nilai v untuk pengamatan tersebut lebih besar dari, dengan q menyatakan banyaknya anggota v dalam model yaitu sebesar q n x p (Littell at al. 003). Pendeteksian Pengamatan Pencilan dan Berpengaruh Pendeteksian pengamatan pencilan pada peubah bebas berpengaruh didasarkan oleh besarnya pengaruh dari setiap pengamatan (C i ) yang didefinisikan sebagai berikut : dengan 004). r C i = λ jν ji, i=,,, n (8) j= λ j dan ν ji akar ciri dan vektor ciri dari matriks A & (Zhu & Zhang

0 Suatu pengamatan dikatakan berpengaruh apabila ukuran pengaruh pengamatan (C i ) lebih besar dari (Lesaffre & Verbeke 998). n Ci n i= dengan n banyaknya pengamatan Regresi Komponen Utama Regresi komponen utama merupakan salah satu metode untuk mengatasi masalah kolinieritas dalam data. Regresi komponen utama bermula dari analisis komponen utama pada peubah bebas yang akan menghasilkan komponenkomponen utama dari peubah bebas yang saling ortogonal. Komponen utama inilah yang kemudian diperlukan sebagai peubah bebas. Masing-masing komponen utama tidak berkorelasi sehingga tidak ada kolinieritas diantara komponen utama tersebut. Jika semua komponen utama diikutkan dalam regresi komponen utama, model yang dihasilkan ekuivalen dengan metode kuadrat terkecil, namun varian penduga yang besar akibat multikolinieritas tidak tereduksi. Untuk mereduksi varian tersebut tidak semua komponen utama diikutkan dalam regresi komponen utama. Berikut ini algoritma dari regresi komponen utama (Jolliffe 986) : a. Menentukan peubah Xs hasil dari standarisasi peubah X. Xsij X ij X j S j =, i =,,3,..., n dan j =,,3,..., p. b. Menentukan akar ciri dari persamaan Xs Xs - λi = 0. c. Menentukan nilai vektor ciri ϕ j dari setiap akar ciri λ j melalui persamaan (Xs Xs-λ j I) ϕ j = 0. d. Menentukan komponen utama Z j melalui prosedur seleksi akar ciri λ j, Z j = ϕ j Xs + ϕ j Xs +... + ϕ rj Xs r, di mana r < p dan r adalah banyaknya komponen yang terpilih. e. Regresikan komponen utama Z, Z, Z 3,..., Z r dengan peubah respon y. f. Menghitung nilai ŷ

g. Melakukan transformasi model regresi dari ŷ = f (Z) ke ŷ = f (Xs) melalui suatu hubungan b = j j * a b = adalah penduga koefisien regresi ŷ = f (Z) a = adalah penduga koefisien regresi ŷ = f (Xs) j j = adalah vektor ciri dari komponen yang ke-j