TINJAUAN PUSTAKA. Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan

dokumen-dokumen yang mirip
BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

Bab 2 LANDASAN TEORI

Bab 2 LANDASAN TEORI. : Ukuran sampel telah memenuhi syarat. : Ukuran sampel belum memenuhi syarat

Bab 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

TINJAUAN PUSTAKA. Model Regresi Linier Ganda

BAB II TINJAUAN PUSTAKA

TINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan

BAB 2 TINJAUAN PUSTAKA = (2.2) =

BAB II TINJAUAN PUSTAKA. Dalam bab ini dibahas tentang matriks, metode pengganda Lagrange, regresi

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 2 LANDASAN TEORI. digunakan sebagai konsep statistik pada tahun 1877 oleh Sir Francis Galton. Dia

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

= parameter regresi = variabel gangguan Model persamaan regresi linier pada persamaan (2.2) dapat dinyatakan dalam bentuk matriks berikut:

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah

BAB II TINJAUAN PUSTAKA. Hal ini sangat membantu dalam proses pembuktian sifat-sifat dan perhitungan

BAB I PENDAHULUAN. Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

BAB III REGRESI PADA DATA SIRKULAR

BAB II LANDASAN TEORI. : Ukuran sampel telah memenuhi syarat. : Ukuran sampel belum memenuhi syarat

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

BAB ΙΙ LANDASAN TEORI

Mata Kuliah: Statistik Inferensial

BAB II METODE ANALISIS DATA. memerlukan lebih dari satu variabel dalam membentuk suatu model regresi.

BAB III MODEL REGRESI DATA PANEL. Pada bab ini akan dikemukakan dua pendekatan dari model regresi data

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. Analisis regresi (regression analysis) merupakan suatu teknik untuk membangun

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. banyak diterapkan pada berbagai bidang sebagai dasar bagi pengambilan

BAB 2 LANDASAN TEORI. regresi adalah sebuah teknik statistik untuk membuat model dan menyelediki

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

BAB III REGRESI SPLINE = + dimana merupakan fungsi pemulus yang tidak spesifik, dengan adalah

BAB Ι PENDAHULUAN. 1.1 Latar Belakang

PEMODELAN UPAH MINIMUM KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHINYA MENGGUNAKAN REGRESI RIDGE

BAB 2 LANDASAN TEORI. Istilah regresi pertama kali digunakan oleh Francis Galton. Dalam papernya yang

BAB 2 LANDASAN TEORI. Analisis regresi merupakan bentuk analisis hubungan antara variabel prediktor

BAB 2 LANDASAN TEORI. 1. Analisis regresi linier sederhana 2. Analisis regresi linier berganda. Universitas Sumatera Utara

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. keuntungan atau coumpouding. Dari definisi di atas dapat disimpulkan bahwa

II. TINJAUAN PUSTAKA 2.1 Metode Regresi 2.2 Model Aditif Terampat ( Generalized additive models , GAM)

Daerah Jawa Barat, serta instansi-instansi lain yang terkait.

BAB 2 LANDASAN TEORI

MODEL-MODEL LEBIH RUMIT

MATRIKS. Notasi yang digunakan NOTASI MATRIKS

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

MATRIK dan RUANG VEKTOR

PEMODELAN UPAH MINIMUM KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHINYA MENGGUNAKAN REGRESI RIDGE

Gambar 2.1 Klasifikasi Metode Dependensi dan Interdependensi Analisis Multivariat

BAB II LANDASAN TEORI

BAB II KAJIAN TEORI. Sebuah Matriks adalah susunan segi empat siku-siku dari bilangan-bilangan.

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

BAB II KAJIAN PUSTAKA. operasi matriks, determinan dan invers matriks), aljabar max-plus, matriks atas

BAB. IX ANALISIS REGRESI FAKTOR (REGRESSION FACTOR ANALYSIS)

BAB II LANDASAN TEORI

TINJAUAN PUSTAKA. Gambar 1 Diagram kotak garis

REGRESI LINIER BERGANDA

II. TINJAUAN PUSTAKA. Suatu matriks didefinisikan dengan huruf kapital yang dicetak tebal, misalnya A,

PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA. Tatik Widiharih Jurusan Matematika FMIPA UNDIP

Analisis Regresi: Regresi Linear Berganda

TINJAUAN PUSTAKA. Analisis regresi merupakan suatu teknik statistika untuk menyelidiki dan

BAB 2 LANDASAN TEORI. Regresi pertama kali dipergunakan sebagai konsep statistik pada tahun 1877 oleh Sir francis

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

STK 511 Analisis statistika. Materi 7 Analisis Korelasi dan Regresi

BAB 2 LANDASAN TEORI. berarti ramalan atau taksiran pertama kali diperkenalkan Sir Francis Galton pada

BAB 2 LANDASAN TEORI. mengetahui pola hubungan antara dua atau lebih variabel. Istilah regresi yang

BAB III KALMAN FILTER DISKRIT. Kalman Filter adalah rangkaian teknik perhitungan matematika (algoritma)

BAB II KAJIAN TEORI. principal component regression dan faktor-faktor yang mempengaruhi IHSG.

BAB II KAJIAN PUSTAKA. dicatat, atau diobservasi sepanjang waktu secara berurutan. Periode waktu dapat

BAB II TINJAUAN PUSTAKA. (b) Variabel independen yang biasanya dinyatakan dengan simbol


BAB 2 LANDASAN TEORI

BAB IV METODE PENELITIAN. resmi Direktorat Jenderal Pengolahan dan Pemasaran Hasil Pertanian yaitu

BAB 2 LANDASAN TEORI. Analisis regresi (regression analysis) merupakan suatu teknik untuk membangun

III. METODE PENELITIAN

BAB 2 LANDASAN TEORI. Analisis Komponen Utama (AKU, Principal Componen Analysis) bermula dari

JURNAL MATEMATIKA DAN KOMPUTER Vol. 4. No. 2, 71-81, Agustus 2001, ISSN :

BAB 2 LANDASAN TEORI

Statistik merupakan salah satu cabang ilmu pengetahuan yang paling banyak

BAB I PENDAHULUAN. Analisis regresi merupakan suatu metode yang digunakan untuk

BAB II LANDASAN TEORI. Analisis regresi (regressison analysis) merupakan suatu teknik untuk membangun persamaan

Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas

BAB II LANDASAN TEORI

Pertemuan 2 Matriks, part 2

BAB 2 LANDASAN TEORI. berkenaan dengan studi ketergantungan dari suatu varibel yaitu variabel tak bebas (dependent

BAB III LANDASAN TEORI

BAB II LANDASAN TEORI. yang biasanya dinyatakan dalam bentuk sebagai berikut: =

BAB 2 LANDASAN TEORI. Analisis Korelasi adalah metode statstika yang digunakan untuk menentukan tingkat

BAB 2 LANDASAN TEORI. Bentuk umum persamaan regresi linier berganda adalah

BAB III MODEL STATE-SPACE. dalam teori kontrol modern. Model state space dapat mengatasi keterbatasan dari

ESTIMASI REGRESI ROBUST M PADA FAKTORIAL RANCANGAN ACAK LENGKAP YANG MENGANDUNG OUTLIER

KAJIAN TELBS PADA REGRESI LINIER DENGAN KASUS PENCILAN

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Model Regresi Dummy dalam Memprediksi Performansi Akademik Mahasiswa Jurusan Matematika FMIPA UNP

Transkripsi:

4 II. TINJAUAN PUSTAKA 2.1 Konsep Dasar Matriks 2.1.1 Matriks Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan dalam susunan itu disebut anggota dalam matriks tersebut. Suatu matriks A mempunyai unsur yang dilambangkan dengan dengan i menyatakan banyaknya baris dan j menyatakan banyak kolom. Suatu matriks A dapat juga dilambangkan dengan A (Anton, 1987). 2.1.2 Transpose Matriks Jika A adalah sebarang matriks m x n, maka transpose A dinyatakan dengan A T, didefinisikan dengan matriks n x m yang didapatkan dengan mempertukarkan baris dan kolom dari A, yaitu kolom pertama dari A T adalah baris pertama dari A, kolom kedua dari A T adalah baris kedua dari A, dan seterusnya (Anton, 1987). 2.1.3 Matriks Simetris Suatu matriks bujur sangkar A disebut simetris jika AA T (Anton, 1987).

5 2.1.4 Invers Matriks Jika A adalah matriks bujur sangkar, dan jika sebuah matriks B yang berukuran sama bisa didapat sedemikian sehingga ABBAI, maka A disebut bisa dibalik dan B disebut invers dari A (Anton, 1987). 2.1.5 Matriks Diagonal Jika adalah elemen pada diagonal ke-i dari matriks A berukuran n x n, dan misalkan adalah unsur-unsur diluar diagonal, jika untuk semua, maka A dinamakan matriks diagonal. Biasanya matriks diagonal dilambangkan dengan D (Anton, 1987). 2.2 Analisis Regresi Linier Analisis regresi linier adalah salah satu analisis statistika yang dapat digunakan untuk menyelidiki atau membangun model hubungan linier antara beberapa variabel. Analisis regresi yang mempelajari pola hubungan antara satu variabel tak bebas dan satu variabel bebas disebut analisis regresi linier sederhana (simple linear regression). Model regresi linier sederhana biasa ditulis sebagai berikut :

6 Dimana : adalah intersep atau perpotongan dengan sumbu tegak. adalah kemiringan atau gradiennya. Y adalah variabel tak bebas. X adalah variabel bebas. adalah galat (error term). Regresi linier berganda (multiple linear regression) merupakan suatu model regresi yang melibatkan satu variabel tak bebas dan lebih dari satu variabel bebas. Model regresi linier berganda dalam bentuk umum yaitu :, i1,2,..,n Bila dirinci untuk setiap pengamatan : Dengan cara matriks dapat ditulis sebagai berikut : [ ] [ ] [ ] [ ]

7 Dalam notasi matriks ditulis sebagai berikut: Dengan: Y adalah vektor n x 1 variabel tak bebas. X adalah matriks n x (p+1) variabel bebas. adalah vektor (p+1) x 1 parameter yang diduga. adalah n x 1 vektor galat atau error term (Myers, 1990). 2.3 Matriks HAT Alat pendiagnosa yang memberikan informasi titik data yang mengandung leverage tinggi adalah matriks HAT. Matriks HAT didefinisikan berikut : Matriks HAT memainkan peranan penting dalam mengidentifikasi pengamatan berpengaruh. H menentukan varian dan kovarian dari dan e, dimana Var ( ) dan var (e) ( Montgomery, Peck & Vinning, 2006 ). Elemen diagonal dari matriks H didefinisikan sebagai, i1,2,,n

8 Diagonal HAT memberikan ukuran jarak yang terbakukan dari titik ke pusat data dari x yaitu. Nilai diagonal HAT yang tinggi menunjukkan pengamatan yang ekstrim pada x (Myers, 1990). Nilai diagonal HAT berada antara 0 dan 1,. Jika X memiliki rank penuh, maka. Sehingga rata-rata dari elemen diagonal adalah p/n. Disarankan menggunakan 2p/n sebagai titik kritis untuk. memiliki potensi untuk berpengaruh kuat pada hasil regresi. Jika pengamatan ke-i mempunyai nilai yang melebihi 2p/n, maka pengamatan tersebut dikatakan titik leverage yang tinggi (Belsley, Kuh, & Welsch, 1980). 2.4 Analisis Residual 2.4.1 Residual Salah satu dari metode pendiagnosa gangguan pada model (pencilan) adalah dengan kuadrat terkecil residual. Dugaan parameter regresi dengan metode kuadrat terkecil dari adalah. Vektor residual adalah

9 Matriks varian-kovarian dari residual adalah Karena bersifat idempoten, maka (Myers,1990). 2.4.2 R-Student Diberikan penduga alternatif yaitu akar nilai tengah kuadrat galat yang dihitung dengan menghilangkan pengamatan ke-i. Ini dinotasikan dengan S -i, yaitu Jumlah kuadrat galat tanpa menggunakan pengamatan ke-i berbeda dari jumlah kuadrat galat menggunakan semua data dengan kuantitas. Penduga S -i digunakan menggantikan menghasilkan eksternal residual student yang sering disebut R-student, dengan rumus

10 Daerah kritis untuk R- student yaitu membandingkannya dengan distribusi-t berderajat bebas n-p-1 yang dapat dilihat pada tabel distribusi-t. Nilai R-student lebih besar dari nilai t-tabel menunjukkan pengamatan merupakan suatu pencilan (Myers, 1990). 2.5 Pengamatan Berpengaruh Menurut Belsley, Kuh, & Welsch (1980), suatu pengamatan berpengaruh adalah sesuatu yang secara individu atau bersama-sama dengan beberapa pengamatan lain, mempengaruhi nilai terhitung dari berbagai pendugaan (koefisien regresi, standar galat, nilai-t dan lain-lain) dibandingkan pada pengamatan yang lain. Untuk menguji pengaruhnya satu demi satu pengamatan berpengaruh tersebut dihilangkan. Baris-baris pengamatan yang dihilangkan relatif menghasilkan perubahan besar pada nilai terhitung dan dianggap berpengaruh. Dengan pengujian dari prosedur ini, dapat dilihat dampak masing-masing baris pengamatan pada koefisien dugaan dan nilai prediksi ( ), residual dan dugaan parameter varian-kovarian matriks. Suatu pengamatan tidak mempunyai dampak yang sama pada semua hasil regresi. Suatu pengamatan mungkin mempunyai pengaruh pada, pengaruh pada penduga ragam dari, kecocokan nilai (fitted value), atau goodness-of-fit statistik ( Chatterjee & Hadi, 1986).

11 2.6 DFBETAS Diberikan matriks berukuran p x p dan jika baris ke-i pada X. adalah matriks dengan baris ke-i dihilangkan. Atau dapat ditulis sebagai Dimana diperoleh dengan menghapus baris ke-i dari X. Juga diberikan dan diasumsikan h ii < 1. Dari formula di atas dihasilkan berikut ( ) (*) Diketahui bahwa Sehingga [ ]. (**)

12 Substitusi (**) ke dalam (*), sehingga dihasilkan [ ] Sehingga ukuran jarak antara b dan b -i sebagai berikut: Jika, maka Karena Maka diperoleh ( ) (Belsley, Kuh & Welsch, 1980). Untuk setiap koefisien regresi, pendiagnosa pengaruh menyediakan satu statistik, yang memberikan nilai standar galat perubahan koefisien jika pengamatan ke-i dihilangkan. Rumusnya

13 Dimana C jj adalah elemen diagonal ke-j dari. b j adalah koefisien regresi ke-j. b j. i adalah koefisien regresi ke-j yang dihitung tanpa pengamatan ke-i. Besarnya nilai DFBETAS j.i mengindikasikan bahwa pengamatan ke-i mempunyai pengaruh pada koefisien regresi ke-j. Untuk menghitung nilai DFBETAS j.i dibutuhkan suatu matriks p x n, matriks. Dari konversi formula diatas didapat (R-student) Ukuran kritis untuk yaitu 2/. Jika nilai mengindikasikan pengamatan ke-i berpengaruh pada koefisien ke-j (Myers,1990).

14 2.7 Regresi Himpunan Bagian ( Subset) Ada beberapa prosedur statistik tertentu yang dapat menentukan variabel yang akan dimasukkan dalam regresi, misal ingin menentukan suatu persamaan regresi linier variabel respon tertentu Y terhadap variabel bebas X. Dalam kaitannya ada dua kriteria yang saling bertentangan: 1. Agar persamaannya bermanfaat bagi tujuan peramalan, dimasukkan sebanyak mungkin variabel X sehingga diperoleh nilai ramalan yang terandalkan. 2. Karena untuk memperoleh informasi dari banyak variabel bebas X serta pemonitorannya seringkali diperlukan biaya yang tinggi, maka diinginkan persamaan regresinya mencakup sedikit mungkin variabel X. Ada beberapa algoritma yang dapat dipergunakan untuk pemilihan himpunan bagian terbaik peubah peramal dalam regresi. Algoritma dapat menghitung hanya sebagian dari semua kemungkinan regresi dalam menentukan himpunan bagian K terbaik. Beberapa kriteria yang dapat digunakan untuk menentukan himpunan bagian K terbaik yaitu adj-r 2 maksimum dan S 2 minimum. Algoritma yang digunakan dapat menghasilkan K regresi terbaik dengan satu peubah peramal, K regresi terbaik dengan dua peubah peramal, dan seterusnya sampai persamaan regresi yang mencakup semua peubah peramal. Misalkan ada 3 variabel X 1, X 2 dan X 3, kelompokkan persamaan regresi kedalam 3 kelompok :

15 Kelompok yang terdiri atas persamaan regresi dengan 1 peubah peramal, dengan model : Kelompok yang terdiri atas persamaan regresi dengan 2 peubah peramal, dengan model : Kelompok yang terdiri atas persamaan regresi dengan 3 peubah peramal, dengan model : (Draper & Smith, 1992).

16 2.8 Kriteria Seleksi Model 2.8.1 Mean Square Error (MSE) Mean Square Error (MSE) dapat didefinisikan sebagai perbandingan antara Sum Square Error (SSE) dan derajat bebas suatu galat. Misalnya diketahui model regresi sederhana sebagai berikut. Maka SSE dapat ditulis dalam persamaan berikut. Sehingga SSE mempunyai n-2 derajat bebas. Kuadrat tengah galat (Mean Square Error) yang tepat dinotasikan oleh MSE atau S 2, dapat ditulis dalam persamaan berikut. Hal ini juga ditunjukan bahwa MSE adalah penduga tak bias dari, sehingga: E(MSE) Sebagai nilai standar deviasi penduga adalah (Neter & Kutner, 1990).

17 MSE yang disimbolkan dengn S 2 merupakan salah satu patokan yang baik digunakan dalam menilai kecocokan suatu model. Semakin kecil MSE maka model semakin baik. Ukuran ini memperhitungkan banyaknya parameter dalam model melalui pembagian dengan derajat bebasnya. S 2 mungkin membesar bila penurunan dalam SSE akibat pemasukan suatu variabel tambahan ke dalam model tidak dapat mengimbangi penurunan dalam derajat bebasnya. Menurut Sembiring (1995), rumus umum dari MSE diberikan sebagai berikut: 2.8.2 R 2 disesuaikan (Adjusted- R 2 ) Membandingkan dua atau lebih model regresi dan himpunan bagian dari model misalkan seperti dengan penggunaan R 2 lebih sesuai. Namun R 2 memiliki salah satu kelemahan yaitu besarnya dipengaruhi oleh banyaknya variabel dalam model. R 2 akan cenderung membesar bersama p, sehingga sulit menyatakan R 2 yang optimum. Untuk mengatasi kesulitan dari interpretasi R 2, maka digunakanlah statistik Adjusted-R 2 (R 2 yang disesuaikan). Penyesuaiannya yaitu membagi Sum Square Error (SSE) dan Sum Square Total (SST) dengan masing-masing derajat bebasnya. Menurut Sembiring (1995), rumus umum dari Adjusted-R 2 diberikan sebagai berikut :

18 Adj- R 2 ( ) ( ) Statistik Adj-R 2 p belum tentu meningkat seiring pertambahan variabel ke dalam model. Faktanya bahwa jika k variabel x (regresor) ditambahkan pada model, Adj-R 2 p+k akan melebihi Adj-R 2 p jika dan hanya jika statistik parsial-f untuk uji signifikan pada penambahan k variabel x (regresor) melebihi 1. Konsekuen, satu kriteria seleksi pada model himpunan bagian (subset) optimum adalah dengan memilih model yang memiliki maksimum Adj-R 2 p. Kriteria seleksi model regresi himpunan bagian selain dengan minimum MSE dapat juga dengan maksimum Adj-R 2. Hubungan keduanya sebagai berikut : Adj-R 2 Dari rumus diatas maka kriteria minimum MSE dan maksimum Adj-R 2 ekuivalen (Montgomery, Peck, & Vinning, 2006).