STK511 Analisis Statistika Pertemuan 11 Regresi Berganda
SALDO 11. Analisis Regresi (2) Review: Regresi Linier Sederhana Regression Analysis: Saldo versus Jumlah Nasabah The regression equation is Saldo = 350 + 0.0929 Jumlah Nasabah Predictor Coef SE Coef T P Constant 349.79 61.81 5.66 0.000 Jumlah Nasabah 0.09286 0.01705 5.44 0.000 S = 162.079 R-Sq = 67.9% R-Sq(adj) = 65.6% Analysis of Variance Source DF SS MS F P Regression 1 778763 778763 29.65 0.000 Residual Error 14 367774 26270 Total 15 1146537 1,200 1,000 800 600 400 200 0 2,000 4,000 6,000 8,000 10,000 JMLNASABAH
11. Analisis Regresi (2) Pencilan dan Pengamatan Berpengaruh Ilustrasi: Pengamatan ini meliputi X yang berupa umur anak pada saat mengucapakan kata kata pertama kalinya (dalam bulan) dan Y berupa skor daya nalar dari masing-masing anak.
11. Analisis Regresi (2) Pencilan dan Pengamatan Berpengaruh Ilustrasi: Pengamatan ini meliputi X yang berupa umur anak pada saat mengucapakan kata kata pertama kalinya (dalam bulan) dan Y berupa skor daya nalar dari masing-masing anak. Pencilan dapat dilihat sebagai pengamatan dengan sisaan yang cukup besar (( r i >2 atau r i >3) Pengamatan berpengaruh lebih berkaitan dengan besarnya perubahan yang terjadi pada koefisien regresi jika pengamatan tersebut disisihkan
11. Analisis Regresi (2) Pencilan dan Pengamatan Berpengaruh Plot Sisaan Persamaan Regresi: Ŷi = 110-1.13 Xi S = 11.0155 R-Sq = 41.1% t = -3.64
11. Analisis Regresi (2) Pencilan dan Pengamatan Berpengaruh Penyisihan pengamatan ke-2, ke-18 dan ke-19 Ŷi = 102.12 0.55 Xi R² = 0.06 ; s = 8.55 dan t = -1.05 Penyisihan pengamatan ke-18 dan ke-19 Ŷi = 108.92 1.02 Xi R² = 0.35 ; s = 11.06 dan t = -3.10 Penyisihan pengamatan ke-2 Ŷi = 108.92 1.02 Xi R² = 0.35 ; s = 11.06 dan t = -3.10 Penyisihan pengamatan ke-18 Ŷi = 105.63 0.78 Xi R² = 0.11 ; s = 11.11 dan t = -1.51 Persamaan Regresi (full data): Ŷi = 110-1.13 Xi S = 11.0155 R-Sq = 41.1% t = -3.64 Penyisihan pengamatan ke-19 Ŷi = 109.30 1.19 Xi R² = 0.57 ; s = 8.63 dan t = 4.90
11. Analisis Regresi (2) Pencilan dan Pengamatan Berpengaruh 2 1 xi -x xi -x hii ; hii p n x - x k Hoaglin dan Welsch( 1978): h ii > 2p/n Huber (1981) : h ii > 0.5 besar; h ii > 0.2 peringatan Pada dasarnya nilai h ii semakin besar menunjukkan semakin besar potensi sebagai pengamatan berpengaruh
11. Regresi Linier Berganda Regresi Linier Berganda Melibatkan lebih dari satu peubah penjelas Memodelkan hubungan antara jumlah nasabah dan lama operasi kantor cabang terhadap nilai total saldo pada suatu waktu tertentu Memodelkan hubungan antara luas bangunan, umur bangunan, kedekatan dengan jalan tol, dan banyaknya kamar mandi terhadap harga jual rumah Memodelkan hubungan intensitas cahaya dan suhu terhadap waktu kunang-kunang mulai bercahaya
11. Regresi Linier Berganda Ilustrasi Peubah Respon Harga (harga rumah dalam juta rupiah) Peubah Penjelas Luas bangunan (luas bangunan, dalam m 2 ) Dekat tol (jarak dengan jalan tol, dalam km) Umur (umur bangunan, dalam tahun)
11. Regresi Linier Berganda Ilustrasi Regression Analysis: harga versus luasbangunan, dekattol, umur The regression equation is harga = 264 + 1.18 luasbangunan - 2.59 dekattol - 3.72 umur Predictor Coef SE Coef T P Constant 264.03 19.46 13.56 0.000 luasbangunan 1.17593 0.07120 16.52 0.000 dekattol -2.5869 0.9645-2.68 0.010 umur -3.7206 0.5296-7.03 0.000 S = 39.7003 R-Sq = 84.1% R-Sq(adj) = 83.3% Analysis of Variance Source DF SS MS F P Regression 3 483410 161137 102.24 0.000 Residual Error 58 91415 1576 Total 61 574825
11. Regresi Linier Berganda Sedikit Teori.
11. Regresi Linier Berganda Sedikit Teori.
11. Regresi Linier Berganda Sedikit Teori.
11. Regresi Linier Berganda Pengujian Pengaruh Peubah Bebas Uji Simultan ANOVA digunakan untuk menguji secara simultan pengaruh seluruh X terhadap Y H 0 : semua b i = 0 (tidak ada X yang berpengaruh terhadap Y) H 1 : ada b i 0 (ada X yang berpengaruh terhadap Y) Uji Parsial Menguji pengaruh setiap peubah bebas satu persatu. Dilakukan jika uji simultan menyatakan tolak H0 (signifikan)
11. Regresi Linier Berganda Ilustrasi Regression Analysis: harga versus luasbangunan, dekattol, umur The regression equation is harga = 264 + 1.18 luasbangunan - 2.59 dekattol - 3.72 umur Predictor Coef SE Coef T P Constant 264.03 19.46 13.56 0.000 luasbangunan 1.17593 0.07120 16.52 0.000 dekattol -2.5869 0.9645-2.68 0.010 umur -3.7206 0.5296-7.03 0.000 S = 39.7003 R-Sq = 84.1% R-Sq(adj) = 83.3% Analysis of Variance Source DF SS MS F P Regression 3 483410 161137 102.24 0.000 Residual Error 58 91415 1576 Total 61 574825
11. Regresi Linier Berganda Multikolinearitas Sekelompok peubah bebas saling terkait linear Multikolinearitas sempurna menyebabkan pendugaan model tidak dapat dilakukan Matriks X X bersifat singular Penduga koefisien bersifat tidak stabil (standard error-nya besar).
11. Regresi Linier Berganda Pemeriksaan Multikolinearitas Sering dicirikan dengan kondisi model memiliki R 2 yang besar, tapi peubah bebasnya tidak signifikan Diindikasikan menggunakan nilai VIF (variance inflation factor). Nilai VIF ideal adalah 1. Jika ditemui nilai VIF yang besar, perlu diwaspadai keberadaan masalah multikolinearitas. R i 2 = koefisien determinasi model antara Xi dengan X yang lain
11. Regresi Linier Berganda Teknik Mengatasi Multikolinearitas Jika kita ingin memilih peubah X dimana hanya X yang signifikan akan memasuki model Gunakan prosedur penyeleksian peubah, seperti forward, backward, stepwise Jika kita ingin mempertahankan konfigurasi peubah X yang akan memasuki model Gunakan metoda estimasi diluar metoda kuadrat terkecil, seperti Ridge Regression, Principal Component Regression, Partial Least Square
Pengantar Pemodelan Regresi dengan Peubah Penjelas Bersifat Kategorik Regression with Dummy Variables
11. Regresi Linier Berganda Peubah Dummy (Boneka) Peubah penjelas di regresi bersifat numerik. Di beberapa kasus, perlu melibatkan peubah kategorik dalam model. Misal, dalam memprediksi harga rumah perlu memasukkan informasi mengenai lokasi (tepi jalan raya, kompleks perumahan, perkampungan) Peubah penjelas kategorik harus diubah menjadi peubah numerik. Peubah dummy, memerankan fungsi yang dimaksud di atas
11. Regresi Dummy Ilustrasi Andaikan ingin dimodelkan variabel harga rumah dengan variabel penjelas adalah luas bangunan dan lokasi. Terdapat tiga jenis lokasi yaitu: tepi jalan raya, kompleks perumahan, dan perkampungan Dibutuhkan dua peubah dummy Kategori D1 D2 Tepi jalan raya 1 0 Perumahan 0 1 Perkampungan 0 0 Selanjutnya, D1 dan D2 dimasukkan dalam model regresi menggantikan peran peubah lokasi.
11. Regresi Dummy Ilustrasi: Model 1 Harga = b 0 + b 1 Luas + b 2 D 1 + b 3 D 2 Model di atas dapat dipecah menjadi tiga model, yang menggambarkan hubungan luas terhadap harga di tiga lokasi berbeda Tepi jalan raya: D1 = 1, D2 = 0 Harga = b 0 + b 1 Luas + b 2 (1) + b 3 (0) = (b 0 + b 2 ) + b 1 Luas Perumahan: D1 = 0, D2 = 1 Harga = b 0 + b 1 Luas + b 2 (0) + b 3 (1) = (b 0 + b 3 ) + b 1 Luas Perkampungan D1 = 0, D2 = 0 Harga = b 0 + b 1 Luas + b 2 (0) + b 3 (0) = (b 0 ) + b 1 Luas Slope sama, intersep berbeda
11. Regresi Dummy Ilustrasi: Model 1 Harga Tepi jalan raya Perumahan Perkampungan Luas Bangunan
11. Regresi Dummy Ilustrasi: Model 1 The regression equation is harga = 192 + 0.475 luasbangunan + 69.3 D1 + 144 D2 Predictor Coef SE Coef T P Constant 192.46 15.71 12.25 0.000 luasbangunan 0.4754 0.1177 4.04 0.000 D1 69.30 13.24 5.23 0.000 D2 144.16 20.53 7.02 0.000 S = 41.1486 R-Sq = 82.9% R-Sq(adj) = 82.0% Analysis of Variance Source DF SS MS F P Regression 3 476619 158873 93.83 0.000 Residual Error 58 98206 1693 Total 61 574825
11. Regresi Dummy Ilustrasi: Model 2 Harga = b 0 + b 1 Luas + b 2 D 1 + b 3 D 2 + b 4 D 1 Luas + b 5 D 2 Luas Model di atas dapat dipecah menjadi tiga model yang menggambarkan hubungan luas terhadap harga di tiga lokasi berbeda Tepi jalan raya: D1 = 1, D2 = 0 Harga = (b 0 + b 2 )+ (b 1 + b 4 ) Luas Perumahan: D1 = 0, D2 = 1 Harga = (b 0 + b 3 )+ (b 1 + b 5 ) Luas Perkampungan D1 = 0, D2 = 0 Harga = (b 0 ) + b 1 Luas Slope dan intersep berbeda
11. Regresi Dummy Ilustrasi: Model 2 Harga Tepi jalan raya Perumahan Perkampungan Luas Bangunan
11. Regresi Dummy Ilustrasi: Model 2 The regression equation is harga = 196 + 0.448 L + 99.2 D1 + 74.8 D2-0.191 D1L + 0.294 D2L Predictor Coef SE Coef T P Constant 195.56 31.32 6.24 0.000 luasbangunan 0.4479 0.2678 1.67 0.100 D1 99.21 42.07 2.36 0.022 D2 74.77 57.38 1.30 0.198 D1L -0.1914 0.3206-0.60 0.553 D2L 0.2938 0.3279 0.90 0.374 S = 40.6149 R-Sq = 83.9% R-Sq(adj) = 82.5% Analysis of Variance Source DF SS MS F P Regression 5 482449 96490 58.49 0.000 Residual Error 56 92376 1650 Total 61 574825
Bersambung.