REGRESI LINIER BERGANDA 7 150
Objektif Mahasiswa dapat menentukan persamaan regresi menggunakan R programming 151
Analisis regresi adalah studi mengenai ketergantungan suatu variabel (variaabel tak bebas) pada satu atau lebih variabe lain (variabel bebas) yang digunakan untuk memprediksi dan atau meramalkan nilai rata-rata hitung (mean) atau rata-rata populasi variabel tak bebas. Program R menu regresi merupakan alat yang digunakan untuk mengukur besarnya pengaruh variabel bebas terhadap variabel tergantung dan memprediksi variabel tergantung dengan menggunakan variabel bebas. Jika variabel dependent yang dihubungkan hanya dengan satu variabel independent saja, maka persamaan regresi yang dihasilkan adalah regresi linier sederhana (liniear regresssion). Jika variabel dependent yang dihubungkan dengan lebih dari satu variabel independent, maka persamaan regresinya adalah regresi linier berganda (multiple liniear regression). 152
ANALISIS YANG DIPERLUKAN Persamaan Umum : Y = α + b1 X1+ b2 X2 + b3 X3 +...+bn Xn Keterangan : Y = variabel dependent α = konstanta X1...Xn = variabel independent b1 bn = koefisien regresi Tiga asumsi dasar yang tidak boleh dilanggar oleh regresi linier berganda yaitu 1) Tidak boleh ada autokorelasi, Untuk menguji variabel-variabel yang diteliti, apakah terjadi autokorelasi atau tidak, bila uji nilai Durbin Watson mendekati angka dua, maka dapat dinyatakan tidak ada korelasi. 2) Tidak boleh ada multikolinieritas Cara yang paling mudah untuk menguji ada atau tidaknya gejala multikolinieritas adalah melihat korelasi (hubungan) antar variabel bebas. Jika nilai korelasi dibawah angka 1, maka tidak terjadi multikolinieritas. 153
3) Tidak boleh ada heterokeditas. Dengan melihat grafik plot antara nilai variabel terikat (SRESID) dengan residual (ZPRED). Jika ada pola tertentu, seperti titik-titik yang ada membentuk pola tertentu yang teratur (bergelombang, melebar, kemudian menyempit), maka mengidentifikasikan telah terjadi heterokeditas. Jika tidak ada pola yang jelas, serta titik-titik menyebar di atas dan di bawah angka 0 pada sumbu Y, maka tidak terjadi heterokeditas. Koefisien Korelasi (r/r) Adalah koefisien yang digunakan untuk mengetahui hubungan antara variabel X dan Y, syaratnya adalah : r = (n (ΣXY) (ΣX) (ΣY)) / [n(σx 2 ) ((ΣX) 2 ) ½ [n(σy2) (ΣY) 2 ] ½ Jika r = 0 atau mendekati 0, maka hubunganya sangat lemah atau bahkan tidak ada hubungan sama sekali. Jika r = +1 atau mendekati +1, maka hubunganya kuat dan searah. Jika r = -1 atau mendekati -1, maka hubunganya kuat dan tidak searah. 154
Koefisien Determinasi (r2/r2) Adalah koefisien yang digunakan untuk mengetahui seberapa besar variabel bebas (X) mempengaruhi variabel terikat (Y). Nilai koefisien determinasi berkisar antara 0 sampai dengan 1. Kesalahan Standar Estimasi Digunakan untuk mengetahui ketepatan persamaan estimasi. Dapat digunakan dengan mengukur besar kecilnya kesalahan standar estimasi (semakin kecil nilai kesalahannya, maka semakin tinggi ketepatannya). 155
CONTOH KASUS Seorang dosen statistika sedang melakukan penelitian terhadap beberapa mahasiswa. Ia ingin mengetahui bagaimana hubungan antara frekuensi belajar dalam satu minggu dan lamanya belajar per hari terhadap IPK yang didapat seorang mahasiswa. Berikut data hasil penelitian : Analisalah data di atas!!! 156
LANGKAH-LANGKAH PENGERJAAN Untuk mencari nilai-nilai regresi data tersebut dengan menggunakan program R, ikutilah langkah-langkah berikut : 1. Tekan icon R Commander pada desktop kemudian akan muncul tampilan seperti gambar di bawah ini. Gambar 7.1. Tampilan menu awal R commander 157
2. Pilih menu Data, New data set. Masukkan nama dari data set adalah regresi kemudian tekan tombol OK Gambar 7.2. Tampilan menu New data set 158
Gambar 7.3. Tampilan New Data Set Kemudian akan muncul Data Editor Gambar 7.4. Tampilan Data Editor 159
3. Masukkan data dengan var1 untuk ipk, var2 untuk frek.belajar dan var3 untuk lama.belajar. Jika Data Editor tidak aktif maka dapat diaktifkan dengan menekan RGui di Taskbar windows pada bagian bawah layar monitor. Jika sudah selesai dalam pengisian data tekan tombol Close. Untuk mengubah nama dan tipe variabel, dapat dilakukan dengan cara double click pada variable yang ingin di setting. Pemilihan type, dipilih numeric pada semua variabel. Gambar 7.5. Tampilan Variabel editor ipk Gambar 7.6. Tampilan Variabel editor frek.belajar 160
Gambar 7.7. Tampilan Variabel editor lama.belajar Kemudian Isi masing-masing variabel sesuai dengan data soal setelah selesai isi data kemudian tekan tombol X (close) 161
Gambar 7.8. Tampilan isi Data Editor Selanjutnya, pilih window R-commander akan muncul tampilan : 162
Gambar 7.9. Tampilan Sript Window 163
4. Untuk mengecek kebenaran data yang sudah dimasukkan, tekan tombol View data set maka akan muncul tampilan seperti gambar di bawah ini. Jika ada data yang salah, tekan tombol edit data set, lalu perbaiki data yang salah. Gambar 7.10. Tampilan View regresi 5. Jika data sudah benar, pilih menu Statistics, Fit models, Linear regression, maka akan muncul menu seperti gambar di bawah ini 164
Untuk membuat persamaan regresi Gambar 7.11. Tampilan menu olah data 165
6. Pada Response Variable pilih variabel yang termasuk variabel terikat misalnya IPK dan pada Explanatory Variable pilih yang termasuk variabel bebas misalnya variable frek..belajar dan lama belajar, untuk memilih 2 variabel sekaligus tekan ctrl lalu pilih frek..belajar dan lama.belajar kemudian tekan tombol OK Variabel terikat Variabel bebas Variabel bebas Gambar 7.12. Tampilan Response variable 166
7. Maka akan muncul hasil pada output window sebagai berikut : Output bagian 1: Probabilitas frek.belajar Probabilitas lama.belajar Gambar 7.13. Tampilan Output 1 167
Analisa output bagian 1 : Pada bagian ini dikemukakan nilai koefisien a dan b serta harga t hitung dan tingkat signifikan. Persamaan regresi : Y= 1.11819 +0.23592 X1 + 0.53187X2 Harga 1.11819 merupakan nilai konstanta (a) yang menunjukkan bahwa jika tidak ada frekuensi dan lama belajar yang dilakukan maka IPK yang akan dicapai 1.11819 sedang harga 0.23592 merupakan koefisien regresi yang menunjukan bahwa setiap penambahan 1 hari belajar maka akan ada penambahan IPK sebesar 0.23592.serta untuk harga 0.53187 merupakan koefisien regresi yang menunjukan bahwa setiap penambahan 1 jam belajar maka akan ada penambahan IPK sebesar 0.53187. Uji t : Dilakukan untuk mengetahui masing-masing variabel bebas mempengaruhi atau tidak variabel terikat. Langkah langkah : a. Ho : Frekuensi belajar tidak berpengaruh terhadap IPK Ha : Frekuensi belajar berpengaruh terhadap IPK 168
Syarat : > 0.05 Ho diterima < 0.05 Ho ditolak Frekuensi belajar = 0.00517< 0.05, Ho ditolak Kesimpulan : Frekuensi belajar berpengaruh terhadap IPK b. Ho : Lama belajar tidak berpengaruh terhadap IPK Ha : Lama belajar tidak berpengaruh terhadap IPK Lama belajar = 0.00161 < 0.05, Ho ditolak Kesimpulan : Lama belajar mempengaruhi IPK. Dapat dilihat di atas terdapat tanda dua bintang pada baris Frekuensi belajar dan Lama belajar itu berarti kedua variabel mempengaruhi IPK. 169
Output bagian 2 : Gambar 7.14. Tampilan Output 2 170
Analisa output bagian 2 Pada bagian ini ditampilkan R 2 adalah sebesar 0.8897. Uji f : Dilakukan untuk mengetahui pengaruh secara bersama-sama. Ho : Frekuensi belajar dan Lama belajar tidak berpengaruh secara bersama-sama terhadap IPK. Ha : Frekuensi belajar dan Lama belajar berpengaruh secara bersama-sama terhadap IPK. Syarat : > 0.05 Ho diterima dan < 0.05 Ho ditolak Didapat p-value = 0.0004458 < 0.05, Ho ditolak Kesimpulan : Frekuensi belajar& Lama belajar berpengaruh secara bersama-sama terhadap IPK. 171
LATIHAN PT ABC ingin mengetahui seberapa besar pengaruh input-input dalam proses produksi terhadap output produksi yang dihasilkan. BahanBaku BahanPenolong JumlahProduksi 13 21 221 23 31 332 21 12 212 12 22 222 22 23 312 32 11 231 31 13 212 22 31 333 23 13 321 172
1. Ujilah data tersebut dengan menggunakan tingkat signifikansi 5%! Berapakah tingkat probabilitas untuk Bahan Penolong? 0.0485 2. Ujilah data tersebut dengan menggunakan tingkat signifikansi 5%! Berapakah nilai R2 dari output yang dihasilkan? 0.5059 3. Ujilah data tersebut dengan menggunakan tingkat signifikansi 5%! Berapakah nilai p-value dan keputusan apa yang diambil? 0.1206, Ho diterima 4. Bagaimanakah persamaan regresinya! Y=91.156 + 3.049X1 + 5.474X2 173