BAB 4 HASIL DAN PEMBAHASAN Dalam bagian hasil dan pembahasan ini akan ditampilkan proses pengolahan data, dalam bentuk statement dalam R Language, diagram pencar, tabel-tabel dan grafik yang digunakan dalam analisis data beserta hasil dan pembahasannya Dengan memperhatikan segi efisiensi dalam penelitian ini, maka tidak semua data yang diolah akan ditampilkan tetapi hanya beberapa bagian saja yang dipilih oleh penulis yaitu data berukuran n=30 untuk 2 variabel bebas, 3 varabel bebas dan 5 variabel bebas Proses pengolahan yang tidak diuraikan dalam hasil dan pembahasan ini akan ditampilkan hasil akhir pengolahannya saja, yaitu dalam bentuk nilai standard error dan persamaan regresi yang diperoleh Proses penelitian dilakukan dengan R Language Data sampel dibangkitkan dengan fungsi rnorm (random number) yang merupakan bilangan acak yang memiliki sebaran normal baku, default dari rnorm adalah standar deviasi = 1, mean = 0 dan memiliki rentang nilai dari -3 sampai 3 Fungsi runif (random uniform) digunakan untuk membantu memperbesar nilai dari fungsi rnorm 41 Proses Pengolahan Data Dalam bagian ini akan ditampilkan sebagian dari proses pengolahan data beserta hasil-hasil dari proses yang ditampilkan Proses pengolahan data disajikan dalam bentuk diagram-diagram dan gambar-gambar yang menunjukkan bahwa data yang dibangkitkan memenuhi asumsi pendugaan untuk regresi linier 35
36 berganda, kemudian dilanjutkan dengan pengolahan data menggunakan metode kuadrat terkecil, metode bootstrap pairs dan metode bootstrap residual 411 Proses Pengolahan Data untuk Sampel n=30 dengan 2 Variabel Bebas Berikut ini akan ditampilkan tahapan-tahapan dalam proses pengolahan data untuk sampel berukuran n=30 dengan 2 variabel bebas 4111 Pembangkitan Data untuk Sampel n=30 dengan 2 Variabel Bebas Data akan dibangkitkan dengan R Languge Statement yang digunakan untuk membangkitkan data dalam R Language adalah sebagai berikut > library(stats) > n=30 > setseed(12343) > x=10*runif(n) > setseed(12344) > x1=15*runif(n)+x+rnorm(n) > setseed(12345) > x2=20*runif(n)+x+rnorm(n) > setseed(12347) > y=x+x1+x2+rnorm(n) > dataentry(y,x1,x2) Hasil pembangkitan data disajikan dalam tabel 41 :
37 Tabel 41 Hasil Pembangkitan Data untuk Sampel n=30 dengan 2 Variabel Bebas Keterangan : y menunjukkan variabel tak bebas, x1 menunjukkan variabel bebas pertama, x2 menunjukkan variabel bebas kedua
38 4112 Matrik Korelasi untuk Sampel n=30 dengan 2 Variabel Bebas Dari data yang sudah dibangkitkan akan diperlihatkan gambaran dalam bentuk diagram pencar Diagram pencar digunakan untuk mengetahui validitas asumsi dari pendugaan regresi linier berganda Pertama-tama akan diperlihatkan matrik korelasi, untuk melihat apakah ada hubungan antar variabel Matrik korelasi diperoleh dengan statement R Language sebagai berikut : > library (base) > matx=matrix(c(x1,x2),ncol=2) > round(cor(matx),4) Hasil pengolahan dengan R Language menunjukkan hasil sebagai berikut: [x1] [x2] [x1] 10000 00092 [x2] 00092 10000 Dari matrix korelasi terlihat bahwa korelasi antar x1 dengan x2 sebesar 00092 dan nilai ini dianggap sangat kecil sehingga dapat ditafsirkan bahwa tidak ada korelasi atau menunjukkan tidak terjadi multikolinieritasantar variabel x Untuk lebih jelasnya, akan ditampilkan hubungan antara variabel x1 dan x2 dengan diagram pencar yang disajikan pada gambar berikut > op <- par(mfrow = c(1,1), pty = "s") > plot(x1,x2)
39 Gambar 41 Diagram Pencar (Scatter Plot) x1 dengan x2 Dari gambar tersebut diatas terlihat bahwa tidak ada hubungan antara variabel x1 dengan x2 Berdasarkan besaran koefisien korelasi dan diagram pencar menunjukkan bahwa asumsi dalam regresi linier berganda yang memerlukan tidak terjadi multikolinieritas dapat dipenuhi dari data yang telah dibangkitkan 4113 Koefisien Korelasi Linier untuk Sampel n=30 dengan 2 Variabel Bebas Proses berikutnya akan menunjukkan koefisien korelasi linier antar variabel y dengan variabel x Dalam R Language dihasilkan dengan statement sebagai berikut > op <- par(mfrow = c(1,2), pty = "s") > plot(x1,y) > plot(x2,y)
40 Hasil yang diperoleh ditunjukkan oleh gambar 42 Gambar 42 Diagram Pencar Antara Data Y dengan Data X Dari gambar menunjukkan hubungan yang linier dan korelasi positif yang tinggi antara kedua variabel Sehingga memenuhi asumsi pendugaan untuk regresi linier berganda 4114 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 2 Variabel Bebas Dari data yang telah dibangkitkan, data akan diolah dengan menggunakan metode kuadrat terkecil Statement dalam R Language adalah sebagai berikut : > library(stats) > reg=lm(y~x1+x2) > reg > summary(reg) > ytopi=reg$fit > residual=reg$res > dataentry(y,x1,x2,ytopi,residual)
41 Hasil pengolahan data ditunjukkan pada tabel 42 Tabel 42 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari Sampel n=30 dengan 2 Variavel Bebas Keterangan : ytopi menunjukkan y estimasi (Ŷ) residual menunjukkan selisih antara y dengan y estimasi
42 Dengan menggunakan metode kuadrat terkecil diperoleh Persamaan regresi : Ŷ = -1493 + 1289 X 1 + 1164X 2 Nilai standard error : 2522 Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan ditunjukkan korelasi antara y estimasi dengan nilai residual Statement dalam R Language adalah sebagai berikut : > library(graphics) > op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual) Dihasilkan gambar dalam bentuk diagram pencar seperti dalam gambar 43 : Gambar 43 Diagram Pencar Ŷ dengan Residual Dari gambar terlihat bahwa nilai penyimpangan (residual) tidak dipengaruhi oleh besarnya nilai y estimasi, yang berarti bahwa persamaan regresi yang dihasilkan memenuhi asumsi untuk persamaan regresi linier
43 berganda(homoskedastisitas) Dengan perkataan lain, besarnya nilai penyimpangan sama untuk setiap nilai pendugaan variabel tak bebas 4115 Distribusi untuk Sampel n=30 dengan 2 Variabel Bebas Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk distribusi dari nilai residual dari persamaan regresi yang telah dihasilkan Statement dalam R Language untuk memeperoleh gambar distribusi nilai residual adalah > library(graphics) > res=reg$res > plot(density(res)) Hasil yang diperoleh ditunjukkan oleh gambar 44 : Gambar 44 Bentuk Distribusi Residual Regresi dengan 2 Variabel Bebas
44 Gambar 44 menunjukkan kurva normal yang berbentuk genta yang mempunyai arti bahwa data yang dibangkitkan mampunyai distribusi normal atau menyebar secara normal 4116 Metode Bootstrap Pairs untuk Sampel n=30 dengan 2 Variabel Bebas Selanjutnya akan dilakukan pengolahan data dengan menggunakan metode bootstrap pairs statement berikut ini digunakan untuk mengolah data dengan bootstrap pairs dalam R Language > ybaru<-0 > setseed(i+123) > ybaru[i]=y[sample(n,rep=t)] > x1baru<-0 > setseed(i+123) > x1baru[i]=x1[sample(n,rep=t)] > x2baru<-0 > setseed(i+123) > x2baru[i]=x2[sample(n,rep=t)] > regbaru=lm(ybaru~x1baru+x2baru) > regbaru > residual=regbaru$res > residualboot<-0 > setseed(i+123) > residualboot[i]=residual[sample(1000,rep=t)] > sdror=sd(residualboot) > sdror > dataentry(ybaru,x1baru,x2baru)
45 Data yang diolah dengan menggunakan metode bootstrap pairs akan menghasilkan nilai-nilai baru berukuran n=1000 Dalam tabel 43 berikut ini akan ditampilkan sebagian dari hasil pengolahan data Tabel 43 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari Sampel n=30 dengan 2 Variabel Bebas
46 Keterangan : ybaru menunjukkan nilai y yang diperoleh setelah dilakukan proses bootstrap pairs 1000 kali x1baru menunjukkan nilai x1 yang diperoleh setelah dilakukan proses bootstrap pairs 1000 kali x2baru menunjukkan nilai x2 yang diperoleh setelah dilakukan proses bootstrap pairs 1000 kali Sebagai contoh dari hasil pengolahan data dengan menggunakan metode bootstrap pairs, terlihat bahwa sampel no1 terpilih kembali sebagai sampel no999, sampel no2 terpilih kembali sebagai sampel no509 dan sampel no3 terplilih kembali sebagai sampel no997 Hal ini menjelaskan inti dari metode bootstrap pairs untuk model regresi yaitu sampling dengan pengembalian dengan probabilitas terpilih yang sama untuk setiap n dan proses bootstrap dilakukan secara berpasangan untuk semua variabel Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh persamaan regresi yaitu Ŷ = -1374 + 1290 X 1 + 1154 X 2 dan nilai standard error yang dihasilkan adalah 2413741 4117 Metode Bootstrap Residual untuk Sampel n=30 dengan 2 Variabel Bebas Hasil pengolahan data dengan menggunakan metode bootstrap residual ditunjukkan dalam tabel 44 dengan statement dalam R Language sebagai berikut > ytopi=reg$fit > residual=reg$res
47 > ytopibaru<-0 > setseed(i+123) > ytopibaru[i]=ytopi[sample(n,rep=t)] > residualboot<-0 > setseed(i+110) > residualboot[i]=residual[sample(n,rep=t)] > x1baru<-0 > setseed(i+123) > x1baru[i]=x1[sample(n,rep=t)] > x2baru<-0 > setseed(i+124) > x2baru[i]=x2[sample(n,rep=t)] > ybarures=ytopibaru+residualboot > regbaru=lm(ybarures~x1baru+x2baru) > regbaru > meanrb=mean(residualboot) > resboot=residualboot-meanrb > sderror=sd(resboot) > sderror > dataentry(x1baru,x2baru,ytopibaru,residualboot,ybaru)
48 Tabel 44 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual dari Sampel n=30 dengan 2 Variabel Bebas Keterangan : x1baru menunjukkan nilai x1 setelah dilakukan proses bootstrap 1000 kali
49 x2baru menunjukkan nilai x2 setelah dilakukan proses bootstrap 1000 kali ytopibaru menunjukkan nilai y estimasi setelah dilakukan proses bootstrap 1000 kali residualboot menunjukkan nilai residual setelah dilakukan proses bootstrap 1000 kali ybaru menunjukkan nilai y yang baru untuk prosedur bootstrap residual Dari hasil pengolahan data dengan metode bootstrap residual terlihat bahwa untuk data x1baru, data no1 terpilih kembali sebagai data no508, data no2 terpilih kembali sebagai data no504 dan 996, sedangkan untuk data x2baru terlihat bahwa data no1 terpilih kembali sebagai data no995 Hal ini menjelaskan metode bootstrap residual untuk model regresi yaitu sampling dengan pengembalian dengan probabilitas terpilih yang sama untuk setiap n Dari hasil pengolahan data dengan metode bootstrap residual diperoleh persamaan regresi yaitu Ŷ = -1503 + 1298 X 1 + 1157X 2 dan nilai standar error yang dihasilkan adalah 2352203 412 Proses Pengolahan Data untuk Sampel n=30 dengan 3 Variabel Bebas Proses pengolahan data yang dilakukan untuk data sampel berukuran n=30 dengan 3 variabel bebas sama dengan proses-proses yang dilakukan untuk data sampel berukuran n=30 dengan 2 variabel bebas dan bentuk pembahasannya
50 pun sama, sehingga untuk pembahasan-pembahasan yang sudah dijelaskan sebelumnya tidak dilakukan penjelasan lebih lanjut 4121 Pembangkitan Data untuk Sampel n=30 dengan 3 Variabel Bebas Statement dalam R Language untuk membangkitkan data sejumlah n=30 dengan 3 variabel bebas adalah sebagai berikut : > library(stats) > n=30 > setseed(12343) > x=10*runif(n) > setseed(12344) > x1=15*runif(n)+x+rnorm(n) > setseed(12345) > x2=20*runif(n)+x+rnorm(n) > setseed(12346) > x3=35*runif(n)+x+rnorm(n) > setseed(12347) > y=x+x1+x2+x3+rnorm(n) > dataentry(y,x1,x2,x3) Hasil pembangkitan data ditunjukkan dalam tabel 45 :
51 Tabel 45 Hasil Pembangkitan Data untuk Sampel n=30 dengan 3 Variabel Bebas Keterangan : y menunjukkan variabel tak bebas, x1 menunjukkan variabel bebas pertama, x2 menunjukkan variabel bebas kedua x3 menunjukkan variabel bebas ketiga
52 4122 Matrik Korelasi untuk Sampel n=30 dengan 3 Variabel Bebas Matrik korelasi dihasilkan dengan statement berikut ini > library (base) > matx=matrix(c(x1,x2,x3),ncol=3) > round(cor(matx),4) Hasil yang diperoleh adalah sebagai berikut : [x1] [x2] x3] [x1] 10000 01682 02645 [x2] 01682 10000-00470 [x3] 02645-00470 10000 Matrik korelasi diatas menunjukkan bahwa korelasi antar peubah bebas dari data yang diperoleh relatif kecil, sehingga antar variabel bebas dapat dianggap tidak memiliki hubungan (tidak multikolinieritas) Hubungan antara variabel x ditunjukkan pada gambar 45 > op <- par(mfrow = c(1,3), pty = "s") > plot(x1,x2) > plot(x1,x3) > plot(x2,x3) Gambar 45 Diagram Pencar Antar variabel X
53 4123 Koefisien Korelasi Linier untuk Sampel n=30 dengan 3 Variabel Bebas Koefisien korelasi linier dihasilkan oleh statement berikut ini dan ditunjukkan oleh gambar dibawahnya > op <- par(mfrow = c(1,3), pty = "s") > plot(x1,y) > plot(x2,y) > plot(x3,y) Gambar 46 Diagram Pencar Antara Data Y dan Data X 4124 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 3 Variabel Bebas Statement dalam R untuk menghasilkan suatu fungsi kuadrat terkecil adalah sebagai berikut > library(stats) > reg=lm(y~x1+x2+x3) > reg > summary(reg) > ytopi=reg$fit > residual=reg$res > dataentry(y,x1,x2,x3,ytopi,residual) Hasil pengolahan data ditunjukkan pada tabel 46 :
54 Tabel 46 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari Sampel n=30 dengan 3 Variavel Bebas Keterangan : ytopi menunjukkan y estimasi (Ŷ) residual menunjukkan selisih antara y dengan y estimasi
55 Dengan menggunakan metode kuadrat terkecil diperoleh Persamaan regresi : Ŷ = 3158+ 1240X 1 + 1182X 2 + 1089 X 3 Nilai standard error : 2351 Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan ditunjukkan korelasi antara y estimasi dengan residual Statement dalam R Language adalah sebagai berikut : > library(graphics) > op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual) Gambar 47 Diagram Pencar Ŷ dengan Residual 4125 Distribusi Residual Regresi untuk Sampel n=30 dengan 3 Variabel Bebas Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk distribusi dari nilai residual dari persamaan regresi yang telah dihasilkan Statement dalam R Language untuk memperoleh gambar distribusi nilai residual adalah
56 > library(graphics) > res=reg$res > plot(density(res)) Diperoleh gambar sebagai berikut : Gambar 48 Distribusi Residual Regresi Dengan 3 Variabel Bebas 4126 Metode Bootstrap Pairs untuk Sampel n=30 dengan 3 Variabel Bebas Statement berikut ini digunakan untuk mengolah data dengan bootstrap pairs dalam R Language > ybaru<-0 > setseed(i+123) > ybaru[i]=y[sample(n,rep=t)] > x1baru<-0 > setseed(i+123) > x1baru[i]=x1[sample(n,rep=t)]
57 > x2baru<-0 > setseed(i+123) > x2baru[i]=x2[sample(n,rep=t)] > x3baru<-0 > setseed(i+123) > x3baru[i]=x3[sample(n,rep=t)] > regbaru=lm(ybaru~x1baru+x2baru) > regbaru > residual=regbaru$res > residualboot<-0 > setseed(i+123) > residualboot[i]=residual[sample(1000,rep=t)] > sdror=sd(residualboot) > sdror > dataentry(ybaru,x1baru,x2baru,x3baru) Hasil pengolahan data akan ditunjukkan dalam tabel 57 :
58 Tabel 47 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari Sampel n=30 dengan 3 Variabel Bebas Keterangan : ybaru menunjukkan nilai y setelah dilakukan proses bootstrap pairs 1000 kali
59 x1baru,x2baru,x3baru menunjukkan nilai x1,x2 dan x3 setelah dilakukan proses bootstrap pairs 1000 kali Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh persamaan regresi yaitu Ŷ = -2856 + 1238 X 1 + 1173 X 2 + 1083 X 3 dan nilai standar error yang dihasilkan adalah 2193715 4127 Metode Bootstrap Residual untuk Sampel n=30 dengan 3 Variabel Bebas Hasil pengolahan data dengan menggunakan metode bootstrap residual diperoleh dengan statement dalam R Language sebagai berikut > ytopi=reg$fit > residual=reg$res > ytopibaru<-0 > setseed(i+123) > ytopibaru[i]=ytopi[sample(n,rep=t)] > residualboot<-0 > setseed(i+110) > residualboot[i]=residual[sample(n,rep=t)] > x1baru<-0 > setseed(i+123) > x1baru[i]=x1[sample(n,rep=t)] > x2baru<-0 > setseed(i+124) > x2baru[i]=x2[sample(n,rep=t)] > x3baru<-0 > setseed(i+125) > x3baru[i]=x3[sample(n,rep=t)]
60 > ybarures=ytopibaru+residualboot > regbaru=lm(ybarures~x1baru+x2baru) > regbaru > meanrb=mean(residualboot) > resboot=residualboot-meanrb > sderror=sd(resboot) > sderror > dataentry(x1baru,x2baru,x3baru,ytopibaru,residualboot,ybaru) Hasil pengolahan data ditampilkan dalam tabel 48
61 Tabel 48 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual dari Sampel n=30 dengan 3 Variabel Bebas Keterangan : x1baru,x2baru,x3baru menunjukkan nilai x1,x2 dan x3 setelah dilakukan proses bootstrap 1000 kali
62 ytopibaru menunjukkan nilai y estimasi setelah dilakukan proses bootstrap 1000 kali residualboot menunjukkan nilai residual setelah dilakukan proses bootstrap 1000 kali ybaru menunjukkan nilai y yang baru untuk prosedur bootstrap residual Dari hasil pengolahan data dengan metode bootstrap residual diperoleh persamaan regresi yaitu Ŷ = -3045 + 1245 X 1 + 1182 X 2 + 1081 X 3 dan nilai standar error yang dihasilkan adalah 2175285 413 Proses Pengolahan Data untuk Sampel n=30 dengan 5 Variabel Bebas Proses pengolahan data yang dilakukan untuk data sampel berukuran n=30 dengan 5 variabel bebas sama dengan proses-proses yang dilakukan untuk data sampel sebelumnya begitu pula bentuk pembahasannya, sehingga untuk pembahasan-pembahasan yang sudah dijelaskan sebelumnya tidak dilakukan penjelasan lagi 4131 Pembangkitan Data untuk Sampel n=30 dengan 5 Variabel Bebas Statement dalam R Language untuk membangkitkan data sejumlah n=30 dengan 5 variabel bebas adalah sebagai berikut : > library(stats) > n=30 > setseed(12343)
63 > x=10*runif(n) > setseed(12344) > x1=15*runif(n)+x+rnorm(n) > setseed(12345) > x2=20*runif(n)+x+rnorm(n) > setseed(12346) > x3=35*runif(n)+x+rnorm(n) > setseed(12348) > x4=40*runif(n)+x+rnorm(n) > setseed(12349) > x5=45*runif(n)+x+rnorm(n) > setseed(12347) > y=x+x1+x2+x3+x3+x4+rnorm(n) > dataentry(y,x1,x2,x3,x4,x5) Hasil pembangkitan data ditunjukkan dalam tabel 49
64 Tabel 49 Hasil Pembangkitan Data untuk Sampel n=30 dengan 5 Variabel Bebas Keterangan : y menunjukkan variabel tak bebas, x1 menunjukkan variabel bebas pertama, x2 menunjukkan variabel bebas kedua
65 x3 menunjukkan variabel bebas ketiga x4 menunjukkan variabel bebas keempat x5 menunjukkan variabel bebas kelima 4132 Matrik Korelasi untuk Sampel n=30 dengan 5 Variabel Bebas Matrik korelasi dihasilkan dengan statement berikut ini > library (base) > matx=matrix(c(x1,x2,x3,x4,x5),ncol=5) > round(cor(matx),4) Hasil yang diperoleh adalah sebagai berikut : [x1] [x2] [x3] [x4] [x5] [x1] 10000 01682 02645 04519 04637 [x2] 01682 10000-00470 -01043 00183 [x3] 02645-00470 10000 01379 03258 [x4] 04519-01043 01379 10000 04133 [x5] 04637 00183 03258 04133 10000 Hubungan antar variabel x ditunjukkan oleh diagram pencar berikut ini > op <- par(mfrow = c(2,3), pty = "s") > plot(x1,x2) > plot(x1,x3) > plot(x1,x4) > plot(x1,x5) > plot(x2,x3) > plot(x2,x4) > op <- par(mfrow = c(2,2), pty = "s") > plot(x2,x5) > plot(x3,x4) > plot(x3,x5)
66 > plot(x4,x5) Gambar 49 Diagram Pencar Antar variabel X
67 4133 Koefisien Korelasi Linier untuk Sampel n=30 dengan 5 Variabel Bebas Koefisien korelasi linier untuk data dengan 5 variabel tidak dapat digambarkan karena akan terjadi hyperplane 4134 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 5 Variabel Bebas Statement dalam R untuk menghasilkan suatu fungsi kuadrat terkecil adalah sebagai berikut > library(stats) > reg=lm(y~x1+x2+x3+x4+x5) > reg > summary(reg) > ytopi=reg$fit > residual=reg$res > dataentry(y,x1,x2,x3,x4,x5,ytopi,residual) Hasil pengolahan data ditunjukkan dalam tabel 410
68 Tabel 410 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari Sampel n=30 dengan 5 Variavel Bebas Keterangan : ytopi menunjukkan y estimasi (Ŷ) residual menunjukkan selisih antara y dengan y estimasi
69 Dengan menggunakan metode kuadrat terkecil diperoleh persamaan regresi Ŷ = -4494 + 1175X 1 + 1204 X 2 + 1085 X 3 + 1050 X 4 + 1019X 5 Nilai standard error : 236 Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan ditunjukkan korelasi antara y estimasi dengan residual Statement dalam R Language adalah sebagai berikut : > library(graphics) > op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual) Gambar 410 Diagram Pencar Ŷ dengan Residual 4135 Distribusi Residual Regresi untuk Sampel n=30 dengan 5 Variabel Bebas Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk distribusi dari nilai residual dari persamaan regresi yang telah dihasilkan statement dalam R Language untuk memeperoleh gambar distribusi nilai residual adalah > library(graphics) > res=reg$res > plot(density(res))
70 Diperoleh gambar sebagai berikut : Gambar 411 Distribusi Residual Regresi Dengan 5 Variabel Bebas 4136 Metode Bootstrap Pairs untuk Sampel n=30 dengan 5 Variabel Bebas Statement berikut ini digunakan untuk mengolah data dengan bootstrap pairs dalam R Language > ybaru<-0 > setseed(i+123) > ybaru[i]=y[sample(n,rep=t)] > x1baru<-0
71 > setseed(i+123) > x1baru[i]=x1[sample(n,rep=t)] > x2baru<-0 > setseed(i+123) > x2baru[i]=x2[sample(n,rep=t)] > x3baru<-0 > setseed(i+123) > x3baru[i]=x3[sample(n,rep=t)] > x4baru<-0 > setseed(i+123) > x4baru[i]=x4[sample(n,rep=t)] > x5baru<-0 > setseed(i+123) > x5baru[i]=x5[sample(n,rep=t)] > regbaru=lm(ybaru~x1baru+x2baru) > regbaru > residual=regbaru$res > residualboot<-0 > setseed(i+123) > residualboot[i]=residual[sample(1000,rep=t)] > sdror=sd(residualboot) > sdror > dataentry(ybaru,x1baru,x2baru,x3baru,x4baru,x5baru) Hasil pengolahan data ditunjukkan dalam tabel 411
72 Tabel 411 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari Sampel n=30 dengan 5 Variabel Bebas Keterangan : ybaru menunjukkan nilai y setelah dilakukan proses bootstrap pairs 1000 kali
73 x1baru, x2baru, x3baru, x4baru, x5baru menunjukkan nilai x1,x2,x3,x4,x5 setelah dilakukan proses bootstrap pairs 1000 kali Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh persamaan regresi yaitu Ŷ = : -4229 + 1164 X 1 + 1199 X 2 + 1078 X 3 + 1050 X 4 + 1023X 5 dan nilai standar error yang dihasilkan adalah 2094366 4137 Metode Bootstrap Residual untuk Sampel n=30 dengan 5 Variabel Bebas Hasil pengolahan data dengan menggunakan metode bootstrap residual ditunjukkan dalam tabel 412 dengan statement dalam R Language sebagai berikut > ytopi=reg$fit > residual=reg$res > ytopibaru<-0 > setseed(i+123) > ytopibaru[i]=ytopi[sample(n,rep=t)] > residualboot<-0 > setseed(i+110) > residualboot[i]=residual[sample(n,rep=t)] > x1baru<-0 > setseed(i+123) > x1baru[i]=x1[sample(n,rep=t)]
74 > x2baru<-0 > setseed(i+124) > x2baru[i]=x2[sample(n,rep=t)] > x3baru<-0 > setseed(i+125) > x3baru[i]=x3[sample(n,rep=t)] > x4baru<-0 > setseed(i+126) > x4baru[i]=x4[sample(n,rep=t)] > x5baru<-0 > setseed(i+127) > x5baru[i]=x5[sample(n,rep=t)] > ybarures=ytopibaru+residualboot > regbaru=lm(ybarures~x1baru+x2baru) > regbaru > meanrb=mean(residualboot) > resboot=residualboot-meanrb > sderror=sd(resboot) > sderror > dataentry(x1baru,x2baru,x3baru,x4baru,x5baru,ytopibaru, +residualboot,ybaru)
75 Tabel 412 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual dari Sampel n=30 dengan 5 Variabel Bebas Keterangan : x1baru, x2baru, x3baru, x4baru, x5baru menunjukkan nilai x1,x2,x3,x4,x5 setelah dilakukan proses bootstrap 1000 kali
76 ytopibaru menunjukkan nilai y estimasi setelah dilakukan proses bootstrap 1000 kali residualboot menunjukkan nilai residual setelah dilakukan proses bootstrap 1000 kali ybaru menunjukkan nilai y yang baru untuk prosedur bootstrap residual Dari hasil pengolahan data dengan metode bootstrap residual diperoleh persamaan regresi yaitu Ŷ = -4537 +1166 X 1 +1203 X 2 + 1075 X 3 +1057 X 4 +1026 X 5 dan nilai standar error yang dihasilkan adalah 209187 42 Hasil dan Pembahasan Dari semua data yang sudah diolah, didapatlah persamaan regresi dan standard error untuk masing-masing sampel dan masing-masing jumlah variabel Dari tabel persamaan regresi dan tabel standard error yang akan diperlihatkan dalam tabel 413 dan 414 dapat dilihat perbedaan nilai dari persamaan regresi dan nilai dari standar error yang dihasilkan oleh metode kuadrat terkecil, metode bootstrap pairs dan bootstrap residual Dari tabel standar error (tabel 414), terlihat bahwa meskipun terdapat perbedaan nilai yang dihasilkan oleh masing-masing metode, namun perbedaan nilai tersebut tidak terlalu jauh atau saling mendekati satu sama lain, meskipun
77 demikian tetap terlihat pola-pola yang menunjukkan bahwa nilai standar error metode yang satu lebih kecil dibandingkan metode lainnya Hasil dari persamaan regresi dan standar error yang diperoleh dengan menggunakan metode kuadrat terkecil, metode bootstrap pairs dan bootstrap residual untuk semua jumlah data dan semua variabel dapat dilihat dalam tabel 413 dan 414
78 Tabel 413 Hasil Persamaan Regresi Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual N = 30 N = 100 N = 200 N = 500 N = 950 N = 30 N = 100 N = 200 N = 500 N = 950 N = 30 N = 100 N = 200 N = 500 N = 950 2 var Ŷ = -1493 + 1289 X 1 + 1164 X 2 3 var Ŷ = -3158 + 1240 X 1 + 1182 X 2 + 1089 X 3 5 var Ŷ = -4494 + 1175 X 1 + 1204 X 2 + 1085 X 3 + 1050 X 4 + 1019 X 5 2 var Ŷ = -04812 + 13055 X 1 + 10844 X 2 3 var Ŷ = -1530 + 1291 X 1 + 1089 X 2 + 1053 X 3 5 var Ŷ = -2657 + 1248 X 1 + 1092 X 2 + 1048 X 3 + 1031 X 4 + 1033 X 5 2 var Ŷ = -02022 + 12924 X 1 + 10749 X 2 3 var Ŷ = -1131 + 1279 X 1 + 1076 X 2 + 1050 X 3 5 var Ŷ = -2261 + 1241 X 1 + 1072 X 2 + 1045 X 3 + 1030 X 4 + 1035 X 5 2 var Ŷ = -02357 + 12507 X 1 + 11283 X 2 3 var Ŷ = -09261 + 12435 X 1 + 11275 X 2 + 10352 X 3 5 var Ŷ = -2538 + 1214 X 1 + 1116 X 2 + 1030 X 3 + 1038 X 4 + 1046 X 5 2 var Ŷ = -04634 + 12405 X 1 + 11555 X 2 3 var Ŷ = -1282 + 1229 X 1 + 1149 X 2 + 1046 X 3 5 var Ŷ = -2537 + 1208 X 1 + 1139 X 2 + 1043 X 3 + 1025 X 4 + 1041 X 5 2 var Ŷ = -1374 + 1290 X 1 + 1154 X 2 3 var Ŷ = -2856 + 1238 X 1 + 1173 X 2 + 1083 X 3 5 var Ŷ = -4229 + 1164 X 1 + 1199 X 2 + 1078 X 3 + 1050 X 4 + 1023 X 5 2 var Ŷ = -06672 + 13283 X 1 + 10786 X 2 3 var Ŷ = -1838 + 1317 X 1 + 1079 X 2 + 1061 X 3 5 var Ŷ = -2920 + 1271 X 1 + 1081 X 2 + 1053 X 3 + 1026 X 4 + 1039 X 5 2 var Ŷ = 01435 + 12907 X 1 + 10588 X 2 3 var Ŷ = -07936 + 12806 X 1 + 10579 X 2 + 10491 X 3 5 var Ŷ = -1785 + 1248 X 1 + 1055 X 2 + 1047 X 3 + 1034 X 4 + 1021 X 5 2 var Ŷ = -03539 + 12548 X 1 + 11320 X 2 3 var Ŷ = -08725 + 12496 X 1 + 11303 X 2 + 10267 X 3 5 var Ŷ = -2324 + 1223 X 1 + 1119 X 2 + 1024 X 3 + 1042 X 4 + 1034 X 5 2 var Ŷ = -05594 + 12432 X 1 + 11521 X 2 3 var Ŷ = -1499 + 1229 X 1 + 1145 X 2 + 1053 X 3 5 var Ŷ = -2459 + 1212 X 1 + 1135 X 2 + 1051 X 3 + 1023 X 4 + 1030 X 5 2 var Ŷ = -1503 + 1298 X 1 + 1157 X 2 3 var Ŷ = -3045 + 1245 X 1 + 1182 X 2 + 1081 X 3 5 var Ŷ = -4537 + 1166 X 1 + 1203 X 2 + 1075 X 3 + 1057 X 4 + 1026 X 5 2 var Ŷ = -01788 + 13055 X 1 + 10645 X 2 3 var Ŷ = -1307 + 1289 X 1 + 1067 X 2 + 1060 X 3 5 var Ŷ = -2554 + 1252 X 1 + 1069 X 2 + 1059 X 3 + 1037 X 4 + 1026 X 5 2 var Ŷ = -0006287 + 1296905 X 1 + 1063794 X 2 3 var Ŷ = -09169 + 12802 X 1 + 10635 X 2 + 10514 X 3 5 var Ŷ = -2127 + 1240 X 1 + 1056 X 2 + 1044 X 3 + 1024 X 4 + 1047 X 5 2 var Ŷ = 009165 + 123955 X 1 + 111495 X 2 3 var Ŷ = -07653 + 12317 X 1 + 11147 X 2 + 10423 X 3 5 var Ŷ = -2387 + 1199 X 1 + 1106 X 2 + 1034 X 3 + 1045 X 4 + 1044 X 5 2 var Ŷ = -06801 + 12472 X 1 + 11561 X 2 3 var Ŷ = -1499 + 1236 X 1 + 1153 X 2 + 1043 X 3 5 var Ŷ = -2823 + 1214 X 1 + 1142 X 2 + 1040 X 3 + 1028 X 4 + 1042 X 5
79 2 Variabel 3 Variabel 5 variabel Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual Tabel 414 Hasil Standard error N = 30 N = 100 N = 200 2522 2452 2442 2413741 2450007 2349687 2352203 2437318 2420663 2351 2395 2388 2193715 2347942 229766 2175285 2343996 2364284 236 2356 232 2094366 2307948 2245379 209187 2271965 2322361 N = 500 247 2363669 2348681 2445 2347885 2332889 2314 2188768 2227493 N = 950 243 2402468 2397367 2382 2359644 2334539 2,299 2310374 2287538
80 43 Analisis Grafik Untuk memudahkan analisis dalam membandingkan metode-metode kuadrat terkecil, bootstrap pairs dan bootstrap residual, maka nilai dari standar error yang dihasilkan akan disajikan dalam bentuk grafik seperti berikut ini : Grafik Standard Error untuk 2 Variabel Nilai Standard Error 2,55 2,5 2,45 2,4 2,35 2,3 2,25 N = 30 N = 100 N = 200 N = 500 N = 950 Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual Jumlah Data (N) Gambar 412 Grafik Standar Error untuk 2 variabel bebas Grafik Standard Error untuk 3 Variabel Nilai Standard Error 2,5 2,45 2,4 2,35 2,3 2,25 2,2 2,15 2,1 2,05 2 N = 30 N = 100 N = 200 N = 500 N = 950 Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual Jumlah Data (N) Gambar 413 Grafik Standar Error untuk 3 variabel bebas
81 Grafik Standard Error untuk 5 Variabel Nilai Standard Error 2,4 2,35 2,3 2,25 2,2 2,15 2,1 2,05 2 1,95 N = 30 N = 100 N = 200 N = 500 N = 950 Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual Jumlah Data (N) Gambar 414 Grafik Standar Error untuk 5 variabel bebas Dari grafik dapat kita lihat bahwa kisaran nilai standard error untuk masing-masing metode yang menunjukkan bahwa nilai standard error untuk metode kuadrat terkecil, metode bootstrap pairs dan metode bootstrap residual saling mendekati dan tidak menunjukkan perbedaan nilai yang terlalu jauh Dapat kita lihat pula bahwa nilai standard error untuk metode bootstrap pairs dan metode bootstrap residual lebih kecil dibandingkan dengan nilai standard error metode kuadrat terkecil Selanjutnya, bila dibandingkan lagi antara metode bootstrap pairs dan metode bootstrap residual terlihat bahwa nilai standard error bootstrap residual cenderung lebih kecil dibandingkan nilai standard error metode bootstrap pairs terutama untuk data dengan ukuran n yang kecil, tetapi untuk data-data tertentu nilai standard error bootstrap pairs lebih kecil dibandingkan nilai standard error bootstrap residual