BAB 2 LANDASAN TEORI. mengetahui pola hubungan antara dua atau lebih variabel. Istilah regresi yang

8 BAB 2 LANDASAN TEORI 2.1 Pengertian Regresi Analisis regresi merupakan suatu model matematis yang dapat di gunakan untuk mengetahui pola hubungan antara dua atau lebih variabel. Istilah regresi yang berarti ramalan atau taksiran pertama kali di perkenalkan Sir Francis Galton pada tahun 1877, sehubungan dengan penelitiannya terhadap tinggi manusia, yaitu antara tinggi anak dan tinggi orang tuanya. Dalam penelitiannya, Galton menemukan bahwa tinggi anak dan orang tuanya cenderung meningkat atau menurun dari berat rata-rata populasi. Garis yang menunjukkan hubungan tersebut disebut garis regresi. Analisis regresi lebih akurat dalam melakukan analisis korelasi, karena pada analisis itu kesulitan dalam menunjukkan slop (tingkat perubahan suatu variabel terhadap variabel lainnya dapat ditentukan). Jadi dengan analisis regresi, peramalan atau perkiraan nilai variabel terikat pada nilai variabel bebas lebih akurat pula. Karena merupakan suatu prediksi, maka nilai prediksi tidak selalu tepat dangan nilai riilnya, semakin kecil tingkat penyimpangan antara nilai prediksi dengan nilai riilnya, maka semakin tepat persamaan regresi yang dibentuk. Dapat disimpulkan bahwa analisis regresi adalah metode statistika yang digunakan untuk menentukan kemungkinan bentuk hubungan antara variabel-

9 variabel, dengan tujuan pokok dalam penggunaan metode ini adalah untuk meramalkan atau memperkirakan nilai dari suatu variabel lain yang diketahui. 2.2 Persamaan Regresi Persamaan Regresi (regression equation) adalah suatu persamaan matematis yang mendefinisikan hubungan antara dua variabel. Persamaan regresi yang digunakan untuk membuat taksiran mengenai variabel dependen disebut persamaan regresi estimasi, yaitu suatu formula matematis yang menunjukkan hubungan keterkaitan antara satu atau beberapa variabel yang nilainya sudah diketahui dengan satu variabel yang nilainya belum diketahui. Sifat hubungan antar variabel dalam persamaan regresi merupakan hubungan sebab akibat (causal relationship). Oleh karena itu, sebelum menggunakan persamaan regresi dalam menjelaskan hubungan antara dua atau lebih variabel, maka perlu diyakini terlebih dahulu bahwa secara teoritis atau perkiraan sebelumnya, dua atau lebih variabel tersebut memiliki hubungan sebab akibat. Variabel yang nilainya akan mempengaruhi nilai variabel lain disebut dengan variabel bebas (independent variabel), sedangkan variabel yang nilainya dipengaruhi oleh nilai variabel lain disebut variabel terikat (dependent variabel). Ada dua jenis Persamaan Regresi Linier, yaitu sebagai berikut: 1. Analisis Regresi Sederhana (simple analisis regresi) 2. Analisis Regresi Berganda (multiple analisis regresi)

10 2.3 Regresi Linier Sederhana Regresi linier sederhana merupakan suatu proses untuk mendapatkan hubungan matematis dalam bentuk suatu persamaan antara variabel tak bebas tunggal dangan variabel bebas tunggal atau dengan kata lain, regresi linier yang hanya melibatkan suatu peubah bebas XX yang dihubungkan dengan satu peubah tak bebas YY. Bentuk umum model regresi linier sederhana yaitu : YY = aa 0 + aa 1 XX 1 + εε ii (2.1) Dimana: YY = Variabel tak bebas (dependent) aa 0 = parameter intersep aa 1 = koefisien regresi (slop) XX 1 = variabel bebas (independent) εε ii = kesalahan penduga 2.4 Regresi Linier Berganda Disamping hubungan linier dua variabel, hubungan linier lebih dari dua variabel dapat juga terjadi. Pada hubungan ini, perubahan satu variabel dipengaruhi oleh lebih dari satu variabel lain. Maka regresi linier berganda adalah analisis regresi yang menjelaskan hubungan antara peubah respon (variable dependent) dengan faktor-faktor yang mempengaruhi lebih dari satu predator (variabel independent).

11 Tujuan analisis regresi linier berganda adalah untuk mengukur intensitas hubungan antara dua variabel atau lebih dan membuat prediksi / perkiraan nilai YY atas nilai XX. Bentuk umum persamaan regresi linier berganda yang mencakup dua atau lebih variabel, yaitu: YY = aa 0 + aaxx 1 + aa 2 XX 2 + aa 3 XX 3 +... + aa kk XX kk + εε ii (2.2) Model diatas merupakan model regresi untuk populasi, sedangkan apabila hanya menarik sebagian berupa sampel dari populasi secara acak dan tidak mengetahui regresi populasi untuk keperluan analisis, variabel bebas akan dinyatakan dengan xx 1, xx 2,..., xx kk (k 1) sedangkan variabel tidak bebas dinyatakan dengan YY. YY = aa 0 + aaxx 1 + aa 2 XX 2 + aaxx 3 +... + aaxx kk + ee (2.3) Dimana: YY = variabel tidak bebas (dependent) aa 0,..., aa kk xx 1,..., xx kk e = koefisien regresi = variabel bebas (independent) = kesalahan pengganggu 2.5 Uji Persyaratan Regresi Linier Berganda Beberapa hal lain yang penting juga untuk dipahami dalam penggunan analisis linier berganda yaitu perlunya melakukan uji asumsi klasik atau uji persyaratan analisis regresi anda sehingga persamaan garis regresi yang diperoleh benar-benar dapat digunakan untuk memprediksi variabel dependen atau kriterium. Uji

12 Persyaratan tersebut harus terpenuhi, apabila tidak maka akan menghasilkan garis regresi yang tidak cocok untuk memprediksi. Sebelum masuk pada uji persyaratan perlu di pahami bahwa statistik sebagai alat analisis dikelompokkam menjadi dua bagian yang berbeda, yaitu kelompok statistik parametrik dan statistik non-parametrik. Pada statistik nonparametrik tidak memerlukan persyaratan tertentu sedangkan pada statistik parametrik memerlukan persyaratan yang harus dipenuhi. Oleh karena itu, dalam uji persyaratan regresi linier ganda yang harus dilakukan pada dasarnya juga dikelompokkan menjadi dua bagian, yaitu uji persyaratan untuk masuk ke statistik parametrik dan uji persyaratan untuk menggunakan regresi linier ganda. Uji asumsi klasik yang secara minimal perlu dilakukan oleh penulis menggunakan regresi linier ganda sebagai alat analisis yaitu berupa: 1. Uji persyaratan untuk statistik parametrik yang berupa: a. Uji normalitas b. Uji homogenitas 2. Uji persyaratan untuk regresi linier ganda, yang terdiri atas: a. Uji linieritas garis regresi b. Tidak terdapat saling hubungan antara variabel bebas (uji multikolinieritas) c. Tidak terdapat autokorelasi antar data pengamatan d. Tidak terjadi adanya heteroskedasitas (Gujarat, 1997)

13 2.6 Membentuk Persamaan Regresi Linier Berganda Dalam regresi linier berganda variabel tak bebas (YY), tergantung kepada dua atau lebih variabel bebas (XX). Bentuk persamaan regresi linier berganda yang mencakup dua atau lebih variabel, yaitu: YY = aa + bb 1 XX 1 + bb 2 XX 2 + bb 2 XX 3 +... + bb kk XX kk + ee (2.4) Dimana: YY = variabel terikat (dependen) aa, bb 1, bb 2, bb 3,..., bb kk = koefisien regresi XX 1, XX 2, XX 3,..., XX kk = variabel bebas (independen) ee = kesalahan pengganggu (disturbance terma) Untuk hal ini, penulis menggunakan regresi linier berganda dengan tiga variabel, yaitu satu variabel tak bebas (dependen variabel) dan dua variabel bebas (independen variable). Bentuk umum persamaan regresi linier berganda tersebut yaitu: YY = aa + bb 1 XX 1 + bb 2 XX 2 (2.5) Nilai dari koefisien aa, bb 1, bb 2 dapat ditentukan dengan metode kuadrat terkecil (least squared) seperti berikut ini: bb 1 = Σxx 2 2 (Σxx 1 yy) (Σxx 2 yy) (Σxx 1 xx 2 ) Σxx 1 2 Σxx 2 2 (Σxx 1 Σxx 2 )² (2.6) bb 2 = Σxx 1 2 (Σxx 2 yy) (Σxx 1 yy) (Σxx 1 xx 2 ) Σxx 1 2 Σxx 2 2 (Σxx 1 Σxx 2 )² (2.7)

14 aa = YY bb 1 ΣXX 1 bb 2 ΣXX 2 nn (2.8) Harga-harga aa, bb 1, bb 2 yang telah didapat kemudian disubstitusikan kedalam persamaan (2.5) sehingga diperoleh model regresi linier berganda YY atas XX 1 dan XX 2. Dalam persamaan model regresi linier yang diperoleh, maka antara nilai YY dan YY akan menimbulkan perbedaan hasil yang sering disebut sebagai kekeliruan. Untuk mengetahui ketepatan persamaan estimasi dapat digunakan kesalahan standar estimasi (standard error of estimate). Besarnya kesalahan standar estimasi menunjukkan ketepatan persamaan estimasi untuk menjelaskan nilai variabel tidak bebas yang sesungguhnya. Semakin kecil nilai kesalahan standar estimasi, maka tinggi ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel tidak bebas sesungguhnya. Sebaliknya, semakin besar nilai kesalahan standar estimasi, makin rendah ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel tidak bebas sesungguhnya. Kesalahan standar estimasi dapat ditentukan dengan rumus: SS yy.12 = Σ(YY ii YY )² nn kk 1 (2.9) Dimana: SS yy.12 = Kesalahan baku YY ii = nilai data sebenarnya YY ii = nilai taksiran nn = banyak ukuran sampel kk = banyak variabel bebas

15 2.7 Koefisien Determinasi Koefisien determinasi adalah salah satu nilai statistik yang dapat digunakan untuk mengetahui apakah ada hubungan pengaruh antara dua variabel. Nilai koefisien determinasi menunjukkan persentase nilai variabel dependen yang dapat dijelaskan oleh persamaan regresi yang dihasilkan. Koefisien determinasi yang dinyatakan RR 2 untuk pengujian regresi linier berganda yang mencakup lebih dari dua variabel adalah untuk mengetahui proporsi keragaman total dalam variabel tak bebas (YY) yang dapat dijelaskan atau diterangkan oleh variabel-variabel bebas (XX) yang ada dalam model persamaan regresi linier berganda secara bersamasama. Maka RR 2 akan ditentukan dengan rumus, yaitu: RR 2 = JJKK rrrrrr Σ yy 2 (2.10) Dengan: JJKK rrrrrr = bb 1 xx 1 yy + bb 2 xx 2 yy +... + bb kk xx kk yy (2.11) Harga RR 2 yang diperoleh sesuai dengan variasi yang dijelaskan masingmasing variabel yang tinggal dalam regresi. Hal ini mengakibatkan variasi yang dijelaskan penduga yang disebabkan oleh variabel yang berpengaruh saja (bersifat nyata).

16 2.8 Koefisien Korelasi Setelah mengetahui hubungan fungsional antara variabel-variabel dimana persamaan regresinya telah ditentukan dan telah melakukan pengujian maka persoalan berikutnya yang perlu dirasakan yaitu, jika data hasil pengamatan terdiri dari banyak variabel adalah seberapa kuat hubungan antara variabel-variabel itu. Dengan kata lain perlu ditentukan derajat hubungan antara variabel-variabel tersebut. Studi yang membahas derajat hubungan antara varibel-variabel tesebut dikenal dengan nama analisis korelasi. Ukuran yang dipakai untuk mengetahui derajat hubungan, terutama data kuantitatif dinamakan koefisien korelasi. Besarnya ukuran yang dipakai variabel yang satu dengan variabel yang lain dinyatakan dengan koefisien korelasi yang disimbolkan dengan rr yang besarnya adalah akar koefisien determinasi. Atau secara matematis dapat ditulis sebagai berikut: rr = RR 2 (2.12) Koefisien korelasi (rr) dapat digunakan untuk: 1. Mengetahui keeratan hubungan (korelasi linier) antara dua variabel 2. Mengetahui arah hubungan antara dua variabel Untuk mengetahui keeratan hubungan antara dua variabel dengan menggunakan koefisien korelasi adalah dengan menggunakan nilai absolut dari koefisien tersebut. Besarnya koefisien korelasi (rr) antara dua variabel nol sampai dengan satu. Apabila dua variabel mempunyai nilai rr = 0, berarti antara dua variabel tersebut tidak ada hubungan. Sedangkan apabila dua buah varibel

17 mempunyai rr = ±1, maka dua buah variabel tersebut mempunyai hubungan yang sempurna. Semakin tinggi nilai koefisien korelasi antara dua buah variabel (semakin mendekati 1), maka tingkat keeratan hubungan antara dua variabel tersebut semakin tinggi. Dan sebaliknya semakin rendah koefisien korelasi antara dua buah variabel (semakin mendekati 0), maka tingkat keeratan hubungan antara dua variabel tersebut semakin lemah. Hubungan antar dua variabel dapat dikelompokkan menjadi 3 jenis hubungan sebagai berikut: 1. Korelasi Positif Terjadinya korelasi positif apabila perubahan pada variabel yang satu diikut dengan perubahan variabel yang lain dengan arah yang sama (berbanding lurus). Artinya, apabila variabel yang satu meningkat, maka akan di ikuti dengan peningkatan variabel lain. 2. Korelasi Negatif Korelasi negatif terjadi apabila perubahan pada variabel yang satu diikuti dengan perubahan variabel yang lain dengan arah yang berlawanan (berbanding terbalik). Artinya apabila variabel yang satu meningkat, maka akan diikuti dengan penurunan pada variabel yang lain dan sebaliknya. 3. Korelasi Nihil Korelasi nihil terjadi apabila perubahan pada variabel yang satu diikuti perubahan pada variabel yang lain dengan arah yang tidak teratur (acak), artinya apabila variabel yang satu meningkat, kadang diikuti dengan

18 peningkatan pada variabel yang lain dan kadang diikuti dengan penurunan pada variabel yang lain. Selain diturunkan dari koefisien determinasi (rr 2 ), koefisien korelasi (rr) dapat pula ditentukan dengan menggunakan formulasi sebagai berikut: nn Σ YYXX 1 (ΣYY)(ΣXX 1 ) rr yyxx1 = (nn ΣYY 2 (ΣYY)²) nn ΣXX 2 1 (ΣXX 1 )² (2.13) Dimana: rr yyxx1 = koefisien korelasi antara YY dan XX XX 1 = variabel bebas (independen) YY = variabel terikat (dependen) Untuk mencari korelasi antara variabel YY terhadap XX 1 atau rr yy.1,2,3,,kk dapat dicari dengan rumus : nn ΣXX ii YY ii (ΣXX ii ) (ΣYY ii ) rr yy.1,2,3,,kk = nn Σ XX 2 ii (Σ XX ii )² nn ΣYY 2 ii (ΣYY ii )² (2.14) Jika kenaikan didalam satu variabel diikuti dengan kenaikan variabel lain maka dapat dikatakan bahwa kedua variabel tersebut mempunyai korelasi yang positif. Tetapi jika kenaikan didalam satu variabel diikuti penurunan didalam variabel lain, maka dapat dikatakan bahwa variabel tersebut mempunyai korelasi yang negatif. Dan jika tidak ada perubahan pada variabel walaupun variabel lainnya berubah maka dikatakan bahwa kedua variabel tersebut tidak mempunyai hubungan. Interpretasi harga r akan disajikan dalam tabel berikut:

19 Tabel 2.1 Interpretasi Koefisien Korelasi Nilai r RR 0 0,01 0,20 0,21-0,40 0,41 0,60 0,61 0,80 0,81 0,99 1 Interpretasi Tidak berkorelasi Sangat rendah Rendah Agak rendah Cukup Tinggi Sangat tinggi 2.9 Uji Regresi Linier Berganda Pengujian hipotesis bagi koefisien-koefisien regresi linier berganda dapat dilakukan secara serentak atau keseluruhan. Pengujian regresi linier perlu dilakukan untuk mengetahui apakah variabel-variabel bebas secara bersamaan memiliki pengaruh terhadap variabel tak bebas. Langkah-langkah pengujiannya adalah sebagi berikut: 1. Menentukan formulasi hipotesis HH 0 : bb 1 = bb 2 = bb 3 =... = bb kk = 0 (XX 1, XX 2,..., XX kk tidak mempengaruhi YY) HH 1 : minimal ada satu parameter koefisien regresi yang tidak sama dengan nol atau mempengaruhi YY.

20 2. Penentuan nilai kritis. Nilai kritis dalam pengujian hipotesis terhadap koefisien regresi dapat ditentukan dengan menggunakan tabel distribusi normal dengan memperhatikan tingkat signifikan (αα) dan banyaknya sampel digunakan serta nilai FF tttttttttt dengan derajat kebebasan v 1 = k dan v 2 = n-k-1. 3. Menentukan kriteria pengujian HH 0 diterima bila FF hiiiiiiiiii FF tttttttttt HH 0 ditolak bila FF hiiiiiiiiii > FF tttttttttt 4. Menetukan nilai statistik FF dengan rumus : FF = JJJJ rrrrrr kk JJJJ rrrrrr (nn kk 1) (2.15) Dimana: JJKK rrrrrr = jumlah kuadrat regresi JJKK rrrrrr = jumlah kuadrat residu (sisa) (n-k-1) = derajat kebebasan JJKK rrrrrr = bb 1 xx 1 yy + bb 2 xx 2 yy JJKK rrrrrr = YY ii YY ² 5. Membuat kesimpulan apakah HH 0 diterima atau ditolak.

21 2.10 Uji Koefisien Regresi Berganda Keberartian adanya variabel-variabel bebas dalam regresi linier berganda perlu diuji untuk menunjukkan seberapa besar pengaruh yang diberikan pada variabel tak bebas. Dan cara yang tepat untuk mengujinya adalah dengan menggunakan uji statistik t (student). Dimisalkan populasi mempunyai model regresi berganda sebagai berikut: μμ yy,xx = bb 0 + bb 1 XX 1 + bb 2 XX 2 + + bb kk XX kk Yang akan ditaksir oleh regresi berbentuk : YY = bb 0 + bb 1 XX 1 + bb 2 XX 2 + + bb kk XX kk. Adanya kriteria bahwa variabel-variabel tersebut memberikan pengaruh yang berarti atau tidak terhadap variabel tak bebas akan diuji hipotesis HH 0 melawan hipotesis tandingan HH 1 dalam bentuk: HH 0 = bb ii = 0 i = 1,2,...,k HH 1 = bb ii 0 i = 1,2,...,k 2 Untuk menguji hipotesis tersebut digunakan kekeliruan baku taksiran SS yy,1,2,3,,kk. Jadi untuk melihat kekeliruan baku dari koefisien bb ii adalah: SSbb ii = SS 2 yy,1,2,,kk xx iiii 2 1 RR iiii 2 (2.16)

22 Dimana: SS yy.1,2,,kk = (YY ii YY )² nn kk 1 xx iiii 2 = XX iiii XX ii ² rr iiii = nn ΣXX ii XX jj (ΣXX ii ) ΣXX jj nn x i 2 (ΣX i )² n x j 2 ΣX j ² Kemudian dicari perhitungan statistik t yaitu: tt ii = bb ii SSbb ii (2.17) Dari tabel distribusi t-student serta dk = (n-k-1), tt tttttttttt = tt nn kk 1, dimana kriteria pengujian diperoleh : HH 0 : ditolak jika tt ii > tt tttttttttt HH 0 : diterima jika tt ii < tt tttttttttt