BAB 2 LANDASAN TEORI 2.1 Konsep Dasar Statistika Statistika merupakan cara-cara tertentu yang digunakan dalam mengumpulkan, menyusun atau mengatur, menyajikan, menganalisadan member interpretasi terhadap sekumpulan data, sehingga kumpulan bahan keterangan dapat member pengertian dan makna tertentu. Seperti pengambilan kesimpulan, membuat estimasi dan juga prediksi yang akan datang. Ruang lingkup statistika meliputi statistik deduktif atau statistik deskriptif dan statistik induktif atau statistik inferensial. Statistik deskriptif terdiri dari menghimpun data, menyusun data, mengolah, menyajikan dan menganalisa data angka. Sedangkan statistik inferensial atau statistic induktif adalah meliputi teori probability, distribusi teoritis, distribusi sampling, penaksiran, pengujian hipotesa, korelasi, komparasi, dan regresi. Sumber data statistic dapat dikumpulkan langsung oleh penelitian dari pihak yang bersangkutan dan biasanya disebut data primer. Dan data juga dapat diperoleh dari pihak lain atau data yang sudah ada disebut dengan data sekunder. 2.2 Pengertian Regresi Regresi pertama kali digunakan sebagai konsep statistika oleh Sir Francis Galton (1822-1911). Beliau memperkenalkan model peramalan, penaksiran, atau penduga, yang selanjutnya dinamakan regresi, sehubungan penelitiannya terhadap tinggi badan manusia.
Galton melakukan suatu penelitian dimana penelitian tersebut dalam makalah yang berjudul Regression Towerd Mediacrety in Hereditary Stature, yang membandingkan tinggi anak laki-laki dengan tinggi badan ayahnya. Galton menukjukkan bahwa tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (Regessed) mendekati nilai tengah populasi. Dengan kata lain,anak laki-laki dari ayah yang badannya sangat tinggi cenderung lebih pendek dari pada ayahnya, sedangkan anak laki-laki dari ayah yang badannya sangat pendek cenderung lebih tinggi dari ayahnya. Penemuan ini ditulis dalam artikel berjudul Family Likeness in Stature (Proceeding of Royal Society, London, Vol. 40,1996). Menurut penjelasannya, ada suatu kecenderungan untuk rata-rata anak dari orang tua dengan tinggi tertentu bergerak menuju nilai rata-rata dari seluruh populasi. Hukum regresi universal dari Galton telah dibuktikan oleh kawannya yang bernama Karl Pearson, dengan jalan mengumpulkan lebih dari seribu catatan mengenai tinggi dari anggota keluarga. Karl Pearson menemukan bahwa rata-rata tinggi ternyata lebih besar dari pada tinggi ayahnya, jadi seolah-olah semua anak laki-laki yang tinggi dan laki-laki yang pendek bergerak menuju rata-rata tinggi dari seluruh anak laki-laki, yang menurut Galton regression to mediocrity. Dari uraian diatas dapat disimpulkan bahwa pada umumnya tinggi anak mengikuti tinggi orang tuanya. Istilah regresi padamulanya bertujuan untuk membuat peerkiraan nilai suatu variabel (tinggi badan anak) terhadap variabel lain (tinggi badan orang tua). Pada perkembangan selanjutnya analisis regresi dapat digunakan sebagai alat untuk membuat perkiraan nilai suatu variabel dengan menggunakan beberapa variabel lain yang berhubungan dengan veriabel tersebut. Jadi prinsip dasar yang harus dipenuhi dalm membangun suatu persamaan regresi adalah bahwa antara suatu variabel tidak bebas (dependent variabel) lainnya
memiliki sifat hubungan sebab akibat (hubungan kausalitas), baik didasarkan pada teori, hasil penelitian sebelumnya, maupun yang didasarkan pada penjelasan logis tertentu. 2.3 Analisis Regresi Linier Persamaan regresi (regression equation) adalah suatu persaman matematis yang mendefenisikan hubungan antara dua variabel atau lebih. Persamaan regresi yang digunakan untuk membuat taksiran mengenai variabel dependen disebut persamaan regresi estimasi, yaitu suatu formula matematis yang menunjukkan hubungan keterkaitan antara satu atau beberapa variabel yang nilainya sudah diketahui dengan satu variabel lainnya yang belum diketahui. Analisis regresi linier atau regresi garis lurus digunakan untuk: 1. Menentukan hubungan fungsional antar vaariabel dependen dengan independen. Hubungan fungsional ini dapat disebut sebagai persamaan garis regresi yang berbentuk linier` 2. Meramalkan atau menduga nilai dari satu variabel dalam hubungannya dengan variabel yang lain yang diketahui melalui persamaan garis regresinya. Analisis regresi terdiri dari dua bentuk, yaitu: 1. Analisis Regresi Linier Sederhana 2. Analisis Regresi Linier Berganda Analisis regresi sederhana adalah bentuk regresi dengan model yang bertujuan untuk mempelajari hubungan antara dua variabel, yakni variabel dependen (terikat) dan variabel independen (bebas). Sedangkan analisis regresi linier berganda adalah
bentuk regresi dengan model yang memiliki hubungan antara satu variabel dependen dengan dua atau lebih variabel independen. Variabel independen adalah variabel yang nilainya tergantung dengan variabel lainnya, sedangkan variabel dependen adalah variabel yang nilainya tergantung dari variabel lainnya. Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan baik, atau untuk mengetahui bagaimana variasi dari beberapa variabel dependen dalam suatu fenomena yang komplek. Jika, X 1, X 2,...... X k adalah variabel-variabel independen dan Y adalah variabel dependen, maka terdapat hubungan fungsional antara Y dan X, dimana variasi X akan diiringi pula oleh variasi dari Y. Jika dibuat matematis hubungan tersebut dapat dijabarkan sebagai berikut: Keterangan: Y= f(x 1, X 2,..... X k ) Y= Variabel dependen (tak bebas) X= Variabel independen (bebas) 2.3.1 Persamaan Regresi Linier Sederhana Regresi linier sederhana merupakan suatu teknik untuk mendapatkan hubungan yang dinyatakan dalam bentuk persamaan matematis yang terdiri dari variabel bebas tunggal (X) dan variabel tak bebas tunggal (Y). Dalam bentuk persamaan, regresi linier adalah: Y = a + bx Keterangan: Y adalah variabel terikat/tak bebas (dependent) X adalah variabel bebas (independent) a adalah penduga bagi intercept (α)
b adalah penduga bagi koefisien regresi (β) 2.3.2 Analisis Regresi Linier Berganda Banyak persoalan penelitian yang terjadi akibat lebih dari dua variabel atau memerlukan lebih dari satu peubah bebas dalam membentuk model regresi. Untuk memperkirakan nilai variabel tak bebas Y, memang akan lebih baik apabila ikut memperhitungkan variabel-variabel bebas lain yang ikut mempengaruhi nilai Y. Dengan demikian dimiliki hubungan antara satu variabel tidak bebas Y dengan beberapa variabel lain yang bebas X 1, X 2, dan X 3,., X k. Untuk itulah digunakan regresi linier berganda. Dalam pembahasan mengenai regresi sederhana, symbol yang digunakan untuk variabel bebasnya adalah X. Dalm regresi linier berganda, persamaan regresinya memiliki lebih dari satu variabel bebas maka perlu menambah tanda bilangan pada setiap variabel tersebut, dalam hal ini X 1, X 2,...., X k. Dalam penelitian ini, digunakan empat variabel yang terdiri dari satu variabel bebas Y dan tiga variabel X yaitu X 1, X 2, dan X 3. Maka persamaan regresi bergandanya adalah: Y i = b 0 + b 1 X 1i + b 2 X 2i + b 3 X 3i Persamaan diatas dapat diselesaikan dengan empat bentuk yaitu: Y i = b 0 n + b 1 X 1i + b 2 X 2i + b 3 X 3i Y i X 1i = b 0 X 1i + b 1 XX 2 1ii + b 2 X 1i X 2i + b 3 X 1i X 3i Y i X 2i = b 0 X 2i + b 1 X 1i X 2i + b 2 XX 2 2ii + b 3 X 2i X 3i 2 Y i X 3i = b 0 X 3i + b 1 X 1i X 3i + b 2 X 2i X 3i + b 3 XX 3ii Sistem persamaan tersebut dapat disederhanakan sedikit, apabila: xx 1 = X 1 - XX 1 xx 2 = X 2 - XX 2
xx 3 = X 3 - XX 3 y = Y - YY Maka persamaan sekarang menjadi: Y = b 1 X 1 + b 2 X 2 + b 3 X 3 Koefisien-koefien b 1, b 2, dan b 3 untuk persamaan tersebut dapat dihitung dari : Y i X 1i = b 1 X 2 1i + b 2 X 1i X 2i + b 3 X 1i X 3i Y i X 2i = b 1 X 1i X 2i + b 2 X 2 2i + b 3 X 2i X 3i 2 Y i X 3i = b 1 X 1i X 3i + b 2 X 2i X 3i + b 3 X 3i Dengan pengunaan X 1, X 2, X 3 dan y yang baru ini, maka diperroleh harga b 0, b 1, b 2, dan b 3. Harga setiap koefisien penduga yang diperoleh kemudian disubtitukan ke persamaan awal sehingga diperoleh model regresi linier berganda Y atas X 1, X 2, dan X 3. 2.4 Pengujian Hipotesis Pengujisn hipotesis merupakan salah satu tujuan yang akan dibuktikan dalam penelitian. Jika terdapat deviasi antara sampel yang ditentukan dengan jumlah populasi maka tidak menutup kemungkinan untuk terjadinya kesalahan dalam mengambil keputusan antara menolak atau menerima suatu hipotesis. Pengujian hipotesis dapat didasarkan dengan menggunakan dua hal, yaitu: tingkat signifikansi atau probabilitas (α) dan tingkat kepercayaan atau confidence interval. Didasarkan tingkat signifikansi pada umumnya orang menggunakan 0,05. Kisaran tingkat signifikansi mulai ari 0,01 sampai dengan 0,1. Yang dimaksud dengan tingkat signifikansi adalah probabilitas melakukan kesalahan tipe I, yaitu kesalahan menolak hipotesis ketika hipotesis tersebut benar. Tingkat kepercayaan pada
umumnya ialah sebesar 95%, yang dimaksud dengan tingkat kepercayaan ialah tingkat dimana sebesar 95% nilai sampel akan mewakili nilai populasi dimana sampel beraasal. Dalam melakukan uji hipotesis terdapat dua hipotesis, yaitu: H o (hipotesis nol) dan H 1 (hipotesis alternatif). H o bertujuan untuk memberikan usulan dugaan kemungkinan tidak adanya perbedaan antara perkiraan penelitian dengan keadaan yang sesungguhnya yang diteliti. Pembentukan suatu hipotesis memerlukan teori-teori maupun hasil penelitian terlebih dahulu sebagai pendukung pernyataan hipotesis yang diusulkan. Dalam uji hipotesis memerlukan teori-teori maupun hasil penelitian terlebih dahulu sebagai pendukung pernyataan hipotesis yang diusulkan. 1) H o : β 0 = β 1 =... = β k = 0 Tidak terdapat hubungan fungsional yang signifikan antara variabel bebas dengan variabel tak bebas. H 1 : Minimal satu parameter koefisien regresi β k yang 0 Terdapat hubungan fungsional yang signifikan variabel bebas dengan variabel tak bebas 2) Pilih taraf α yang diinginkan 3) Hitung statistik F hitung dengan menggunakan persamaan 4) Nilai F tabel menggunakan daftar tabel F dengan taraf signifikansi α yaitu F tabel = F (1-α)(k),(n-k-1) 5) Kriteria pengujian: jika F hitung F tabel, maka H O ditolak dan H 1 diterima. Sebaliknya Jika F hitung < F tabel, maka Ho diterima dan H 1 ditolak. 2.5 Koefisen Determinasi
Koefisien determinasi yang disimbolkan dengan RR 2 bertujua untuk mengetahui seberapa besar kemampuan variabel independen menjelaskan variabel dependen. Nilai RR 2 dikatakan baik jika berada di atas 0,5 karena nilai RR 2 berkisar antara 0 dan 1. Pada umumnya model regresi linier berganda dapat dikatakan layak dipakai untuk penelitian, karana sebagian besar variabel dependen dijelaskan oleh variabel independen yang digunakan dalam model. Koefisien determinasi dapat dihitung dari: RR 22 = bb 11 xx 1111 yy ii + bb 22 xx 2222 yy ii +. + bb kk xx kkkk yy ii (YY 11 YY 11 ) 22 Sehingga rumus umum koefisien determinasi yaitu: R 2 = JK reg n i=1 y i 2 Harga R 2 diperoleh sesuai dengan variansi yang dijelaskan oleh masing-masing variabel yang tinggal dalam regresi. Hal ini mengakibatkan variasi yang dijelaskan penduga hanya disebabkan oleh variabel yang berpengaruh saja. 2.6 Uji Korelasi Uji korelasi bertujuan untuk menguji hubungan antara dua variabel yang tidak menunjukkan hubungan fungsional (berhubungan bukan berarti disebabkan). Uji korelasi tidak membedakan jenis variabel (tidak ada variabel dependen maupun independen). Keeratan hubungan ini dinyatakan dalam bentuk koefisien korelasi. Uji korelasi terdiri dari Pearson, Spearman dan Kendal. Jika sampel data lebih dari 30
(sampel besar) dan kondisi data normal, sebaiknya menggunakan korelasi Pearson karena memenuhi asumsi parametrik. Jika jumlah sampel kurang dari 30 (sampel kecil) dan kondisi data tidak normal maka sebaiknya menggunakan korelasi Spearman atau Kendall karena memenuhi asumsi non-parametrik. 2.6.1 Koefisien Korelasi Nilai koefisien korelasi merupakan nilai yang digunakan untuk mengukur kekuatan (keeratan) suatu hubungan antar variabel` Koefisien korelasi biasanya disimbolkan dengan r. Koefisien korelasi dapat dirumuskan sebagai berikut: nn XX ii YY ii ( XX ii )( YY ii ) r = (nn XX 22 ii ( XX ii ) 22 ) (nn YY 22 ii ( YY ii ) 22 ) Sedangkan untuk mengalami korelasi antar variabel bebas dengan tiga buah variabel bebas adalah: 1) Koefisien korelasi antara X 1 dan X 2 r 12 = n X 1 X 2 ( X 1 )( X 2 ) {n X 1 2 ( X 1 ) 2 } {n X 2 2 ( X 2 ) 2 } 2) Koefisien korelasi X 1 dan X 3 r 13 = n X 1 X 3 ( X 1 )( X 3 ) {n X 1 2 ( X 1 ) 2 } {n X 3 2 ( X 3 ) 2 } 3) Koefisien Korelasi X 2 dan X 3 r 23 = n X 2 X 3 ( X 2 )( X 3 ) {n X 2 2 ( X 2 ) 2 } {n X 3 2 ( X 3 ) 2 }
Koefisien korelasi memiliki nilai antara -1 hingga +1. Sifat nilai koefisien korelasi adalah plus (+) atau minus (-) yang menunjukkan arah korelasi. Makna sifat korelasi: Korelasi Nihil Terjadi apabila perubahan paa variabel yang satu diikuti perubahan pada variabel lain dengan arah yang tidak teratur (acak). Artinya, apabila variabel yang satu meningkat, kadang diikuti dengan peningkatan dengan variabel yang lain dan kadaang diikuti dengan penurunan pada variabel yang lain. Korelasi Positif Terjadi korelasi positif apabila perubahan pada variabel yang sat diikuti dengan perubahan variabel yang lain dengan arah yang sama (berbanding lurus). Artinya, apabila variabel yang satu meningkat, maka akan diikuti dengan peningkatan varibel yang lain. Korelasi Negatif Korelasi negative terjadi apabila perubahan pada variabel yang satu diikuti dengan perubahan yang lain dengan arah yang berlawanan (berbanding terbalik). Artinya, apabila variabel yang satu meningkat, maka akan diikuti dengan penurunan pada variabel yang lain dan sebaliknya. Sifat korelasi akan menentukan arah dari korelasi. Keeratan korelasi dapat dikelompokan sebagai berikut: 1. 0,00 sampai dengan 0,20 berarti korelaasi memiliki keeratan sangat lemah. 2. 0,21 sampai dengan 0,40 berarti korelasi memiliki keeratan lemah. 3. 0,41 sampai dengan 0,70 berarti korelasi memiliki keeratan kuat. 4. 0,71 sampai dengan 0,90 berarti korelasi memiliki keeratan sangat kuat.
5. 0,91 sampai dengan 0,99 berati korelasi memiliki keeratan sangat kuat sekali. 6. 1 berarti korelasi sempurna. 2.7 Uji Koefisen Regresi Linier Berganda Untuk mengetahui bagaimana keberartian setiap variabel bebas dalam regresi, perlu diadakan pengujian tersendiri mengenai koefisien-koefisien regresi. Misalkan populasi memiliki model regresi linier berganda: µ yy.xx1.xx 2.xx nn = β 0 + β 1 X 1 + β 2 X 2 + + β k X k Yang berdasarkan sebuah ampel acak berukuran n ditaksir oleh regresi berbentuk: Ŷ = b 0 + b 1 X I + b 2 X 2 + + b k X k Akan dilakukan pengujian hipotesis dalam bentuk: H O : β i = 0, i = 1, 2,, k H 1 : β i 0, i = 1, 2,, k Untuk menguji hipotesis ini digunakan kekeliruan baku taksiran S yy.12..kk, jumlah 2 kuadarat-kuadrat X ij dengan X ij = X i - X j dan koefisien korelasi ganda masingmasing variabel bebas X dengan variabel tak bebas Y dalam regresi yaitu R i. Dengan besaran-besaran ini dibentuk kekeliruan baku koefisien b i yakni : S bi = S 2 y.12..k X 2 ij 1 R 2 i 2 Keterangan : S y.1,2..k = (Y i Ŷ) n k 1 X ij 2 = (X j - X j )
R 2 = JK reg y i 2 n i=1 Selamat hitung : t i = b i SS b i Dengan kriteria pengujian : jika t i > t tabel, maka tolak H O dan jika t i < t tabel, maka terima H O yang akan berdistribusi t dengan derajat kebebasan dk = (n-k-1) dan t tabel = t (n-k-1,α/2).