1/8/01 KORELASI DAN REGRESI Sinollah, S.Sos, M.AB Dalam banyak keputusan manajemen terutama dalam dunia usaha, adalah perlu untuk membuat ramalan nilai-nilai dari variable yang tidak diketahui. Perencanaan anggaran perusahaan tahun mendatang memerlukan ramalan tentang nilai penjualan. Manajer bagian produksi harus membuat ramalan berapa banyak bahan dasar yang terbuang selama pengerjaan untuk dapat menentukan berapa banyak bahan dasar yang akan dipesan. Perusahaan listrik harus meramalkan permintaan akan jasa-jasa pemakaian listrik tahun-tahun akan datang dalam hal akan memutuskan berapa besar kapasitas generator yang akan dibangun. Manajer sumberdaya manusia perlu mengetahui apakah Produktivitas karyawan dapat diramalkan dari hasil tes Seleksi dan lamanya latihan, dan sebagainya. 1
1/8/01 Dalam pembahasan ini kita akan mempelajari bagaimana pengetahuan tentang hubungan antara dua variable dapat dipraktekkan, sehingga informasi dari satu variable dapat digunakan untuk memperkirakan nilai dari variable lain. Teknik statistik tentang hubungan antara dua variabel tersebut dinamakan korelasi dan regresi. Regresi akan menjelaskan kepada kita bagaimana satu variable dihubungkan dengan variable lain, dimana hubungan tersebut dinyatakan dalam bentuk persamaan dan nilai dari satu variable yang diketahui atau variable yang digunakan untuk meramalkan (predictor) dapat digunakan untuk menduga nilai variable lain yang tidak diketahui atau variable yang diramalkan (kreterium). Misalnya manajer pemasaran dapat memperkirakan penjualan (kreterium) yang akan dicapai berdasarkan besarnya biaya advertensi (predictor). Sedangkan korelasi akan menjelaskan kepada kita tentang besarnya derajat hubungan antara dua variable. KORELASI Korelasi (correlation) adalah salah satu teknik statistik yang digunakan untuk mencari hubungan antara dua variabel atau lebih yang sifatnya kuantitatif. Misalnya kita ingin menyelidiki apakah ada hubungan antara penetapan harga dengan jumlah yang diminta, biaya advertensi yang dikeluarkan dengan hasil penjualan barang yang diadvertensikan, banyaknya jam kerja dengan besarnya penghasilan dsb. Hubungan antara dua variabel dapat hanya karena kebetulan saja, dapat pula memang merupakan hubungan sebab akibat. Dalam statistik yang dipelajari adalah hubungan yang bersifat tidak kebetulan. Dua variabel dikatakan berkorelasi apabila perubahan pada variabel yang satu akan diikuti perubahan pada variabel yang lain secara teratur, dengan arah yang sama atau dapat pula dengan arah yang berlawanan. Bila dua variabel tersebut dinyatakan sebagai variabel X dan variabel Y, maka apabila variabel X berubah, variabel Y pun berubah dan sebaliknya.
1/8/01 Arah hubungan antara dua variabel (direction of correlation) dapat dibedakan menjadi: 1. Direct correlation (Positive Correlation) Perubahan pada salah satu variabel diikuti perubahan variabel yang lain secara teratur dengan arah/gerakan yang sama. Kenaikan nilai variabel X selalu diikuti kenaikan nilai variabel Y dan sebaliknya turunnya nilai X selalui diikuti oleh turunnya nilai variabel Y. misalnya : hubungan antara penetapan harga dengan jumlah yang ditawarkan.. Inverse Correlation (Negative Correlation) Perubahan pada salah satu variabel diikuti perubahan variabel yang lain ssecara teratur dengan arah/gerakan yang berlawanan. Nilai variabel X yang tinggi selalu disertai dengan nilai variabel Y yang rendah dan sebaliknya variabel X yang rendah nilainya selalu diikuti nilai variabel Y yang tinggi. Misalmya : hubungan antara penetapan harga dengan jumlah yang diminta. 3. Korelasi Nihil (Tidak Berkorelasi) Kenaikan nilai variabel yang satu kadang-kadang disertai dengan turunnya nilai variabel yang lain atau kadang-kadang diikuti kenaikan variabel yang lain. Arah hubungannya tidak teratur kadang-kadang dengan arah yang sama kadang-kadang berlawanan. Besar kecilnya hubungan dinyatakan dalam bilangan. Bilangan yang menyatakan besar kecilnya hubungan tersebut disebut koefisien korelasi yang bergerak antara 0,000 sampai +1,000 atau diantara 0,000 sampai 1,000, tergantung kepada arah korelasinya (nihil, positif apa negatif). Koefisien yang bertanda positif menunjukkan arah korelasi yang positif. Koefisien yang bertanda negatif menunjukkan arah korelasi yang negatif. Adapun koefisien yang bernilai 0,000 menunjukkan tidak adanya korelasi antara X dan Y. 3
1/8/01 Jika dua variable mempunyai koefisien korelasi sebesar +1,000 atau - 1,000, kedua variable tersebut dikatakan mempunyai korelasi yang sempurna. Yang pertama disebut korelasi yang sempurna positif dan sebaliknya. Dalam korelasi yang sempurna positif, tiap-tiap kenaikan variable X selalu disertai kenaikan yang seimbang (proporsional) pada nilai-nilai variable Y. Sebaliknya dalam korelasi yang sempurna negatif, tiap-tiap kenaikan variable X selalu diserta penurunan yang seimbang pada nilai variable Y. Korelasi Product Moment (Karl Pearson) Korelasi dari Pearson, atau juga disebut Korelasi Momen Tangkar mendasarkan perhitungannya pada angka-angka kasar seperti apa adanya. Untuk menghitung korelasi product moment dapat dilakukan dengan rumus deviasi dan rumus angka kasar. r xy Rumus deviasi: = Σxy ( Σx )( Σy ) Rumus angka kasar: ( ΣX )( ΣY ) ΣXY r = N xy ( ΣX ) ( ΣΥ) ΣX ΣΥ N N Ket: rxy = koefisien korelasi x = deviasi X (X M) y = deviasi Y (Y M) 4
1/8/01 Contoh perhitungan: Tabel. contoh perhitungan dengan rumus deviasi Subjek X Y x x y y xy 1 130 0-9.5 870.5-7.6 57.76 4. 13 4-7.5 756.5-3.6 1.96 99 3 15 8-7.5 56.5 0.4 0.16-3 4 14 3-17.5 306.5-4.6 1.16 80.5 5 184 37 4.5 600.5 9.4 88.36 30.3 6 190 3 30.5 930.5 4.4 19.36 134. 7 150 5-9.5 90.5 -.6 6.76 4.7 8 170 3 10.5 110.5-4.6 1.16-48.3 9 181 9 1.5 46.5 1.4 1.96 30.1 10 164 35 4.5 0.5 7.4 54.76 33.3 Jumlah 1595 76 0 40.5 0 84.4 805 M x = 1595/10 = 159,5 M y = 76/10 = 7,6 Rxy = 805 = 0.7363 (40.5)(84.4) Tabel. contoh perhitungan dengan rumus kasar Subjek X Y X Y XY 1 130 0 16900 400 600 13 4 1744 576 3168 3 15 8 3104 784 456 4 14 3 0164 59 366 5 184 37 33856 1369 6808 6 190 3 36100 104 6080 7 150 5 500 65 3750 8 170 3 8900 59 3910 9 181 9 3761 841 549 10 164 35 6896 15 5740 Jumlah 1595 76 58605 790 4487 5
1/8/01 (1595)(76) 44.87 10 805 r xy = = = 0. 7363 (1595) (76) (40)(84.4) 58.605 790 10 10 Untuk menguji apakah harga rxy = 0,7363 itu signifikan atau tidak, kita dapat berkonsultasi dengan tabel r teoritik dengan N = 10 atau derajat kebebasan db = 10. Dari tabel r teoritik dengan N = 10 (atau db = 8) akan kita temukan harga r teoritik pada taraf signifikansi 1% atau rt1% = 0,765 dan rt5% = 0,63. karena harga rt5% < rxy < rt1% maka kita nyatakan signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X dan Y signifikan. Resp Berat Bada(X) Kelincahan(Y) 1 4 8 3 30 3 6 4 5 8 5 0 8 6 4 9 7 3 7 Carilah koefisien korelasinya. Apakah koefisien tersebut signifikan atau tidak? 6
1/8/01 Tujuan utama dari analisis regresi adalah mendapatkan ramalan dari satu variable (kreterium) dengan menggunakan variable lain yang diketahui (predictor). Korelasi antara variable kreterium dengan variable predictor dapat dilukiskan dalam satu garis. Garis tersebut disebut garis regresi. Garis regresi mungkin merupakan garis lurus (linier), mungkin merupakan garis lengkung (parabolic, hiperbolik dsb). Dalam kesempatan ini dibicarakan garis yang linier saja. Suatu garis dapat dinyatakan dalam persamaan matematik. Persamaan ini disebut persamaan regresi linier. Dengan mengetahui persamaan regresi ini peramalan nilai Y (kreterium) dapat dibuat berdasarkan nilai X (predictor) tertentu. Untuk garis linier dengan satu variable predictor persamaannya adalah: Y = ax + K Dimana: Y = kriterium X = predictor a = bilangan koefisien preditktor K = bilangan konstans Tugas pokok regresi linier adalah: 1) mencari korelasi antara kreterium dengan predictor, ) menguji apakah korelasi itu signifikan atau tidak, dan 3) mencari persamaan garis regresinya. 7
1/8/01 Contoh: misalkan suatu Penyelidikan ingin memastikan apakah berat badan orang pada kelompok umur tertentu dapat diramalkan dari tinggi badan? Dalam penyelodokan itu dikumpulkan data tinggi badan dan berat badan sepuluh orang sebagai seperti nampak pada tabel 100 berikut: Subjek Tinggi Badan (cm) X Berat Badan (kg) Y X Y XY 1 168 63 84 3969 10584 173 81 999 6561 14013 3 16 54 644 916 8748 4 157 49 4649 401 7693 5 160 5 5600 704 830 6 165 6 75 3844 1030 7 163 56 6569 3136 918 8 170 78 8900 6084 1360 9 168 64 84 4096 1075 10 164 61 6896 371 10004 Jumlah 1650 60 7460 3943 1073 Korelasi antara X dan Y dapat kita cari melalui teknik korelasi product moment dari Pearson, dengan rumus umum (deviasi). Telah diketahui: Σxy = ΣΧΥ Σx Σy r xy = = ΣΧ = ΣΥ Σxy ( Σx )( Σy ) ( ΣΧ )( ΣΥ ) ( 1650 )( 60 ) ( ΣΧ ) ( 1650 ) Ν 10 ( ΣΥ ) ( 60 ) Ν Ν = = 1073 = 7460 = 3943 10 = 99 43 = 0,946 (10)(99) = 10 = 43 8
1/8/01 Untuk menguji apakah harga rxy = 0,946 itu signifikan kita dapat berkonsultasi dengan tabel r teoritik dengan N = 10 atau derajat kebebasan db = 10. Dari tabel r teoritik dengan N = 10 (atau db = 8) akan kita temukan harga r teoritik pada taraf signifikansi 1% atau rt1% = 0,765 dan rt5% = 0,63. karena harga rt5% < rxy < rt1% maka kita nyatakan signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X dan Y signifikan. Kesimpulannya adalah bahwa korelasi antara tinggi badan dan berat badan sangat signifikan. Dengan harga korelasi antara tinggi badan dan berat badan yang sangat signifikan tersebut kita mempunyai landasan untuk meramalkan berat badan dari tinggi badan. Karenanya kita dapat membuat garis regresi untuk prediksi dengan rumus garis linier yang sudah ada, yaitu: y = ax = K. Untuk mengisi persamaan regresi itu harga koefisien predictor (harga a) dan harga bilangan konstan K harus kita ketemukan lebih dahulu. Harga-harga a dan K itu dapat kita cari melalui dua jalan: yaitu dengan metode skor kasar dan dengan metode skor deviasi. Dengan metode skor kasar, harga a dan K dapat dicari dari persamaan: ΣXY = a ΣX + KΣX ΣY = a ΣX + NK Jika data yang sudah kita ketahui kita masukkan ke dalam rumusrumus tersebut: (1) 1073 = 7,460 a + 1650K () 60 = 1650 a + 10 K 9
1/8/01 Dengan penyelesaian persamaan secara simultan akan kita temukan (dengan membagi persamaan 1 dengan 1.650 dan persamaan dengan 10). (3) 6 = 165,13 a + K (4) 6 = 165 a + K (5) 0,6 = 0,13 a a = (4) 6 = (165) + K K = - 68 Dengan harga a = dan K = -68, persamaan garis regresinya adalah: Y = ax K Y = X 68 Dengan metode skor deviasi harga-harga a dan K dapat kita cari dari persamaan: y = ax Σxy Υ dimana: y = Y, x = X -Χ dan a =, maka: Σxy = 43 Σx Σx = 10 a = 43/10 =,05 Y =,05x dari data yang dikumpulkan dapat dicari: Υ ΣΥ 60 = = = 6 ΣΧ 1650 Ν 10 Χ = = = 165 Ν 10 10
1/8/01 Karena itu, untuk persamaan garis regresi y = ax atau Y - = a (X - ), adalah: Y 6 = (,05) (X 165) Y =,05X 338,5 + 6 =,05X 76,5 Υ Χ Dengan metode skor kasar kita dapat menemukan persamaan garis regresinya, yaitu: Y = X 68, sedang dengan metode skor deviasi kita menemukan persamaan garis regresinya Y =,05X 76,5. Seharusnya dengan kedua metode itu kita tidak menemukan hasil perhitungan yang berbeda. Perbedaan hasil perhitungan garis regresi yang kita temukan itu semata-mata disebabkan karena ketelitian perhitungan saja. Resp Berat Bada(X) Kelincahan(Y) 1 4 8 3 30 3 6 4 5 8 5 0 8 6 4 9 7 3 7 Carilah koefisien regresinya. Apakah koefisien tersebut signifikan atau tidak? 11
1/8/01 Tabel r Product Moment Pada Sig.0,05 (Two Tail) N r N r N r N R 1 0.997 31 0.344 61 0.48 91 0.04 0.95 3 0.339 6 0.46 9 0.03 3 0.878 33 0.334 63 0.44 93 0.0 4 0.811 34 0.39 64 0.4 94 0.01 5 0.754 35 0.35 65 0.4 95 0. 6 0.707 36 0.3 66 0.39 96 0.199 7 0.666 37 0.316 67 0.37 97 0.198 8 0.63 38 0.31 68 0.35 98 0.197 9 0.60 39 0.308 69 0.34 99 0.196 10 0.576 40 0.304 70 0.3 100 0.195 11 0.553 41 0.301 71 0.3 101 0.194 1 0.53 4 0.97 7 0.9 10 0.193 13 0.514 43 0.94 73 0.7 103 0.19 14 0.497 44 0.91 74 0.6 104 0.191 15 0.48 45 0.88 75 0.4 105 0.19 16 0.468 46 0.85 76 0.3 106 0.189 17 0.456 47 0.8 77 0.1 107 0.188 18 0.444 48 0.79 78 0. 108 0.187 19 0.433 49 0.76 79 0.19 109 0.187 0 0.43 50 0.73 80 0.17 110 0.186 1 0.413 51 0.71 81 0.16 111 0.185 0.404 5 0.68 8 0.15 11 0.184 3 0.396 53 0.66 83 0.13 113 0.183 4 0.388 54 0.63 84 0.1 114 0.18 5 0.381 55 0.61 85 0.11 115 0.18 6 0.374 56 0.59 86 0.1 116 0.181 7 0.367 57 0.56 87 0.08 117 0.18 8 0.361 58 0.54 88 0.07 118 0.179 9 0.355 59 0.5 89 0.06 119 0.179 30 0.349 60 0.5 90 0.05 10 0.178 1
1/8/01 13