REGRESI LINEAR SEDERHANA DAN KORELASI 1. Model Regresi Linear 2. Penaksir Kuadrat Terkecil 3. Prediksi Nilai Respons 4. Inferensi Untuk Parameter-parameter Regresi 5. Kecocokan Model Regresi 6. Korelasi Utriweni Mukhaiyar MA 2181 Analisis Data
Tujuan 2 2. Melakukan prediksi terhadap nilai suatu variabel, misalkan Y, berdasarkan nilai variabel yang lain, misalkan X, dengan menggunakan model regresi linier (interpolasi). i l i
f(x) Suhu (X) Gula yang Dihasilkan (Y) X menentukan Y prediktor respons peubah acak 3 bk bukan peubah acak Memiliki distribusi
Observasi 1 2 3 n X X 1 X 2 X 3 X n Y Y 1 Y 2 Y 3 Y n 1 Variabel yang nilainya mempengaruhi variabel yang lainnya. 2 Variabel yang kejadiannya lebih dahulu terjadi. 3 Variabel yang variansinya terkecil 4
MODEL REGRESI LINEAR SEDERHANA Y X e i 0 1 i i - 1 dan 0 merupakan parameter-parameter model yang akan ditaksir - e i adalah galat pada observasi ke-i (acak) 5
Sumber Galat 6 1. Ketidakmampuan model regresi dalam memodelkan hubungan prediktor dan respons dengan tepat 2. Ketidakmampuan peneliti dalam melakukan pengukuran dengan tepat 3. Ketidakmampuan model untuk melibatkan semua variabel blprediktor dk
Penaksir Kuadrat Terkecil - 1 dan 0 ditaksir dengan metode kuadrat terkecil (least square) - Asumsi-asumsi : 1. Ada pengaruh X terhadap Y 7 2. Yi 0 1 Xi ei, untuk i = 1, 2,..., n 3. Nilai harapan dari e i adalah 0, atau E[ e i ] = 0 4. Variansi i dari e i, sama untuk tk semua i = 1, 2,, n 5. e i berdistribusi normal untuk semua i = 1, 2,, n 6. e 1,e 2,...,e n saling bebas (independen)
Misalkan b 1 adalah taksiran bagi 1 dan b 0 adalah taksiran bagi 0. Maka taksiran bagi model regresi adalah Yˆ b b X i 0 1 Kriteria penaksiran kuadrat terkecil adalah meminimumkan n 2 ei i1 terhadap b 0 dan b 1, dengan e ˆ. i Yi Yi Yi b0 b1xi i 8
Diperoleh b 1 JK JK XY XX X XY Y n i i i1 n Xi X i1 2 b Y bx 0 1 Sedangkan taksiran untuk variansi galat acak adalah ˆ n i i 2 JKG i1 Y Yˆ 2 n2 n2 9
Suhu (X) 1 1.11 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 Gula yg dihasilkan (Y) 8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5 Sumber: Walpole and Myers, 1989 e i 10
n = 11 1 n 1 n i n i1 n i1 x x 1.5 y y 9.13 i b 1 n i i i1 2 n xi x i1 x xy y 1.8091 b0 Y bx 1 6.4136 Yˆ 6.4136 1.8091X 11 Model persamaan regresi
Prediksi Nilai Respons 12 e y yˆ Suhu (x i ) Gula yg dihasilkan (y i ) Prediksi (y model ˆ i) i i i 1 8.1 8.22-0.12 1.1 7.8 8.40-0.60 1.2 8.5 8.58-0.08 1.3 9.8 8.77 1.03 1.4 9.5 8.95 0.55 1.5 8.9 2 1 ˆ 9.13-0.23 y ˆ 2 y 0.4 9 1.6 8.6 i i 9.31-0.71 1.7 10.2 9.49 0.71 1.8 9.3 9.67-0.37 1.9 9.2 9.85-0.65 2 10.5 10.03 0.47 Tki Taksiran variansi i galat acak
Misalkan suhu proses (X) adalah 1.55 satuan suhu. Maka prediksi banyaknya gula yang dihasilkan pada suhu tersebut t adalah ŷ 6.4136 1.8091x = 6.4136 + 1.8091(1.55) =9.217705 13
ASUMSI KENORMALAN 1 Asumsie i berdistribusi normal untuk semua i = 1, 2,, n Y i beristribusi normal untuk i 1 2 2 semua i = 1, 2,, n 3 b 0 dan b 1 berdistribusi normal 14
INFERENSI UNTUK PARAMETER 0 T= 0 ˆ b 2 n x i i1 0 0 / njk XX berdistribusi t dengan derajat kebebasan n-2. Selang kepercayaan (1-α) untuk 0 : n n 2 2 0 t ˆ /2 XX 0 ˆ 0 xi n t/2 xi n XX i1 i1 b / JK b / JK 15 t /2 adalah nilai distribusi t dengan derajat kebebasan n-2
INFERENSI UNTUK PARAMETER 1 b 1 1 T= 1 ˆ/ JKXX berdistribusi t dengan derajat kebebasan n-2. Selang kepercayaan (1-α) untuk 1 : b t ˆ b JK /2 /2 1 1 1 XX t JK ˆ XX 16 t /2 adalah nilai distribusi t dengan derajat kebebasan n-2
PENGUJIAN PARAMETER REGRESI Rumusan Hipotesis H 0 : β 0 = 0 H 0 : β 1 = 0 H 1 : β 0 0 H 1 : β 1 0 b0 t 0 b 1 n 2 xi t1 ˆ ˆ i1 njk XX JK XX 17
SELANG PREDIKSI Misalkan nilai respons Y untuk X = X 0 adalah Y 0 0, dan misalkan adalah prediksi model regresi bagi Y 0. Maka Ŷ-Y ˆ 0 0 T ˆ 1+(1/n)+[(x x) 2 / JK ] 0 XX berdistribusi t dengan derajat kebebasan n-2. Selang prediksi (1 α) bagi y 0 adalah 1 (x x) 1 (x x) yˆ t ˆ 1+ + y yˆ t ˆ 1+ + 2 2 0 0 0 /2 0 0 /2 n JK XX n JK XX 18
CONTOH 1 SELANG KEPERCAYAAN 1- TINJAU CONTOH SEBELUMNYA (2.26)(0.4) (2.26)(0.4) 1.8091 1 1.8091 1.1 1.1 Selang kepercayaan 95% untuk β 1 : b 1 =1,8091 b 0 =6,4136 Selang kepercayaan 95% untuk β 0 : 19 25.85 25.85 6.4136 (2.26)(0.4) 0 6.4136 (2.26)(0.4) (11)(1.1) (11)(1.1)
CONTOH 2 UJI HIPOTESIS t 0 > t 0.025 & t 1 > t 0.025 maka masing-masing H 0 ditolak Kesimpulan β 0 dan β 1 tidak dapat diabaikan 20
Kecocokan Model Regresi Salah satu alat ukur untuk melihat apakah model regresi yang diperoleh sudah memadai adalah koefisien determinasi yaitu 2 n 2 (yˆ i y) JK R i=1 n JKT 2 (yi y) 2 i=1 R = =, dengan 0 R 1 Besaran R 2 menunjukkan proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang diperoleh 21
UJI KEBAIKAN MODEL H 0 : Model regresi yang diperoleh tidak memadai H 1 : Model memadai Statistik uji f JKR 1 ˆ n i i= (yˆ y) ˆ 2 Tolak H 0 pada tingkat keberartian α jika f > f,(1,n-2), dimana f,(1,n-2) adalah nilai distribusi F dengan derajat kebebasan 1 dan n 2. 22
CONTOH 3 Untuk contoh sebelumnya diperoleh R 2 = 0,499. Artinya proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang diperoleh adalah 49.9% Uji kebaikan model 23 n i 2 (yˆ i y) JK 1 8.99 ˆ i= f R ˆ Untuk α = 5%, titik kritis f 005(19) 0.05,(1,9) = 5,12 f > f 0.05,(1,9), model memadai.
Korelasi Mengukur hubungan linear dua peubah acak Misalkan X dan Y adalah dua peubah acak, maka korelasi antara X dan Y dinyatakan dengan XY E(X )(Y ) X X Y Y 24
25
Gambar 1 Korelasi positif Gambar 2 Korelasi negatif 26 Gambar 3 Korelasi nol Gambar 4 Korelasi nol
KORELASI SAMPEL Korelasi dapat ditaksir dengan koefisien korelasi sampel, yaitu r XY JK JK XX XY JK n i=1 YY (X X)(Y Y) i n n 2 2 (Xi X) (Yi Y) i=1 i=1 i 27
CONTOH 4 Data dua peubah acak berat badan bayi (kg) dan ukuran dada bayi (cm) berat (kg) ukuran dada (cm) 2.75 29.5 2.15 26.3 4.41 32.2 5.52 552 36.5 3.21 27.2 4.32 27.7 2.31 28.3 4.3 30.3 3.71 371 28.7 28 Rata-rata berat = 3.63, Rata-rata ukuran dada = 29.63
(cm) ukuran 38 36 34 32 30 28 26 24 22 20 1 2 3 4 5 6 berat (kg) 29 9 i i i=1 (X X)(Y Y) r 0.78 9 9 2 2 (Xi X) (Yi Y) i=1 i=1
Referensi 30 Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika. Walpole, Ronald E. Dan Myers, Raymond H., Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung: Penerbit ITB, 1995.