Catatan Kuliah MA2081 Statistika Dasar Orang Cerdas Belajar Statistika Dosen: Khreshna I.A. Syuhada, MSc. PhD. Kelompok Keilmuan Statistika - FMIPA Institut Teknologi Bandung 2015 1
Tentang MA2081 Statistika Dasar Jadwal kuliah: Senin, 13-; Rabu, 9- Silabus: - Statistika deskriptif - Peluang - Peubah acak dan fungsi peluang/distribusi - Distribusi diskrit dan kontinu - Distribusi sampel - Statistika inferensi: selang kepercayaan - Statistika inferensi: uji hipotesis - Analisis variansi - Analisis regresi dan korelasi Buku teks: Ronald Walpole, Raymond Myers, Sharon Myers, Keying Ye, 2007, Probability and Statistics for Engineers and Scienctists. Penilaian: - Ujian 2 kali (75%); UTS - 9 Maret 2015, Pukul 13.00 - Kehadiran/PR/Tugas (15%) - Praktikum (10%) 2
Analisis Regresi (dan Korelasi) Silabus: Peubah bebas dan terikat, konsep relation, model regresi linier, penaksir kuadrat terkecil, uji koefisien, koefisien determinasi, korelasi. Ilustrasi: Artikel Seto dkk (2009) Konsep Relation Hubungan antara peubah-peubah dapat berupa hubungan yang memiliki sebab dan akibat (kausalitas). Peubah yang menjadi sebab adalah peubah bebas atau prediktor. Sedangkan peubah yang menjadi akibat adalah peubah terikat atau respon. Contoh: (a) Hubungan antara ketinggian suatu daerah dan kecepatan angin, (b) Hubungan antara tingkat kebisingan/keheningan dan stres pada pekerja, (c) Hubungan antara hasil TPA dan keberhasilan mahasiswa dalam kuliah Diskusi: - Dapatkah anda menenetukan peubah bebas dan terikat dari persoalan diatas? - Apakah hubungan diatas berlaku satu arah? dua arah? - Adakah syarat utama untuk jenis data pada hubungan diatas? Model Regresi Linier Sederhana Hubungan dua peubah, prediktor dan respon, dapat dianalisis dengan terlebih dahulu menggambarkan garis lurus atau linier. Selanjutnya, plot dari data/observasi pada garis lurus tadi dapat membawa kita mencari model yang tepat. Kita ketahui bahwa persamaan garis lurus dapat dibangun dan dapat memiliki slope bernilai positif atau negatif. Model regresi linier sederhana: Y = α + β X + ε, 3
dengan Y peubah terikat atau respon X peubah bebas atau prediktor ε adalah galat yang diasumsikan berdistribusi N(0, σ 2 ) α intercept β slope Catatan: - Nilai (sebenarnya) dari α, β tidak diketahui; nilai σ 2 umumnya diketahui - Data atau observasi: (x 1, y 1 ),..., (x n, y n ) digunakan untuk menaksir parameter tersebut Hubungan dua peubah yang dibangun dalam model regresi akan berhubungan POSI- TIF jika memiliki slope bernilai positif. Dengan kata lain, jika X membesar maka nilai Y akan membesar. Atau, sebagai contoh, jika tingkat kebisingan/keheningan makin tinggi maka stres pekerja akan meningkat. (Diskusi: Dapatkah anda menggambarkan hubungan NEGATIF pada model regresi? Berikan contoh) Penaksir Kuadrat Terkecil Parameter regresi (α, β, σ 2 ) dapat ditaksir dengan metode KUADRAT TERKECIL atau Least Square dari observasi sebagai berikut: dengan β = S xy S xx, α = ȳ β x, S xy = n x i y i n x ȳ dan S xx = i=1 n x 2 i n x 2 i=1 4
Dengan demikian, penaksir model regresi atau garis regresi atau persamaan regresinya adalah ŷ = α + β x, yang meminimumkan jumlah kuadrat galat (galat = jarak antara nilai y i dengan garis regresi) Contoh. Tingkat kebisingan/keheningan menyebabkan tingginya tingkat stres pekerja. Data yang diperoleh sbb: Observasi ke- Tgkt Bising/Hening (X) Tgkt Stres (Y ) 1 1 5 2 3 6 3 8 10 4 2 4 5 7 8 6 8 9 7 4 5 Persamaan garis regresinya adalah: ŷ = 3.28 + 0.728 x. Dari persamaan diatas, kita ketahui bahwa β > 0. Artinya garis regresi memiliki slope positif, yaitu y akan membesar apabila x membesar. Sebagian orang berpendapat bahwa persamaan garis regresi dapat digunakan untuk PREDIKSI nilai y, jika diberikan nilai x tertentu. Hal ini tidak benar karena persamaan regresi hanya dapat memberikan nilai y jika diberikan nilai x pada domainnya saja, bukan untuk PREDIKSI ke depan. Uji Hipotesis Koefisien Regresi Setelah persamaan regresi diperoleh, kita akan menguji apakah koefisen regresi, yaitu α dan β, sama dengan NOL atau tidak. Apabila β = 0 maka kita dapat mengatakan bahwa X tidak mempengaruhi Y. Sebab, berapapun nilai x, akan diperoleh nilai y yang sama. 5
Untuk keperluan uji hipotesis diatas, langkah-langkahnya sbb: 1. Hipotesis: H 0 : β = 0, H 1 : β > 0, atau H 0 : β = 0, H 1 : β < 0, atau H 0 : β = 0, H 1 : β 0 2. Tingkat signifikansi α 3. Statistik uji: T = β β 0 s.e( ˆβ) t n 2 4. Daerah kritis: Tolak H 0 jika t > t n 2 (1 α), atau... 5. Perhitungan:... 6. Kesimpulan:... Koefisien Determinasi Kita dapat menghitung koefisien determinasi, r 2, pada analisis regresi, r 2 = S2 xy S xx S yy yang menyatakan prosentase banyaknya variasi dalam nilai y yang dijelaskan oleh nilai x. Nilai r 2 yang diharapkan adalah nilai yang tinggi, kira-kira lebih dari 80%. Catatan: 0 r 2 1 Jika r 2 = 1 maka seluruh titik sampel berada di garis lurus (untuk slope positif atau negatif); Jika r 2 = 0 maka tidak ada hubungan linier antara X dan Y 6