UJIAN AKHIR SEMESTER STATISTIKA DAN PROBABILITAS Senin, 19 Desember 016 100 menit [ Boleh membuka buku Tidak boleh memakai komputer ] SOAL 1 [SO A-3, BOBOT 40%] Hasil pengukuran sampel di beberapa sekolah dan universitas terhadap kondisi fisik siswa/ mahasiswa menghasilkan data amatan seperti disajikan pada tabel di bawah ini. Nomor data Usia [tahun] Tinggi badan [cm] 1 1 155 19 169 3 18 171 4 0 173 5 17 167 6 16 161 7 15 158 8 14 170 9 13 156 (a) Temukanlah persamaan hubungan antara kedua variabel dengan teknik regresi linear, metode kuadrat terkecil. [Bobot 0%] (b) Berapakah koefisien korelasi hubungan linear kedua variabel tersebut? [Bobot 10%] (c) Apakah yang dapat Saudara simpulkan dari hubungan kedua variabel tersebut? [Bobot 10%] PENYELESAIAN (a) Regresi linear [bobot 0%] Jika n adalah ukuran sampel, usia siswa/mahasiswa dinyatakan sebagai variabel X (x x, x,, x ) dan tinggi badan siswa dinyatakan sebagai variabel Y (y y, y, y ), maka hubungan antara kedua variabel, yang diperoleh dari regresi linear, dapat dinyatakan dalam persamaan linear di bawah ini: Y a + a X Variabel Y atau sering pula disimbolkan dengan Y adalah tinggi badan siswa sebagai fungsi usia siswa. Nilai a 0 dan a 1 dalam persamaan regresi dicari dengan persamaan berikut: a n x y x n x x y dan a Y a X Dalam persamaan di atas, n adalah jumlah data, Y dan X adalah tinggi badan rata-rata dan usia ratarata. Untuk menghemat penulisan, indeks pada operator penjumlahan tidak dituliskan, sehingga x dituliskan sebagai x. Hitungan regresi linear dengan metode kuadrat terkecil disajikan pada Tabel 1 pada halaman setelah halaman ini. Dari Tabel 1, diperoleh informasi sebagai berikut: jumlah siswa, n 9; tinggi badan rata-rata, Y y n 1480 9 164.4 cm; usia rata-rata, X x n 144 9 16 tahun. Penyelesaian Soal UAS Statistika dan Probabilitas 016119.docx hlm 1 dari 7
Koefisien π dan π pada persamaan kurva regresi dihitung sebagai berikut: π π₯ π¦ π₯ π₯ π¦ 9 380 144 1480.03 cm/tahun. π₯ 9 364 144 π π π π 164.4.03 16 131.9 cm. Perhatikan bahwa usia dan tinggi badan siswa memiliki satuan. Koefisien a0 bersatuan [cm] dan a1 bersatuan [cm/tahun]. Hubungan antara tinggi badan dan usia siswa yang diperoleh dari regresi linear antara kedua variabel adalah: π 131.9 +.03 π atau π¦ 131.9 +.03 π₯. Istiarto Departemen Teknik Sipil dan Lingkungan FT UGM http://istiarto.staff.ugm.ac.id/ TABEL 1 HITUNGAN REGRESI LINEAR HUBUNGAN ANTARA TINGGI BADAN DAN USIA SISWA DENGAN METODE KUADRAT TERKECIL i 1 3 4 5 6 7 8 9 Σ ππ [tahun] 1 19 18 0 17 16 15 14 13 144 ππ [cm] 155 169 171 173 167 161 158 170 156 1480 ππ π [tahun] 144 361 34 400 89 56 5 196 169 364 ππ ππ [tahun.cm] 1860 311 3078 3460 839 576 370 380 08 380 (b) Koefisien korelasi [bobot 10%] Koefisien korelasi, r, dinyatakan dalam persamaan berikut: π π π π π¦ π π¦ π¦ π¦ π atau π π₯ π¦ π₯ Dalam persamaan di atas, operator penjumlahan π₯ dibaca π₯ π₯ π¦ π¦ π¦ π₯ dan indeks i 1,,, n. Hitungan untuk mendapatkan nilai St dan nilai Sr dilakukan secara tabulasi dalam Tabel di bawah ini. Hitungan mengacu kepada persamaan r di atas yang di sebelah kiri. TABEL HITUNGAN KOEFISIEN KORELASI ANTARA TINGGI BADAN DAN USIA SISWA ππ [tahun] 1 19 18 0 17 16 15 14 13 i 1 3 4 5 6 7 8 9 ππ [cm] 155 169 171 173 167 161 158 170 156 πΊπ ππ π π [cm] 88.36 1.16 43.56 73.96 6.76 11.56 40.96 31.36 70.56 388.4 π [cm] 156.3 170.5 168.5 17.5 166.4 164.4 16.4 160.3 158.3 πΊπ ππ π π [cm] 1.69.5 6.5 0.5 0.36 11.56 19.36 94.09 5.9 141.10 π π π π 388.4 141.10 0.80. 388.4 Penyelesaian Soal UAS Statistika dan Probabilitas 016119.docx hlm dari 7
Akar kuadrat dapat bernilai positif atau negatif. Koefisien korelasi dapat bernilai positif atau negatif. Karena gradien kurva regresi, a, bernilai positif, atau dengan kata lain tinggi badan siswa berbanding lurus dengan usia siswa, maka koefisien korelasi bernilai positif, r 0.80. Gambar 1 menyajikan hubungan antara usia dan tinggi badan siswa secara grafis. Gambar ini tidak wajib dibuat karena soal tidak memintanya. Salah satu data tampak berada jauh dari kurva regresi linear. Si siswa ini berusia 14 tahun dan memiliki tinggi badan 170 centimeter. Datum seperti ini dikenal sebagai outlier. Adanya outlier dapat disebabkan oleh sifat keragaman (variabilitas) sampel atau diakibatkan oleh kesalahan pengukuran. Apabila penyebab outlier diketahui, maka perlakuan terhadapnya dapat diputuskan. Jika outlier disebabkan oleh kesalahan pengukuran, maka outlier dikeluarkan dari data dan tidak diikutkan dalam pengolahan data. Sebaliknya, jika pengukuran sudah benar, maka outlier tetap diikutkan dalam pengolahan data. Tinggi badan siswa [cm] 174 17 170 168 166 164 16 160 158 156 outlier 154 11 1 13 14 15 16 17 18 19 0 1 Usia siswa [tahun] GAMBAR 1 HUBUNGAN LINEAR ANTARA USIA SISWA DALAM SATUAN TAHUN DAN TINGGI BADAN SISWA DALAM SATUAN CENTIMETER (c) Hubungan antara usia dan tinggi badan [bobot 10%] kurva regresi linear tinggi badan.03 (usia) + 131.9 Tinggi badan dan usia siswa menunjukkan hubungan linear yang erat, walau linearitas hubungan antara kedua variabel tidak sepenuhnya sempurna. Nilai koefisien korelasi 0.80 cukup mendukung simpulan yang menyatakan bahwa tinggi badan siswa berbanding lurus dengan usia siswa. Ini tampak jelas pada tampilan grafis titik-titik data (Gambar 1). Keberadaan sebuah outlier (14,170) mengurangi keeratan hubungan linear antara kedua variabel. SOAL [SO B-4, BOBOT 60%] Angka-angka di bawah ini adalah sampel kelembaban udara relatif, dalam satuan persen, yang diperoleh dari sebuah stasiun cuaca. 88 9 79 86 81 77 8 83 87 94 81 90 85 70 84 78 74 85 75 85 75 78 80 8 78 76 90 85 71 83 90 73 87 89 77 81 94 78 84 81 Penyelesaian Soal UAS Statistika dan Probabilitas 016119.docx hlm 3 dari 7
(a) Buatlah tabel frekuensi dengan rentang kelas 4%, batas bawah rentang kelas pertama adalah 68% (rentang kelas pertama 68-7). [Bobot 10%] (b) Hitunglah nilai rata-rata, median, dan modus berdasarkan sampel kelembaban udara dengan memakai tabel frekuensi. [Bobot 10%] (c) Hitunglah nilai simpangan baku sampel kelembaban udara dengan memakai tabel frekuensi. [Bobot 10%] (d) Hitunglah rentang keyakinan kelembaban udara rata-rata populasi dengan tingkat keyakinan 95%. [Bobot 15%] (e) Ujilah hipotesis yang menyatakan bahwa kelembaban udara rata-rata populasi adalah 80% dengan tingkat keyakinan 90%. [Bobot 15%] PENYELESAIAN (a) Tabel frekuensi [bobot 10%] Kelembaban udara adalah variabel random kontinu. Data kelembaban udara tersebut adalah data sampel, bukan data populasi. Tabel frekuensi disajikan pada Tabel 3 di bawah ini. Kelembaban udara disimbolkan dengan notasi X. TABEL 3 KELEMBABAN UDARA RELATIF DI SEBUAH STASIUN CUACA i Kelembaban udara, X [%] Frekuensi Frekuensi Kelas x i f i kumulatif f i x i [%] f i x i [% ] 1 68-7 70 140 9800 7-76 74 5 7 370 7380 3 76-80 78 8 15 64 4867 4 80-84 8 10 5 80 6740 5 84-88 86 8 33 688 59168 6 88-9 90 5 38 450 40500 7 9-96 94 40 188 1767 Σ 40 380 7043 Jumlah data dalam sampel kelembaban udara adalah f 40. Operator penjumlahan f dibaca f. Data kelembaban udara dalam tabel frekuensi di atas dapat pula disajikan dalam bentuk grafik batang atau histogram seperti disajikan pada Gambar. Frekuensi 1 10 8 6 4 0 68-7 7-76 76-80 80-84 84-88 88-9 9-96 Kelembaban udara relatif [%] GAMBAR KELEMBABAN UDARA RELATIF DI SUATU STASIUN CUACA Penyelesaian Soal UAS Statistika dan Probabilitas 016119.docx hlm 4 dari 7
Grafik ini tidak wajib dibuat karena soal tidak memintanya. Perhatikan bentuk kurva pada gambar tersebut. Tampak jelas bahwa bentuk kurva mirip dengan kurva pdf distribusi normal. Dengan demikian, sampel kelembaban udara tersebut berdistribusi normal. (b) Nilai rata-rata, median, modus [bobot 10%] Nilai rata-rata dihitung dengan bantuan tabel frekuensi, yaitu dengan menambahkan satu kolom yang berisi nilai frekuensi dikalikan dengan nilai data, f x. Kelembaban udara rata-rata adalah: X f x f 380 40 8% Nilai rata-rata dapat pula dibaca pada histogram (Gambar ). Karena histogram data kelembaban udara mirip dengan kurva pdf distribusi normal, maka kelembaban udara rata-rata berada di tengah, yaitu dalam kelasa 80-84 [%]. Jadi, kelembaban udara rata-rata adalah 8%. Nilai median adalah nilai data yang berada di tengah dalam deret data yang diurutkan dari kecil ke besar atau dari besar ke kecil. Tabel 3 telah mengatur data dalam deret dari kecil ke besar. Karena jumlah data adalah 40, maka nilai median adalah nilai yang berada di tengah antara data ke-0 dan ke-1. Dari histogram data (Gambar ) dan kolom frekuensi pada tabel frekuensi data (Tabel 3), tampak bahwa data berdistribusi secara simetris dengan sumbu simetri kelas 80-84 [%]. Nilai median kelembaban udara, dengan demikian, adalah 8%. Nilai median dapat pula dihitung dengan persamaan berikut: X "#$%& x + n f x f x Dalam persamaan di atas, x adalah batas bawah kelas yang mengandung nilai median, x adalah batas atas kelas yang mengandung nilai median, m adalah nomor urut kelas yang mengandung nilai median, dan f adalah frekuensi data. X "#$%& 80 + 0 15 10 84 80 80 + 5 10 4 8%. Nilai modus adalah nilai data yang memiliki frekuensi tertinggi, yaitu kelas data 80-84 [%]. Mengingat distribusi data adalah simetri, maka modus kelembaban udara adalah 8%. Nilai modus dapat pula dihitung dengan persamaan berikut: X "#$% x + f f f f + f f x x Dalam persamaan di atas, x adalah batas bawah kelas yang mengandung nilai modus, x adalah batas atas kelas yang mengandung nilai modus, m adalah nomor urut kelas yang mengandung nilai modus, dan f adalah frekuensi data. X "#$%& 80 + 10 8 10 8 + 10 8 84 80 80 + + 4 8%. Tampak bahwa nilai rata-rata, median, dan modus kelembaban udara adalah sama, yaitu 8%. Kesamaan ketiga nilai ini merupakan salah satu sifat data yang berdistribusi normal. (c) Simpangan baku [bobot 10%] Simpangan baku kelembaban udara dihitung dengan bantuan tabel frekuensi, yaitu dengan menambahkan kolom yang berisi f x. Nilai simpangan baku adalah: Penyelesaian Soal UAS Statistika dan Probabilitas 016119.docx hlm 5 dari 7
π₯ π π 1 π π π₯ π π π 1 7043 40 8 6.1%. 40 1 (d) Rentang keyakinan kelembaban udara rata-rata [bobot 15%] Rentang keyakinan kelembaban udara rata-rata, dengan asumsi bahwa kelembababn udara tersebut berdistribusi normal, dinyatakan dengan persamaan berikut: prob π π π’ 1 πΌ Istiarto Departemen Teknik Sipil dan Lingkungan FT UGM http://istiarto.staff.ugm.ac.id/ Dalam persamaan di atas, l adalah batas bawah rentang keyakinan, u adalah batas atas rentang keyakinan, dan 1 πΌ adalah tingkat keyakinan. Batas bawah dan batas atas rentang keyakinan kelembaban udara rata-rata dinyatakan dengan persamaan berikut: ππ π π‘, dan π’ π+ π π‘, Nilai π‘, adalah nilai t pada pdf distribusi t sedemikian hingga prob π < π‘ 1 πΌ pada nilai derajat kebebasan π 1, n ukuran sampel (jumlah data). Karena tingkat keyakinan telah ditetapkan, yaitu 1 πΌ 95%, maka 1 πΌ 97.5%. Nilai π‘, π‘."#," dibaca pada tabel distribusi t. Bacaan tabel menjadi mudah dilakukan dengan cara membuat sketsa pdf distribusi t. Dari tabel distribusi t, diperoleh: π‘."#,".07 πΌ 0.05 1 πΌ 0.95 Dengan demikian, batas bawah dan batas atas rentang adalah: πΌ 0.05 π 8.07 π‘."#," π‘."#," π‘."#," π’ 8 +.07 6.1 40 80%. 6.1 40 84%. Jadi, rentang keyakinan 95% kelembaban udara rata-rata adalah: prob 80% π 84% 0.95. (e) Uji hipotesis kelembaban udara rata-rata [bobot 15%] H0 : π 80% H1 : π 80% Karena varians populasi tidak diketahui (π tidak diketahui), maka statistika uji adalah: π π π π 40 8 80.0736. 6.1 Batas-batas penerimaan atau penolakan statistika uji dengan tingkat keyakinan 1 πΌ 90% dan jumlah sampel n 40 adalah: π‘, π‘."," dan π‘, π‘.",". Dari tabel distribusi t, diperoleh: π‘."," 1.6849 dan 1 πΌ 0.90 πΌ 0.05 π‘."," 1.6849 π‘."," 1.6849 πΌ 0.05 π‘."," 1.6849 Penyelesaian Soal UAS Statistika dan Probabilitas 016119.docx Dengan demikian, statistika uji π.0736 berada di luar rentang penerimaan hipotesis H0 ( π > π‘."," ), hlm 6 dari 7
sehingga hipotesis yang menyatakan bahwa kelembaban udara rata-rata adalah 80% tidak diterima atau ditolak. -o0o- Penyelesaian Soal UAS Statistika dan Probabilitas 016119.docx hlm 7 dari 7