MATA KULIAH PERANCANGAN PERCOBAAN (*) **
MATERI PERKULIAHAN No. Materi 1 Review Statistika Dasar 2 Pengenalan Perancangan Percobaan 3 Percobaan Faktor Tunggal dalam RAL 4 Percobaan Faktor Tunggal RKLT 5 Percobaan Faktor Tunggal RBSL 6 Pembandingan antar perlakuan UTS 7 Pembandingan antar perlakuan 8 Pengujian Asumsi 9 Percobaan faktorial dalam RAL 10 Percobaan Faktorial dalam RKLT 11 Percobaan rancangan petak terbagi (RPT) dalam RAL 12 Percobaan rancangan petak terbagi dalam RKLT 13 Percobaan kelompok terbagi (RKT) 14 Analisis Peragam (ANCOVA) UU
Ketentuan Perkuliahan Penilaian UTS (Kompilasi) : 50% Kompilasi dari nilai UTS, Kuis, Tugas, PBL, Kehadiran Ujian Utama : 50% Tips & Triks Buku referensi Selalu mengikuti materi perkuliahan Mengulang & latihan untuk lebih memahami 3
Review Statistika Dasar
PENDAHULUAN Apa itu statistika? Statistika berasal dari kata statistik penduga parameter Ilmu yang mempelajari dan mengusahakan agar data menjadi informasi yang bermakna
Populasi dan Sampel Populasi X~N(, 2 ) PARAMETER Acak Uji Sampel X~n(x,s 2 ) STATISTIK
Terminologi dalam Statistika A. Populasi: Merupakan himpunan seluruh subjek yang dipelajari (diselidiki / diinvestigasi) All voters, all students, all plants, all animals. Masing-masing kelompok tersebut disebut populasi Sebuah populasi terdiri keseluruhan elemen/individu atau objek yang memiliki karakteristik yang kita pelajari B. Sampel: Sejumlah elemen yang dipilih dari suatu populasi yang diamati (diobservasi). Suatu sampel yang diambil harus bersifat representatif, yaitu menunjukkan karakteristik dari populasi sedekat mungkin Populasi Sampel
Terminologi dalam Statistika C. Parameter Populasi: Merupakan semua karakteristik yang diukur berkaitan dengan suatu populasi. Nilainya umumnya tak pernah diketahui karena ukuran populasi yang biasanya sangat besar ataupun tak berhingga. Rata-rata dan simpangan baku suatu populasi dinotasikan dengan µ (baca: myu) & σ (baca: sigma) D. Statistik Sampel: Merupakan semua karakteristik yang diukur berkaitan dengan suatu data sampel. Berfungsi penaksir (estimator) untuk parameter Rata-rata dan simpangan baku suatu sampel dinotasikan dengan x dan s Agar dapat menjadi estimator yang valid bagi parameter populasi, statistik sampel harus diperoleh dari sampel representatif, yang dipilih secara acak dari populasi. Sampel demikian dinamakan sampel random (acak).
Konsep Peubah Definisi Peubah merupakan karakteristik dari objek yang sedang diamati, seperti tinggi tanaman, produksi, dll Skala pengukuran peubah Nominal : mengklasifikasikan Ordinal : mengklasifikasikan dan mengurutkan Interval : mengklasifikasikan, mengurutkan dan membedakan Rasio : mengklasifikasikan, mengurutkan, membedakan dan membandingkan
Statistika Deskripsi dan Eksplorasi Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami. Penyajian data dapat dilakukan melalui: Tabel Gambar (histogram, plot, stem-leaf, box-plot) Peringkasan data dinyatakan dalam dua ukuran yaitu: Pemusatan (Median, Modus, Kuartil, Mean, dll) Penyebaran (Range, Interquartile Range, Ragam)
Penyajian Data Data Pengamatan Tanaman Obs Tinggi Pohon (m) Diameter Pohon (m) Varietas 1 3.5 0.25 A 2 4.0 0.40 A 3 2.8 0.20 B 4 3.2 0.21 C 5 3.6 0.30 C 6 4.2 0.35 C 7 2.9 0.22 B 8 2.5 0.18 B 9 3.8 0.38 A 10 4.6 0.41 A 11 2.2 0.15 A 12 3.4 0.28 D 13 4.2 0.37 D 14 4.8 0.39 D 15 5.0 0.40 D
Penyajian Dengan Tabel dan Gambar Varietas Count CumCnt Percent CumPct A 5 5 33.33 33.33 B 3 8 20.00 53.33 C 3 11 20.00 73.33 D 4 15 26.67 100.00 Chart of Varietas Pie Chart of Varietas 5 4 Category A B C D Count 3 2 1 0 A B Varietas C D Dotplot of Tinggi Pohon (m) Scatterplot of Tinggi Pohon (m) vs Diameter Pohon (m) 5.0 4.5 2.4 2.8 3.2 3.6 4.0 Tinggi Pohon (m) 4.4 4.8 Tinggi Pohon (m) 4.0 3.5 3.0 2.5 2.0 0.15 0.20 0.25 0.30 Diameter Pohon (m) 0.35 0.40
Penyajian Dengan Stem-Leaf Stem-and-Leaf Display: Tinggi Pohon (m), Diameter Pohon (m) Stem-and-leaf of Tinggi Pohon (m) N = 15 Leaf Unit = 0.10 1 2 2 4 2 589 6 3 24 (3) 3 568 6 4 022 3 4 68 1 5 0 Stem-and-leaf of Diameter Pohon (m) N = 15 Leaf Unit = 0.010 2 1 58 5 2 012 7 2 58 (1) 3 0 7 3 5789 3 4 001
Penyajian Dengan Box-plot 5 Boxplot of Tinggi Pohon (m), Diameter Pohon (m) 4 Data 3 2 1 0 Tinggi Pohon (m) Diameter Pohon (m)
Peringkasan Data (Pemusatan dan Penyebaran) Beberapa ukuran pemusatan, yaitu: 1. Modus: Nilai pengamatan yang paling sering muncul 2. Median: Pengamatan yang ditengah-tengah dari data terurut 3. Quartil: Nilai-nilai yang membagi data terurut menjadi 4 bagian yang sama 4. Mean: merupakan pusat massa (centroid) sehingga simpangan kiri dan simpangan kanan sama besar Beberapa ukuran penyebaran, yaitu: 1. Range: besarnya penyebaran data dari data terkecil sampai data terbesar 2. Interquartile Range: besarnya penyebaran data yang diukur mulai quartile satu sampai quartile tiga atau besarnya penyebaran data dari 50% pengamatan ditengah 3. Ragam: merupakan ratarata jarak kuadrat setiap titik pengataman terhadap nilai mean (rata-rata)
Langkah-langkah teknis Median Urutkan data dari kecil ke besar Cari posisi median (n med =(n+1)/2) Nilai median Jika n med bulat, maka Median=X (n+1)/2 Jika n med pecahan, maka Median=(X (n)/2 + X (n)/2+1 )/2 (rata-rata dua pengamatan yang berada sebelum dan setelah posisi median)
Kuartil (Quartile) Metode Belah dua Urutkan data dari kecil ke besar Cari posisi kuartil n q2 =(n+1)/2 n q1 =(n q2* +1)/2= n q3, n q2* posisi kuartil dua terpangkas (pecahan dibuang) Nilai kuartil 2 ditentukan sama seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan.
Metode Interpolasi Urutkan data dari kecil ke besar Cari posisi kuartil n q1 =(1/4)(n+1) n q2 =(2/4)(n+1) n q3 =(3/4)(n+1) Nilai kuartil dihitung sebagai berikut: X qi =X a,i + h i (X b,i -X a,i ) X a,i = pengamatan sebelum posisi kuartil ke-i, X b,i = pengamatan setelah posisi kuartil ke-i dan h i adalah nilai pecahan dari posisi kuartil
Rata-rata (Mean) Populasi: Sampel: Wilayah (Range) W=Xmax-Xmin Jarak antar kuartil (Interquartile range) JAK=q 3 -q 1 N i 1 N x i x n i 1 n x i
Ragam (Variance) Populasi Sampel Simpangan baku (standard deviation) Merupakan akar dari ragam yaitu simpangan baku populasi dan s simpangan baku sampel N x N i i 1 2 2 1 1 2 2 n x x s n i i
Descriptive Statistics: Tinggi Pohon (m), Diameter Pohon (m) Variable N N* Mean StDev Variance Minimum Q1 Median Tinggi Pohon (m) 15 0 3.647 0.837 0.700 2.200 2.900 3.600 Diameter Pohon ( 15 0 0.2993 0.0919 0.00845 0.1500 0.2100 0.3000 Variable Q3 Maximum Range IQR Tinggi Pohon (m) 4.200 5.000 2.800 1.300 Diameter Pohon ( 0.3900 0.4100 0.2600 0.1800 Descriptive Statistics: Tinggi Pohon (m) Variable Varietas N N* Mean StDev Variance Minimum Q1 Tinggi Pohon (m) A 5 0 3.620 0.890 0.792 2.200 2.850 B 3 0 2.733 0.208 0.0433 2.500 2.500 C 3 0 3.667 0.503 0.253 3.200 3.200 D 4 0 4.350 0.719 0.517 3.400 3.600 Variable Varietas Median Q3 Maximum Range IQR Tinggi Pohon (m) A 3.800 4.300 4.600 2.400 1.450 B 2.800 2.900 2.900 0.400 0.400 C 3.600 4.200 4.200 1.000 1.000 D 4.500 4.950 5.000 1.600 1.350
Rancangan Pengumpulan Data Kenapa? Untuk mendapatkan penduga yang tidak berbias, (misal systematic error) Untuk meningkatkan presisi kesimpulan Kesimpulan dapat digeneralisasi ke populasi target
Ada dua jenis rancangan pengumpulan data yang utama: Observasi : Data dikumpulkan melalui pengamatan langsung terhadap penomena yang terjadi dilapangan, yang merupakan potret dari penomena yang sedang diamati. Survei merupakan salah satu bentuk khusus dari observasi Percobaan : Data yang dikumpulkan merupakan respon dari objek/individu/unit yang dikondisikan tertentu.
Pengujian Hipotesis HIPOTESIS Suatu pernyataan / anggapan yang mempunyai nilai mungkin benar / salah atau suatu pernyataan /anggapan yang mengandung nilai ketidakpastian CONTOH Besok akan turun hujan mungkin benar/salah Penambahan pupuk meningkatkan produksi mungkin benar/salah Varietas A lebih baik dibandingkan dengan varietas B mungkin benar/salah dll
HIPOTESIS statistik dinyatakan dalam dua bentuk yaitu: H0 (hipotesis nol): suatu pernyataan / anggapan yang ingin kita tolak H1 (hipotesis tandingan): pernyataan lain yang akan diterima jika H0 ditolak Pengambilan keputusan akan memunculkan dua jenis kesalahan yaitu: Salah jenis I (Error type I) : kesalahan akibat menolak H0 padahal H0 benar Salah jenis II (Error type II) : kesalahan akibat menerima H0 padahal H1 benar Besarnya peluang kesalahan dapat ini dapat dihitung sebagai berikut: P(salah jenis I) = P(tolak H0/H0 benar) = P(salah jenis II) = P(terima H0/H1 benar) =
Rangkuman Tolak H0 Terima H0 H0 benar Peluang salah jenis I (Taraf nyata; ) Tingkat kepercayaan (1-) H0 salah Kuasa pengujian (1-) Peluang salah jenis II ()
CONTOH Sampel diambil secara acak dari populasi normal(;2 = 9), berukuran 25. Hipotesis yang akan diuji, H0 : = 15 H1 : = 10 Tolak H0 jika Berapakah besarnya kesalahan jenis I dan II? Jawab: P(salah jenis I) = P(/ = 15) = P(z (12.5-15)/3/25)) = P(z - 4.167 ) 0 P(salah jenis II) = P(/ = 10) = P(z (12.5-10)/3/25)) = P(z 4.167 ) = 1 - P(z 4.167 ) 0
Beberapa langkah yang perlu diperhatikan dalam pengujian hipotesis: (1) Tuliskan hipotesis yang akan diuji Ada dua jenis hipotesis: Hipotesis sederhana Hipotesis nol dan hipotesis alternatif sudah ditentukan pada nilai tertentu H0 : = 0 vs H1 : = 1 H0 : 2 = 2 0 vs H1 : 2 = 2 1 H0 : P = P 0 vs H1 : P = P 1 Hipotesis majemuk Hipotesis nol dan hipotesis alternatif dinyatakan dalam interval nilai tertentu b.1. Hipotesis satu arah H0 : 0 vs H1 : < 0 H0 : 0 vs H1 : > 0 b.2. Hipotesis dua arah H0 : = 0 vs H1 : 0
(2). Deskripsikan data sampel yang diperoleh (hitung rataan, ragam, standard error dll) (3). Hitung statistik ujinya Statistik uji yang digunakan sangat tergantung pada sebaran statistik dari penduga parameter yang diuji CONTOH H0: = 0 maka maka statistik ujinya bisa t-student atau normal baku (z) atau x t h 0 x 0 z s / n h / n (4). Tentukan batas kritis atau daerah penolakan H0 Daerah penolakan H0 sangat tergantung dari bentuk hipotesis alternatif (H1) CONTOH H1: < 0 Tolak H0 jika th < -t(; db)(tabel) H1: > 0 Tolak H0 jika th > t(; db)(tabel) H1: 0 Tolak H0 jika th > t(/2; db)(tabel) (5). Tarik kesimpulan
Hipotesis yang dapat diuji: Hipotesis satu arah H0 : 0 vs H1 : < 0 H0 : 0 vs H1 : > 0 Hipotesis dua arah H0 : = 0 vs H1 : 0 Statistik uji: Jika ragam populasi ( 2 ) diketahui : Jika ragam populasi ( 2 ) tidak diketahui : x 0 z h / n x t 0 h s / n
Daerah kritis pada taraf nyata () Besarnya taraf nyata sangat tergantung dari bidang yang sedang dikaji Daerah penolakan H0 sangat tergantung dari bentuk hipotesis alternatif (H1) H1: < 0 Tolak H0 jika th < -t (; db=n-1) (tabel) H1: > 0 Tolak H0 jika th > t (; db=n-1) (tabel) H1: 0 Tolak H0 jika th > t (/2; db=n-1) (tabel) Atau, jika nilai peluang nyata (p) dihitung, H1: < 0 p=p(t<th) atau p=p(z<zh), Tolak H0 jika p< H1: > 0 p=p(t>th) atau p=p(z>zh), Tolak H0 jika p< H1: 0 p=p( t > th ) atau p=p( z < zh ), Tolak H0 jika p< /2 Tarik Kesimpulan
ANALISIS KORELASI DAN REGRESI Apa itu analisis regresi? Hubungan sebab akibat antara dua peubah atau lebih Apa itu analisis korelasi? Tingkat keeratan hubungan linier antara dua peubah atau lebih
Koefisien Korelasi Pearson (r) 1 ) ( dan 1 ) ( 1 ) )( ( 2 2 n y y S n x x S n y y x x S S S S r i y i x i i xy y x xy xy
Besaran koefesien korelasi
Contoh: Hubungan Biaya Promosi vs Penjualan Produk Perusahaan Biaya Promosi (X) Penjualan Xi-RX Yi-RY (Xi-RX)^2 (Yi-RY)^2 (Yi-RY)(Xi-RX) 1 40 385 6.5-60.5 42.25 3660.25-393.25 2 20 400-13.5-45.5 182.25 2070.25 614.25 3 25 395-8.5-50.5 72.25 2550.25 429.25 4 20 365-13.5-80.5 182.25 6480.25 1086.75 5 30 475-3.5 29.5 12.25 870.25-103.25 6 50 440 16.5-5.5 272.25 30.25-90.75 7 40 490 6.5 44.5 42.25 1980.25 289.25 8 20 420-13.5-25.5 182.25 650.25 344.25 9 50 560 16.5 114.5 272.25 13110.25 1889.25 10 40 525 6.5 79.5 42.25 6320.25 516.75 Jumlah 335 4455 0 0 1302.5 37722.5 4582.5 Rata-rata 33.5 445.5
Plot Biaya Promosi vs Penjualan Produk Korelasi: rxy = 0.653753
ANALISIS REGRESI Hubungan Antar Peubah: Model deterministik Y=f(X) ; misalnya: Y=10X (Model tanpa unsur random atau hubungannya bersifat pasti) Model stokastik model yang melibatkan unsur random, dengan kata lain model dipecah menjadi dua bagian yaitu bagian yang dapat dijelaskan dan bagian yang tidak dapat dijelaskan Mis: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi Model regresi sederhana: Yi 0 1X i i ; i 1,2,..., n
Regresi Makna 0 & 1?
Regresi
Analisis Regresi Pendugaan terhadap koefisien regresi: b 0 penduga bagi 0 dan b 1 penduga bagi 1 b b 1 0 xy y b x 1 n x) Bagaimana Pengujian terhadap model regresi?? parsial (per koefisien) uji-t bersama uji-f (Anova) Bagaimana menilai kesesuaian model?? x 2 ( ( x)( n 2 y) Metode Kuadrat Terkecil R 2 (Koef. Determinasi: % keragaman Y yang mampu dijelaskan oleh X)
Contoh Data Percobaan dalam bidang lingkungan Apakah semakin tua mobil semakin besar juga emisi HC yang dihasilkan? Diambil contoh 10 mobil secara acak, kemudian dicatat jarak tempuh yang sudah dijalani mobil (dalam ribu kilometer) dan diukur Emisi HC-nya (dalam ppm) Jarak Emisi 31 553 38 590 48 608 52 682 63 752 67 725 75 834 84 752 89 845 99 960 Emisi = 382 + 5.39 Jarak
Plot antara Emisi Hc (ppm) dg Jarak Tempuh Mobil (ribu kilometer) 950 850 Emisi 750 650 550 30 40 50 60 70 80 90 100 Jarak
Pendugaan Parameter Mobil Jarak (X) Emisi (Y) Xi-RX Yi-RY (Xi-RX)^2 (Yi-RY)^2 (Yi- RY)(Xi- RX) 1 31 553-33.6-177.1 1128.96 31364.41 5950.56 Penduga Koefesien Regresi: b1 = 5.38931 b0 = 381.9506 2 38 590-26.6-140.1 707.56 19628.01 3726.66 3 48 608-16.6-122.1 275.56 14908.41 2026.86 4 52 682-12.6-48.1 158.76 2313.61 606.06 Model dugaan: Emisi = 381.9506 + 5.38931 Jarak 5 63 752-1.6 21.9 2.56 479.61-35.04 6 67 725 2.4-5.1 5.76 26.01-12.24 7 75 834 10.4 103.9 108.16 10795.21 1080.56 8 84 752 19.4 21.9 376.36 479.61 424.86 9 89 845 24.4 114.9 595.36 13202.01 2803.56 10 99 960 34.4 229.9 1183.36 52854.01 7908.56 Jumlah 646 7301 5.68E-14-2.3E-13 4542.4 146050.9 24480.4 Rata-rata 64.6 730.1
Contoh output regresi dengan Minitab Regression Analysis (Emisi Hc vs Jarak Tempuh Mobil) The regression equation is Emisi = 382 + 5.39 Jarak Predictor Coef StDev T P Constant 381.95 42.40 9.01 0.000 Jarak 5.3893 0.6233 8.65 0.000 S = 42.01 R-Sq = 90.3% R-Sq(adj) = 89.1% Analysis of Variance Source DF SS MS F P Regression 1 131932 131932 74.76 0.000 Error 8 14118 1765 Total 9 146051 Unusual Observations Obs Jarak Emisi Fit StDev Fit Residual St Resid 8 84.0 752.0 834.7 18.0-82.7-2.18R R denotes an observation with a large standardized residual
Pengujian Model Bagaimana Pengujian kesesuaian model regresi?? parsial (per koefisien) uji-t bersama uji-f (Anova) Bagaimana menilai keakuratan model?? R 2 Koef. Determinasi (% keragaman Y yang mampu dijelaskan oleh X)
Pengujian Kesesuaian Model H 0 : 1 =0 vs H 1 : 1 0 ANOVA (Analysis of Variance) Uji F n i1 ( y i y ) 2 n i1 ( yˆ i y) 2 n i1 ( y i yˆ i ) 2 JK total = JK regresi + JK error Keragaman total = keragaman yang dapat dijelaskan oleh model + keragaman yang tidak dapat dijelaskan oleh model Anova Sumber db JK KT F Regresi 1 JKR KTR KTR/KTE Error n - 2 JKE KTE Total n - 1 JKT F ~ F (1,n-2)
Perhatikan Ilustrasi Sebelumnya Analysis of Variance Source DF SS MS F P Regression 1 131932 131932 74.76 0.000 Error 8 14118 1765 Total 9 146051
Pengujian Parameter Model Secara Parsial Pengujian Pengaruh X terhadap Y Hipotesis: H 0 : 1 0 vs H 1 : 1 >0 Statistik uji: 2 ) ˆ ( ) ( 2 2 1 1 1 n y y s x x s S S b T i i i b b
Perhatikan Contoh sebelumnya The regression equation is Emisi = 382 + 5.39 Jarak Predictor Coef StDev T P Constant 381.95 42.40 9.01 0.000 Jarak 5.3893 0.6233 8.65 0.000