STK511 Analisis Statistika Pertemuan - 1
PERKULIAHAN 1. Dosen : Anang Kurnia (anangk@apps.ipb.ac.id) 2. Asisten : Septian Rahardiantoro 3. Waktu : Rabu > 08.00 09.40 Jumat > 08.00 10.00 4. Office Hours : Rabu -> 11.00-12.00 (STK Darmaga) atau dengan perjanjian 5. Berpakaian dan berperilaku sopan 5. Selama perkuliahan tidak terdengar bunyi HP 6. Penilaian : NA = UTS (40%) + UAS (40%) + Tugas/Kuis (20%)
MATERI PERKULIAHAN No. Pokok Bahasan #Pertemuan 1 Pendahuluan 1 2 Review Statistika Dasar 1 3 Sebaran Peluang 1 4 Sebaran Penarikan Contoh 1 5 Statistika Inferensia (Pendugaan dan Pengujian) 2 6 Analisis Data Perancangan Percobaan 3 7 Analisis Korelasi dan Regresi 2 8 Analisis Data Kategorik 1 9 Analisis Peubah Ganda 2
Apa itu Statistika? Statistika berasal dari kata statistik penduga parameter Ilmu yang mempelajari dan mengusahakan agar data menjadi informasi yang bermakna Ilmu yang mempelajari teknik-teknik yang diperlukan dalam pengumpulan data, analisis dan penarikan kesimpulan berdasarkan data contoh mencerminkan ciri populasi Statistics vs Statistic
Statistika Populasi Sampling Pendugaan Contoh Deskriptif Tingkat Keyakinan Statistika Deskriptif vs Statistika Inferensia Ilmu Peluang
Cakupan Statistika? Tata cara pengumpulan data baik melalui percobaan, survey, dan observasi Tata cara analisis data untuk menyarikan keterangan dari data yang terkumpul, numerik maupun grafik, untuk memudahkan pembahasan dan penarikan kesimpulan Statistika deskriptif Tata cara pengukuran kepercayaan dalam penarikan kesimpulan untuk ruang lingkup yang lebih luas Statistika inferensia
Proses Analisis Statistika Kesimpulan Pendugaan Pengujian Hipotesis Penyarian Keterangan Pembandingan Keterangan Pengumpulan Data
Analisis vs Tujuan/Ruang Lingkup Enumeratif Menduga nilai agregat dari populasi. Analitik Membahas perilaku hubungan antar berbagai faktor, menjelaskan hubungan sebab akibat. Metode Pengumpulan Data
Metode Pengumpulan Data Metode Percobaan Memiliki keleluasaan untuk melakukan pengawasaan terhadap sumber-sumber keragaman data Dapat menciptakan jenis perlakuan yang diinginkan dan mengamati perubahan pada respon Metode observasi (pasif) Tidak memiliki kendali dalam pengumpulan data (kecuali menentukan faktor yang diamati dan memeriksa ketelitian data) Perubahan pada respon sulit diketahui penyebabnya Metode survey Contoh data diambil dengan teknik tertentu dari populasi mewakili populasi Nilai dugaan populasi dapat ditentukan dengan tingkat kepercayaan tertentu namun tidak cukup kuat menggambarkan hubungan sebab akibat
Metode Pengumpulan Data Metode Percobaan Metode Observasi Metode Survey Kelebihan Kelemahan Kelebihan Kelemahan Kelebihan Kelemahan Kuat dalam pengendalian keragaman Represen- tasi hasil Mudah, murah, mengamati masalah dalam kondisi yang sebenarnya Pengendalian keragaman dan Representasi Hasil Represen- tasi hasil Pengendalian keragaman
Sumber Keragaman Dapat diidentifikasi dan diperkirakan pengaruhnya => Pengelompokan Dapat diidentifikasi tetapi tidak dapat diperkirakan pengaruhnya => Pengacakan Sulit diidentifikasi => Pengulangan
Keterbatasan Hasil Analisis Statistika Permasalahan : Model kuantitatif yang sempurna belum tentu diketahui Faktor penyebab bisa banyak sekali Adanya keragaman alami -> pengulangan tidak bisa persis Penelitian yang sempurna tidak mungkin dilakukan Hasil Penelitian Bersifat Kondisional, tergantung pada : Kerangka contoh atau populasi percobaan yang diamati Metode pelaksanaannya (alat dan metode pengukuran, jenis dan definisi peubah yang diamati, dll) Pelaksana penelitian (enumerator, petugas lab, responden, dll)
Keterbatasan Hasil Analisis Statistika Statistika adalah tongkat ke daerah ketidaktahuan. Semua model adalah salah, namun paling tidak ada satu yang bisa digunakan (mendekati kondisi sebenarnya).
Frequency Gambaran Analisis Statistika : Statistika Deskriptif Stem-and-Leaf Display: Volume Stem-and-leaf of Volume N = 31 Leaf Unit = 1.0 20 15 Diameter Matrix Plot of Diameter, Height, Volume 60 70 80 10 1 0005688999 (9) 2 111224457 12 3 13468 7 4 2 6 5 11558 1 6 1 7 7 10 70 45 20 10 15 20 Height 20 Volume 45 70 80 70 60 14 400 12 300 10 8 200 6 100 4 0 5 10 15 20 0 400000 800000 1200000 1600000 Data asal 2000000 2400000 2800000 M-GREG MKT-GREG
Gambaran Analisis Statistika : Statistika Deskriptif 350.0 322.3 300.0 250.0 200.0 150.0 237.5 198.1 272.3 100.0 50.0 0.0 51.6 33.2 30.1 Negeri 44.1 Swasta Skor Evaluasi Diri Program Studi Skor Borang Unit Pengelola Skor Borang Program Studi Nilai Total
Gambaran Analisis Statistika : Statistika Inferensia Statistika Inferensia Perbandingan Rataan Populasi Satu populasi Uji t atau uji z Dua populasi Uji t atau uji z Lebih dari dua populasi anova Hubungan antar variabel Hubungan dua arah Analisis Korelasi Hubungan satu arah (sebab akibat) Analisis Regresi
Gambaran Analisis Statistika : Statistika Inferensia Suatu Penelitian dilakukan untuk mengetahui pengaruh kecepatan pengisian cat (X1) dan ketebalan cat (X2) terhadap kualitas hasil pengecatan (Y) Surface Plot of Y vs X1, X2 Y 120 100 80 Duga Persamaan Regresi-nya!!! 60 0.15 0.20 0.20 0.25 X2 0.25 0.30 X1
X1 1. Pendahuluan Gambaran Analisis Statistika : Statistika Inferensia Surface Plot of FITS3 vs X1, X2 Regression Analysis: Y versus X1, X2 The regression equation is Y = 15.0 + 183 X1 + 171 X2 FITS3 110 100 90 80 0.30 Predictor Coef SE Coef T P Constant 15.02 10.24 1.47 0.155 X1 182.75 33.02 5.53 0.000 X2 170.65 35.38 4.82 0.000 0.15 0.20 0.20 0.25 X2 0.25 X1 S = 7.41471 R-Sq = 72.6% R-Sq(adj) = 70.4% 0.30 0.28 0.26 Contour Plot of FITS3 vs X1, X2 FITS3 < 80 80-85 85-90 90-95 95-100 100-105 105-110 > 110 Analysis of Variance Source DF SS MS F P Regression 2 3503.9 1752.0 31.87 0.000 Residual Error 24 1319.5 55.0 Total 26 4823.4 0.24 0.22 0.20 0.150 0.175 0.200 X2 0.225 0.250
Analisis Lebih Lanjut : Regresi Logistik Binary Logistic Regression: Y2 versus x1, x2 Link Function: Logit Response Information Variable Value Count Y2 1 12 (Event) 0 8 Total 20 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Constant 3.87448 3.38365 1.15 0.252 x1-0.516801 0.357665-1.44 0.148 0.60 0.30 1.20 x2 0.396576 0.211489 1.88 0.061 1.49 0.98 2.25
Analisis Lebih Lanjut : Peubah Ganda Menggambarkan suatu objek tidak cukup menggunakan satu peubah saja Kasus pengamatan peubah ganda dijumpai di seluruh bidang terapan Perlu analisis lebih canggih dibandingkan analisis pada peubah tunggal (univariate) Peubah yang diamati tidak saling bebas (ada overlapping informasi antar peubah), sehingga diperlukan teknik-teknik penyusunan peubah baru seperti komponen utama dan peubah kanonik
Analisis Lebih Lanjut : Peubah Ganda Manova Analisis Komponen Utama Analisis Faktor Analisis Cluster Analisis Diskriminan Analisis Korelasi Kanonik Analisis Biplot Ilustrasi : Biplot
Analisis Lebih Lanjut : Time Series Data time series (deret waktu) merupakan data yang dikumpulkan secara sequensial menurut periode waktu tertentu. Peranan ramalan (forecasting) data ke depan memegang peranan penting dalam menyusun kebijakan strategis perusahaan/lembaga Metode Forecasting yang berkembang saat ini, antara lain: Metode Rataan Kumulatif Metode Pemulusan (Smoothing) ARIMA (AutoRegressive Integrated Moving Average) Fungsi Transfer (Bivariate ARIMA) MARIMA (Multivariate ARIMA)
x x Analisis Lebih Lanjut : Time Series 1400 Time Series Plot of x 1200 1000 800 600 400 Winters' Method Plot for x Additive Method 200 0 1 5 10 15 20 25 Index Ilustrasi Metode Winter (Kasus data musiman) 30 35 40 45 1400 1200 1000 800 600 400 200 0 1 5 10 15 20 25 Index 30 35 40 45 Variable Actual Smoothed Smoothing Constants Alpha (level) 0.2 Gamma (trend) 0.2 Delta (seasonal) 0.2 Accuracy Measures MAPE 60 MAD 267 MSD 101122
Analisis Lebih Lanjut : Small Area Estimation perlu informasi yang lebih rinci, cepat, dan handal, tidak saja untuk lingkup superpopulasi tetapi pada lingkup yang lebih kecil Pada level nasional, data tersedia baik melalui BPS DESAIN SURVEY PADA LEVEL NASIONAL Masalah : tingkat akurasi dan presisi pendugaan langsung untuk area kecil akan rendah karena ukuran contoh sedikit atau bahkan tidak terwakili dalam survey Solusi Alternatif : Small Area Estimation (SAE)
Analisis Lebih Lanjut : Small Area Estimation Suatu metode untuk menduga parameter pada suatu area (sub-domain) yang relatif kecil dalam percontohan survey dengan memanfaatkan informasi dari luar area, dari dalam area itu sendiri dan dari luar survey. Menambah informasi pada data contoh tanpa menambah ukuran contoh. => Generalized Linear Mixed Model
Bersambung.