1. 2 2. 3. 4. Statistik dan Statistika Populasi dan Sampel Jenis-jenis Observasi Statistika Deskriptif Sari Numerik Penyajian Data 2008 by USP & UM ; last edited Jan 11 MA 2081 Statistika Dasar 24 Januari 2011 Utriweni Mukhaiyar
Data rata-rata curah hujan (mm) di 15 daerah pada bulan Oktober 2010. 87 37 59 49 95 69 83 87 39 95 76 83 83 26 46 Berapa ratarata curah hujan seluruh daerah? Statistika deskriptif Seberapa menyebarnya y curah hujan dari beberapa daerah tersebut? Adakah daerah yang perlu perhatian khusus? Apakah rata-rata curah hujan bulan Oktober lebih besar dibanding bulan lainnya Inferensi statistik 2
Statistik : nilai-nilai ukuran data yang mudah dimengerti. Contoh : statistik IP mahasiswa ITB semester I 2010-2011 Statistika : ilmu yang berkaitan dengan cara pengumpulan, p pengolahan, analisis dan pernarikan kesimpulan atas data. 3
1. Statistika deskriptif: metode yang berkaitan dengan pengumpulan dan penyajian data. 2. Statistika inferensi: metode yang berkaitan dengan analisis sampel untuk penarikan kesimpulan tentang karakteristik populasi. 4
Populasi Sampel setiap obyek populasi memiliki kemungkinan/kesempatan yang sama untuk terpilih Sampel Acak hasil pengukuran atau pengamatan Data 5
Akan dilakukan penelitian apakah tahun pertama a di ITB (TPB) memberikan pengaruh terhadap perubahan berat badan mahasiswa. Untuk itu dilakukan pengambilan data pada hari terakhir ujian TPB. Seluruh mahasiswa TPB ITB? Populasi Kendala: - sangat banyak, -menghabiskan waktu, -menghabiskan biaya Keterwakilan sampel atas populasi?? Sampel Contoh: tiap-tiap kelas TPB diambil secara acak 10 orang mahasiswa. @ UM 6 Kaidah Pengambilan Sampel (Teknik Sampling)
OBSERVASI / DATA KUALITATIF KUANTITATIF Nominal Ordinal/Rank Diskrit Kontinu Tidak mengenal urutan dan operasi aritmatika Mengenal urutan dan operasi aritmatika Berhubungan dengan Didasarkan pada suatu proses menghitung, selang/interval dan pengamatan atas sehingga meliputi himpunan terhitung. semua bilangan riil Warna batuan (abuabu, hitam, putih, coklat, dll), jenis kelamin, dll Tingkat curah hujan (rendah, sedang, tinggi), i) strata t pendidikan (SD, SMP, SMA, S1, S2, S3) Banyaknya pekerja yang dibutuhkan dalam suatu area pertambangan, jarak yang dilangkahi seseorang (bisa mundur, bisa maju) per 0,5 meter 7 Berat batuan, luas area pertambangan, jarak tempuh truk pengangkut, suhu, dll
Metode yang berkaitan dengan pengolahan dan penyajian suatu gugus data sehingga memberikan informasi i yang berguna. bentuk kdistribusi data 8
1. PARAMETER DISTRIBUSI Ukuran Pemusatan Ukuran Penyebaran Kemencengan Kelancipan mean, median, modus, kuartil atas, kuartil bawah, dll Range, simpangan baku, variansi, jangkauan antar kuartil, dll skewness kurtosis 2. BENTUK DISTRIBUSI Simetris mean = median Menceng/skew Positif mean > median Berpuncak Jamak Berpuncak Tunggal Menceng/skew Negatif mean < median # modus > 1 # modus = 1 92008 by UM
Data rata-rata curah hujan (mm) di 15 daerah pada bulan Oktober 2010. (n = 15) ) 87 37 59 49 95 69 83 87 39 95 76 83 83 26 46 x 1 x 2 x 9 x 12 x 15 Data yang diurutkan: 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 x (1) x (2) x (9) x (12) x (15) minimum i Adakah perbedaan dari penyajian kedua data di atas? 10 maksimum
1. Mean (rata-rata) x 1 n n n i1 x i Contoh : x x x... x 1 2 15 15 87 37... 46 15 67,6060 11
26 37 50 39 % data 46 49 (awal awal) 59 69 76 83 50% 83 data 83 87(akhir akhir) 95 95 x (8) 3 x 2 x 2 x 2. Median Nilai tengah yang membagi dua kelompok data sama banyak. med = x (8) = 76 3. Modus Nilai yang paling sering muncul. mod = 83 12
26 37 25 % 39 46 49 25 59 % 69 76 83 2583 % 83 87 87 2595 % 95 q 1 q 2 = med q 3 Kuartil bawah (q 1 ) : q x n q1 x x(4) Kuartil tengah (q 2 ) : Kuartil atas (q 3 ) : 1 1 4 q x x 2 2( n1) n1 4 2 151 4 q x x ( ) 76 q x 2 151 (8) 2 3 3( n 1) 4 q x x 3 3(151) (12) 4 13 46 87
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 p 25 p 50 = med p 75 Persentil ke-i : i ( n1) Persentil ke-50 : x x median x 100 50( n1) n1 100 2 Persentil ke-25 dan Persentil ke-75? kuartil bawah kuartil atas 14
1. Jangkauan data (Range) R = data max data min R = 95 26 = 69 2. Variansi n n n 2 1 2 1 xi 2 i1 s ( xi x) x i n1 i1 n 1 i1 n JK XX 3. Simpangan Baku (standard deviation) s = s 2 s 529,2571 23,01 2 2 s 529,2571 4. Jangkauan antar kuartil dq = q 3 q 1 dq = q 3 q 1 = 87 46 = 41 15
Data yang nilainya berbeda jauh dari kelompok data yang lain. Bagaimana mendeteksi data pencilan?? 1. Hitung dq dq = 41 2. Hitung BBP = q 1 k.dq BBP = 46 (1,5)(41) = -15,5 5 Pilih nilai k = 3/2 (tidak mutlak) 3. Hitung BAP = q 3 + k.dq BAP = 87 + (1,5)(41) = 148,5 4. Pencilan bawah < BBP tidak ada pencilan bawah 5. Pencilan atas > BAP tidak ada pencilan atas 16
SARI NUMERIK Count (banyak data, n) 15 Sum (jumlah data) 1014 Average (rata-rata) 67.6 Median (kuartil tengah) 76 mean < median Mode (modus) 83 Minimum 26 Maximum 95 Range 69 Standard Deviation 23.01 Menceng kiri Variance 529.2571 Skewness -0.50* Kurtosis -1.23* 25th Percentile (persentil-25) 46 50th Percentile (persentil-50) 76 75th Percentile (persentil-75) 87 Interquartile Range (dk) 41 * Perhitungan dengan Mic. Excel 17
1. Tabel Distribusi Frekuensi 2. Pie Chart 3. Dot Plot 4. Histogram 5. Diagram Batang Daun (stem - leaf) 6. Diagram Kotak Titik (box plot) 7. dll Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik. Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik ti tik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya. 18
Data curah hujan bulan Oktober 2011 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 Kelas Interval Titik Tengah Kelas Frekuensi (f) Frekuensi Kumulatif 21-35 28 1 1 36-50 43 4 5 51-65 58 1 6 66-80 73 2 8 81-95 88 7 15 Bagaimana bentuk histogramnya? PRINSIP DASAR PELUANG @ UM 19
9% 10% 23% 58% Pie chart merupakan grafik yang berbentuk b lingkaran yang mana setiap potongannya mewakili proporsi atau persentase suatu komponen dari sebuah kelompok data (100%). Pemakaian pie chart hanya cocok ketika menyatakan data dalam bentuk proporsi dari satu kelompok data. 20
35 3,5 3 2,5 frekuen nsi 2 1,5 1 05 0,5 0 0 20 40 60 80 100 nilai Cara menggambarkan data dalam bentuk titik, dengan memperhatikan frekuensi dari data yang bersangkutan Titik ditumpuk diatas nilai i data yang digambarkan. 21
Histogram adalah gambar berdasarkan distribusi frekuensi Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle). Daerah setiap rectangle sebanding dengan frekuensinya. 22
Stem atau batang, mirip dengan grup data pada histogram, sedangkan leaf atau daun, mirip dengan frekuensi. Stem atau batang adalah digit pertama yang terpenting yang ada dalam bilangan yang membentuk harga data, sedangkan digit di belakangnya akan merupakan leaf atau daun. Melalui stem-leaf masih dapat dilihat nilai data mentahnya. 23
100 90 80 70 60 50 40 30 20 10 95 26 max 85 76 47,5 min q 2 q 3 mean 0 Box Plot digunakan untuk menyelidiki distribusi ib i tanpa menggunakan grup data seperti pada histogram dan diagram batang daun. Box Plot terdiri dari: data min, q 1, q 2 (median), q 3, dan data max yang disusun secara terurut dengan membentuk kotak. 24 q 1
* pencilan atas max kedua q 3 q 2 mean min ketiga q 1 * * pencilan bawah 25
DOT PLOT HISTOGRAM BATANG-DAUN BOX PLOT KELEMAHAN Tidak efektif untuk ukuran data yang besar Lama Banyak perhitungan Nilai data tidak nampak Menuntut ketelitian mencatat daun Membutuhkan perhitungan yang panjang Terdiri dari parameterparameter dari data yang sudah diurutkan Cepat KEUNGGULAN Nilai i data asli dapat diperkirakan k Histogram peluang dapat memberi gambaran tentang distribusi populasi Tidak menuntut ketelitian dalam mencatat setiap nilai data Cepat Tidak memerlukan perhitungan Nilai data asli dapat dilihat Memudahkan perhitungan berbagai parameter Box plot dapat memberi gambaran tentang bentuk distribusi populasi Efektif untuk membandingkan bentuk distribusi beberapa kelompok data sekaligus 26
mean = median Memiliki bentuk distribusi yang simetris, yaitu : Skewness = 0 Kurtosis = 3, (dalam software tertentu kurtosis normal = 0 27
Suatu jenis polimer digunakan dalam sistem evakuasi pesawat terbang. Penting diperhatikan bahwa polimer tersebut harus mampu melawan proses penuaan. Diambil dua puluh sampel polimer yang kemudian dibagi atas dua percobaan. Percobaan pertama (batch 1) yang melibatkan 10 sampel dikenakan proses percepatan penuaan dengan temperatur tinggi selama 10 hari. Sedangkan 10 sampel lainnya (batch 2) tidak dikenakan proses apa-apa. Kekuatan daya rentang (dalam psi) sampel-sampel tersebut diukur dan dicatat sebagai berikut. Batch 1 227 222 218 217 225 218 216 229 228 221 Batch 2 219 214 215 211 209 218 203 204 201 205 Q: Apakah percobaan proses penuaan memberikan dampak pada kekuatan k daya rentang polimer? Sumber: Walpole (2006), hal.13 @ UM 28
Apa yang dapat kita lakukan untuk menjawab pertanyaan tersebut??? - Keluarkan sari numerik yang mungkin Ukuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATAS Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL, VARIANSI,SIMPANGAN BAKU Lain-lain : SKEWNESS dan KURTOSIS Apakah diperlukan??? - Plot data Pilih plot yang informatif untuk menjawab pertanyaan tersebut Misal: BOXPLOT @ UM 29
Batch.1 Batch.II Mean 222,10 209,90 Variansi 23,6556 42,1000 Simp.Baku 486 4,86 649 6,49 Min. 216 201 Max. 229 219 Q1 218 204,25 Median 221,5 210 Q3 226,5 214,75 230 229 230 225 220 226,5 221,5 225 220 218 215 216 215 219 214,75 210 210 210 205 205 204,2525 200 195 Batch 1 200 195 201 Batch 2 APA YANG DAPAT DISIMPULKAN?? KESIMPULAN DESKRIPTIF @ UM 30
TUGAS 1 Emisi karbon pada kecepatan stasioner (dalam ppm) pada mobil-mobil keluaran tahun 1980 dan 1990 dicatat dengan mengambil 20 sampel mobil secara acak untuk setiap model. Model 1980 141 359 247 940 882 494 306 210 105 880 200 223 188 940 241 190 300 435 241 380 Model 1990 140 160 20 20 223 60 20 95 360 70 220 400 217 58 235 380 200 175 85 65 Q: Apakah emisi populasi berubah dari tahun 1980 dan 1990? Dikumpul Senin, 7 Februari 2011 Sumber: Walpole (2006), hal.29 @ UM 31
Transformasi dilakukan untuk mendapatkan bentuk distribusi yang lebih simetris. Transformasi Tangga Tukey -1/x 2-1/x x log (x) x x 2 x 3 10 x untuk bentuk distribusi : skewness positif data awal untuk bentuk distribusi : skewness negatif Merenggangkan data data yang berharga kecil dan merapatkan data data yang berharga besar Merapatkan data data yang berharga kecil dan merenggangkan data data yang berharga besar Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x 2, x 3, dan 10 x. 32
x 87 37 59 49 69 95 83 87 39 95 83 76 83 26 46 transformasi y = x 2 Lebih mendekati simetris (skew = 0) 7569 dibanding sebelum transformasi 1369 (skew = -0,5) 3481 2401 4761 9025 6889 skew = -0,18 7569 1521 9025 6889 5776 6889 676 ** Ketika data ditransformasi, maka satuan 2116 dari data juga akan berubah 33
TUGAS A Mencari, mengumpulkan, mengolah, lhmenganalisis i dan menarik kesimpulan atas data Anda sendiri. Sumber data: buku teks, TA, data praktikum, koran, majalah, internet, dll (sebaiknya disesuaikan dengan permasalahan yang mungkin dihadapi di prodi masing masing). Ceritakan tentang data tersebut (histori data). Tugas A diketik pada kertas (A4) dikumpul Senin, 7 Februari 2011 @ UM 34
Berikut adalah nilai UTS 1 dari 55 mahasiswa MA2181 Analisis Data Tahun 2010. 70,5 75,5 68 85,5 84,5 78,5 58,5 82 75,5 84 64,5 53 69,5 92,5 62 68,5 74,5 59,5 83 79,5 89,5 79 53 54 84 66 79 78,5 84 80,5 74,5 74,5 64 74,5 73 75 82 73 67,5 70 68 75 70,5 74,5 70,5 62 61,5 81 58,55 43,5 74,5 39 77 87 71 Histori data: Nilai UTS 1 ini diambil dari kelas 02 tahun 2010 yang mahasiswanya adalah terdiri dari 54 mahasiswa angkatan 2009 dan 1 orang mahasiswa angkatan 2008 prodi Matematika ITB UTS 1 dilaksanakan pada hari Rabu, 13 Oktober 2010. Pelaksanaan ujian adalah paralel dengan kelas 01. Soal ujian terdiri dari dua bagian, dimana Bagian I terdiri dari 4 soal Pilihan Ganda dan 2 soal Pilihan Benar-Salah, dan Bagian II terdiri dari 3 soal ESEI. Nilai maksimum adalah 100 (Soal UTS 1 dilampirkan). Sumber: Nilai UTS 1 MA 2181 Analisis Data, Kelas: 02, Pengajar: Utriweni Mukhaiyar @ UM 35
@ UM 36
Djauhari, M.A., 2001, Catatan Kuliah Analisis Data. Walpole, Ronald E., et.al, Statistitic for Scientist and Engineering, 8th Ed., 2007. 37