PENGANTAR STATISIK DAN ANALISIS DATA 1. Statistik dan Statistika 2. Populasi dan Sampel 3. Jenis-jenis Observasi 4. STATISTIKA DESKRIPTIF Sari Numerik Penyajian Data MA 2181 Analisis Data 8 Agustus 2011 Utriweni Mukhaiyar
Ilustrasi 2 Data banyaknya pelanggan yang datang ke sebuah mini market di 15 hari tertentu pada bulan Juli 2011. 26 37 76 49 95 69 83 87 39 95 59 83 83 87 46 Q1: Berapa rata-rata banyak pelanggan yang datang di 15 hari tsb? Q2 : Seberapa menyebarnya banyak pelanggan yang datang dalm 15 hari tsb? Q4 : Apakah rata-rata pelanggan yang datang di mini market tsb lebih besar dibanding mini market lainnya Q3 : Adakah hari yang perlu perhatian khusus?
Statistik ti tik dan Statistika ti tik 3 Statistik : nilai-nilai ukuran data yang mudah dimengerti. Contoh : statistik IP mahasiswa ITB semester II 2010-2011 Statistika : ilmu yang berkaitan dengan cara pengumpulan, pengolahan, analisis dan pernarikan kesimpulan atas data.
Jenis-jenis Statistika 4 1. Statistika deskriptif: metode yang berkaitan dengan pengumpulan dan penyajian data. 2. Statistikati tik inferensi: i metode yang berkaitan dengan analisis sampel untuk penarikan kesimpulan tentang karakteristik populasi.
Populasi dan Sampel 5 Populasi Sampel setiap obyek populasi memiliki kemungkinan/kesempatan yang sama untuk terpilih Sampel Acak hasil pengukuran atau pengamatan Data
Contoh Populasi dan Sampel 6 Akan dilakukan k penelitian i apakah tahun pertama di ITB (TPB) memberikan pengaruh terhadap perubahan berat badan mahasiswa. Untuk itu dilakukan pengambilan data pada hari terakhir ujian TPB. Populasi Kendala: - sangat banyak, -menghabiskan waktu, -menghabiskan biaya Seluruh u mahasiswa TPB ITB Keterwakilan sampel Kaidah Pengambilan? atas populasi p?? Sampel (Teknik Sampling) Sampel Contoh: tiap-tiap kelas TPB diambil secara acak 10 orang mahasiswa.
Jenis-jenis Observasi 7 OBSERVASI / DATA KUALITATIF KUANTITATIF Nominal Ordinal/Rank Diskrit Kontinu Berhubungan dengan proses menghitung, Didasarkan pada suatu selang/interval sehingga meliputi Tidak mengenal Mengenal urutan urutan dan operasi dan operasi danpengamatanatas aritmatika aritmatika himpunan terhitung. semua bilangan riil Jnis bidang datar (persegi, lingkaran, jajaran genjang, dll), jenis kelamin, dll 2008 by UM Kapasitas hard disk (80GB, 160GB, 320GB,...), kelas penumpang pesawat (ekonomi, bisnis), dll Banyaknya peserta OSKM 2011 dari fakultas MIPA, banyaknya yang antri di depan bioskop, dll Waktu tercepat mobil F1 di setiap pertandingan, luas daerah hijau di kota Bandung, dll
Statistika Deskriptif 8 Metode yang berkaitan dengan pengolahan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. bentuk distribusi data
Karakteristik k Distribusi 9 1. PARAMETER Ukuran DISTRIBUSI Pemusatan Ukuran Penyebaran Kemencengan Kelancipan mean, median, modus, kuartil atas, kuartil bawah, dll Range, simpangan baku, variansi, jangkauan antar kuartil, dll skewness kurtosis 2. BENTUK DISTRIBUSI Berpuncak Jamak Berpuncak Tunggal Simetris Menceng/skew Positif Menceng/skew Negatif mean = median mean > median mean < median # modus > 1 # modus = 1
CONTOH KASUS 10 Data banyaknya pelanggan yang datang ke sebuah mini market di 15 hari tertentu pada bulan Juli 2011. (n = 15) 26 37 76 49 95 69 83 87 39 95 59 83 83 87 46 x 1 x 2 x 9 x 12 x 15 Data yang diurutkan: 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 x (1) x (2) x (9) x (12) x (15) minimum Adakah perbedaan dari penyajian kedua data di atas? maksimum
Ukuran Pemusatan & 11 Penyebaran Data Ukuran pemusatan data statistik yang memberikan informasi dimana data terkumpul dengan ukuran/jumlah tertentu. Contoh : Mean (rataan), kuartil bawah, kuartil tengah (median), kuartil atas, modus, persentil,... Ukuran penyebaran data statistik yang memberikan informasi bagaimana data menyebar di sekitar pusat data. Contoh : range (jangkauan data), IQR (jangkauan antar kuartil), variansi, standar deviasi (simpangan baku),...
Ukuran Pemusatan Data 12 1. Mean (rata-rata) x 1 n n i 1 x i Contoh : x x x... x 1 2 15 15 87 37... 46 15 67,60
13 26 50 37 % 39 data 46 49 (awal) 59 69 76 83 50% 83 data 83 87 (akhir) 87 95 95 x (8) 3 x 2 x 2 x 2. Median Nilai tengah yang membagi dua kelompok data sama banyak. med = x (8) = 76 3. Modus Nilai yang paling sering muncul. mod = 83
4. Kuartil 14 26 25 37 % 39 46 49 25 59 % 69 76 83 25 83 % 83 87 87 25 95 % 95 q 1 q 2 = med q 3 Kuartil bawah (q 1 ) : q1 x n 1 q1 x x(4) 46 Kuartil tengah (q 2 ) : Kuartil atas (q 3 ) : 4 q x x 2 2( n1) n1 4 2 q x x q x 2 151 (8) 2 3 3( n 1) 4 151 4 76 q x x 3 3(151) (12) 4 87
5. Persentil 15 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 p 25 p 50 = med p 75 Persentil ke-i : i( n1) Persentil ke-50 : median x x 100 x 50( n1) n1 100 2 Persentil ke-25 dan Persentil ke-75? kuartil bawah kuartil atas
Ukuran Penyebaran Data 16 Tidak memberikan informasi apa- apa, karena : i 1 n n Data : x 1, x 2, x 3,..., x n Rataan : x Ukuran penyebaran data yang melihat bagaimana SETIAP (keseluruhan) observasi terpisah dari pusat data. n ( x x) ( x x) x nx nx nx 0 n i i i 1 i 1 2 ( xi x) i1 i Jumlah Kuadrat (JK)
Ukuran Penyebaran Data 17 1. Jangkauan data (Range) R = 95 26 = 69 R = data max data min 2. Variansi n? x n n i 2 1 2 1 2 i 1 s ( xi x) x i n 1 i1 n 1 i1 n 2 2 s 529,25712571 JK XX 3. Simpangan Baku (standard deviation) ) s = s 2 s 529,2571 23,01 4 Jangkauan antar kuartil 4. Jangkauan antar kuartil dq = q 3 q 1 dq = q 3 q 1 = 87 46 = 41
Data Pencilan 18 Data yang nilainya berbeda jauh dari kelompok data yang lain. Bagaimana mendeteksi data pencilan?? 1. Hitung dq dq = 41 2. Hitung BBP = q 1 k.dq Pilih nilai i k = 3/2 (tidak mutlak) BBP = 46 (1,5)(41) = -15,5 3. Hitung BAP = q 3 + k.dq BAP = 87 + (1,5)(41) = 148,5 4. Pencilan bawah < BBP tidak ada pencilan bawah 5. Pencilan atas > BAP tidak ada pencilan atas
SARI NUMERIK Count (banyak data, n) 15 Sum (jumlah data) 1014 Average (rata-rata) t 67.66 Median (kuartil tengah) 76 Mode (modus) 83 Minimum 26 Maximum 95 Range 69 Standard Deviation 23.01 Variance 529.2571 Skewness -0.50* Kurtosis -1.23* 25th Percentile (persentil-25) 46 50th Percentile (persentil-50) 76 75th Percentile (persentil-75) 87 Interquartile Range (dk) 41 19 * Perhitungan dengan Mic. Excel mean < median Menceng kiri
Penyajian Data 20 1. Tabel Distribusi Frekuensi 2. Pie Chart 3. Dot Plot 4. Histogram 5. Diagram Batang Daun (stem - leaf) 6. Diagram Kotak Titik (box plot) 7. dll Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik. Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
Tabel Distribusi Frekuensi 21 Data banyaknya pelanggan yang datang ke sebuah mini market di 15 hari tertentu pada bulan Juli 2011. 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 Kelas Titik Frekuensi Frekuensi Interval Tengah (f) Kumulatif Kelas 21-35 28 1 1 36-50 43 4 5 51-65 58 1 6 66-80 73 2 8 81-95 88 7 15 Bagaimana bentuk histogramnya? PRINSIP DASAR PELUANG
Pie Chart 22 9% 10% 23% 58% Pie chart merupakan grafik yang berbentuk lingkaran yang mana setiap potongannya mewakili proporsi atau persentase suatu komponen dari sebuah kelompok data (100%). Pemakaian pie chart hanya cocok ketika menyatakan data dalam bentuk proporsi dari satu kl kelompokdata.
Dot Plot 23 3,5 3 2,5 frekuensi f 2 1,5 1 0,5 0 0 20 40 60 80 100 nilai Cara menggambarkan data dalam bentuk titik, dengan memperhatikan frekuensi dari data yang bersangkutan Titik ditumpuk diatas nilai i data yang digambarkan.
Histogram 24 Histogram adalah gambar berdasarkan distribusi frekuensi Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle). Daerah setiap rectangle sebanding dengan frekuensinya.
Diagram Batang-Daun (Stem-Leaf) L 25 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 Stem atau batang, mirip dengan grup data pada histogram, sedangkan leaf atau daun, mirip dengan frekuensi. Stem atau batang adalah digit pertama yang terpenting yang ada dalam bilangan yang membentuk harga data, sedangkan digit di blk belakangnya akan merupakan leaf atau daun. Melalui stem-leaf masih dapat dilihat nilai data mentahnya.
Diagram Kotak-Titik (Box-Plot) 26 100 95 90 80 70 60 50 40 30 26 20 10 0 max 85 76 47,5 min q 2 q 3 q 2 q 1 mean Box Plot digunakan untuk menyelidiki distribusi tanpa menggunakan grup data seperti pada histogram dan diagram batang daun. Box Plot terdiri dari: data min, q 1, q 2 (median), q 3, dan data max yang disusun secara terurut dengan membentuk kotak.
Pencilan pada Box Plot 27 * pencilan atas BAP (pagar atas) upper whisker q 3 maksimum q 2 q 3 mean q 1 lower whisker minimum * * BBP (pagar bawah) pencilan bawah
Kelemahan dan Keunggulan 28 DOT PLOT HISTOGRAM BATANG- DAUN BOX PLOT KELEMAHAN Tidak efektif untuk ukuran data yang besar Lama Banyak perhitungan Nilai data tidak nampak Menuntut ketelitian mencatat daun Membutuhkan perhitungan yang panjang Terdiri dari parameter- a parameter dari data yang sudah diurutkan KEUNGGULAN Cepat Nilai data asli dapat diperkirakan Histogram peluang dapat memberi gambaran tentang distribusi populasi Tidak menuntut ketelitian dalam mencatat t setiap nilai i data Cepat Tidak memerlukan perhitungan Nilai data asli dapat dilihat Memudahkan perhitungan berbagai parameter Box plot dapat memberi gambaran tentang bentuk distribusi populasi Efektif untuk membandingkan a bentuk distribusi beberapa kelompok data sekaligus
Bentuk Distribusi Ideal 29 Normal mean = median Memiliki bentuk distribusi yang simetris, yaitu : Skewness = 0 Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
Latihan 1 30 Suatu jenis polimer digunakan dalam sistem it evakuasi pesawat terbang. Penting diperhatikan bahwa polimer tersebut harus mampu melawan proses penuaan. Diambil dua puluh sampel polimer yang kemudian dibagi atas dua percobaan. Percobaan pertama (batch 1) yang melibatkan 10 sampel dikenakan proses percepatan penuaan dengan temperatur tinggi selama 10 hari. Sedangkan 10 sampel lainnya (batch 2) tidak dikenakan proses apa-apa. Kekuatan daya rentang (dalam psi) sampel-sampel tersebut diukur dan dicatat sebagai berikut. Batch 1 227 222 218 217 225 218 216 229 228 221 Batch 2 219 214 215 211 209 218 203 204 201 205 Q: Apakah percobaan proses penuaan memberikan dampak pada kekuatan daya rentang polimer? Sumber: Walpole (2006), hal.13
Latihan 1 31 - Keluarkan sari numerik yang mungkin Ukuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH- ATAS Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL, VARIANSI,SIMPANGAN BAKU Lain-lain : SKEWNESS dan KURTOSIS Apakah diperlukan??? Pilih plot yang informatif untuk menjawab pertanyaan tersebut Misal: BOXPLOT
32 SARI NUMERIK Batch.1 Batch.II Mean 222,10 209,9090 Variansi 23,6556 42,1000 Simp.Baku 4,86 6,49 Min. 216 201 Max. 229 219 Q1 218 204,25 Median 221,5 210 Q3 226,5 214,75 230 225 229 226,5 230 225 220 215 216 221,5 218 220 215 219 214,75 210 210 210 205 205 204,25 200 195 Batch 1 200 195 201 Batch 2 APA YANG DAPAT DISIMPULKAN?? @ UM
Latihan 2 33 Berikut adalah data historis gaji pegawai (dollar per siswa pada 30 sampel sekolah di US bagian timur awal tahun 1970). 3,79 2,99 2,77 2,91 3,10 1,84 2,52 3,22 2,45 2,14 267 2,67 252 2,52 271 2,71 275 2,75 357 3,57 385 3,85 336 3,36 205 2,05 289 2,89 283 2,83 23,13 2,44 2,10 3,71 3,14 3,54 2,37 2,68 3,51 3,37 Q: 1. Keluarkan sari numerik data di atas. 2. Hitung variansi dengan 2 cara, bandingkan. 3. Buat box plot. 4. Ceritakan hasil olahan data Anda. Sumber: Walpole (2006), hal.29 Dikumpul Senin, 15 Agustus 2011
Transformasi Data (pengayaan) 34 Transformasi dilakukan untuk mendapatkan bentuk distribusi yang lebih simetris. Transformasi Tangga Tukey -1/x 2-1/x x log (x) x x 2 x 3 10 x untuk bentuk distribusi : skewness positif data awal untuk bentuk distribusi : skewness negatif Merenggangkan data data d yang berharga kecil Merapatkan data data d yang berharga kecildan dan merapatkan data data yang berharga besar merenggangkan data data yang berharga besar Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x 2, x 3, dan 10 x.
Transformasi Data (pengayaan) Contoh Kasus 35 x y = x 2 87 37 59 49 69 95 83 87 39 95 83 76 83 26 46 transformasi Lebih mendekati simetris (skew = 0) 7569 dibanding sebelum transformasi 1369 (skew = -0,5) 3481 2401 4761 9025 6889 skew = -0,18 7569 1521 9025 6889 5776 6889 676 ** Ketika data ditransformasi, maka satuan 2116 dari data juga akan berubah
Latihan 3 36 Mencari, mengumpulkan, mengolah, menga nalisis dan menarik kesimpulan atas data Anda sendiri. Sumber data: buku teks, TA, data praktikum, koran, majalah, internet, dll (sebaiknya disesuaikan dengan permasalahan yang mungkin dihadapi diprodimasing masing masing). masing) Ceritakan tentang data tersebut (histori data). Tugas A diketik (Mic.Word atau Mic.Excel) dikumpul (online) Senin, Tugas A diketik (Mic.Word atau Mic.Excel) dikumpul (online) Senin, 22 Agustus 2011
Contoh Tugas A 37 Berikut adalah nilai UTS 1 dari 55 mahasiswa MA2181 Analisis Data Tahun 2010. 70,5 75,55 68 85,55 84,5 78,5 58,55 82 75,55 84 64,5 53 69,5 92,5 62 68,5 74,5 59,5 83 79,5 89,5 79 53 54 84 66 79 78,5 84 80,5 74,5 74,5 64 74,5 73 75 82 73 67,5 70 68 75 70,5 74,5 70,5 62 61,5 81 58,5 43,5 74,5 39 77 87 71 Histori data: Nilai UTS 1 ini diambil dari kelas 02 tahun 2010 yang mahasiswanya adalah terdiri dari 54 mahasiswa angkatan 2009 dan 1 orang mahasiswa angkatan 2008 prodi Matematika ITB UTS 1 dilaksanakan k pada hari Rabu, 13 Oktober 2010. 0 Pelaksanaan ujian adalah paralel dengan kelas 01. Soal ujian terdiri dari dua bagian, dimana Bagian I terdiri dari 4 soal Pilihan Ganda dan 2 soal Pilihan Benar-Salah, dan Bagian II terdiri dari 3 soal ESEI. Nilai maksimum adalah 100 (Soal UTS 1 dilampirkan). Sumber: Nilai UTS 1 MA 2181 Analisis Data, Kelas: 02, Pengajar: Utriweni Mukhaiyar
Lampiran Tugas A 38 @ UM
Referensi Djauhari, M.A., 2001, Catatan Kuliah Analisis Data. Walpole, Ronald E., et.al, Statistitic for Scientist and Engineering, 8th Ed., 2007. 39