STATISTIK, PENGERTIAN DAN EKSPLORASI DATA 1. Populasi da Sampel. Statistik da Statistika 3. Jeis-jeis Observasi 4. Statistika Deskriptif Sari Numerik Peyajia Data 008 by USP & UM ; last edited Aug 10 MA 181 Aalisis Data, Agustus 010 Utriwei Mukhaiyar ILUSTRASI Data ilai ujia Aalisis Data dari 15 mahasiswa Program Studi Matematika semester gajil tahu 008: 87 37 59 49 69 95 83 87 39 95 83 76 83 6 46 Berapa rata-rata ilai ujia? Statistika deskriptif Seberapa meyebarya kemampua dari mahasiswa? Adakah mahasiswa yag perlu perhatia khusus? Apakah rata-rata ilai tahu ii lebih baik daripada tahu lalu? Iferesi statistik STATISTIK DAN STATISTIKA Statistik : ilai-ilai ukura data yag mudah dimegerti. Cotoh : statistik liga sepak bola Idoesia Statistika : ilmu yag berkaita dega cara pegumpula, pegolaha, aalisis da perarika kesimpula atas data. 3 1
JENIS-JENIS STATISTIKA 1. Statistika deskriptif: metode yag berkaita dega pegumpula da peyajia data.. Statistika iferesi: metode yag berkaita dega aalisis sampel utuk pearika kesimpula tetag karakteristik populasi. 4 POPULASI DAN SAMPEL Populasi Sampel setiap obyek populasi memiliki kemugkia/kesempata yag sama utuk terpilih Sampel Acak hasil pegukura atau pegamata Data 5 CONTOH POPULASI DAN SAMPEL Aka dilakuka peelitia apakah tahu pertama di ITB (TPB) memberika pegaruh terhadap perubaha berat bada mahasiswa. Utuk itu dilakuka pegambila data pada hari terakhir ujia TPB. Populasi Seluruh mahasiswa TPB ITB? Kedala: - sagat bayak, -meghabiska waktu, -meghabiska biaya Keterwakila sampel atas populasi?? Kaidah Pegambila Sampel (Tekik Samplig) @ UM Sampel Cotoh: tiap-tiap kelas TPB diambil secara acak 10 orag mahasiswa. 6
JENIS-JENIS OBSERVASI OBSERVASI / DATA KUALITATIF KUANTITATIF Nomial Ordial/Rak Diskrit Kotiu Tidak megeal uruta da operasi aritmatika Megeal uruta da operasi aritmatika Berhubuga dega proses meghitug, da pegamata atas himpua terhitug. Didasarka pada suatu selag/iterval sehigga meliputi semua bilaga riil Wara batua (abuabu, hitam, putih, coklat, dll), jeis kelami, dll Ukura baju (S, M, L, XL), ukura kepuasa (tidak suka sama sekali, tidak suka, biasa saja, suka, sagat suka) Bayakya pekerja yag dibutuhka dalam suatu area pertambaga, jarak yag dilagkahi seseorag (bisa mudur, bisa maju) per 0,5 meter Berat batua, luas area pertambaga, 7 jarak tempuh truk pegagkut, suhu, dll STATISTIKA DESKRIPTIF Metode yag berkaita dega pegolaha da peyajia suatu gugus data sehigga memberika iformasi yag bergua. betuk distribusi data 8 KARAKTERISTIK DISTRIBUSI 1. PARAMETER DISTRIBUSI Ukura Pemusata Ukura Peyebara Kemecega Kelacipa mea, media, modus, kuartil atas, kuartil bawah, dll Rage, simpaga baku, variasi, jagkaua atar kuartil, dll skewess kurtosis. BENTUK DISTRIBUSI Berpucak Jamak Berpucak Tuggal Simetris Meceg/skew Positif Meceg/skew Negatif mea = media mea > media mea < media 9 # modus > 1 # modus = 1 3
CONTOH KASUS Berikut adalah data ilai ujia Statistik Dasar dari 15 mahasiswa Program Studi tertetu. ( = 15) 87 37 59 49 69 95 83 87 39 95 83 76 83 6 46 x 1 x x 9 x 1 x 15 Data yag diurutka: 6 37 39 46 49 59 69 76 83 83 83 87 87 95 95 x (1) x () x (9) x (1) x (15) miimum Adakah perbedaa dari peyajia kedua data di atas? 10 maksimum UKURAN PEMUSATAN DATA 1. Mea (rata-rata) 1 x Cotoh : i 1 x i x1x... x15 x 15 87 37... 46 67,60 15 11 6 50 37 % 39 data 46 49 (awal) 59 69 76 83 50% 83 data 83 87(akhir akhir) 95 95 x 3 x x x (8). Media Nilai tegah yag membagi dua kelompok data sama bayak. med = x (8) = 76 3. Modus Nilai yag palig serig mucul. mod = 83 1 4
4. KUARTIL 6 5 37 % 39 46 49 5 59 % 69 76 83 583 % 83 87 87 595 % 95 q 1 q = med q 3 Kuartil bawah (q 1 ) : q1 x 1 q1 x x(4) 46 151 4 4 Kuartil tegah (q ) : q x x Kuartil atas (q 3 ) : q x ( 1) 1 4 q x x 76 151 (8) 3 3( 1) 4 3 3(151) (1) 4 13 q x x 87 5. PERSENTIL 6 37 39 46 49 59 69 76 83 83 83 87 87 95 95 p 5 p 50 = med p 75 Persetil ke-i : x i( 1) Persetil ke-50 : media x 100 Persetil ke-5 da Persetil ke-75? x 50( 1) 1 100 kuartil bawah kuartil atas 14 UKURAN PENYEBARAN DATA 1. Jagkaua data (Rage) R = data max data mi R = 95 6 = 69. Variasi x i 1 1 i 1 s ( xi x) x i 1 i1 1 i1 s 59,571571 JK XX 3. Simpaga Baku (stadard deviatio) s = s s 59,571 3,01 4. Jagkaua atar kuartil dq = q 3 q 1 dq = q 3 q 1 = 87 46 = 41 15 5
DATA PENCILAN Data yag ilaiya berbeda jauh dari kelompok data yag lai. Bagaimaa medeteksi data pecila?? 1. Hitug dq dq = 41. Hitug BBP = q 1 k.dq BBP = 46 (1,5)(41) = -15,5 Pilih ilai k = 3/ (tidak mutlak) 3. Hitug BAP = q 3 + k.dq BAP = 87 + (1,5)(41) = 148,5 4. Pecila bawah < BBP tidak ada pecila bawah 16 5. Pecila atas > BAP tidak ada pecila atas SARI NUMERIK Cout (bayak data, ) 15 Sum (jumlah data) 1014 Average (rata-rata) 67.6 Media (kuartil tegah) 76 Mode (modus) 83 Miimum 6 Maximum 95 Rage 69 Stadard Deviatio 3.01 Variace 59.571 Skewess -0.50* Kurtosis -1.3* 5th Percetile (persetil-5) 46 50th Percetile (persetil-50) 76 75th Percetile (persetil-75) 87 Iterquartile Rage (dk) 41 * Perhituga dega Mic. Excel mea < media Meceg kiri 17 PENYAJIAN DATA 1. Pie Chart. Dot Plot 3. Histogram 4. Diagram Batag Dau (stem - leaf) 5. Diagram Kotak Titik (box plot) 6. dll Skala peggambara harus diperhatika dalam peyajia data dalam betuk grafik. Peyajia data dalam betuk grafik dapat dilakuka secara maual maupu megguaka software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Miitab da laiya. 18 6
f PIE CHART 10% 9% 3% 58% Pie chart merupaka grafik yag berbetuk ligkara yag maa setiap potogaya mewakili proporsi atau persetase suatu kompoe dari sebuah kelompok data (100%). Pemakaia pie chart haya cocok ketika meyataka data dalam betuk proporsi dari satu kelompok data. 19 DOT PLOT 3.5 3.5 frekuesi 1.5 1 0.5 0 0 0 40 60 80 100 Cara meggambarka data dalam betuk titik, dega memperhatika frekuesi dari data yag bersagkuta Titik ditumpuk diatas ilai data yag digambarka. 0 ilai HISTOGRAM Histogram adalah gambar berdasarka distribusi frekuesi Setiap frekuesi dipresetasika oleh suatu segi empat (rectagle). Daerah setiap rectagle sebadig dega frekuesiya. 1 7
DIAGRAM BATANG-DAUN (STEM-LEAF) Stem atau batag, mirip dega grup data pada histogram, sedagka leaf atau dau, mirip dega frekuesi. Stem atau batag adalah digit pertama yag terpetig yag ada dalam bilaga yag membetuk harga data, sedagka digit di belakagya aka merupaka leaf atau dau. Melalui stem-leaf masih dapat dilihat ilai data metahya. DIAGRAM KOTAK-TITIK (BOX-PLOT) 100 90 80 70 95 max 85 76 q q 3 mea 60 50 40 47.5 q 1 30 0 6 mi 10 0 Box Plot diguaka utuk meyelidiki distribusi tapa megguaka grup data seperti pada histogram da diagram batag dau. Box Plot terdiri dari: data mi, q 1, q (media), q 3, da 3 data max yag disusu secara terurut dega membetuk kotak. PENCILAN PADA BOX PLOT * pecila atas max kedua q3 q 3 q mea mi ketiga q 1 * * pecila bawah 4 8
KELEMAHAN DAN KEUNGGULAN DOT PLOT HISTOGRAM BATANG- DAUN BOX PLOT KELEMAHAN KEUNGGULAN Tidak efektif utuk ukura Cepat data yag besar Nilai data asli dapat diperkiraka Lama Histogram peluag dapat memberi gambara tetag distribusi populasi Bayak perhituga Tidak meutut ketelitia dalam Nilai data tidak ampak mecatat t setiap ilai i data Meutut ketelitia mecatat dau Membutuhka perhituga yag pajag Terdiri dari parameterparameter dari data yag sudah diurutka Cepat Tidak memerluka perhituga Nilai data asli dapat dilihat Memudahka perhituga berbagai parameter Box plot dapat memberi gambara tetag betuk distribusi populasi Efektif utuk membadigka 5 betuk distribusi beberapa kelompok data sekaligus BENTUK DISTRIBUSI IDEAL NORMAL mea = media Memiliki betuk distribusi yag simetris, yaitu : Skewess = 0 Kurtosis = 3, (dalam software tertetu kurtosis ormal = 60 TRANSFORMASI DATA Trasformasi dilakuka utuk medapatka betuk distribusi yag lebih simetris. Trasformasi Tagga Tukey -1/x -1/x x log (x) x x x 3 10 x utuk betuk distribusi : skewess positif data awal utuk betuk distribusi : skewess egatif Data cotoh kasus : skewess = -0,5 (meceg kiri), maka trasformasi yag mugki adalah x, x 3, da 10 x. Mereggagka data data yag berharga kecil da merapatka data data yag berharga besar Merapatka data data yag berharga kecil da mereggagka data data yag berharga besar 7 9
TRANSFORMASI DATA CONTOH KASUS x 87 37 59 49 69 95 83 87 39 95 83 76 83 6 46 trasformasi 7569 1369 3481 401 4761 905 6889 7569 151 905 6889 5776 6889 676 116 y = x Lebih medekati simetris (skew = 0) dibadig sebelum trasformasi (skew = -0,5) skew = -0,18 ** Ketika data ditrasformasi, maka satua 8 dari data juga aka berubah REFERENSI Djauhari, M.A., 001, Catata Kuliah Aalisis Data. Devore, J.L. ad Peck, R., Statistics The Exploratio ad Aalysis of Data, USA: Duxbury Press, 1997. Walpole, Roald E. da Myers, Raymod H., Ilmu Peluag da Statistika ik utuk Isiyur da Ilmuwa, Edisi i 4, Badug: Peerbit ITB, 1995. Walpole, Roald E., et.al, Statistitic for Scietist ad Egieerig, 8th Ed., 007. Wild, C.J. ad Seber, G.A.F., Chace Ecouters A first Course i Data Aalysis ad Iferece, USA: Joh Wiley&Sos,Ic., 000. 9 Pasaribu, U.S., 007, Catata Kuliah Biostatistika. 10