1 Pendahuluan & Statistika Deskriptif Pendahuluan Statistical Thinking Percentil dan Kuartil Ukuran Pemusatan Ukuran Variabilitas Pengelompokkan Data Skewness dan Kurtosis Metoda Penyajian Data Analisis Data Penggunaan Komputer TI-131 Teori Probabilitas 1 1-1. Pendahuluan Statistika Deskriptif Collect Organize Summarize Display Analyze Tidak dilakukan generalisasi Statistika Inferensi Memperkirakan dan meramalkan nilai parameter populasi Menguji hipotesisi tentang nilai parameter populasi Membuat keputusan Inferensi berdasarkan keterbatasan informasi sample TI-131 Teori Probabilitas 1
Dua Type Data Qualitative - Categorical atau Nominal: Contoh: Warna Jenis kelamin Kewarganegaraan Quantitative - Measurable atau terhitung: Contoh: Temperatur Ongkos per unit Nilai ujian (a 100 point exam) TI-131 Teori Probabilitas 3 Skala Pengukuran Skala Nominal -group or kelas Jenis Kelamin Skala Ordinal -urutan Ranking Skala Interval - Perbedaan, selisih, jarak Temperatur Ratio Scale -perbandingan Ongkos per unit TI-131 Teori Probabilitas 4
Sample dan Populasi Populasi mencakup set dari seluruh pengukuran yang ingin diketahui. Sample adalah sebuah subset dari pengukuran yang dipilih dari populasi. Sensus adalah complete enumeration dari setiap item dalam populasi. TI-131 Teori Probabilitas 5 Sample Random Sederhana Sampling dari populasi dilakukan secara random, sedemikian sehingga setiap sampel berukuran sama (n) memiliki kesempatan yang sama untuk diambil atau dipilih. Sebuah sample yang diambil dengan cara tersebut disebut sebuah sample random sederhana atau sample random. TI-131 Teori Probabilitas 6 3
Sample dan Populasi Populasi (N) Sample (n) TI-131 Teori Probabilitas 7 Mengapa diambil sample? Sensus dari sebuah populasi mungkin: Tidak memungkinkan Tidak praktis Terlalu mahal/sulit TI-131 Teori Probabilitas 8 4
Tingkat Kepercayaan Sample yang baik adalah yang mewakili ciri atau karakteristik populasi. Tingkat kepercayaan (α) adalah bagian dari populasi yang tidak dapat terwakili dalam sample. Selalu ada kesalahan karena ketidakpastian (error), Ekspektasi [error] = variansi + (bias) TI-131 Teori Probabilitas 9 Proses Deduksi dan Induksi Hipotesis 1 Deduksi Konsekuensi 1 Modifikasi (hipotesis ) Induksi Fenomena Eksperimen Data TI-131 Teori Probabilitas 10 5
1- Statistical Thinking System Thinking Statistical Method Process Variation Data Improvement Falsafah Analisis Tindakan Observed Value= True value + Systematic Error + Random (sampling) Error TI-131 Teori Probabilitas 11 1-3 Persentil dan Kuartil Pada sebuah set observasi numerik, urutkan berdasarkan besarnya. Persentil ke-p dalam urutan adalah nilai dimana nilai observasi dibawahnya mencakup p% dari seluruh observasi dalam set. Position dari persentil ke-p adalah (n + 1)p/100, dimana n adalah jumlah observasi dalam set. TI-131 Teori Probabilitas 1 6
Contoh 1-3 (1) Data Produksi Sebuah perusahaan manufaktur perakit kendaraan memiliki data produksi harian dari lantai produksinya. Pada perioda bulan yang lalu terdapat 0 hari kerja dengan tingkat produksi seperti pada halaman berikut. TI-131 Teori Probabilitas 13 Contoh 1-3 () Produksi dan urutannya Produksi dan urutannya 9 6 6 9 1 10 10 1 13 13 15 14 16 14 14 15 14 16 16 16 17 16 16 17 4 17 1 18 18 18 19 19 0 18 1 0 17 4 TI-131 Teori Probabilitas 14 7
Contoh 1-3 (3) Persentil Temukan persentil ke- 50, 80, dan 90 dari set data. Persentil ke-50 dietnatukan oleh data pada posisi (n+1)p/100 = (0+1)(50/100) = 10.5. Maka persentil ke-50 terletak pada posisi ke- 10.5. Observasi ke-10 adalah 16, dan posisi ke-11 adalah 16. Persentil ke-50 adalah ditengah nilai ke-10 dan 11, maka bernilai 16. TI-131 Teori Probabilitas 15 Contoh 1-3 (4) Persentil Persentil ke-80 dietnatukan oleh data pada posisi (n+1)p/100 = (0+1)(80/100) = 16.8. Maka persentil ke-80 terletak pada posisi ke- 16.8. Observasi ke-16 adalah 19, dan posisi ke-17 adalah 0. Persentil ke-80 adalah 0.8 diantara nilai ke- 16 dan 17, maka bernilai 19.8. TI-131 Teori Probabilitas 16 8
Contoh 1-3 (5) Persentil Persentil ke-90 dietnatukan oleh data pada posisi (n+1)p/100 = (0+1)(90/100) =. Maka persentil ke-50 terletak pada posisi ke- Observasi ke- adalah, dan posisi ke- adalah. Persentil ke-90 adalah di antara nilai ke- dan, maka bernilai. TI-131 Teori Probabilitas 17 Kuartil Kuartil aadalah nilai persentase yang membagi data menjadi 4 bagian yang sama. Kuartil pertama adalah percentil ke-5, merupakan nilai yang mencakup 1/4 data pertama. Kuartil kedua adalah persentil ke-50, merupakan nilai yang mencakup 1/ data pertama. Seringkali dikenal sebagai median. Kuartil ketiga adalah persentil ke-75, merupakan nilai yang mencakup 3/4 data pertama. TI-131 Teori Probabilitas 18 9
Kuartil dan Rentang Antar Kuartil Kuartil pertama (persentil k-5) disebut kuartil bawah. Kuartil kedua (persentil ke-50) disebut kuartil tengah. Kuartil ketiga (persentil ke-75) disebut kuartil atas. Rentang antar kuartil adalah perbedaan antara kuartil pertama dan ketiga. TI-131 Teori Probabilitas 19 Contoh 1-3 (6) - Kuartil (n+1)p/100 Kuartil Produksi Urutan 9 6 6 9 1 10 10 1 13 13 15 14 16 14 14 15 14 16 16 16 17 16 16 17 4 17 1 18 18 18 19 19 0 18 1 0 17 4 Kuartil pertama Median Kuartil ketiga (0+1)5/100=5.5 (0+1)50/100=10.5 (0+1)75/100=15.75 13 + (.5)(1) = 13.5 16 + (.5)(0) = 16 18+ (.75)(1) = 18.75 TI-131 Teori Probabilitas 0 10
Ukuran Parameter Population & Statistik Sample Ukuran pemusatan Median Mode Mean Ukuran variabilitas Range Interquartile range Variance Standard Deviation Ukuran lain: Skewness Kurtosis TI-131 Teori Probabilitas 1 1-4 Ukuran Pemusatan Data atau Lokasi Median Nilai tengah data yang diurutkan Persentil ke-50 Modus/mode Frekuensi tertinggi Mean Rata-rata TI-131 Teori Probabilitas 11
Contoh 1.3 (7) - Median Produksi Sorted 9 6 6 9 1 10 10 1 13 13 15 14 16 14 14 15 14 16 16 16 17 16 16 17 4 17 1 18 18 18 19 19 0 18 1 0 17 4 Median Median Percentile ke-50 (0+1)50/100=10.5 16 + (.5)(0) = 16 Median adalah nilai tengah dari data yang diurutkan. Adalah nilai persentil ke- 50. TI-131 Teori Probabilitas 3 Contoh 1-3 (8) - Modus............ ::.. :: :: ::.......... --------------------------------------------------------------- 6 9 10 10 1 113 1314 1415 1516 1617 1718 1819 190 01 1 4 4 Modus = 16 Modus adalah nilai yang paling sering muncul, merupakan nilai dengan frekuensi tertinggi. TI-131 Teori Probabilitas 4 1
Arithmetic Mean atau Rata-rata Mean dari sebuah set data observasi adalah ratarata penjumlahan nilai observasi dibagi dengan jumlah observasi. Population Mean N x i µ = = 1 N Sample Mean n x i x = = 1 n TI-131 Teori Probabilitas 5 Contoh 1-3 (9) - Mean produksi 9 6 1 10 13 15 16 14 14 16 17 16 4 1 18 19 18 0 17 317 n x i= 1 317 x = = = n 0 1585. TI-131 Teori Probabilitas 6 13
Contoh 1-3 (10) - Ukuran Lokasi............ ::.. :: :: ::.......... --------------------------------------------------------------- 6 9 10 10 1 113 1314 1415 1516 1617 1718 1819 190 01 1 4 4 Mean = 15.85 Median and Mode = 16 TI-131 Teori Probabilitas 7 Ukuran Rata-rata Lain Rata-rata terbobot (weighted mean), diperoleh dengan cara memberi bobot pada setiap data. Rata-rata geometris (geometrics mean) diperoleh dengan menggunakan frekuensi data sebagai pangkat dan selanjutnya diakar sebanyak jumlah data. Rata-rata geometris digunakan untuk perubahan relatif/growth. Rata-rata harmonik (harmonic mean) adalah bentuk invers dari rata-rata hitung. Rata-rata harmonik ini digunakan untuk menghitung data yang dinyatakan dalam bentuk inversnya. TI-131 Teori Probabilitas 8 14
Contoh Rata-rata Harmonik (1) Misalkan diperoleh data nilai persedian dari tiga kali pengiriman sebagai berikut: Tanggal Jumlah produk Nilai Nilai/produk 1/1 10 0.000.000 15/1 0 0.000 1.000 18/1 50 0.000 400 80 60.000 Rata-rata hitung adalah 1.133 (nilai persediaan 1.133x80=90.666). Rata-rata harmonik adalah 750 (total nilai 750x80=60.000) TI-131 Teori Probabilitas 9 1-5 Ukuran Variabilitas (Dispersi) Range(Rentang) Selisih antara data maximum dan minimum Rentang Antar Kuartil Selisih antara kuartil ketiga dan pertama (Q 3 - Q 1 ) Variance (Variansi) Rata-rata kuadrat penyimpangan dari mean Standard Deviation (Deviasi standar) Akar kuadrat dari variansi TI-131 Teori Probabilitas 30 15
Contoh 1-3 (11) Range dan Rentang Antar Kuartil Produksi Sorted Rank Range Maksimum - Minimum = 9 6 1 Minimum 4-6 = 6 9 18 1 10 3 10 1 4 13 13 5 15 14 6 Kuartil pertama Q 1 = 13 + (.5)(1) = 13.5 16 14 7 14 15 8 14 16 9 16 16 10 17 16 11 16 17 1 4 17 13 1 18 14 18 15 18 19 16 Kuartil ketiga Q 3 = 18+ (.75)(1) = 18.75 Rentang Q3 - Q1 = 0 19 17 4 0 Maksimum antar kuartil 18.75-13.5 = 5.5 19 18 0 1 17 18 TI-131 Teori Probabilitas 31 Variansi dan Deviasi Standar Variansi populasi Variansi sample σ = = σ = N i= 1 N i= 1 ( x µ ) x σ N ( N ) x N i= 1 N s = = s = n ( x x) i= 1 ( ) n 1 ( n ) x n i= 1 x i= 1 n ( n 1) s TI-131 Teori Probabilitas 3 16
Perhitungan Variansi Sample x x x ( x x) 6-9.85 97.05 36 9-6.85 46.95 81 10-5.85 34.5 100 1-3.85 14.85 144 13 -.85 8.15 169 14-1.85 3.45 196 14-1.85 3.45 196 15-0.85 0.75 5 16 0.15 0.05 56 16 0.15 0.05 56 16 0.15 0.05 56 17 1.15 1.35 89 17 1.15 1.35 89 18.15 4.65 34 18.15 4.65 34 19 3.15 9.95 361 0 4.15 17.5 400 1 5.15 6.55 441 6.15 37.85 484 4 8.15 66.45 576 x i= 1 s = ( n 1) ( x x) 37855. = ( 0 1) 37855. = = 19. 93684 19 n x n i= 1 x i= 1 = n ( n 1) ( 0 1) 5403 504. 45 37855. = = = 19. 93684 19 19 s = s = 19. 93684 = 4. 46 317 0 378.5500 5403 TI-131 Teori Probabilitas 33 n 5403 317 5403 100489 = 0 = 0 19 Perhitungan Variansi Sample () Nilai simpangan baku dapat diestimasi dari rata-rata rentang R (diasumsikan simetrik) dengan persamaan s=r/d 1, dimana d 1 (ditentukan oleh ukuran sampel) adalah: 3 4 5 6 7 8 9 10 1.18 1.693.059.36.534.704.847.970 3.078 TI-131 Teori Probabilitas 34 17
1-6 Pengelompokkan Data dan Histogram Pembagian data dalam kelompok dapat dilakukan secara sistematis: Aturan Sturges: L=1+3.3 log n Aturan Dixon & Kronmal: L= 10 log n. Aturan Emerson & Hoaglin: L= n. dimana L adalah jumlah kelas dan n adalah jumlah data Pengelompokkan memberi makna. TI-131 Teori Probabilitas 35 Sifat Kelompok Data Mutually exclusive Tidak overlapping sebuah observasi hanya ada dalam sebuah kelompok. Exhaustive Setiap observasi ditempatkan dalam sebuah kelompok. Equal-width (if possible) Kelompok pertama dan terakhir dapat berbeda. TI-131 Teori Probabilitas 36 18
Distribusi Frekuensi Frekuensi dari setiap kelompok : Jumlah observasi dalams etiap kelompok Jumlah frekuensi adalah jumlah observasi, yaitu N untuk populasi n untuk sample Kelompok midpoint adalah nilai tengah kelompok, kelas atau interval. Frekuensi relatif adalah prosentase dari total observasi dalam setiap kelompok Jumlah frekuensi relatif = 1 TI-131 Teori Probabilitas 37 Distribusi Frekuensi Contoh 1-6 Waktu operasi perakitan kendaraan bermotor xx f(x) f(x) f(x)/n f(x)/n Waktu Waktuoperasi (menit) (menit) Frekuensi Frekuensi (jumlah (jumlahproduk) Frekuensi Frekuensirelatif relatif 00 to to less less than than 100 100 30 30 0.163 0.163 100 100 to to less less than than 00 00 38 38 0.07 0.07 00 00 to to less less than than 300 300 50 50 0.7 0.7 300 300 to to less less than than 400 400 31 31 0.168 0.168 400 400 to to less less than than 500 500 0.10 0.10 500 500 to to less less than than 600 600 13 13 0.070 0.070 184 184 1.000 1.000 Contoh frekuensi: 30/184 = 0.163 Jumlah frekuensi relatif = 1 TI-131 Teori Probabilitas 38 19
Distribusi Frekuensi Kumulatif xx F(x) F(x) F(x)/n F(x)/n Waktu Waktuoperasi (menit) (menit) Frekuensi Frekuensikumulatif kumulatif Frekuensi Frekuensirelatif relatifkumulatif 00 to to less less than than 100 100 30 30 0.163 0.163 100 100 to to less less than than 00 00 68 68 0.370 0.370 00 00 to to less less than than 300 300 118 118 0.641 0.641 300 300 to to less less than than 400 400 149 149 0.810 0.810 400 400 to to less less than than 500 500 171 171 0.99 0.99 500 500 to to less less than than 600 600 184 184 1.000 1.000 Frekuensi kumulatif dari setiap kelompok adalah jumlah Frekuensidari kelompok sebelumnya (preceding groups). TI-131 Teori Probabilitas 39 Histogram Histogram adalah sebuah peta berbentuk batang dengan perbedaan ketinggian. Lebar dan lokasi batang menunjukkan lebar dan lokasi kelompok data. Tinggi batang menunjukkan frekuensi atau frekuensi relatif kelompok data. TI-131 Teori Probabilitas 40 0
Contoh Histogram Histogram frekuensi 5 0 5 0 4 0 3 8 Frequency 3 0 0 3 0 3 1 1 3 1 0 1 0 0 0 0 3 0 0 4 0 0 Waktu operasi (menit) 5 0 0 6 0 0 TI-131 Teori Probabilitas 41 Contoh Histogram Histogram frekuensi relatif 0.3 0. 7 1 7 3 9 R e la tive F re q ue nc y 0. 0.1 6 3 0 4 3 0. 0 6 5 0.1 6 8 4 7 8 0.1 1 9 5 6 5 0.1 0.0 7 0 6 5 1 0 0 0 0 3 0 0 4 0 0 Waktu operasi (menit) 5 0 0 6 0 0 TI-131 Teori Probabilitas 4 1
1-7 Skewness dan Kurtosis Skewness Ukuran kesimetrisan dari distribusi frekuensi Skewed ke kiri Unskewed atau simetris Skewed ke kanan Kurtosis Ukuran kedataran atau keruncingan distribusi frekuensi Platykurtic (relatif datar) Mesokurtic (normal) Leptokurtic (relatif runcing) TI-131 Teori Probabilitas 43 Skewness Skewed ke kiri 3 0 Mean < median < mode F re q ue nc y 0 1 0 0 1 0 0 0 0 3 0 0 x 4 0 0 5 0 0 6 0 0 TI-131 Teori Probabilitas 44
Skewness Simetris 3 0 Mean = median = mode F re q ue nc y 0 1 0 0 1 0 0 0 0 3 0 0 x 4 0 0 5 0 0 6 0 0 TI-131 Teori Probabilitas 45 Skewness 3 0 Skewed ke kanan Mode > median > mean F re q ue nc y 0 1 0 0 1 0 0 0 0 3 0 0 x 4 0 0 5 0 0 6 0 0 TI-131 Teori Probabilitas 46 3
Kurtosis Platykurtic distribusi cendrung mendatar 7 0 0 6 0 0 5 0 0 F re q u e n c y 4 0 0 3 0 0 0 0 1 0 0 0-3. 5 -. 7-1. 9-1. 1-0. 3 0. 5 1. 3. 1. 9 3. 7 X TI-131 Teori Probabilitas 47 Kurtosis Mesokurtic tidak terlalu datar atau terlalu runcing 5 0 0 4 0 0 F re q u e n c y 3 0 0 0 0 1 0 0 0-4 - 3 - - 1 0 1 3 4 X TI-131 Teori Probabilitas 48 4
Kurtosis Leptokurtic distribusi runcing 0 0 0 F re q u e n c y 1 0 0 0 0-1 0 Y 0 1 0 TI-131 Teori Probabilitas 49 1-8 Hubungan antara Rata-rata dan Deviasi Standar Teorema Chebyshev s Berlaku untuk setiap distribusi bagaimanapun bentuknya. Memberikan batas bawah prosentase observasi dalam rentang satuan deviasi standar dari rataratanya. Aturan Empiris Berlaku hanya peda distribusi berbentuk moundshaped dan simetris Menunjukkan pendekatan prosentase observasi dalam rentang satuan deviasi standar dari rataratanya. TI-131 Teori Probabilitas 50 5
Teorema Chebyshev s 1 sekurangnya 1 dari anggota distribusi k apapun berada dalam rentang k deviasi standard dari rata-ratanya. 1 1 3 1 = 1 = = 75% 4 4 Sekurangnya 1 1 8 berada 1 = 1 = = 89% 3 9 9 1 1 15 1 = 1 = = 94% 4 16 16 3 4 Deviasi standar dari rata-rata TI-131 Teori Probabilitas 51 Aturan Empiris Untuk distribusi berbentuk mound-shaped dan simetris, sekitar: 68% 1 standard deviation of the mean 95% Lie within standard deviations of the mean All 3 standard deviations of the mean TI-131 Teori Probabilitas 5 6
1-9 Metoda Penyajian Data Pie Charts Kelompok adalah prosentase dari total Bar Graphs Tinggi batang adalah frekuensi kelompok Polygons Tinggi garis menunjukkan frekuensi Ogives Tinggi garis menunjukkan frekuensi kumulatif Time Plots Menunjukkan nilai dalam dimensi waktu TI-131 Teori Probabilitas 53 Pie Chart Pangsa pasar produk di dunia Other (8.0%) U.S. (30.0%) Europe (5.0%) Britain (8.0%) Japan (9.0%) TI-131 Teori Probabilitas 54 7
Bar Chart Diagram Batang Pengeluaran dan pendapatan sektor penerbangan 1 10 Average Revenues Average Expenses 8 6 4 0 American Continental Delta Northwest Southwest United USAir Airline TI-131 Teori Probabilitas 55 Polygon dan Ogive Frequency Polygon Ogive Relative Frequency 0.3 0. 0.1 0.0 0 10 0 Sales 30 40 50 Cumulative Relative Frequency 1.0 0.5 0.0 0 10 0 30 Sales 40 50 TI-131 Teori Probabilitas 56 8
Time Plot M o n th ly S te e l P ro d u c tio n (P ro b le m 1-4 6 ) 8.5 Millions of Tons 7.5 6.5 5.5 Mo n th J F M A M J J A S O N D J F M A M J J A S ON D J F M A M J J A S O TI-131 Teori Probabilitas 57 1-10 Analisis Data Eksploratoris Teknik untuk menentukan hubungan dan kecenderungan, mengidentifikasi outliers dan observasi yang berpengaruh, dan secara cepat menyimpulkan kelompok data. Stem-and-Leaf Diagram Pencantuman seluruh data dengan cepat Memberikan informasi seperti halnya histogram Box Plots Median Kuartil atas dan bawah Maksimum dan minimum TI-131 Teori Probabilitas 58 9
Contoh 1-10 (1) Stem-and-Leaf Diagram Median MTB> MTB> Stem-and-Leaf of of C1 C1 Stem-and-leaf of of C1 C1 N = 4 4 Leaf Leaf Unit Unit = 1.0 1.0 4 1 13 13 9 1 55567 55567 18 18 011134 (7) (7) 6777899 17 17 3 014 014 13 13 3 57 57 11 11 4 11 11 8 4 57 57 6 5 03 03 3 5 6 6 0 0 TI-131 Teori Probabilitas 59 Contoh 1-10 () Box Plot (Tukey) Elemen dari Box Plot Elemen dari Box Plot Outlier Data terkecil dalam batas dalam Data terbesar dalam batas dalam Diduga outlier o X X * Batas luar Batas dalam Q 1-1.5(IQR) Q 1-3(IQR) Q Median 1 Q 3 Rentang antar kuartil Batas dalam Q 3 +1.5(IQR) Batas luar Q 3 +3(IQR) TI-131 Teori Probabilitas 60 30
Contoh 1-10 (3) Box Plot MTB MTB > BoxPlot BoxPlot c1. c1. Character Boxplot Boxplot --------------------- ----------I + I--------------------- --------------------- --+---------+---------+---------+---------+---------+----C1 10 10 0 0 30 30 40 40 50 50 60 60 MTB MTB > TI-131 Teori Probabilitas 61 1-11 Penggunaan Komputer Statistika deskriptif dengan minitab Descriptive Statistics Variable N Mean Median TrMean StDev SE SE Mean No_Sales 0 0 15.850 16.000 15.944 4.464 0.998 Variable Minimum Maximum Q1 Q1 Q3 Q3 No_Sales 6.000 4.000 13.50 18.750 MTB MTB > TI-131 Teori Probabilitas 6 31
Penggunaan komputer dengan Excel Column1 Mean 15.85 Standard Error 0.99809 Median 16 Mode 16 Standard Deviation 4.463595 Sample Variance 19.9368 Kurtosis 0.115608 Skewness -0.35153 Range 18 Minimum 6 Maximum 4 Sum 317 Count 0 TI-131 Teori Probabilitas 63 3