S T A T I S T I K A Oleh : WIJAYA email : zeamays_hibrida@yahoo.com FAKULTAS KEGURUAN DAN ILMU PENDIDIKIAN UNIVERSITAS SWADAYA GUNUNG JATI CIREBON 2010 Wijaya : Statistika 0
I. PENDAHULUAN Statistika adalah pengetahuan cara cara mengumpulkan, mengolah, menyajikan, menganalisis data dan menafsirkannya atau menarik kesimpulan berdasarkan analisis tersebut. Statistika Deskriptif adalah bagian dari statistika yang hanya berkaitan dengan pengumpulan, pengolahan dan penyajian data sehingga memberikan informasi yang berguna, tanpa menarik kesimpulan terhadap gugus data (populasi). Statistika Inferensia adalah semua metode yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan mengenai gugus data (populasi). Data adalah keterangan mengenai suatu hal yang berbentuk bilangan atau kategori. Data dapat dibagi atas dasar : 1. Sifatnya : a. Data Kuantitatif adalah data yang berbentuk bilangan. Data Diskrit : Data hasil menghitung (membilang) ; merupakan bilangan bulat. Data Kontinyu : Data hasil mengukur; bisa berbentuk bilangan pecahan. b. Data Kualitatif adalah data yang dikategorikan menurut kualitas objek. 2. Sumbernya : a. Data Internal : Data yang menggambarkan keadaan di dalam suatu organisasi. b. Data Eksternal : Data yang menggambarkan keadaan di luar suatu organisasi. Wijaya : Statistika 1
3. Cara Memperolehnya : a. Data Primer : Data yang diperoleh langsung dari sumbernya. b. Data Sekunder : Data yang diperoleh dari pihak lain. 4. Skala Data : a. Skala Nominal atau Klasifikasi, misal jenis kelamin, pekerjaan dll.. b. Skala Ordinal atau Berperingkat, misal opini (baik, sedang, jelek). c. Skala Interval, misal suhu, jarak d. Skala Rasio, misal pendapatan keluarga, produksi dll. Data yang baru dikumpulkan dan belum mengalami pengolahan apapun disebut Data Mentah. Proses pengumpulan data dapat dilakukan melalui Sensus dan Sampling. Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita. Banyaknya pengamatan atau anggota populasi disebut Ukuran Populasi. Ukuran populasi ada terhingga ada yang tak hingga. Dalam Statistika Inferensia, kita ingin memperoleh kesimpulan mengenai populasi, meskipun kita tidak mungkin atau tidak praktis untuk mengamati keseluruhan individu yang menyusun populasi. Oleh karena itu, kita terpaksa menggantungkan pada sebagian anggota populasi (contoh) untuk menarik kesimpulan mengenai populasi tersebut. Sampel atau Contoh atau Cuplikan adalah himpunan bagian dari populasi. Apabila kita menginginkan kesimpulan dari contoh terhadap populasi menjadi sah, maka contoh harus bersifat representatif (mewakili). Sebaliknya apabila contoh tidak representatif maka kesimpulan akan menjadi bias. Kesimpulan yang tidak bias adalah kesimpulan yang sesuai dengan keadaan sebenarnya. Untuk menghilangkan kemungkinan kesimpulan yang bias, kita perlu mengambil Contoh Acak Sederhana atau disingkat Contoh Acak. Contoh Acak n pengamatan adalah suatu contoh yang dipilih sedemikian rupa sehingga himpunan bagian yang berukuran n dari populasi tersebut mempunyai peluang yang sama untuk dipilih. Wijaya : Statistika 2
Apabila populasinya terhingga, penentuan contoh acak dapat dilakukan dengan menuliskan semua anggota pada sepotong kertas kecil (cara undian). Untuk populasi yang berukuran besar, penentuan contoh acak dilakukan dengan menggunakan Tabel Angka Acak. Penyajian Data ada dua cara, yaitu dalam bentuk : 1. Tabel atau Daftar, seperti Tabel Distribusi Frekuensi dan Daftar Baris Kolom. 2. Grafik atau Diagram, seperti Diagram Batang, Diagram Garis (Grafik), Diagram Lambang atau Simbol (Piktogram), Diagram Pastel (Lingkaran) atau Pie, dan Diagram Pencar (Titik) atau Scatter Diagram. Wijaya : Statistika 3
II. UKURAN STATISTIK BAGI DATA 2.1 Parameter dan Statistik Terminologi dan notasi yang digunakan statistikawan dalam mengolah data sepenuhnya bergantung pada apakah data tersebut merupakan populasi atau suatu contoh yang diambil dari suatu populasi. Misal banyaknya kesalahan ketik pada setiap halaman yang dilakukan oleh seorang sekretaris ketika mengetik sebuah dokumen setebal 10 halaman adalah 1, 0, 1, 2, 3, 1, 1, 4, 0 dan 2. Pertama, jika diasumsikan bahwa dokumen itu memang tepat setebal 10 halaman maka data tersebut merupakan populasi terhingga yang kecil. Kita dapat mengatakan bahwa banyaknya kesalahan ketik terbesar adalah 4, atau menyatakan nilai tengah (rata rata) hitungnya adalah 1,5. Bilangan 4 dan 1,5 tersebut merupakan deskripsi bagi populasi. Kita menyebut nilai nilai demikian itu parameter populasi. Parameter adalah sembarang nilai yang menjelaskan ciri populasi Sekarang misalkan bahwa data tersebut merupakan contoh 10 halaman dari naskah yang jauh lebih tebal. Maka bilangan 4 dan 1,5 tersebut merupakan deskripsi bagi contoh, dan disebut statistik. Statistik adalah sembarang nilai yang menjelaskan ciri suatu contoh. 2.2 Ukuran Data Untuk mendapatkan gambaran yang lebih jelas tentang data (sampel atau populasi), selain dengan tabel dan diagram, masih diperlukan ukuran ukuran lain yang merupakan wakil dari data tersebut. Ukuran yang dimaksud dapat Wijaya : Statistika 4
berupa Ukuran Pemusatan (rata rata, median, modus), Ukuran Letak atau Fraktil atau Kuantil (Persentil, Desil, Quartil) dan Ukuran Penyimpangan atau Keragaman (Rentang, Rentang Antar Quartil, Simpangan Antar Quartil, Rata rata Simpangan, Ragam, Simpangan Baku, Koefisien Keragaman, Koefisien Keragaman Quartil, Bilangan Baku). Penjelasan berikut merupakan ukuran data bagi Sampel (Contoh). 2.2.1 Data Tidak Dikelompokkan (1) Ukuran Pemusatan Ukuran pemusatan merupakan sembarang ukuran yang menunjukkan pusat segugus data yang telah diurutkan. a. Rata rata Hitung (Aritmatic Mean) atau Nilai Tengah Misalkan x 1, x 2,..., x n, tidak harus semuanya berbeda, merupakan sebua h conto h terhingga berukuran n, maka rata ratanya adalah : Teladan 2.1. Tabel di bawah ini menunjukkan gaji bulanan (dalam jutaan rupiah) 40 pegawai lembaga pemerintah : 2,2 4,1 3,5 2,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1 3,3 3,8 3,1 4,5 3,7 2,5 2,8 2,8 3,6 2,9 2,7 3,9 3,1 3,3 3,1 3,7 2,4 3,2 4,1 1,9 3,4 2,3 3,8 3,2 2,6 3,9 3,0 4,2 3,5,, Wijaya : Statistika 5
b. Rata rata Gabungan Bila contoh acak berukuran n 1, n 2,..., n k, diambil dari k populasi masing masing dengan ra ta rata x 1, x 2,..., x k, maka rata rata gabungannya : Teladan 2.2 Tiga kelas statistika masing masing mempunyai 28, 32 dan 35 mahasiswa, pada ujian akhir mencapai rata rata 83, 80 dan 76. Berapa rata rata gabungannya :, c. Rata rata Tertimbang (Terboboti) Bila contoh dengan nilai x 1, x 2,..., x n, diberi bobot w 1, w 2,..., w n, maka rata rata tertimbangnya : Teladan 2.3 Nilai ujian 3 mata kuliah seorang mahasiswa adalah : Mata Kuliah Nilai (x i ) SKS (w i ) w i.x i Statistika 2 3 6 Akuntansi 3 4 12 T. Ekonomi 4 3 12 10 30 Wijaya : Statistika 6
Beberapa Sifat Rata rata Hitung 1. Jumlah dari selisih nilai pengamatan terhadap rata ratanya adalah nol, atau jumlah simpangannya adalah nol. 2. Jumlah simpangan kuadrat dari rata ratanya berharga minimum : k = nilai pengamatan 3. Penambahan atau pengurangan suatu konstanta c pada setiap nilai pengamatan, maka rata rata semula sama dengan rata rata yang baru dikurangi atau ditambah dengan c. 5. Penggandaan atau pembagian setiap nilai pengamatan dengan suatu konstanta c, maka rata rata semula sama dengan rata rata yang baru dibagi atau digandakan dengan c. d. Rata rata Harmonik Rata rata Harmonik (H) bagi n buah bilangan x 1, x 2,..., x n, adalah n dibagi dengan jumlah kebalikan bilangan bilangan tersebut. Dalam praktek rata rata harmonik paling sering digunakan merata ratakan kecepatan untuk beberapa jarak tempuh yang sama, untuk mencari harga rata rata suatu komoditi tertentu, dan dana bersama yang dibeli dengan cara menginvestasikan sejumlah uang tertentu setiap kali. Wijaya : Statistika 7
Teladan 2.4 Seorang keryawan menanamkan uang 1200 dolar per bulan untuk usaha bersama. Dalam tiga bulan terakhir harga sahamnya adalah 2,4 ; 3,0 dan 4,0 dolar. Berapa rata rata harga saham yang dibeli karyawan tersebut? Penyelesaian :,,, Keterangan : jika menggunakan rata rata hitung hasilnya 9,4 : 3 = 3,13, dan tentu saja merupakan hasil yang salah. Hal ini bisa dijelaskan sebagai berikut : Pada Bulan I : saham yang dibeli 1200 : 2,4 = 500 lembar Pada Bulan II : saham yang dibeli 1200 : 3,0 = 400 lembar Pada Bulan III : saham yang dibeli 1200 : 4,0 = 300 lembar Rata ratanya = 3600 dolar : 1200 lembar = 3 dolar per lembar e. Rata rata Ukur (Geometrik) Rata rata Ukur (U) bagi n buah bilangan x 1, x 2,..., x n, adalah akar ke n hasil kali bilangan bilangan tersebut. U = (x 1. x 2.... x n ) 1/n Log U = 1/n. Log (x 1. x 2.... x n ) Teladan 2.5 Selama periode 4 tahun berturut turut seorang karyawan telah menerima kenaikan gaji tahunan sebesar 7,2 ; 8,6 ; 6,9 dan 9,8 %, maka rasio gaji tahun sedang berjalan dengan tahun sebelumnya adalah 1,72 ; 1,86 ; 1,69 dan 1,98. Maka rata rata ukur bagi rasio kenaikan gaji tersebut adalah : Log U = 1/4. Log (1,72) (1,86) (1,69) (1,98) Log U = 0,034 U = 1,08 (sama dengan 8 %) Wijaya : Statistika 8
Hubungan rata rata Ukur Dengan Bunga Majemuk Pada bunga majemuk, jumlah uang pada akhir tahun ke n dengan bunga tetap r adalah : P n = P ( 1 + r) n 0 Kalau tingkat bunga berubah dari waktu ke waktu yaitu r 1, r 2,..., r n maka : P n = P 0 ( 1 + r 1 )(1 + r 2 )...(1 + r n ) Dari kedua formula di atas dapat dikembangkan menjadi : ( 1 + r) n = ( 1 + r 1 )(1 + r 2 )...(1 + r n ) Teladan 2.6 Pendapatan Nasional suatu negara tahun 1976 sebesar 400 milyar dolar, dan pada tahun 1980 sebesar 500 milyar dolar. Berapa rata rata tingkat pertumbuhan pendapatan nasional per tahun? Jawab :,,% f. Median (Me) merupakan nilai rata rata ditinjau dari segi kedudukannya dalam urutan data. membagi keseluruhan data menjadi dua bagian yang sama banyaknya (setelah data diurutkan dari terkecil sampai terbesar, atau sebaliknya). Wijaya : Statistika 9
Me = Nilai ke ½ (n + 1) Teladan 2.7 Tabel di bawah ini menunjukkan gaji bulanan (dalam jutaan rupiah) 40 pegawai lembaga pemerintah : 2,2 4,1 3,5 2,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1 3,3 3,8 3,1 4,5 3,7 2,5 2,8 2,8 3,6 2,9 2,7 3,9 3,1 3,3 3,1 3,7 2,4 3,2 4,1 1,9 3,4 2,3 3,8 3,2 2,6 3,9 3,0 4,2 3,5 Setelah diurutkan menjadi : 1,6 1,9 2,2 2,3 2,4 2,5 2,5 2,6 2,6 2,7 2,8 2,8 2,9 3,0 3,0 3,1 3,1 3,1 3,1 3,2 3,2 3,2 3,3 3,3 3,4 3,4 3,5 3,5 3,6 3,7 3,7 3,7 3,8 3,8 3,9 3,9 4,1 4,1 4,2 4,5,,,, g. Modus (Mo) Modus suatu pengamatan adalah nilai yang paling sering terjadi, atau nilai dengan frekuensi paling tinggi. Modus tidak selalu ada, juga bisa lebih dari satu nilai. Wijaya : Statistika 10
Teladan 2.8. Untuk data gaji bulanan pegawai pemerintah setelah diurutkan yaitu : 1,6 1,9 2,2 2,3 2,4 2,5 2,5 2,6 2,6 2,7 2,8 2,8 2,9 3,0 3,0 3,1 3,1 3,1 3,1 3,2 3,2 3,2 3,3 3,3 3,4 3,4 3,5 3,5 3,6 3,7 3,7 3,7 3,8 3,8 3,9 3,9 4,1 4,1 4,2 4,5 Modus (Mo) = 3,1 (2) Ukuran Letak (Fraktil atau Kuantil) Ukuran Letak adalah nilai nilai yang dibawahnya terdapat sejumlah pecahan atau persentase tertentu. a. Quartil (Q) = nilai yang membagi segugus pengamatan menjadi 4 bagian yang sama banyaknya setelah data diurutkan. Q i = nilai ke i ( n + 1) / 4 b. Desil (D) = nilai yang membagi segugus pengamatan menjadi 10 bagian yang sama banyaknya setelah data diurutkan. D i = nilai ke i ( n + 1) / 10 c. Persentil (P) = nilai yang membagi segugus pengamatan menjadi 100 bagian yang sama banyaknya setelah data diurutkan. P i = nilai ke i ( n + 1) / 100 Wijaya : Statistika 11
Teladan 2.9 Untuk data gaji bulanan pegawai pemerintah setelah diurutkan yaitu : 1,6 1,9 2,2 2,3 2,4 2,5 2,5 2,6 2,6 2,7 2,8 2,8 2,9 3,0 3,0 3,1 3,1 3,1 3,1 3,2 3,2 3,2 3,3 3,3 3,4 3,4 3,5 3,5 3,6 3,7 3,7 3,7 3,8 3,8 3,9 3,9 4,1 4,1 4,2 4,5 A. Quartil (Q) : 1. Quartil-1 (Q 1 ) : 1 1 40 1 10 4 4 10 1 4 11 10 2,7 1 2,8 2,7 2,725 4 2. Qua rtil-2 (Q 2 ) : 2 40 1 20 1 4 2 20 1 2 21 20 3,2 1 3,2 3,2 3,200 2 3. Qua rtil-3 (Q 3 ) : 3 40 1 30 3 4 4 30 3 4 31 30 3,7 3 3,7 3,7 3,700 4 Wijaya : Statistika 12
B. Desil (D) : 1. Desil-1 (D 1 ) : 1 40 1 4 1 10 10 4 1 10 5 4 2,3 1 2,4 2,3 2,310 10 2. Desil-5 (D 5 ) : 5 40 1 20 1 10 2 20 1 2 21 20 3,2 1 3,2 3,2 3,200 2 3. Desil-8 (D 8 ) : 8 40 1 32 8 10 10 32 8 10 33 32 3,7 8 3,8 3,7 3,780 10 Dengan cara yang sama akan diperoleh nilai desil lainnya yaitu : D 2 = 2,600 D 3 = 2,830 D 4 = 3,100 D 6 = 3,360 D 7 = 3,570 D 9 = 4,080 C. Persentil (P) : 1. Persentil-25 (P 25 ) : 25 1 40 1 10 100 4 10 1 4 11 10 2,7 1 2,8 2,7 2,725 4 Wijaya : Statistika 13
2. Persentil-75 (P 75 ) : 100 75 3 40 1 30 4 30 3 4 31 30 3,7 3 3,7 3,7 3,700 4 3. Persentil-90 (P 90 ) : 90 0 40 1 36 9 10 10 36 9 10 37 36 3,9 9 4,1 3,9 4,080 10 Dengan cara yang sama akan diperoleh nilai desil lainnya yaitu : P 10 = 2,310 P 20 = 2,600 P 30 = 2,830 P 40 = 3,100 P 50 = 3,200 P 60 = 3,360 P 70 = 3,570 P 80 = 3,780 Dari hasil perhitungan di atas, terdapat hubungan antara Quartil, Desil dan Persntil yaitu : D 1 = P 10 D 2 = P 10 D 3 = P 30 D 4 = P 40 D 5 = P 50 D 6 = P 60 D 7 = P 70 D 8 = P 80 D 9 = P 90 Q 1 = P 25 Q 2 = D 5 = P 50 Q 3 = P 75 3. Ukuran Penyimpangan/Keragaman/Variasi/Penyebaran/Dispersi Ukuran penyimpangan adalah ukuran yang menunjukkan penyimpangan nilai suatu variabel terhadap nilai rata ratanya. Ukuran penyimpangan ini sebagai pelengkap bagi ukuran pemusatan dalam membandingkan dua atau lebih gugus bilangan yang berbeda. Wijaya : Statistika 14
Rumus ukuran penyimpangan yang dibahas merupakan rumus ukuran penyimpangan contoh (untuk populasi lambang dan s diganti dengan μ dan σ) yang meliputi : a. Rentang / Range / Jangkauan = Selisih nilai terbesar dengan terkecil b. Rentang Antar Kuartil (RAK) = K 3 K 1 c. Simpangan Kuartil (SK) = ½ ( K 3 K 1 ) d. Rata rata Simpangan (RS) = 1/n n x 2 ( x) 2 e. Ragam atau Varians ( s 2 ) = n (n 1) f. Simpangan Baku (s) = s g. Koefisien Variasi atau Koefisien Keragaman (KK) = h. Bilangan Baku z = x 100% Teladan 2.10 Untuk data gaji bulanan pegawai pemerintah setelah diurutkan yaitu : 1,6 1,9 2,2 2,3 2,4 2,5 2,5 2,6 2,6 2,7 2,8 2,8 2,9 3,0 3,0 3,1 3,1 3,1 3,1 3,2 3,2 3,2 3,3 3,3 3,4 3,4 3,5 3,5 3,6 3,7 3,7 3,7 3,8 3,8 3,9 3,9 4,1 4,1 4,2 4,5. 4,5 1,6 2,9. 3,700 2,725 0,975. 1 0,975 0,488 2 Wijaya : Statistika 15
. 1 Tabel di bawah merupakan nilai : 0,98 0,92 0,32 0,68 0,02 0,52 0,18 0,58 0,22 1,58 0,08 0,12 0,62 0,08 1,32 0,52 0,68 0,38 0,38 0,42 0,28 0,48 0,72 0,08 0,12 0,08 0,52 0,78 0,02 0,92 1,28 0,22 0,88 0,62 0, 02 0,58 0,72 0,18 1,02 0,32. 1 1 20,44 0,511 40. 1 Tabel di bawah merupakan nilai x 2 : 4,84 16,81 12,25 6,25 10,24 13,69 9,00 6,76 11,56 2,56 9,61 10,89 14,44 9,61 20,25 13,69 6,25 7,84 7,84 12,96 8,41 7,29 15,21 9,61 10,89 9,61 13,69 5,76 10,24 16,81 3,61 11,56 5,29 14,44 10,24 6,76 15,21 9,00 17,64 12,25. 40420,86 127,2 4040 1 0,4196. 0,4196 0,6478. 100% 0,6478 3,18 100% 20,37. Wijaya : Statistika 16
Tabel di bawah merupakan nilai baku z : -1,513 1,420 0,494-1,050 0,031 0,803-0,278-0,895 0,340-2,439-0,124 0,185 0,957-0,124 2,038 0,803-1,050-0,587-0,587 0,648-0,432-0,741 1,112-0,124 0,185-0,124 0,803-1,204 0,031 1,420-1,976 0,340-1,359 0,957 0,031-0,895 1,112-0,278 1,575 0,494 Tabel nilai baku z diatas, apabila dihitung nilai rata-rata dan ragamnya diperoleh : a. Rata-rata = 0,000 b. Ragam = 1,000 Teladan 2.11 Data berikut merupakan banyaknya ikan (x i ) yang dapat ditangkap dari dua buah kolam oleh 9 orang. Kolam Nilai pengamatan A 3 4 5 6 8 9 10 12 15 B 3 7 7 7 8 8 8 9 15 Selanjutnya dieroleh ukuran keragamannya sebagai berikut : Ukuran Gugus A Gugus B Rentang 15 3 = 12 15 3 = 12 RAK 11 4,5 = 6,5 8,5 7 = 1,5 SK 3,25 0,75 RS 1/9 (28) = 28/9 1/9 (16) = 16/9 s 2 [9(700) (72) 2 ] / 72 = 15,5 [9(654) (72) 2 ] / 72 = 9,8 s 15,5 = 3,94 9,8 = 3,13 KK (%) (3,94 : 8) x 100 % = 49,3 (3,13 : 8) x 100 % = 39 Wijaya : Statistika 17
Data di atas menunjukkan bahwa antara Gugus A dan B walaupun mempunyai ukuran pemusatan dan Rentang yang sama, tetapi mempunyai ukuran keragaman yang berbeda. Ternyata Rentang tidak berhasil mengukur keragaman nilai nilai diantara kedua ekstrim tersebut. Gugus A mempunyai nilai keragaman yang lebih besar dibanding gugus B. Teladan 2.12 Harga 5 buah mobil bekas masing masing adalah Rp 4.000.000, Rp 4.500.000, Rp 5.000.000, Rp 4,750.000, Rp 4.250.000, dan harga 5 ekor ayam masing masing adalah Rp 6000, Rp 8000, Rp 9000, Rp 5500, Rp 10.000. Tentukan harga mobil atau harga ayam yang lebih beragam! Penyelesaian : No Ukuran Mobil Ayam 1. Rata-rata 4.500.000 7.700 2. Simpangan Baku 395.280 1.920 3. Koef. Keragaman (%) 8,78 24,95 Jadi harga ayam lebih beragam dibandingkan harga mobil. Teladan 2.13 Misal seorang mahasiswa mendapat nilai ujian Ekonomi Makro 82, sedangkan rata rata kelasnya 68 dengan simpangan baku 8. Nilai ujian Statistikanya 89, sedangkan rata rata kelasnya 80 dengan simpangan baku 6. Dalam ujian mana ia mempunyai kedudukan yang lebih baik? Penyelesaian : Ekonomi Makro : z = ( 82 68 ) / 8 = 1,75 Statistika : z = ( 89 80 ) / 6 = 1,50 Ternyata dalam ujian Ekonomi Makro mahasiswa tersebut berada 1,75 simpangan baku di atas rata rata kelasnya, sedangkan dalam Statistika ia hanya 1,5 simpangan baku di atas rata rata kelasnya. Dengan demikian Wijaya : Statistika 18
mahasiswa tersebut mempunyai kedudukan yang lebih baik dalam ujian Ekonomi Makro. Pengkodean Terhadap Ragam Pengkodean disini dimaksudkan sebagai operasi penjumlahan, pengurangan, penggandaan atau pembagian setiap nilai pengamatan dengan suatu konstanta. Misalkan data pengamatan semula adalah x i kemudian masing masing nilai ditambah dengan konstanta c, sehingga rata rata data pengamatan semula adalah x dan rata rata yang baru y = x + c. Kita hitung ragam bagi y yaitu : 1 1 1 Jadi, bila setiap pengamatan ditambah atau dikurangi dengan suatu konstanta c, maka ragam data semula sama dengan ragam data yang baru. Sekarang misalkan nilai data awal digandakan dengan konstanta c, jadi y = cx maka rata ratanya y = cx dan ragam bagi y : 1 1 1 Jadi, bila setiap pengamatan digandakan (atau dibagi) dengan suatu konstanta c, maka ragam data semula sama dengan ragam data yang baru dibagi (atau digandakan) dengan c 2. 2.2.2 Data Dikelompokkan (1) Distribusi Frekuensi Ciri ciri penting bagi data dengan segera dapat diketahui melalui pengelompokan data tersebut ke dalam beberapa kelas, kemudian dihitung banyaknya pengamatan yang masuk ke dalam setiap kelas. Susunan demikian dalam bentuk tabel disebut distribusi (sebaran) frekuensi. Data yang disajikan Wijaya : Statistika 19
dalam bentuk distribusi frekuensi dikatakan sebagai data yang dikelompokkan. Pengelompokan memberikan gambaran yang lebih jelas mengenai data tersebut, tetapi kita kehilangan identitas masing masing pengamatan. Distribusi Frekuensi adalah susunan data berdasarkan kelas interval atau kategori tertentu. Distribusi Frekuensi ada dua macam, yaitu : 1. Distribusi Frekuensi Numerik adalah distribusi frekuensi yang pembagian kelasnya dinyatakan dengan angka. 2. Distribusi Frekuensi Kategori adalah distribusi frekuensi yang pembagian kelasnya berdasarkan kategori. Langkah langkah penyusunan distribusi frekuensi adalah sebagai berikut : a. Menentukan banyaknya kelas interval (5 sampai 20) atau digunakan Aturan Sturges, yaitu : 1 + 3,3 Log n, dimana n menunjukkan ukuran sampel. b. Menentukan selisih bilangan terbesar dengan terkecil, yang disebut rentang (range). c. Menentukan panjang kelas interval (p) dimana p = (rentang : banyaknya kelas interval). d. Mencacah banyaknya pengamatan yang masuk ke dalam kelas interval. Teladan 2.1. Tabel di bawah ini menunjukkan gaji bulanan (dalam jutaan rupiah) 40 pegawai lembaga pemerintah : 2,2 4,1 3,5 2,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1 3,3 3,8 3,1 4,5 3,7 2,5 2,8 2,8 3,6 2,9 2,7 3,9 3,1 3,3 3,1 3,7 2,4 3,2 4,1 1,9 3,4 2,3 3,8 3,2 2,6 3,9 3,0 4,2 3,5 Wijaya : Statistika 20
1. Banyaknya kelas interval = 1 + 3,3 log n = 1 + 3,3 log 40 = 6,3 (misal kelas intervalnya sebanyak 6). 2. Selisih bilangan terbesar dengan terkecil (Range) = 4,5 1,6 = 2,9 3. Panjang kelas interval (p) = 2,9 : 6 = 0,50. Daftar distribusi frekuensinya disajikan pada Tabel 1 berikut. Tabel 1. Distribusi Frekuensi Gaji Bulanan (juta rupiah) 40 Pegawai Lembaga Pemerintah. No No X F Frek. Relatif Frek. Kumulatif F % < > 1 1,6 2,0 1,8 2 0,05 5,0 2 40 2 2,1 2,5 2,3 5 0,13 12,5 7 38 3 2,6 3,0 2,8 8 0,20 20,0 15 33 4 3,1 3,5 3,3 13 0,33 32,5 28 25 5 3,6 4,0 3,8 8 0,20 20,0 36 12 6 4,1 4,5 4,3 4 0,10 10,0 40 4 Jumlah 40 1,00 100,0 Dari Tabel 1 di atas, yang dimaksud dengan : a. Tepi (limit) Kelas adalah nilai nilai dalam setiap kelas, terdiri dari Tepi Kelas Bawah : 1,6 ; 2,1 ; 2,6 ; 3,1 ; 3,6 ; 4,1 Tepi Kelas Atas : 2,0 ; 2,5 ; 3,0 ; 3,5 ; 4,0 ; 4,5 b. Batas Kelas adalah nilai nilai teoritis dari tepi kelas, terdiri dari Batas Kelas Bawah : 1,55 ; 2,05 ; 2,55 ; 3,05 ; 3,55 ; 4,05 Batas Kelas Atas : 2,05 ; 2,55 ; 3,05 ; 3,55 ; 4,05 ; 4,55 c. Lebar (Panjang) Kelas adalah selisih batas atas kelas dengan batas bawah kelas (p = 0,5) d. Frekuensi Kelas adalah banyaknya pengamatan yang masuk ke dalam setiap kelas e. Titik Tengah Kelas (X) adalah titik tengah antara batas atas dengan batas bawah kelas Wijaya : Statistika 21
g. Frekuensi Kumulatif Kurang Dari dihitung atas dasar batas atas kelas, sedangkan Frekuensi Kumulatif Lebih Dari dihitung atas dasar batas bawah kelas. Dari Tabel 1 dapat dikemukakan misalnya : a. Karyawan yang mempunyai gaji antara 3,5 sampai 3,9 juta sebanyak 10 orang. b. Karyawan dengan gaji minimal 3,0 juta sebanyak 33 orang atau 82,5 %. Penyajian dalam bentuk diagram dan grafik disajikan pada Gambar 1 (Histogram, Poligon Frekuensi dan Kurva Frekuensi) dan Gambar 2 (Kurva Frekuensi Kumulatif atau OGIF). Gambar 1. Histogram, Poligon Frekuensi dan Kurva Frekuensi Keterangan : Poligon Frekuensi Kurva Frekuensi (Kurva Populasi) Wijaya : Statistika 22
Gambar 2. OGIF atau Frekuensi Kumulatif Kurang Dari dan Lebih dari (2) Model Populasi Gambar 1 menunjukkan bahwa Poligon Frekuensi merupakan garis patah patah yang menghubungkan titik titik tengah kelas interval. Garis patah patah ini dapat didekati oleh sebuah lengkungan halus yang bentuknya secocok mungkin dengan poligon tersebut. Lengkungan yang didapat dinamakan Kurva Frekuensi. Kurva frekuensi ini merupakan Model Populasi yang ikut menjelaskan ciri ciri populasi. Oleh karena itu model populasi biasanya didekati atau diturunkan dari kurva frekuensi. Bentuk kurva untuk model populasi yang sering dijumpai yaitu bentuk simetrik, positif atau miring ke kiri (ekor kurva menjulur ke kanan), negatif atau miring ke kanan (ekor kurva menjulur ke kiri). Simetri Positif Negatif Wijaya : Statistika 23
(3) Kurva Lorentz Misalkan pendapatan per hari 10 orang masing masing Rp 10.000,, apabila digambarkan dengan grafik dimana absis menyatakan kumulatif jumlah orang dan ordinat menyatakan kumulatif pendapatan, maka grafiknya disajikan pada Gambar 3. Seandainya orang yang ke 10 mempunyai pendapatan Rp 100.000, dan 9 orang lainnya tidak mempunyai pendapatan (nol), maka kurvanya adalah OPQ. 10 Q 9 8 7 6 5 4 3 2 1 P 0 1 2 3 4 5 6 7 8 9 10 Gambar 3. Grafik atau Kurva Lorentz Kurva OQ menunjukkan pembagian pendapatan yang sama, artinya kalau data tersebut merupakan data tingkat nasional (data penduduk dan pendapatan) dan angka angka kumulatif dinyatakan dengan persentase maka terjadi pembagian pendapatan yang sama yaitu x % penduduk mendapat x % pendapatan nasional. Dalam prakteknya apabila kurva Lorentz diterapkan pada data pendapatan negara, kurvanya akan menyerupai ORQ. Semakin dekat ke OQ pendapatan makin merata. Wijaya : Statistika 24
(4) Ukuran Data Dikelompokkan A. Ukuran Pemusatan A.1 Rata rata Hitung : Cara I Cara II. X 0 = titik tengah kelas yang dipilih, dan diberi nilai c = 0 p = panjang kelas interval A.2 Median : 1 2 Me = Median B = Batas bawah kelas median (kelas dimana median terletak) p = Panjang kelas n = Ukuran contoh F = Jumlah frekuensi dengan tanda kelas lebih kecil dari kelas median f = frekuensi kelas median A.3 Modus (Mo) : Mo = B = p = Modus Batas bawah kelas modus Panjang kelas Wijaya : Statistika 25
f 1 = Selisih frekuensi kelas modus dengan frekuensi kelas sebelumnnya f 2 = Selisih frekuensi kelas modus dengan frekuensi kelas sesudahnya Tabel 2. Distribusi Frekuensi Gaji Bulanan (juta rupiah) 40 Pegawai Lembaga Pemerintah. No Interval x f f.x c f.c 1 1,6 2,0 1,8 2 3,6 3 6 2 2,1 2,5 2,3 5 11,5 2 10 3 2,6 3,0 2,8 8 22,4 1 8 4 3,1 3,5 3,3 13 42,9 0 0 5 3,6 4,0 3,8 8 30,4 1 8 6 4,1 4,5 4,3 4 17,2 2 8 Jumlah 40 128,0 8 A.1 Rata rata Hitung : Cara I. 128,0 40 3,20 Cara II 3,3 0,58 3,20 40 A.2 Median : 1 2 20 15 3,05 0,5 3,24 13 A.3 Modus (Mo) : 3,05 0,5 5 3,30 55 Wijaya : Statistika 26
B. Ukuran Letak /4 Quartil = Desil = /10 Persentil = /100 BB = Batas bawah kelas P i, atau D i atau K i p = Panjang kelas = 0,5 n = Ukuran contoh = 40 F = Jumlah frekuensi dengan tanda kelas lebih kecil dari kelas Pi, D i, atau K i f = frekuensi kelas P i, D i, atau K i Tabel 2. Distribusi Frekuensi Gaji Bulanan (juta rupiah) 40 Pegawai Lembaga Pemerintah. No Interval X f BB 1 1,6 2,0 1,8 2 1,55 2 2,1 2,5 2,3 5 2,05 3 2,6 3,0 2,8 8 2,55 4 3,1 3,5 3,3 13 3,05 5 3,6 4,0 3,8 8 3,55 6 4,1 4,5 4,3 4 4,05 B.1 Quartil : 140 4 10 1/4 10 7 2,55 0,5 2,738 8 Wijaya : Statistika 27
240 4 20 2/4 20 15 3,05 0,5 3,242 13 340 4 30 3/4 30 28 3,55 0,5 3,675 8 B.2 Desil : 140 4 10 1/10 2,05 0,5 4 2 2,250 5 540 20 10 5/10 20 15 3,05 0,5 3,242 13 840 32 10 8/10 32 28 3,55 0,5 3,800 8 Dengan cara yang sama akan diperoleh nilai desil lainnya yaitu : D 2 = 2,613 D 3 = 2,742 D 4 = 3,088 D 6 = 3,396 D 7 = 3,550 D 9 = 4,050 Wijaya : Statistika 28
B.3 Persentil : 1040 4 100 10/100 2,05 0,5 4 2 2,250 5 2540 100 10 2540/100 10 7 2,55 0,5 2,738 8 5040 100 20 5040/100 20 15 3,05 0,5 3,242 13 7540 100 30 7540/100 30 28 3,55 0,5 3,675 8 Dengan cara yang sama akan diperoleh nilai desil lainnya yaitu : P 20 = 2,613 P 30 = 2,742 P 40 = 3,088 P 60 = 3,396 P 70 = 3,550 P 80 = 3,800 P 90 = 4,050 Wijaya : Statistika 29
Hubungan nilai persentil, desil dan kuartil dapat digambarkan dengan diagram berikut : Batas Gaji 2,738 3,242 3,675 Persentase 25 25 25 25 Ukuran Letak P 25 = Q 1 P 50 = D 5 = Q 2 P 75 = Q 3 Dari tabel tersebut dapat dikemukakan, misalnya : sebanyak 25 % atau 10 orang karyawan memperoleh gaji lebih kecil dari Rp 2,738 juta. banyaknya karyawan dengan gaji dari Rp 2,738 juta sampai Rp 3,675 juta sebanyak 50 % atau 20 orang. C. Ukuran Penyimpangan / Keragaman Misal kita gunakan Distribusi Frekuensi Gaji Bulanan (juta rupiah) 40 Pegawai Lembaga Pemerintah. No Interval x i f 1 1,6 2,0 1,8 2 1,4 2,8 3,24 6,48 2 2,1 2,5 2,3 5 0,9 4,5 5,29 26,45 3 2,6 3,0 2,8 8 0,4 3,2 7,84 62,72 4 3,1 3,5 3,3 13 0,1 1,3 10,89 141,57 5 3,6 4,0 3,8 8 0,6 4,8 14,44 115,52 6 4,1 4,5 4,3 4 1,1 4,4 18,49 73,96 Jumlah 40 4,5 21,0 60,19 426,70. 3,675 2,738 0,937. 1 0,937 0,469 2 Wijaya : Statistika 30
... 1 1 21,0 0,53 4 0 1 0,44 0,662 40426,70 128,0 4040 1 0,44. 100% 0,662 3,20 100% 20,69 (5) Ukuran Distribusi Data Tunggal A. Skewness (Koefisien Kemenjuluran) Sebagaimana telah dikemukakan sebelumnya, bahwa model populasi biasanya didekati atau diturunkan dari kurva frekuensi. Bentuk kurva untuk model populasi yang sering dijumpai yaitu bentuk simetrik, positif atau miring ke kiri (ekor kurva menjulur ke kanan), negatif atau miring ke kanan (ekor kurva menjulur ke kiri). Untuk mengetahui kemenjuluran kurva populasi digunakan koefisien kemenjuluran (skewness). Berdasarkan data tunggal untuk data gaji 40 pegawai lembaga pemerintah diperoleh nilai : Rata-rata, Simpangan Baku s = 0,648 Nilai : Wijaya : Statistika 31
14,512 7,716 3,463 2,507 1,746 1,157 1,157 0,718 0,718 0,407 0,202 0,202 0,081 0,021 0,021 0,002 0,002 0,002 0,002 0,000 0,000 0,000 0,006 0,006 0,039 0,039 0,121 0,121 0,273 0,517 0,517 0,517 0,877 0,877 1,373 1,373 2,865 2,865 3,904 8,462 Jumlah 9,882,, Hasil perhitungan diperoleh nilai Skewness berharga negatif, artinya data gaji pegawai yang diteliti mempunyai distribusi negatif atau menjulur kekiri. B. Kurtosis (Koefisien Keruncingan) Kurtosis merupakan ukuran keruncingan sebuah kurva populasi. Berdasarkan koefisien kurtosis, kurva frekuensi atau model populasi digolongkan menjadi 3 jenis yaitu : Mesokurtik (Normal ) jika Koefisien Kurtosis = 0 Platikurtik (Datar ) jika Koefisien Kurtosis < 0 Leptokurtik (Runcing ) jika Koefisien Kurtosis > 0 Berdasarkan data tunggal untuk data gaji 40 pegawai lembaga pemerintah diperoleh nilai : Rata-rata, Simpangan Baku s = 0,648 Wijaya : Statistika 32
Nilai : 35,398 15,247 5,239 3,406 2,102 1,214 1,214 0,643 0,643 0,302 0,118 0,118 0,035 0,006 0,006 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,001 0,013 0,013 0,060 0,060 0,177 0,415 0,415 0,415 0,839 0,839 1,526 1,526 4,069 4,069 6,148 17,244 Jumlah 103,527,, Hasil perhitungan diperoleh nilai Kurtosis berharga negatif, artinya distribusi data gaji pegawai tergolong Platikurtik. 2.3 Dalil Chebyshev dan Kaidah Empirik 2.3.1 Dalil Chebyshev : Sekurang kurangnya 1 1/k 2 bagian data terletak dalam k simpangan baku dari rata ratanya. Teladan 2.20. Misalkan data IQ suatu contoh acak 1.080 mahasiswa mempunyai rata rata 120 dengan simpangan baku 8. Gunakan dalil Chebyshev untuk menentukan selang yang mengandung sekurang kurangnya 810 mahasiswa mempunyai IQ yang terletak di dalamnya! Wijaya : Statistika 33
Penyelesaian : 810 : 1080 = 3/4, jadi 1 1/k 2 = 3/4, maka diperoleh nilai k = 2 dan x ± 2 s = 120 ± 2 (8) = 120 ± 16. Jadi sekurang kurangnya 810 mahasiswa mempunyai IQ antara 104 sampai 136. Dalil Chebyshev kurang banyak memberikan manfaat apabila nilai k = 1. Disamping itu hanya memperhatikan batas bawahnya saja (dengan istilah sekurang kurangnya), dan tidak memperhatikan bagaimana bentuk sebaran data pengamatan, apakah berbentuk genta (simetris) atau tidak. Oleh karena itu, untuk sebaran data pengamatan yang berbentuk genta akan lebih baik digunakan Kaidah Empirik. 2.3.2 Kaidah Empirik Pada sebaran pengamatan yang berbentuk genta (simetrik) maka kira kira : 68 % pengamatan terletak dalam 1 simpangan baku dari rata ratanya. 95 % pengamatan terletak dalam 2 simpangan baku dari rata ratanya. 99,7 % pengamatan terletak dalam 3 simpangan baku dari rata ratanya. Misal dengan menggunakan data gaji 40 karyawan Pabrik Rotan (Tabel 2) diperoleh rata rata (x) = 3,41 dengan simpangan baku (s) = 0,70. Maka menurut Kaidah Empirik berarti kurang lebih 68 % atau 27 diantara 40 karyawan memperoleh gaji yang terletak dalam selang x ± s = 3,41 ± 0,7 atau antara 2,71 sampai 4,11 juta rupiah. Wijaya : Statistika 34
DAFTAR PUSTAKA Anto Dajan. 1995. Pengantar Metode Statistika Jilid I. LP3ES. Jakarta. J. Supranto. 1996. Statistik : Teori dan Aplikasi, Jilid I. Erlangga. Jakarta. Robert, G. D. Steel dan James H. Torrie. 1993. Prinsip dan Prosedur Statistika. Gramedia Pustaka Utama. Jakarta. Ronald E. Walpole. 1995. Pengantar Statistika. Gramedia Pustaka Utama. Jakarta. Sudjana. 1989. Metoda Statistika. Tarsito. Bandung. Wijaya : Statistika 35