Azimmatul Ihwah
Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada. Ada cara yg lebih baik untuk menginterpretasi data yg akan dibahas kali ini.
Salah satu ukuran sebaran data (variabilitas) adalah jangkauan. Jangkauan disebut juga range / rentangan. Menghitung jangkauan adalah sangat mudah, yaitu mengurangkan nilai tertinggi dengan nilai terendah dari data. Contoh skor dr salah 1 pemain mempunyai jangkauan = 13 7 = 6
Temukan mean, nilai terendah, nilai tertinggi dan jangkauan dari data di bawah ini 1. 2.
Perhitungan mean, nilai terendah, nilai tertinggi dan jangkauan dari kedua data diatas menghasilkan nilai yg sama
Jangkauan pada data menghasilkan nilai yg sama, tetapi perhatikan histogram dr kedua data. Kalau dicermati lagi ternyata data tersebar secara berbeda. Pada histogram data kedua, ternyata terjadi loncatan dari skor 8 ke 10 dan dari skor 10 ke 12 karena skor 9 dan 11 mempunyai frekuensi 0. Jangkauan hanya mendeskripsikan lebar dari data, namun tidak bisa menunjukkan apakah terdapat jarak dari skor data satu ke data berikutnya.
Banyak data mempunyai jangkauan yg sama, namun dari jangkauan kita hanya bisa tahu seberapa jauh jarak antara nilai terendah dan nilai tertinggi. Sehingga banyak informasi dari data yg tidak terjelaskan. Jadi jangkauan merupakan cara yg paling mudah atau cara yg paling dasar untuk mengetahui sebaran data, namun sangat terbatas sekali untuk memberikan informasi mengenai sebaran yg sesungguhnya dalam data.
Salah satu cara untuk membuat mini range adalah mengurutkan data kemudian membagi menjadi 4 bagian yang sama. Contoh Kita dapat mengonstruksikan jangkauan dengan cara terlebih dahulu mencari nilai diantara dua bagian data
Kuartil adalah nilai yg memisahkan antar bagian data. Kuartil terendah dinamakan kuartil pertama (Q 1 ) dan kuartil tertinggi dinamakan kuartil ketiga (Q 3 ). Sedangkan kuartil tengah (Q 2 ) merupakan median karena membagi data menjadi dua bagian yg sama. Jangkauan dari nilai dalam kuartil terendah dan kuartil tertinggi dinamakan jangkauan interkuartil Jangkauan interkuartil = Q 3 - Q 1
Jika banyak data n, maka Mencari letak kuartil terendah : Pertama hitung n : 4. Selanjutnya, 1. Jika hasilnya bilangan bulat, nyatakan dgn k, maka mencari kuartil terendah adalah dgn mencari rata-rata dari data ke-k dan data ke-(k+1). 2. Jika hasilnya bukan bilangan bulat, maka bulatkan ke atas. Posisi kuartil terendah adalah pada hasil pembulatan tersebut. Contoh misal n = 9, maka 9 : 4 = 2.25 dibulatkan ke atas menjadi 3. Jadi kuartil terendah adalah data ke-3
Mencari letak kuartil tertinggi : Pertama hitung 3n : 4. Selanjutnya, 1. Bila hasil 3n : 4 adlh bilangan bulat, nyatakan dgn m, maka nilai kuartil tertinggi adalah dengan mencari ratarata data ke-m dan data ke-(m+1). 2. Jika hasil 3n : 4 bukan bilangan bulat, maka bulatkan hasilnya ke atas. Posisi kuartil tertinggi adalah pada hasil pembulatan tersebut.
Determine range, lower and upper quartile, and interquartile range from the data below
Jika data disajikan dalam tabel distribusi frekuensi data berkelompok, maka kuartil ke-i dicari dgn rumus Kuartil ke i = b + l i 4 N F f, i = 1,2,3 dimana b adalah tepi bawah kelas kuartil ke-i, l adalah luas kelas, F adalah jumlah frekuensi sebelum kelas kuartil ke-i, f adalah frekuensi kelas kuartil dan N adalah banyaknya data.
Hitung Q 1, Q 2, Q 3 dan jangkauan interkuartil dari data di bawah ini
Box Plot pertama kali dikenalkan oleh American Statistician, John Tukey, pada tahun 1977 yg berguna untuk menampilkan lima summary dalam data yaitu median, kuartil, data maksimum dan minimum. Boxplot merupakan diagram yg terdiri dari box dan whiskers, sehingga biasa disebut juga dgn box and whisker plot.
Box Plot dapat digambarkan dalam posisi vertical maupun horizontal.
Interpretasi Boxplot: Box mengandung 50% dari data. Tepi atas dari box disebut Q3 (75% dari data) dan tepi bawah dari box disebut Q1(25 % dari data). Garis yang terdapat pada box disebut dengan median data (Q2). Titik terakhir dari garis vertical merupakan nilai maksimum dan minimum. Titik yang berada di luar garis tersebut disebut dengan outlier. Outlier yaitu data yang terletak diluar jarak 1.5 * jangkauan interkuartil dari kuartil pertama dan ketiga. Untuk boxplot horizontal, titik ujung garis whisker kiri adlh nilai terendah dari data yg lebih dari Q1-(1.5xjangkauan interkuartil), dan titik ujung garis whisker kanan adalah nilai tertinggi dari
Apabila jarak antara tepi bawah dan tepi atas ke median data tidak sama, berarti distribusi data tersebut tidak simetris (skewed).
Misal berikut ini terdapat data tinggi badan siswa dalam cm: 148.7 149.8 147.9 152.1 152.1 147.9 150.4 160.0 150.5 150.4 147.3 142.6 153.4 149.3 153.8 144.7 154.9 152.7 150.5 151.0 149.2 154.0 152.7 147.2 145.8 149.9 151.2 148.0 148.0 153.0 146.3 149.2 149.3 153.0 150.7 152.2 148.7 148.7 146.8 148.9 155.1 151.5 148.9 152.3 156.2 153.3 151.6 154.1 150.3 142.4 Dari data tersebut diperoleh beberapa statistik: Mean : 150.37 cm Median : 150.38 cm SE Mean: 0.46 St. Dev: 3.31 Nilai minimum: 142.4 cm Nilai maximum: 160 cm Q1: 148.49 cm Q3: 152.69 cm
Boxplot untuk data diatas adalah (Data maks < Q3+1.5xIQR) Q3 (Data min > Q1-1.5XIQR)- Q1 Terdapat 1 outlier yaitu 160, karena 160 > Q 3 + 1.5 x 4.2
Ketiga kuartil adalah nilai-nilai yg membagi sekumpulan data menjadi 4 bagian. Persentil merupakan nilai yg membagi data dalam persentase dalam cara yg sama dgn kuartil. Persentil ke-k disimbolkan dgn P k adalah nilai pada k% dari data. Jadi Q 1 adalah persentil ke-25, Q 2 adalah persentil ke-50 dan Q 3 adalah persentil ke-75
Jika ingin mencari nilai persentil ke-k dgn banyak data n, pertama hitung k n, selanjutnya 100 1. Jika hasilnya bilangan bulat, nyatakan dgn i, maka persentil ke-k adalah rata-rata dari data ke-i dan ke- (i+1). 2. Jika hasilnya bukan bilangan bulat, maka posisi persentil adalah pada hasil pembulatan bilangan tersebut. Contoh kita punya 125 data. Untuk mencari persentil ke-10 hitung 10 125 = 12.5. Maka persentil ke-10 adalah data 100 ke-13
Salah satu cara untuk mengetahui variabilitas data adalah melalui variansi. Variansi juga adalah salah satu cara untuk mengukur sebaran data. Variansi pada populasi disimbolkan dengan σ 2, dihitung dengan menggunakan rumus. f x μ 2 N tunggal f x i μ 2 N untuk data pada tabel distribusi frekuensi data untuk data pada tabel distribusi frekuensi data berkelompok, dgn x i merupakan titik tengah tiap kelas f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data.
Untuk penyederhanaan penghitungan, variansi dapat dihitung menggunakan rumus fx 2 fx N N data tunggal 2 fx i fx i N N 2, untuk data pada tabel distribusi frekuensi 2, untuk data pada tabel distribusi frekuensi data berkelompok, dengan x i adalah titik tengah tiap kelas. dan f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data.
Variansi pada sampel disimbolkan dgn s 2, dihitung dengan rumus. f x x 2 n 1 tunggal f x i x 2 dan n 1 untuk data pada tabel distribusi frekuensi data untuk data pada tabel distribusi frekuensi data berkelompok, dgn x i merupakan titik tengah tiap kelas. f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan n adalah ukuran sampel.
Penyederhanaan rumus variansi pada sampel n fx2 fx 2, untuk data pada tabel distribusi frekuensi n n 1 data tunggal. n fx i 2 fx 2 i, untuk data pada tabel distribusi frekuensi n n 1 data berkelompok, dengan x i merupakan titik tengah tiap kelas. dan f adalah frekuensi tiap nilai/tiap kelas, n merupakan ukuran sampel.
Perhatikan bahwa variansi adalah rataan kuadrat jarak tiap nilai dari mean. Ukuran yg benar-benar menyatakan jarak nilai dari mean adalah standar deviasi. Standar deviasi merupakan akar dari variansi. Standar deviasi pada populasi disimbolkan dengan σ dan pada sampel disimbolkan dengan s. σ = Variansi
Menunjukkan seberapa nilai menyimpang dari rataannya. Standard scores atau bilangan baku merupakan ukuran yg bersifat individual. Bilangan baku untuk setiap nilai/skor x i pada sampel dilambangkan dengan z i dicari dgn menggunakan rumus z i = x i x s
Hitung dan bandingkan standard scores dari kedua pemain basket berikut
Berikut standard scores dari kedua pemain dalam kurva Jika skor kedua pemain distandardize, maka skor dari pemain kedua lebih tinggi dari pemain pertama. Jadi meskipun pencapain skor pemain pertama lebih tinggi pada suatu pertandingan, tetapi dikatakan bahwa track record pencapaian prestasi pemain kedua relatif lebih baik dr pemain pertama.