Pendahuluan Pertemuan I
Apa data? Data merupakan hasil pengukuran terhadap suatu objek/individu yang menjadi pusat perhatian. Pengukuran dapat dilakukan secara kualitatif maupun kuantitatif Secara umum, skala pengukuran dibedakan menjadi nominal, ordinal, interval dan rasio Apa beda data dengan informasi? Informasi merupakan hasil yang diperoleh dari analisis data Misal, data tentang pendapatan kota Bogor tahun 007 maka rata-rata pendapatan per kapita kota Bogor tahun 007 merupakan informasi.
Ada berapa jenis data yang Anda kenal? Menurut sumbernya data dapat dibedakan menjadi data PRIMER dan SEKUNDER Menurut periode pengumpulannya data dibedakan menjadi data TIME SERIES dan data CROSS SECTION Menurut skala pengukurannya data dibedakan menjadi data KUALITATIF dan data KUANTITATIF Menurut cakupan objeknya data dibedakan menjadi data POPULASI dan data SAMPEL
Bagaimana Teknik Pengumpulan Data? observasi survei percobaan
PENGERTIAN DASAR SURVEI Survei didefinisikan sebagai sebuah metode untuk mengumpulkan data primer yang mendasarkan pada komunikasi dengan perwakilan sampel secara individu o Instrumen: kuesioner o Ada aktivitas bertanya melalui wawancara o Ada yang menjawab pertanyaan (individu / klp. individu) responden Keuntungan survei: proses cepat, tidak mahal, efisien, dan merupakan sarana yang akurat untuk mengakses informasi yang menyangkut populasi (dengan catatan: survei dilaksanakan dengan tepat dan akurat) Etika dalam survei: hak pribadi responden, pencegahan penipuan, penjelasan tujuan survei kepada responden, kerahasiaan, kejujuran dalam pengumpulan data, dan objektivitas dalam melaporkan data Observasi Observasi ilmiah merupakan suatu proses pencatatan yang sistematis terhadap pola perilaku orang, objek, dan kejadian-kejadian tanpa bertanya atau berkomunikasi dengan orang, objek atau kejadian tersebut
Wawancara Wawancara Personal pewawancara bertanya jawab langsung dengan responden Keuntungan: responden dapat umpan balik, konfirmasi jawaban, waktu dapat lebih longgar, potensi pengisian kuesioner secara lengkap lebih tinggi, dapat menggunakan alat bantu visual, partisipasi lebih tinggi Kerugian: biaya lebih mahal, waktu lebih lama, efek anonimitas responden Wawancara dapat dilakukan dari rumah kerumah atau di tempattempat dimana responden dapat mudah dijumpai misalnya mal, kantor pelayanan pengaduan, dll. Wawancara Telepon pewawancara bertanya jawab dengan responden melalui telepon Keuntungan: cepat, biaya relatif tidak mahal, mengurangi hal-hal yang bersifat pribadi, ada yang lebih suka diwawancarai via telpon. Kerugian: keterwakilan populasi dapat menjadi masalah karena mungkin tidak semua responden sasaran memiliki telpon, tidak dapat menggunakan media visual, durasi terbatas
Non Wawancara Survei melalui surat/pos Keuntungan: fleksibilitas geografi, biaya relatif lebih murah, responden lebih nyaman tidak diburu waktu, lebih pas untuk hal yang bersifat pribadi Kerugian: non respon tinggi, pertanyaan harus standar & terstruktur, sebelum menjawab seringkali responden membaca dulu seluruh pertanyaan kuesioner sehingga dapat menimbulkan bias Kuesioner Format baku, panjang halaman ma 6, bahasa sederhana & mudah, harus ada pengantar, kadang perlu pemberitahuan awal Kuesioner tertulis menggunakan jalur distribusi lain Melalui kartu garansi Melalui majalah dengan pemberian (iming-iming) hadiah tertentu Survei dengan media internet, dll.
ERROR DALAM SURVEI
ilustrasi Sebelum kita bicarakan cara pengambilan contohnya, perhatikan ilustrasi berikut (semuanya dikutip dari kuliah STK, kelas Prof AHN): Seorang ibu rumah tangga melewati Jalan Pajajaran di Kota Bogor, dan dilihatnya banyak penjual duku Palembang di sepanjang jalan tersebut. Pada saat ingin membeli, penjual menawarkan untuk mencicipi terlebih dahulu. Puas dengan rasanya, ibu tersebut membeli dua kilogram. Sesampai di rumah, ternyata rasa duku yang dia beli tidak manis seperti yang dia rasakan di tempat penjualan tadi. BPS mengadakan survei ekonomi dan menyebar beberapa petugas survei ke berbagai perumahan di Bogor. Hasil yang diperoleh cukup mengagetkan karena tingkat pendapatan masyarakat di Bogor Baru (salah satu perumahan A di Bogor) memiliki rata-rata yang tidak setinggi perkiraan. Setelah diselidiki ternyata, petugas di perumahan tersebut adalah petugas yang phobia terhadap anjing. Sehingga rumah yang dia datangi adalah rumah-rumah yang tidak memelihara anjing, dan rumah yang dilengkapi anjing umumnya lebih kaya daripada yang tidak.
Dua ilustrasi di atas adalah ilustrasi teknik pengambilan contoh yang salah, hasilnya akan berbias. Inilah resiko pengambilan kesimpulan dari data contoh. Jika cara pengambilannya tidak tepat, maka hanya satu kelompok saja yang didapatkan dan kesimpulan yang diambil tidak bisa berlaku umum.
Manajemen Survei: Fieldwork Seleksi enumerator sehat, memiliki raport yg baik, komunikatif, menarik, terdidik, berpengalaman Pelatihan sangat menentukan kualitas data yang dikumpulkan membekali enumerator tentang: memilih responden, kontak awal, teknik bertanya, probing, menulis jawaban, dan mengakhiri interview Supervisi meyakinkan bahwa enumerator mengikui prosedur & teknik sesuai dengan yang diterima pada saat pelatihan (termasuk: quality control, editing, sampling control, control of cheating, progress) Validasi memverifikasi apakah interview benar-benar dilakukan (ambil 0-5% durasi & kualitas interview, tanggapan thd enumerator, data demografi pokok, dan variabel-variabel kunci) Evaluasi evaluasi terhadap biaya, waktu, response rates, kualitas interview, & kualitas data
Populasi vs Contoh population sample himpunan semua objek yang menjadi minat pengambilan kesimpulan himpunan bagian dari populasi melakukan pengamatan terhadap seluruh populasi seringkali tidak mungkin dilakukan ketika akan membuat kesimpulan, mengapa?
Mengapa harus dengan contoh? sumber daya terbatas waktu yang tersedia terbatas pengamatan kadang bersifat merusah 3 4 mustahil mengamati seluruh anggota populasi bagaimana caranya dengan menggunakan data contoh kita dapat mengambil kesimpulan terhadap populasi? INI YANG KITA PELAJARI PADA MATA KULIAH INI
Ilustrasi Andaikan kita memiliki sepiring sambel buatan ibu kita. Berapa banyak yang kita ambil untuk mencicipi rasa sambel tersebut? Sebagian besar orang akan berpendapat bahwa seujung jari sudah cukup untuk mengetahui rasa sepiring sambel tersebut. Tidak akan ada seorang pun yang menjawab bahwa kita harus merasakan setengah piring untuk menyatakan rasa sambel buatan ibu. Pengambilan contoh dari sebuah populasi bisa dianalogkan dengan mencicipi masakan seperti di atas. Jika data masing-masing objek bermacam-macam, dengan kata lain karakteristik objeknya berbeda-beda, maka perlu diambil contoh yang banyak untuk mewakili setiap kelompok karakteristik. Namun jika karakteristik objek pada populasi itu seragam, hampir sama, maka contoh yang sedikit sudah cukup.
Statistika Populasi Sampling Pendugaan Contoh Deskriptif Tingkat Keyakinan Statistika Deskriptif vs Statistika Inferensia Ilmu Peluang
Parameter vs Statistik data populasi olah/analisis parameter data contoh olah/analisis statistik Parameter tidak pernah diketahui, yang kita ketahui adalah statistik. Statistik merupakan penduga bagi parameter.
Statistika Populasi : Keseluruhan pengamatan yang menjadi pusat perhatian kita Contoh : Himpunan bagian dari populasi (mewakili) Parameter : Karakteristik numerik dari populasi Statistik : Karakteristik numerik dari contoh Peubah / Variabel : Ciri dari objek yang diamati Skala pengukuran : Nominal, Ordinal, Interval, Rasio Peubah: Kualitatif vs Kuantitatif, Diskret vs Kontinu Pengumpulan Data: Harus dibangkitkan dulu Percobaan Langsung dikumpulkan Survei/Observasi
Emisi Hc (ppm) Analisis Eksplorasi Data Eksplorasi Upaya untuk melihat ke dalam data guna mengungkap informasi yang terkandung dalam data tersebut manipulasi, penyarian/perangkuman, peragaan Peragaan : tabel & grafik (histogram, diagram batang, diagram lingkaran/pie chart, plot, dll.) Penyarian: ukuran pemusatan (mean, median, modus, quartil), ukuran penyebaran (ragam, standard deviasi, range, jarak antar kuartil) 90 80 70 60 50 40 30 0 0 0 Tw- Tw- Tw-3 Tw-4 Jabar Jatim Lampung % Laki-Laki 79% Perempuan 000 900 800 700 600 500 400 0 40 60 80 00 0 Jarak (000 Km)
Teknik Meringkas Data ukuran pemusatan ukuran penyebaran
Ukuran Pemusatan nilai tempat mengumpulnya sebagian besar data Median, membagi data menjadi dua bagian yang sama banyak Me = data ke-(n+)/ Modus, nilai data yang paling sering muncul Rataan/Rata-rata N N Xi i mean n n Xi i average
dikenal adanya Truncated Mean (rataan Tentang Rataan Rataan bersifat tidak kekar (robust) terhadap adanya data-data bernilai ekstrim. misal data yang dimiliki: 5, 7, 8, 3, 4, 4, 6, 7, 8, rataan 3.3, median 4 5, 7, 8, 3, 4, 4, 6, 7, 8, 70 rataan 8., median 4
Ukuran Penyebaran semakin besar nilainya berarti data semakin bervariasi/beragam Wilayah (Range), selisih antara nilai data terbesar dengan data terkecil Jangkauan antar kuartil (Inter Quartile Range), selisih antara kuartil dengan kuartil 3 kisaran tempat mengumpulnya 50% data bernilai sedang Ragam (variance), rata-rata kuadrat n N penyimpangan data terhadap rata-ratanya ( X i ) s ( X i ) Simpangan N n - i Baku (standard deviation), i akar dari ragam
Analisis Eksplorasi Data Penyajian dengan: - Diagram Dahan Daun (Stem-and-Leaf Display) - Diagram Kotak Garis (Bo-Plot) Contoh data: Contoh Contoh Contoh3 5 65 9 6 3 8 65 93 6 9 5 8 66 38 3 7 37 50 5 7 4 7 54 43 4 0 9 9 4 69 7 4 0 48 73 0 53 0 4 76 8 9 3 6 5 54 35 3 8 7 5 39 55 8 8 3 4 7 9 6
Analisis Eksplorasi Data Stem-and-Leaf Display Stem-and-leaf of Contoh N = 0 Leaf Unit =.0 5 4 3 579 7 4 38 (4) 5 0445 9 6 5569 5 7 36 3 8 9 3 Stem-and-leaf of Contoh N = 4 Leaf Unit =.0 3 0 899 7 03 (6) 566779 0344 6 689 3 3 3 8 4 4 5 3 Stem-and-leaf of Contoh3 N = 3 Leaf Unit =.0 0 3 3 0 45 5 0 77 8 0 899 (4) 00 3 8 4455 4 67 8 7
Contoh Contoh Contoh3 Analisis Eksplorasi Data Boplot 95 85 50 30 75 65 55 45 35 5 40 30 0 0 0 0 0 Langkah Pembuatan Bop-Plot:. Tentukan: nilai terkecil, nilai terbesar, Q, Median, Q3. Lakukan identifikasi pencilan: dekat: < Q 3/ d atau > Q3 + 3/ d & jauh: < Q 3d atau > Q3 + 3d 3. Gambar!
Sebaran Penarikan Contoh populasi ambil contoh berukuran n ambil contoh berukuran n ambil contoh berukuran n ambil contoh berukuran n 3 Rata-rata contoh adalah peubah acak yang juga memiliki sebaran tertentu. Contoh yang berbeda dari populasi yang sama, hampir dapat dipastikan memiliki rata-rata yang berbeda. k
Sebaran Penarikan Contoh menyebar N(, /n),,, n dari populasi yang menyebar N(, ) s menyebar t-student db=n-
Sifat-sifat Penduga Penduga bagi suatu parameter, dilambangkanˆ Sifat yang diinginkan dari suatu penduga parameter adalah:. Tak Bias (unbiased) Eˆ. Ragam penduga, Var ˆ, kecil
Sifat-sifat Penduga Tak bias, ragam kecil Bias, ragam kecil Tak bias, ragam besar Bias, ragam besar
Selang Kepercayaan Menduga nilai parameter menggunakan kisaran nilai antara batas bawah (LCL=lower confidence limit) dan batas atas (UCL=upper confidence limit),,, n dari populasi yang menyebar N(, ) Selang kepercayaan (-)00% bagi adalah t s n
Peluang Bagaimana membuktikan bahwa sebuah dadu setimbang? Empiris Peluang = frekuensi relatif Contoh: Satu mata uang setimbang dilempar sekali RC = {M, B} P({M})=/ dan P({B})=/ Satu mata uang setimbang dilempar 3 kali RC = {BBB,BBM,BMB,MBB,BMM,MBM,MMB,MMM} P({MMM})=/8 ; P({BBB})=/8 ; P({BMB})=/8 X = Jumlah sisi muka yang muncul (X disebut peubah acak)
Peluang Peubah Acak fungsi yang memetakan anggota gugus RC ke gugus bilangan nyata P(X=0) = P({BBB}) = /8 P(X=) = P({BBM,BMB,MBB}) = 3/8 P(X=) = P({BMM,MBM,MMB}) = 3/8 P(X=3) = P({MMM}) = /8 n n P( X ) p ( p) ; 0,,,...,n Sebaran Binom(n,p) sebaran Binom dengan parameter n dan p (sebaran peluang diskret)
Nilai Harapan & Ragam Peubah Acak X Nilai Harapan & Ragam : Sebaran Binom(n,p) E( X ) E n ip( i ) ; i 0,...,n i0 ( X ) E( X Contoh: n=3 & p=0.5 E( X ) n ) i P( i ) ; i 0,...,n i0 X 0 3 P(X) 0.5 0.375 0.375 0.5 E(X) =.5 = 0.75 Khusus pada sebaran Binom(n,p) : E(X) = = np dan = np(-p)
Peluang Kontinu 4 0 ; 4 ) ( f Sebaran Seragam kontinu P(X=3) = 0 pada sebaran kontinu, peluang pada satu titik =0 4 3 4 0 4 3 4 4 ) ( 3) ( 3 0 3 0 3 d d f X P 4 4 4 3 4 4 ) ( 3) ( 3 3 3 d d f X P d f X E ) ( ) ( Nilai harapan
Peluang Normal Sebaran Normal f ( ;, ) e ; - X ~ N(, (fungsi peluang kontinu) ) Z X - Z ~ N(0,) Tabel-Z Contoh: Berat ikan di suatu danau mengikuti pola sebaran normal dengan rataan 400g dan standard deviasi 00g. Jika diambil satu ikan secara acak, berapa peluang mendapatkan ikan yang beratnya lebih dari 500g? 500 400 P( X 500) PZ P( Z ) 00 0.587
Peluang Normal, Z, t,, F Jika X~N(, ) ~N(, /n) Bagaimana jika sebaran pop tdk normal Dalil Limit Pusat Apapun sebaran populasinya, ~N(, /n) dengan n Jika tidak diketahui, maka sebaran Normal (Z) sebaran t Peubah acak Z sebaran (Khi-kuadrat) Rasio dari p.a. sebaran sebaran F Penggunaan: Sebaran Z menguji jika diketahui Sebaran t menguji jika tidak diketahui Sebaran menguji ragam ( ) Sebaran F Rasio dua ragam
Pendugaan Parameter Dugaan Titik untuk menduga s untuk menduga Dugaan Selang Selang kepercayaan (-)00% bagi Jika diketahui: z Jika tdk diketahui: t z n s n t n ( n ) ( n ) s n
Dugaan Selang Selang kepercayaan (-)00% bagi - Jika dan tdk diketahui dan diasumsikan sama: Pendugaan Parameter ) ( ) ( n n z n n z ) ( ) ( ) ( ) ( n n s t n n s t gab v gab v dan ) ( ) ( n n v n n s n s n s gab
Pengujian Hipotesis Hipotesis Statistik: Pernyataan/dugaan mengenai parameter populasi yang ingin dibuktikan kebenarannya H 0 hipotesis nol H atau H a Misalnya: hipotesis satu atau hipotesis alternatif H 0 : =60 vs H : 60 uji dwi arah H 0 : =60 vs H : >60 H 0 : =500 vs H : <500 uji eka arah uji eka arah Berdasarkan data yang dikumpulkan, H atau H 0 yang benar?
Pengujian Hipotesis Hasil Pengujian H0 terima H terima Keadaan Sebenarnya H0 benar Benar Salah Jenis ( H benar Salah Jenis (b Benar = Peluang menolak H0 padahal H0 benar b = Peluang menerima H0 padahal H yang benar
Pengujian Hipotesis Kaidah Keputusan: Jika p-value < H benar Jika p-value H0 dianggap benar taraf nyata pengujian (kesalahan maksimum yang diperbolehkan jika memutuskan H benar) P-value peluang salah jenis berdasarkan data Teladan : Pada saat ini diduga terjadi kenaikan rata-rata tinggi badan orang Indonesia dibandingkan tahun 70-an. Untuk membuktikan dugaan ini diambil contoh acak berukuran 5 dan diperoleh rataan sebesar 64 cm. Ujilah apakah dugaan tersebut benar. Gunakan =5%. (Catatan: Tinggi rata-rata tahun 70-an=6 cm, dan =8 cm ).
Pengujian Hipotesis Diketahui: n=5, =64 cm ; =8 cm ; =5%=0.05. H 0 : =6 cm vs H : >6cm - Z / n Z tabel = Z 0.05 =.65 64-6 8/ 5.67 Z > Ztab Tolak H0 P-value = P(> 0 / =6) = P(Z>.67) = 0.0475 P-value < Tolah H 0 (Memang benar sekarang ada kenaikan rata-rata tinggi orang Indonesia dibandingkan dengan tahun 70-an)
Pengujian Hipotesis Secara Umum: Satu Nilai Tengah Populasi: H 0 : = 0 vs H : 0 Dua Nilai Tengah Populasi: H 0 : 0 vs H : > 0 H 0 : 0 vs H : < 0 Saling Bebas Berpasangan H 0 : = vs H : H 0 : D = 0 vs H : D 0 H 0 : vs H : > H 0 : D 0 vs H : D > 0 H 0 : vs H : < H 0 : D 0 vs H : D < 0
Pengujian Hipotesis Teladan-: Ada dugaan kuat bahwa latar belakang petambak berpengaruh terhadap keberhasilan sebagai petambak di CP Bahari. Untuk membuktikan pendapat ini, dipilih petambak contoh secara acak, dimana orang berlatar belakang petambak dan orang sisanya berlatar belakang bukan petambak. Jika produksi merupakan ukuran tingkat keberhasilan petambak, dan produksi terakhir dari ke- petambak tersebut seperti tabel di bawah ini, ujilah apakah dugaan tersebut di atas benar? (Gunakan =5% dan asumsikan ragam produksi kedua populasi sama). Produksi dari Petambak yang Berlatar Belakang Petambak.7 9.6. 8.6 9.3 0. 8.9 9.5 0.4 8.3 9.4 Produksi dari Petambak yang Berlatar Belakang Bukan Petambak 7.4 8.5 9. 8.7 7.8 6.9 0. 9.4 8. 8.3 9.0 Bentuk Hipotesis? Statistik Uji? H 0 : vs H : > t hit ( s ) s ( gab ) n n