Sample Size for a Simple Random Sample

dokumen-dokumen yang mirip
STATISTICAL STUDENT OF IST AKPRIND

MODUL TEORI ESTIMASI ATAU MENAKSIR TEORI ESTIMASI ATAU MENAKSIR

mengsumsikan tidak ada kesalahan pengukuran, validitas dapat dievaluasi dengan mengamati nilai bias dari penduganya. Bias, B ( ) dari populasi

PENARIKAN SAMPEL & PENDUGAAN PARAMETER

ESTIMASI. Arna Fariza PENDAHULUAN

PENAKSIRAN PARAMETER TM_3

6.5 Pertimbangan penentuan ukuran sampel

KONSISTENSI ESTIMATOR

APLIKASI RAPID SURVEY

STK 511 Analisis statistika. Materi 4 Sebaran Penarikan Contoh

BAB 4 METODOLOGI PENELITIAN

(ESTIMASI/ PENAKSIRAN)

METODE SAMPLING. Met. Sampling-T.Parulian

TEORI PENDUGAAN STATISTIK. Oleh : Riandy Syarif

Pengantar Statistika Matematika II

Materi Kuliah: Statistik Inferensial

Gejala Pusat - Statistika

STATISTICAL STUDENT OF IST AKPRIND

Materi Kuliah: Statistik Inferensial

PERTEMUAN 11-MPC 2 PRAKTIK. Oleh: Adhi Kurniawan SEKOLAH TINGGI ILMU STATISTIK

STATISTIKA. Statistika pengkuantifikasian (pengkuantitatifan) hasil-hasil pengamatan terhadap kejadian, keberadaan, sifat/karakterisitik, tempat, dll.

Pengantar Statistik Inferensial

Sebaran (Distribusi) Peluang teoritis Peubah Acak : Statistik Sample, misal Rata-rata dan proporsi sample Hasil semua kemungkinan Sample dg ukuran yg

STATISTIKA BISNIS PENDUGAAN STATISTIKA. Deden Tarmidi, SE., M.Ak., BKP. Modul ke: Fakultas Ekonomi dan Bisnis. Program Studi Akuntansi

UJI HIPOTESA PERBEDAAN. t-test

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

MENGAPA PERLU SAMPLING

ETIH SUDARNIKA LABORATORIUM EPIDEMIOLOGI FAKULTAS KEDOKTERAN HEWAN IPB

TEORI PENDUGAAN. diketahui berdasarkan informasi sampel.

BAB III METODE PENELITIAN

Kucing Peliharaan Rumah Tangga

BAB 2 LANDASAN TEORI

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. Jenis penelitian yang akan dilakukan adalah penelitian komparatif dan

Regresi Linier Berganda

The Central Limit Theorem

ESTIMASI. Widya Setiafindari

BAB III METODE PENELITIAN. Muarareja yang terletak di Kel. Muarareja, Kota Tegal, Jawa Tengah. Sedangkan

BAB 2 TINJAUAN PUSTAKA

DISTRIBUSI SAMPLING besar

BAB 6 PENAKSIRAN PARAMETER

TINJAUAN PUSTAKA. Rancangan petak teralur (strip plot design) merupakan susunan petak-petak (plotplot)

Pendugaan Parameter. Ayundyah Kesumawati. April 13, Prodi Statistika FMIPA-UII. Ayundyah (UII) Pendugaan Parameter April 13, / 30

BAB III METODE PENELITIAN. survei dengan menggunakan alat bantu kuesioner dan menggunakan metode

PENAKSIRAN RATAAN DAN VARIANSPOPULASI PADA SAMPEL ACAK TERSTRATIFIKA DENGAN AUXILIARY VARIABLE

Estimasi dan Confidence Interval

Sampling, Estimasi dan Uji Hipotesis

Setiap karakteristik dari distribusi populasi disebut dengan parameter. Statistik adalah variabel random yang hanya tergantung pada harga observasi

BAB 2 LANDASAN TEORI. Analisis Korelasi adalah metode statstika yang digunakan untuk menentukan tingkat

MENGENAL APLIKASI PROJECT PORTFOLIO MANAGEMENT DARI HEWLETT PACKARD

S T A T I S T I K A OLEH : WIJAYA FAKULTAS PERTANIAN UNIVERSITAS SWADAYA GUNUNG JATI CIREBON

BAB I PENDAHULUAN. melalui pos. Ada beberapa keuntungan yang dapat diperoleh, diantaranya

TINJAUAN PUSTAKA ( ) ( ) ( )

Review Teknik Sampling

II. TINJAUAN PUSTAKA

6. Teori Estimasi. EL2002-Probabilitas dan Statistik. Dosen: Andriyan B. Suksmono

BAB I PENDAHULUAN. Dalam suatu penelitian, seringkali tidak mungkin untuk melakukan

BAB II TINJAUAN PUSTAKA. nonparametrik, pengujian hipotesis, One-Way Layout, dan pengujian untuk lebih dari

Oleh: Herien Puspitawati Tin Herawati

1. PENGERTIAN. Manfaat Sampling :

SURVEI STATISTIK KHUSUS

BAB 2 LANDASAN TEORI

SESI 13 STATISTIK BISNIS

PEMILIHAN DATA (SAMPEL) PENELITIAN PERTEMUAN KE 5

UJI HIPOTESIS SATU-SAMPEL

BAB III METODE PENELITIAN. kuantitatif merupakan metode penelitian yang menekankan pada fenomenefenomena

Metoda Penelitian TEKNIK SAMPLING

STK511 Analisis Statistika. Pertemuan 5 Statistika Inferensia (1)

BAB 2 LANDASAN TEORI. bebas X yang dihubungkan dengan satu peubah tak bebas Y.

Estimasi dan Confidence Interval

Kesalahan Perhitungan Aritmatika Pada Beberapa Program Kalkulator

KORELASI LINIER BERGANDA

S T A T I S T I K A OLEH : WIJAYA

BAB IV METODE PENELITIAN. ditentukan dengan metode purposive sampling, yaitu suatu metode penentuan lokasi

III. METODE PENELITIAN. Tipe penelitian ini adalah penelitian penjelasan (explanatory research), yaitu

BAB I PENDAHULUAN I.1.

BAB II TINJAUAN PUSTAKA. (b) Variabel independen yang biasanya dinyatakan dengan simbol

BAB 2 LANDASAN TEORI

REGRESI LINIER. b. Variabel tak bebas atau variabel respon -> variabel yang terjadi karena variabel bebas. Dapat dinyatakan dengan Y.

RISET AKUNTANSI. Materi RISET AKUNTANSI

III. METODE PENELITIAN. probiotik maupun non probiotik oleh peternak, dimulai dari pembesaran bibit

Pembelian Tiket Pesawat dengan menggunakan Google Form

ANALISA DATA. Mayang Adelia Puspita

POPULASI, SAMPEL, METODE SAMPLING. Musafaah, SKM, MKM

BAB IV HASIL DAN PEMBAHASAN

Pertemuan 4-5 ANALISIS REGRESI SEDERHANA

REGRESI LINIER BERGANDA. Debrina Puspita Andriani /

ESTIMASI. Podojoyo, SKM, M.Kes. Podojoyo 1

PENGENALAN IPHOST NETWORK MONITOR

PERTEMUAN 13-MPC 2 PRAKTIK. Oleh: Adhi Kurniawan SEKOLAH TINGGI ILMU STATISTIK

BAB III METODE PENELITIAN

BAB IV ANALISIS HASIL PENELITIAN. Satriyan kecamatan Tersono kabupaten Batang. Langkah-langkah yang dilakukan

Metode kuantitatif: Randomisasi 12 O K TO BER 2016

BAB III METODOLOGI PENELITIAN

POPULASI DAN SAMPEL. Gambar 1 POPULASI dan SAMPEL

Iman Adrianto

BAB III ANALISIS SPEKTRAL PADA RUNTUN WAKTU MODEL ARIMA. Analisis spektral adalah metode yang menggambarkan kecendrungan osilasi

Transkripsi:

E-mail : statistikaista@yahoo.com Blog : Sample Size for a Simple Random Sample Lisensi Dokumen: Copyright 2010 ssista.wordpress.com Seluruh dokumen di ssista.wordpress.com dapat digunakan dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ssista.wordpress.com. Pendahuluan Secara umum, dua metode yang digunakan untuk mencari ukuran sampel yang optimal (akan kembali ke sampling tujuan) dan adalah (1) menemukan n terkecil yang akan menyediakan setidaknya presisi tertentu (Var(θ)) atau diikat pada perkiraan kesalahan dari θ dengan tingkat kepercayaan tertentu atau (2) menemukan n terbesar untuk suatu biaya total tetap sehingga untuk mendapatkan presisi maksimum yang kita usahakan. Metode 1. Specified Precision. 1. Kami ingin untuk memilih ukuran n sampel yang sekecil mungkin, namun sedemikian rupa sehingga melebihi perkiraan maksimum dengan perbedaan yang diperbolehkan d, Antara nilai sebenarnya dan estimasi dengan kemungkinan kecil α. d juga sering disebut sebagai satu batasan pada kesalahan dari estimasi B dengan kriteria Pθ θ > d < α untuk beberapa d dan α. 2. Jika θ adalah distribusi yang mendekati normal maka P > Z = P θ θ > ZVarθ = α. 3. Kita berharap untuk memilih n seperti ZVarθ d. 1

E-mail : statistikaista@yahoo.com Blog : 4. Rumus ukuran sampel untuk memperkirakan mean populasi dengan menggunakan sampel acak sederhana ditemukan oleh pengaturan d = Z 1 dan pemecahan untuk n. ini memberikan rumusan n = = dimana n =. Perhatikan bahwa n adalah ukuran sampel yang akan diperlukan jika n sampling dari populasi yang tak terbatas. Itu juga merupakan formula yang disajikan dalam banyak kursus statistik dasar untuk ukuran sampel, tapi sekali lagi, itu berlaku untuk populasi yang tak terbatas (atau hampir tak terbatas). 5. Jika ukuran populasi relatif besar maka ukuran sampel biasanya n 0 dapat digunakan sebagai perkiraan ukuran sampel. 6. Ukuran sampel untuk memperkirakan jumlah populasi dengan menggunakan sampel acak sederhana dengan presisi yang ditentukan pada kepercayaan tertentu adalah : n = = dimana n = Metode 2. Total Biaya yang Ditentukan 1. Biarkan C menjadi biaya total sampling, biarkan C menjadi biaya overhead (kadangkadang disebut "biaya pergi sampling "atau" biaya awal "), dan biarkan c menjadi biaya sampling dari sebuah individu sampling unit. Maka total biaya proyek sampling akan: C = C + cn 2. Biaya overhead mungkin mencakup hal-hal seperti mendapatkan peralatan yang akan digunakan dalam pengambilan sampel, menyewa dari samplers, dll. Biaya ini diasumsikan independen dari jumlah sampel unit yang benar-benar dipilih. 3. Jika Anda diberikan dana F untuk proyek sampling, maka ukuran sampel yang akan menghabiskan semua uang akan diperoleh dengan menetapkan C = F dan memecahkan n. n = 4. Presisi yang diharapkan dari perkiraan yang diperoleh dengan ukuran sampel ini 2

E-mail : statistikaista@yahoo.com Blog : kemudian dapat dihitung dengan mengganti ukuran sampel di atas ke dalam persamaan untuk varians dari perkiraan. Compromise Dalam prakteknya, kedua perhitungan mungkin perlu dilakukan dan kemudian yang lebih kecil dari 2 perhitungan akan digunakan sebagai ukuran sampel yang layak. Jika ukuran sampel lebih kecil menggunakan metode 1 (presisi) dan Anda menggunakan metode 2 ukuran sampel, maka Anda akan menghabiskan lebih banyak uang daripada yang diperlukan untuk mencapai ketepatan yang diminta. Di sisi lain, jika ukuran sampel kecil menggunakan Metode 2 (biaya) dan Anda menggunakan metode 1 ukuran sampel, maka Anda tidak akan memiliki cukup sumber daya untuk mencapai presisi yang diminta. Dalam contoh yang terakhir, anda tidak akan mampu mencapai yang diminta presisi dengan kepercayaan diri yang dikehendaki dan sehingga perhitungan presisi yang diharapkan dapat menunjukkan apakah atau tidak penelitian ini adalah senilai mengerucutkan dengan dana yang tersedia. Contoh 1 : (Soal 4,7 dari Scheaffer et al. 1990) Sampel acak sederhana dari 100 meter air dalam komunitas dimonitor untuk memperkirakan rata-rata konsumsi air harian per rumah tangga selama musim kering tertentu. Rata-rata sampel dan varians yang ditemukan y = 12.5 galon dan s = 1252. Berdasarkan catatan Kota, ada N = 10,000 meter air di masyarakat. 1. Perkirakan rata-rata populasi konsumsi air per meter dan tempat yang terikat pada kesalahan estimasi. Juga interval kepercayaan 95% untuk rata-rata populasi konsumsi air per meter. Pengukur untuk rata-rata populasi adalah μ = y = 12.5 galon per meter. Hitunglah varians dan standar error dari taksiran untuk menghitung satu batasan dan interval kepercayaan. var(μ ) = var (y) = 1 = (1 ) = 12.3948 3

E-mail : statistikaista@yahoo.com Blog : se(μ ) = var (y) = 12.3948 = 3.52 gallon. Batasannya adalah B = 1.96(3.52) = 6.9 gallon dengan 95% C.I. dari 12.5 ± 6.9 atau (5.6, 19.4) gallon. Dengan demikian, dengan tingkat kepercayaan 95% kita yakin bahwa interval (5.6, 19.4) galon berisi rata-rata populasi konsumsi air per meter yang sebenarnya. 2. Memperkirakan populasi (masyarakat) total konsumsi air dan menempatkan batasan pada kesalahan estimasi. Juga melaporkan interval kepercayaan 95% untuk populasi (masyarakat) total konsumsi air. Gunakan pengukur inflasi sederhana untuk memperkirakan total konsumsi penduduk. τ = Ny = 10000(12.5) = 125000 galon dikonsumsi oleh masyarakat. Sekali lagi, menghitung varians dan standard error dari estimasi. var(τ ) = N var(y) = (10000) (12.3948) = 1239480000 se(τ ) = 1239480000 = 35206.25 gallon. Batasan pada kesalahan estimasi oleh karena itu B = 1.96(35206.25) = 69004 galon dengan 95% C.I.dari 125000 ± 69004 atau (55996, 194004) galon. Kita dapat yakin 95% bahwa interval (55996, 194004) galon berisi total populasi masyarakat yang sebenarnya mengkonsumsi air selama masa studi. 3. Apakah ukuran sampel harus diambil dalam rangka untuk memperkirakan total konsumsi air masyarakat ke dalam batasan 5.000 galon. Asumsikan ukuran sampel populasi yang tak terbatas sehingga n = N Z S d = (10000) (1.96) (1252) (5000) = 19239 yang mana ketika dikoreksi untuk ukuran populasi terbatas adalah n = = = 6580 meter air yang perlu dibaca. 4. Masyarakat hanya memiliki $ 300 untuk studi. Biaya overhead untuk studi adalah $ 50 dan biaya $ 0,25 untuk membaca meter. Apa ukuran sampel yang harus mereka ambil untuk tetap di dalam anggaran sebelum mendapatkan kemungkinan presisi terbesar? Apa 4

E-mail : statistikaista@yahoo.com Blog : Contoh 2 : yang diharapkan akan batasan pada perkiraan kesalahan total dalam menggunakan ukuran sampel ini? Pertama, mengakui bahwa semakin besar ukuran sampel, semakin besar presisi, dan karena itu, mereka harus mengambil ukuran sampel terbesar bahwa mereka mampu. Karena mereka memiliki total $ 300 dan biaya $ 50 dalam overhead, maka mereka dapat mencurahkan 300 50 = 250 dolar untuk pengambilan sampel. Jadi, menemukan berapa banyak meter yang dapat dibaca dengan biaya $ 0,25 per meter. n =. = 1000 meter. Jika varians dari data yang baik diperkirakan oleh sampel pertama kami, maka perkiraan batasan pada kesalahan estimasi menggunakan ukuran sampel yang baru akan B = 1.96 var (τ ) = 1.96 N 1 20806 galon. Perkiraan koefisien variasi dari perkiraan total menjadi CV(τ ) = () 100 =. (100) = 8.5 %. = 1.96(10000) 1 = Tanda tangan untuk sebuah petisi yang dikumpulkan di 676 lembar. Setiap lembar sudah cukup 42 ruang untuk tanda tangan, tetapi pada banyak sheet, sejumlah kecil tanda tangan dikumpulkan. Itu jumlah tanda tangan per lembar dihitung untuk sampel acak dari 50 lembar dengan hasil ditunjukkan dalam tabel di bawah ini. No. Tanda Tangan y Frekuensi f 42 23 41 4 36 1 32 1 29 1 5

E-mail : statistikaista@yahoo.com Blog : 27 2 23 1 19 1 16 2 15 2 14 1 11 1 10 1 9 1 7 1 6 3 5 2 4 1 3 1 1. Memperkirakan jumlah tanda tangan untuk petisi dan melaporkan standard error dari estimasi. Kemudian membuat perkiraan interval keyakinan 95% perkiraan jumlah tanda tangan untuk permohonan. Pertama menghitung dan melaporkan informasi ringkasan dengan menggunakan data dari tabel di atas. N = 676, n = 50 y = jf = 1471, y = j f = 54497 y = 1471 50 = 29.42,s = 54497 (1471) 50 = 228.98 50 1 Gunakan pengukur inflasi sederhana untuk memperkirakan populasi total. τ = Ny = 676(29.42) = 19888 tanda tangan untuk permohonan. 6

E-mail : statistikaista@yahoo.com Blog : var(τ ) = N 1. = (679) 1 = 1937676.81 dengan standar error. se(τ ) = 1937676.81 = 1392 tanda tangan. Dengan 95% perkiraan interval keyakinan kemudian akan τ ± (1.96) se(τ ) atau 19888 ± (1.96)1392 19888 ± 2728 (17160, 22616) tanda tangan untuk permohonan. 2. Anggaplah bahwa jumlah sepenuhnya mengisi lembar (dengan masing-masing 42 tanda tangan) dihitung dan ditemukan untuk menjadi 326. Gunakan informasi ini untuk memperbarui titik dan perkiraan interval dari bagian 1. Kita sekarang mengingat bahwa 326 lembar semua lembaran dalam populasi yang memiliki tepat 42 tanda tangan. Dengan demikian, kita dapat menghapus lembaran tersebut dari populasi (dan contoh kita) dan perkiraan berapa banyak tanda tangan yang di sisa "populasi". Kemudian, kita dapat menambahkan kembali 326 (42) = 13692 tanda tangan untuk perkiraan kami untuk mendapatkan perkiraan jumlah tanda tangan penduduk. N = 676 326 = 350 lembar dengan kurang dari 42 tanda tangan, n = 50 23 = 27 lembaran dalam sampel dengan kurang dari 42 tanda tangan, y = 1471 23(42) = 505, y = 54497 23(42)2 = 13925, sehingga y = = 18.704 dan s = () / = 172.29. Menggunakan statistik ringkasan di atas sekarang kita dapat memperkirakan jumlah tanda tangan ke permohonan lembar berisi lebih sedikit dari 42 tanda tangan. τ = 350(18.704) = 6546.3 tanda tangan dan var(τ ) = (350)2. 721399.04 = 849,35 tanda tangan. (1 ) = 721399.04 dengan standar error se(τ ) = Perkiraan kami jumlah tanda tangan untuk permohonan kemudian akan 7

E-mail : statistikaista@yahoo.com Blog : τ = 326(42) + 6546 = 20238 tanda tangan dengan standar error se(τ) = 849.35. Pemberitahuan standard error tidak terpengaruh oleh informasi yang diketahui. Interval kepercayaan 95% Oleh karena itu, τ ± (1.96)se(τ ) 20238 ± 1665 (18573, 21903) tanda tangan untuk permohonan. Contoh 3 : Dokter gigi A dan B membuat survei keadaan gigi dari 200 anak-anak di sebuah desa. Dr A memilih sampel acak sederhana dari 20 anak dan menghitung jumlah dari membusuk gigi untuk setiap anak dengan hasil sebagai berikut: No. dengan gigi busuk/anak 0 1 2 3 4 5 6 7 8 9 10 No. dari anak-anak 8 4 2 2 1 1 0 0 0 1 1 Dr B, dengan menggunakan teknik gigi yang sama, mengkaji seluruh 200 anak-anak, merekam hanya orang-orang yang punya gigi membusuk. Ia menemukan 60 anak tanpa gigi membusuk. 1. Memperkirakan jumlah gigi membusuk pada anak-anak desa menggunakan hasil Dr A saja. Meringkas data di atas: N = 200, n = 20, y = 42, y = 252, y = s = () / τ = 200(2.1) = 420 = 8.621. = 2.1, dan gigi membusuk pada anak-anak desa dengan varians dan standard error dari perkiraan var(τ ) = 200. (1 ) = 15517.8 dan se(τ ) = 124.6 gigi membusuk. 2. Memperkirakan jumlah gigi membusuk pada anak-anak desa menggunakan kedua hasil Dr A dan Dr B. Karena kita sekarang tahu bahwa terdapat 60 anak-anak di desa tanpa gigi membusuk, kita dapat mendefinisi ulang populasi anak-anak dengan paling sedikit 1 gigi membusuk. Memperbarui informasi ringkasan : N = 200 60 = 140, n = 20 8 = 8

E-mail : statistikaista@yahoo.com Blog : 12, y = 42 8(0) = 42, y = 252 8(0) = 252, y = = 3.5 dan s = () / = 9.545. τ = 140(3.5) = 490 gigi membusuk dengan varians dan standard error var(τ ) = 140. 1 = 14253.9 dan se(τ ) = 119.4 gigi membusuk. Perhatikan bahwa perkiraan terbaru ini juga merupakan perkiraan jumlah gigi membusuk dalam populasi sejak 60 anak tanpa gigi membusuk berkontribusi apa pun untuk total ini. Jadi, τ = 490 gigi membusuk dan var(τ ) = 14253.9 dengan se(τ ) = 119.4 gigi membusuk. 3. Apakah perkiraan di bagian 1 dan bagian 2 tak bias? Mengapa atau mengapa tidak? Kedua penduga tak bias dari jumlah total penduduk gigi membusuk. Ini karena masingmasing populasi didefinisikan sedemikian rupa sehingga perkiraan total dapat didasarkan pada inflasi penilai sederhana dari sampel acak sederhana. Penting untuk dicatat bahwa kedua sampel merupakan sampel acak sederhana. Satu aspek, namun, yang tidak berbeda antara kedua sampel dan belum dipertimbangkan adalah bahwa untuk jawaban kedua, ukuran sampel, jumlah anak-anak dalam sampel dengan gigi membusuk, dapat dianggap sebagai variabel acak. Demikian, varians kami perkiraan hanya perkiraan varians bersyarat (pengondisian pada ukuran sampel yang tetap pada 12). Kita akan melihat ini jenis masalah lagi ketika kita membahas estimasi parameter dari subdomain dan pascastratifikasi dari sampel. 4. Perkiraan mana yang lebih tepat? Mengapa? Jika kita mengabaikan bahwa ukuran sampel merupakan variabel acak dalam situasi kedua, maka Pengukur memanfaatkan kedua data Dr A dan Dr B's yang sedikit lebih baik daripada yang hanya menggunakan data Dr A's. Hal ini karena standard error dari data gabungan Pengukur lebih kecil daripada hanya menggunakan data Dr A. 9