Modul 13 Ukuran Sampel Daftar Isi 13.1 Tujuan Pembelajaran..................... 1 13.2 Prinsip Penghitungan Besar Sampel............. 1 13.3 Ukuran Sampel untuk Uji Mean............... 3 13.4 Ukuran Sampel untuk Uji dua Mean............. 5 13.5 Ukuran Sampel untuk Uji Proporsi............. 5 13.6 Ukuran Sampel untuk Uji RR dan OR............ 7 13.7 Latihan............................. 9 13.1 Tujuan Pembelajaran Setelah selesai melakukan pembelajaran pada bagian ini, mahasiswa diharapkan dapat: 1. Menjelaskan prinsip penghitungan besar sampel 2. Menghitung ukuran sampel dengan diberikan outcome yang menjadi perhatian dan asumsi tertentu 13.2 Prinsip Penghitungan Besar Sampel Suatu penelitian bidang ilmu kesehatan atau epidemiologi dimulai dari desain penelitian yang salah satunya adalah penentuan ukuran sampel yang diperlukan dalam studi. Sampel yang berukuran sangat besar mungkin akan menghasilkan kesimpulan yang signifikan secara statistik, namun mungkin tidak signifikan secara substansi maupun praktek. Selain itu, penelitian ddengan sampel sangat besar akan menghabiskan banyak biaya dan tenaga. 1
13.2. Prinsip Penghitungan Besar Sampel 2 Tabel 13.1: Kesalahan Tipe I dan Tipe II Keputusan Uji Kenyataan H 0 benar H 0 salah H 0 tidak ditolak benar salah (Tipe II) H 0 ditolak salah (Tipe I) benar Sebaliknya penelitian dengan sampel yang terlalu sedikit akan berakhir tanpa ada kesimpulan, atau tidak memberikan hasil yang signifikan secara statistik, meskipun sebenarnya penting secara substansi. Oleh karena itu penghitungan besar sampel, dengan diberikan syarat dan asumsi tertentu, memegang peranan penting dalam penelitian di bidang kesehatan dan epidemiologi. Tujuan utama penghitungan sampel adalah untuk verifikasi bahwa data yang akan dikumpulkan akan cukup berguna dalam menjawab pertanyaan penelitian. Perhitungan sampel dapat ditentukan berdasarkan presisi (precision analysis) dan berdasarkan power (power analysis). Keduanya dilakukan dengan cara mengendalikan Kesalahan Tipe I dan Kesalahan Tipe II dalam uji hipotesis suatu parameter tertentu. Pengertian dua kesalahan tersebut dapat dilihat pada Tabel 13.1. Lebih lanjut kesalahan tersebut dinyatakan dalam probabilitas α, β dan power = 1 β sebagai berikut α = P(Kesalahan Tipe I) = P(H 0 ditolak H 0 benar) (13.1) β = P(Kesalahan Tipe II) = P(H 0 tidak ditolak H 0 salah) (13.2) Power = 1 β = P(H 0 ditolak H 0 salah) (13.3) Perhitungan sampel berdasarkan presisi biasanya digunakan dalam aurvei, misalnya survei prevalensi suatu penyakit tertentu atau suatu status kesehatan tertentu. Presisi adalah setengah dari lebar interval konfidensi, untuk semua bentuk interval konfidensi yang berdasarkan pada distribusi yang simetrik seperti misalnya distribusi Normal dan distribusi t. Perhitungan sampel berdasarkan power memerlukan kuantitas effect size δ, yaitu selisih minimal antara nilai parameter di bawah H 0 dengan parameter di bawah H 1 yang masih dianggap penting secara substansial. Misalnya, untuk uji dua mean µ 1 dan µ 2, effect size adalah δ = µ 1 µ 2. Secara umum besar ukuran sampel ditentukan oleh faktor-faktor berikut: 1. Ukuran sampel akan membesar jika standar deviasi (variansi) membesar
13.3. Ukuran Sampel untuk Uji Mean 3 2. Ukuran sampel akan membesar jika α mengecil 3. Ukuran sampel akan membesar jika power= 1 β membesar 4. Ukuran sampel akan membesar jika presisi dan effect size mengecil Formulasi penghitungan ukuran sampel ditentukan oleh uji statistik yang digunakan. Pada dasarnya dari setiap uji statistik dapat diturunkan formulasi untuk penghitungan ukuran sampel. Dalam modul ini akan dibahas beberapa rumus penghitungan besar sampel untuk beberapa uji tertentu. Formulasi untuk permasalahan ukuran sampel yang lebih general, berdasarkan rancangan studi tertentu, dan statistik uji tertentu yang lebih lengkap akan dibahas dalam kuliah Biostatistika dan Epidemiologi II. 13.3 Ukuran Sampel untuk Uji Mean Berdasarkan analisis presisi, ukuran sampel n ditentukan berdasarkan interval konfidensi untuk mean µ dan presisi E, yaitu setengah lebar interval konfidensi. interval konfidensi untuk µ ditentukan dengan formulasi X ±Z α/2 σ n (13.4) dengan X adalah mean sampel, Z α/2 adalah nilai batas Z normal standar untuk probabilitas ekor α/2 atau kuantil ke-1 α/2 dan σ adalah deviasi standar. Presisi dalam metode ini sama dengan setengah lebar interval konfidensi, atau E = Z α/2 σ n, (13.5) sehingga diperoleh ukuran sampel n = Z2 α/2 σ2 E 2. (13.6) Dalam metode ini, formulasi untuk n diturunkan berdasarkan Kesalahan Tipe I saja (α). Penghitungan ukuran sampel berdasarkan analisis power memerlukan baik Kesalahan Tipe I maupun Kesalahan Tipe II dan biasanya digunakan untuk permasalahan inferensi terkait uji hipotesis. Misalkan akan dihitung besar sampel untuk uji hipotesis sebagai berikut: dengan α = 0,05 dan statistik uji H 0 : µ = µ 0 H 1 : µ > µ 0 Z = X µ 0 σ/ n. (13.7)
13.3. Ukuran Sampel untuk Uji Mean 4 Apabila nilai parameter di bawah H 0 dinotasikan µ 0, di bawah H 1 dinotasikan µ 1, maka effect size uji ini adalah selisih antara µ 0 dengan µ 1. Power suatu uji merupakan fungsi dari n dan effect size dan α sehingga dari situ dapat diturunkan formulasi untuk menghitung ukuran sampel n. power = P(Z > Z α H 0 salah) = P(Z > Z α H 1 benar) = P(Z > Z α µ = µ 1 ). (13.8) Di bawahh 0, bila nilaiz ditransformasikan kembali ke X berdasarkan statistik uji (13.7) akan diperoleh X = Z α σ n +µ 0 (13.9) yang apabila dimasukkan ke (13.8) diperoleh power = P( X > Z α σ n +µ 0 µ = µ 1 ). (13.10) Nilai X ditransformasikan ke Z kembali di bawah asumsi H 1, menjadi power = P(Z > Z α σ n +µ 0 µ 1 σ/ ) n = P(Z > Z α + µ 0 µ 1 σ/ ). (13.11) n Karena sifat simetri distribusi Normal yang mana P(Z > z) = P(Z < z), sehingga yang ekivalen dengan diselesaikan ke n diperoleh power = P(Z < µ 1 µ 0 σ/ n Z α) (13.12) Z β = µ 1 µ 0 σ/ n Z α (13.13) n = (Z β +Z α ) 2 σ 2 (µ 1 µ 0 ) 2 (13.14) Untuk uji dua sisi, penghitungan besar sampel sama seperti formula (13.14), dengan Z α digantikan Z α /2. Rumus ini juga berlaku untuk uji satu sisi dengan H 1 : µ < µ 0.
13.4. Ukuran Sampel untuk Uji dua Mean 5 Contoh 13.1 Dalam suatu penelitian tentang CVD (Cardiovascular Disease) diketahui mean kadar kolesterol dari penelitian sebelumnya adalah 175 mg/dl dengan deviasi standar 50 mg/dl. Berapa ukuran sampel yang diperlukan untuk mendeteksi perbedaan kolesterol sebesar 15mg/dL, dua sisi, dengan α = 5% dan Power 90%? Jawab: Diketahui power = 1 β = 0,9, atau β = 0,1; effect size µ 1 µ 0 = 15; σ = 50; dan α = 0,05; diperoleh sampel berukuran n = (Z α/2 +Z β ) 2 σ 2 (µ 1 µ 0 ) 2 = (1,96+1,28)2 50 2 15 2 = 116,64 117 13.4 Ukuran Sampel untuk Uji dua Mean Uji dua mean biasanya digunakan untuk membandingkan untuk melihat apakah ada perbedaan antar dua mean dari dua kelompok sampel. Apabila mean kelompok sampel pertama adalah µ 1 dan mean sampel kelompok kedua adalah µ 2, kuantitas yang menjadi perhatian adalah µ 1 µ 2 = δ. Diasumsikan variansi yang sama untuk kedua kelompok yaitu σ 2. Ukuran sampel untuk kedua kelompok dinotasikan sebagai n 1 dan n 2, total sampel n = n 1 +n 2 dan rasio alokasi sampel r = n 1 /n 2. Uji hipotesis untuk perbandingan dua mean ditentukan sebagai berikut H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 = δ dengan δ < 0 atau δ > 0 untuk uji satu sisi, dan δ 0 untuk ujia dua sisi. Formulasi ukuran sampel dapat diturunkan seperti pada bagian 13.3 menggunakan metode power dan dapat diperoleh n = (r +1)2 (Z α +Z β ) 2 σ 2 δ 2 r (13.15) untuk uji satu sisi. Untuk uji dua sisi, Z α diganti dengan Z α /2 pada formula (13.15) di atas. 13.5 Ukuran Sampel untuk Uji Proporsi Untuk keperluan penelitian seperti survei prevalensi, rumusan ukuran sampel proporsi dapat diturunkan menggunakan presisi seperti pada bagian 13.3. Interval konfidensi (1
13.5. Ukuran Sampel untuk Uji Proporsi 6 α) untuk proporsi π dengan pendekatan Normal adalah P ±Z α/2 π(1 π) n (13.16) dengan P adalah estimasi untuk parameter proporsi π. Dengan diberikan presisi E, yaitu setengah lebar interval konfidensi di atas, dapat diturunkan formula untuk besar sampel sebagai berikut n = Z α/ 2P(1 P) E 2 (13.17) Contoh 13.2 Dinas kesehatan di suatu daerah ingin melakukan pendugaan terhadap prevalensi tuberkulosis pada anak-anak di bawah 5 tahun di daerahnya. Berapa anak yang harus dimasukkan dalam sampel, sehingga angka prevalensi dapat diduga dalam jarak 5% di atas dan di bawah prevalensi yang sesungguhnya dengan tingkat keyakinan 95%, jika diasumsikan Proporsi yang sebenarnya adalah 20%? Jawab: Perkiraan besar proporsi P = 20%, dengan α = 0,05 dan presisi E = 0,05. Menggunakan rumus penghitungan n berdasarkan presisi diperoleh: n = Z α/ 2P(1 P) E 2 = 1,962 (0,2)(0,8) 0,05 2 = 245,85 246 Untuk permasalahan uji hipotesis proporsi, ukuran sampel dapat diturunkan menggunakan pendekatan power uji. Hipotesis untuk uji proporsi adalah sebagai berikut H 0 : π = π 0 H 1 : π = π 0 +δ = π 1 denganπadalah proporsi parameter yang dianggap benar,π 0 adalah asumsi nilai proporsi; δ < 0 atau δ > 0 untuk uji satu sisi, dan δ 0 untuk ujia dua sisi. Formulasi ukuran sampel dapat diturunkan seperti pada bagian 13.3 menggunakan metode power dan dapat diperoleh n = 1 ] [Z δ 2 α π0 (1 π 0 )+Z β π1 (1 π 1 ). (13.18) Untuk uji dua sisi, rumus yang digunakan sama namun dengan Z α diganti Z α /2.
13.6. Ukuran Sampel untuk Uji RR dan OR 7 13.6 Ukuran Sampel untuk Uji RR dan OR Uji terkait risiko relatif (RR) dan odds ratio (OR) pada prinsipnya adalah uji proporsi (probabilitas) dua populasi, namun dinyatakan sebagai rasio (multiplikatif) bukan sebagai selisih (aditif). Hipotesis untuk risiko relatif adalah sbb.: H 0 : π 1 = π 2 H 1 : π 1 /π 2 = λ, dengan π 1 adalah probabilitas pada grup 1, dan π 2 adalah probabilitas pada grup 2, yang pada pernyataan di atas grup 2 adalah grup referensi (pembanding), yaitu sebagai penyebut (denominator) pada RR. Untuk uji satu sisi λ < 1 atau λ > 1, sedangkan untuk uji dua sisi λ 1. Penghitungan ukuran sampel berdasarkan RR ini hanya tepat untuk rancangan studi cohort, cross-sectional atau intervention. Studi case-control seperti telah dipelajari pada Modul 2 dan Modul 4, dirancang berdasarkan sampling yang berbeda dan penghitungan sampelnya akan lebih tepat jika diturunkan berdasarkan OR. Menggunakan pendekatan power uji, dengan rasio alokasi sampel r = n 1 /n 2, total sampel yang diperlukan adalah r+1 [ ] 2, n = r(λ 1) 2 π 2 Z α (r +1)pc (1 pc)+z β λπ(1 λπ)+rπ(1 π) (13.19) dengan π = π 2 adalah proporsi pada grup referensi dan p c adalah proporsi bersama (gabungan) dari kedua grup, yang diestimasi sbb.: p c = π(rλ+1). (13.20) r +1 Bila r = 1, yaitu kedua grup mempunyuai ukuran sampel yang sama, p c = π(rλ+1) 2 = π 1 +π 2. (13.21) 2 Untuk uji dua sisi, Z α diganti Z α/2 pada rumus (13.19). Dalam penghitungan sampel (13.19),nbergantung pada π 2, yaitu probabilitas dalam grup referensi. Kuantitas ini dapat diestimasi dari studi sejenis yang pernah dilakukan, pilot study, maupun asumsi. Dalam desain case-control, uji seperti di atas tidak dapat langsung diturunkan untuk mendapatkan formulasi n karena π 1 dan π 2 tidak dapat diestimasi. π 1 = P(D+ E+) π 2 = P(D+ E ) adalah probabilitas sakit (atau dapat berupa outcome yang lain yang menjadi perhatian), jika diketahui individu mendapatkan ekspos E+ (untuk π 1 ) atau non-ekspos E (untuk
13.6. Ukuran Sampel untuk Uji RR dan OR 8 π 2 ). Dalam desain case-control yang dapat diestimasi adalah φ 1 = P(E+ D+) = P(E+ Case) φ 2 = P(E+ D ) = P(E+ Control), yaitu sebagai variabel dependennya adalah eksposure bukan penyakit, karena proses sampling yang diawali dari pemilihan kasus (case) dan kontrol (control) terlebih dahulu. Rasio yang dapat dihitung adalah λ = φ 1 /φ 2. (13.22) Namun, dengan menggunakan teorema Bayes dapat diperoleh φ 1 dari π 1 dan π 2 sebagai berikut φ 1 = λp 1+(λ 1)P (13.23) dengan P = P(E+) adalah prevalensi dari kelompok ekspos. Nilaiφ 2 didekati oleh P sehingga dapat diperoleh φ 2 P (13.24) λ = φ 1 /φ 2 λp = 1+(λ 1)P 1 P λ = 1+(λ 1)P (13.25) Formula untuk n desain case-control untuk uji satu sisi diberikan sebagai berikut [ (r +1)(1+(λ 1)P)2 n = rp 2 (1 P) 2 (λ 1) 2 Z α (r +1)p c (1 p c) ] 2 λp(1 P) +Z β [1+(λ 1)P] 2 +rp(1 P), (13.26) dengan p c = P ( ) rλ r+1 1+(λ 1)P +1. (13.27) Untuk uji dua sisi, z α diganti z α /2.
13.7. Latihan 9 13.7 Latihan 13.1. Jelaskan (turunkan secara matematis) formulasin untuk rumus (13.17) dan (13.18) 13.2. Seorang peneliti ingin mengetahui hubungan antara obat diuretics (obat untuk melancarkan buang air kecil) dan kasus terjatuh pada manula. Hal ini karena diuretics dipercaya juga akan menurunkan tekanan darah. Dalam studi ini peneliti merencanakan untuk mengambil sampel pada apotik-apotik dan menanyai para manula apakah mereka pernah terjatuh dalam setahun dalam periode mereka mendapatkan dierutics. Variabel yang menjadi perhatian adalah, apakah mereka minum diuretics dan apakah mereka pernah terjatuh yang agak parah, jawabannya berupa ya/tidak. Kesemuanya ada 2000 subyek. (a) Diperkirakan 1/3 dari para manula yang tidak minum diuretics akan mengalami kasus jatuh yang parah dalam setahun. Uji statistik apa yang tepat untuk permasalahan ini, kemudian hitunglah power uji ini, mengasumsikan ukuran sampel yang sama dari tiap kelompok, untuk mendeteksi resiko terjatuh lebih tinggi 1,2 kalinya pada manula yang minum diuretics (uji dua sisi, α = 5%) (b) Permasalahan apa yang mungkin terjadi pada desain penelitian seperti di atas, jika ada? (c) Alternatif desain studi apa yang dapat dilakukan pada masalah penelitian ini, jika ada?
Bibliografi Armitage, P. and Colton, T. (1998). Encyclopedia of Biostatistics, John Wiley and Sons, Inc. Chow, S. C. (2000). Encyclopedia of Biopharmaceutical Statistics., John Wiley and Sons, Inc. Hofacker, C, F. (1983). Abuse of statistical packages: the case of the general linear model, Am J Physiol Regul Integr Comp Physiol 245: R299 R302. Kleinbaum, D. G., Kupper, L. L. and Morgenstern, H. (1982). Epidemiologic Research: Principles and Quantitative Methods., Wadsworth, Inc. Last, J. (1995). A Dictionary of Epidemiology, 3rd edn., Oxford University Press. Le, C. T. (2003). Introductory Biostatistics, John Wiley and Sons, Inc. 10