1 METODE SCAN STATISTIC MODEL BINOMIAL DENGAN PENDEKATAN STATISTIK AREA KECIL MAULANI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 29
2 RINGKASAN MAULANI. Metode Scan Statistic Model Binomial dengan Pendekatan Statistik Area Kecil. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO dan ANANG KURNIA. Metode scan statistic membutuhkan data populasi untuk mengidentifikasi area yang signifikan secara statistik dengan resiko tinggi terhadap suatu kasus tertentu. Namun demikian, dalam aplikasinya data populasi jarang tersedia dan hanya data contoh yang tersedia, sehingga muncul pertanyaan apakah metode scan statistic memiliki akurasi yang tinggi jika menggunakan data contoh. Penggabungan metode pendugaan area kecil (small area estimation, SAE) pada scan statistic diharapkan mampu meningkatkan akurasi pendugaan proporsi dan akurasi hotspot berdasarkan data contoh. Penerapan metode pendugaan area kecil pada scan statistic tersebut, terkait dengan pendugaan proporsi pada statistik uji kemungkinan maksimum dalam metode scan statistic. SAE dilakukan melalui teknik empirical Bayes (EB) terhadap model Beta-Binomial. Dalam karya ilmiah ini dilakukan simulasi dengan menetapkan proporsi ekstrim pada area tertentu sebesar.5,.7 dan.9. Hasil menunjukkan bahwa ketika proporsi ekstrim ditetapkan di suatu area sebesar.5, ternyata akurasi yang diperoleh belum memuaskan sebesar (42.7%). Jika proporsi ekstrim di suatu area ditingkatkan menjadi.7 dan.9, akurasi yang diperoleh dalam mendeteksi hotspot sudah cukup memuaskan walaupun ukuran contohnya kecil. Penerapan penduga langsung pada scan statistic memiliki akurasi yang sama dengan penduga tidak langsung untuk mendeteksi hotspot. Namun demikian, penduga tidak langsung dapat dikatakan lebih baik dibandingkan penduga langsung dalam hal pendugaan proporsi, karena telah mampu mengurangi galat dan bias penduga proporsi. Kata kunci : Hotspot, Metode Scan Statistic, Model Beta-Binomial, Pendugaan Area Kecil
3 METODE SCAN STATISTIC MODEL BINOMIAL DENGAN PENDEKATAN STATISTIK AREA KECIL Oleh: MAULANI G145623 Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 29
4 Judul Nama NRP : Metode Scan Statistic Model Binomial dengan Pendekatan Statistik Area Kecil : Maulani : G145623 Menyetujui : Pembimbing I Pembimbing II Prof. Dr. Ir. Khairil Anwar Notodiputro Anang Kurnia, S.Si, M.Si NIP. 1956441981112 NIP. 19738241997211 Mengetahui : Ketua Departemen Dr. Ir. Hari Wijayanto, M.Si NIP. 1965421199211 Tanggal Lulus :
5 RIWAYAT HIDUP Penulis dilahirkan di Serang pada tanggal 1 November 1987 sebagai anak ketiga dari empat bersaudara dari pasangan H. Ahmad Rohman dan Rukiyah. Pada tahun 1998 penulis menyelesaikan pendidikan dasar di SDN Ciracas Serang, kemudian melanjutkan studi ke sekolah menengah pertama di MTsN Serang hingga tahun 24. Pada tahun 25 penulis menyelesaikan pendidikan menengah atas di MAN 2 Model Serang dan pada tahun yang sama diterima di Institut Pertanian Bogor melalui jalur Ujian Saringan Masuk IPB (USMI) dan masuk lolos masuk di Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam pada tahun 26. Semasa menjadi mahasiswa, penulis aktif menjdi asisten dosen mata kuliah regresi. Selain itu penulis juga aktif di organisasi kemahasiswaan tingkat departemen. Pada tahun 27-28 sebagai Staff Olah Raga dan Seni Himpunan Keprofesian Gamma Sigma Beta dan pada tahun 28 penulis diangkat sebagai Kepala Biro Kestari. Penulis juga aktif diberbagai kegiatan kepanitiaan baik itu statistika Ria, SGST, Pesta Sains dan COPA TPB. Selain itu penulis lolos menjadi peserta Pekan Karya Ilmiah Mahasiswa Kewirausahaan (PKMK) 27 dengan karya ilmiah berjudul Inisiasi Teh Kombucha Berkemasan Handy. Selama perjalanan di Statistika penulis pernah terlibat diberbagai proyek yang berkaitan dengan statistika baik sebagai surveyor, validator, analis, dan pengolahan data. Praktik lapang dilakukan penulis di Balai Penelitian Aromatik dan Obat- Obatan (BALITTRO) pada bulan Februari-April 29.
6 KATA PENGANTAR Alhamdulillaahi Rabbil Aalamiin, segala puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala karunia-nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Shalawat serta salam semoga selalu tercurah kepada nabibina wa syafi ina wa maulana Muhammad SAW beserta keluarga, sahabat, dan pengikutnya hingga akhir jaman. Karya ilmiah ini berjudul Metode Scan Statistic Model Binomial dengan Pendekatan Statistik Area Kecil. Dalam penelitian ini dilakukan analisis scan statistic untuk mengidentifikasi hotspot pada data contoh dengan penduga langsung dan penduga tidak langsung. Pada kesempatan ini, penulis mengucapkan terima kasih kepada semua pihak yang telah membantu baik secara moril dan materil sehingga karya ilmiah ini dapat terselesaikan. Penulis mengucapkan terima kasih kepada: 1. Bapak Prof. Dr. Ir. Khairil Anwar Notodipuro, MS dan Bapak Anang Kurnia, S.Si, M.Si selaku dosen pembimbing atas bimbingan, saran dan nasihat yang telah diberikan yang tidak pernah saya lupakan. 2. Bapak dan Ibu tercinta serta kakak-kakak dan adikku atas segala doa, kasih sayang, serta semangat dan motivasi yang tidak pernah henti diberikan kepada penulis. 3. Seluruh dosen Departemen Statistika FMIPA IPB atas ilmu dan nasihat yang bermanfaat sehingga membantu penulis dalam menyelesaikan karya ilmiah ini, serta kepada seluruh staff administrasi Departemen Statistika (Bu Markonah, Bu Sulis, Pak Iyan, Bu Aat, Bang Sudin, Mang Herman, Mang Dur). 4. Singgih Gustanto atas doa, kasih sayang, motivasi dan kesetiaannya selama ini menemani penulis baik dalam keadaan suka maupun duka. 5. Andi Setiawan sebagai teman diskusi yang tidak pernah lelah mengajari ku dalam menyelesaikan karya ilmiah ini. 6. Yani suryani, Monica Halim (sebagai sahabat yang selalu setia menemani penulis selama perjalanan di statistika), Teman-teman PIRANHA, Wiwid Widiyani, Erfira Savitri (atas doa, dukungan dan motivasinya). 7. Terima kasih kepada teman-teman Statistika 42 atas segala motivasi dan kebersamaannya selama ini. 8. Kakak STK 41, STK 43, STK 44 dan STK 45. 9. Semua pihak yang telah memberikan dukungan kepada penulis yang tidak dapat disebut satu per satu sehingga karya ilmiah ini dapat diselesaikan. Penulis menyadari bahwa penulisan karya ilmiah ini masih jauh dari sempurna. Oleh karena itu kritik dan saran yang membangun sangat penulis harapkan sebagi pemicu untuk bisa berkarya lebih baik di masa yang akan mendatang. Semoga karya ilmiah ini dapat bermanfaat bagi pihak yang membutuhkan. Bogor, November 29 Penulis
7 DAFTAR ISI Halaman DAFTAR TABEL. DAFTAR LAMPIRAN. vi vi PENDAHULUAN Latar Belakang 1 Tujuan... 1 TINJAUAN PUSTAKA Scan Statistic..... 1 Model Beta-Binomial pada Pendugaan Area Kecil. 2 DATA DAN METODE Data... 3 Metode... 3 HASIL DAN PEMBAHASAN Pengujian Hotspot untuk Area ke-3... 4 Evaluasi Hotspot Berdasarkan Data Contoh... 4 Hasil Pendugaan dan Jumlah Kuadrat Galat Proporsi....... 5 KESIMPULAN DAN SARAN Kesimpulan... 7 Saran. 7 DAFTAR PUSTAKA..... 7 LAMPIRAN... 8
8 DAFTAR TABEL Halaman 1. Hasil Pengujian Hotspot untuk Area Ke-3... 4 2. Hasil Evaluasi Hotspot yang Dihasilkan untuk Data Contoh... 5 3. Ringkasan Hasil Jumlah Kuadrat Galat pada Proporsi Ekstrim.5 dari 1 Ulangan... 5 4. Ringkasan Hasil Jumlah Kuadrat Galat pada Proporsi Ekstrim.7 dari 1 Ulangan... 6 5. Ringkasan Hasil Jumlah Kuadrat Galat pada Proporsi Ekstrim.9 dari 1 Ulangan... 6 DAFTAR LAMPIRAN Halaman 1. Nilai Proporsi (π i ) dan Resiko Relatif untuk Data Populasi... 8 2. Nilai Relatif Bias untuk Penduga Langsung... 9 3. Nilai Relatif Bias untuk Penduga Tidak Langsung... 1 4. Kurva Sebaran Jumlah Kuadrat Galat () Proporsi Ekstrim.5... 11 5. Kurva Sebaran Jumlah Kuadrat Galat () Proporsi Ekstrim.7... 12 6. Kurva Sebaran Jumlah Kuadrat Galat () Proporsi Ekstrim.9... 13 7. Box Plot Jumlah Kuadrat Galat dari 1 Ulangan... 14
1 PENDAHULUAN Latar Belakang Scan statistic merupakan suatu metode yang dikembangkan oleh Kulldorff (1997) untuk mendeteksi kejadian-kejadian ekstrim (hotspot) pada kasus yang menjadi perhatian. Metode scan statistic membutuhkan data populasi untuk mengidentifikasi area yang signifikan sebagai hotspot. Namun demikian, dalam aplikasinya data populasi jarang tersedia dan hanya data contoh yang diperoleh. Berdasarkan kondisi tersebut muncul pertanyaan apakah metode scan statistic masih memiliki akurasi yang tinggi jika menggunakan data contoh. Selain itu, ukuran contoh yang sangat kecil sering kali menyebabkan presisi dan akurasi pendugaan tidak memuaskan. Untuk melihat akurasi metode scan statistic menggunakan data contoh, dalam penelitian ini dilakukan simulasi dengan menerapkan metode pendugaan area kecil (small area estimation, SAE). Penggabungan metode pendugaan area kecil pada scan statistic diharapkan mampu meningkatkan akurasi dan presisi pendugaan. Penerapan metode pendugaan area kecil pada scan statistic tersebut, terkait dengan pendugaan proporsi pada statistik uji kemungkinan maksimum dalam metode scan statistic. Pendekatan pendugaan area kecil yang dilakukan, melalui teknik empirical Bayes (EB) berdasarkan model Beta-Binomial. Hasil penelitian sebelumya (Setiawan, 29) menunjukkan bahwa akurasi hotspot yang diperoleh menggunakan data contoh masih sangat rendah. Hal tersebut diduga karena tidak adanya proporsi ekstrim pada suatu area dan proporsi antar area tidak terlalu berbeda. Sebagai tindak lanjut dari penelitian tersebut, pada penelitian ini dilakukan simulasi dan kajian metode scan statistic untuk statistik area kecil dengan adanya proporsi ekstrim yang ditetapkan pada suatu area tertentu. Penetapan proporsi ekstrim tersebut diharapkan mampu mendeteksi sejauh mana sensitifitas scan statistic sebagai alat pendeteksi hotspot jika ditemukan kasus data contoh yang berukuran kecil. Tujuan 1. Mengkaji metode scan statistic dengan menggunakan data contoh. 2. Menerapkan pendugaan area kecil yang berbasis model Beta-Binomial pada metode scan statistic dalam penentuan hotspot. 3. Mengetahui pengaruh proporsi ekstrim terhadap pendugaan langsung dan tidak langsung dalam menduga hotspot. TINJAUAN PUSTAKA Scan Statistic Hotspot didefinisikan sebagai sesuatu hal luar biasa, aneh dan pengelompokkan suatu kasus pada area kritis yang memiliki tingkat risiko tinggi (Patil & Taillie, 24). Selain itu hotspot juga dapat didefinisikan sebagai suatu area atau wilayah tertentu yang memiliki tingkat konsistensi paling tinggi terhadap suatu kasus penyebaran tertentu dan memiliki karakteristik tersendiri yang tidak dimiliki oleh area lain disekelilingnya (Haran, Molineros & Patil, 26 dalam Ardiyanto, 28). Metode scan statistic merupakan metode yang digunakan untuk mendeteksi suatu hotspot yang memiliki tingkat risiko yang paling tinggi terhadap suatu kasus tertentu. Scan statistic digunakan dalam berbagai aplikasi seperti kesehatan dan sosial ekonomi. Bidang sosial ekonomi biasanya digunakan untuk mendeteksi daerah atau area kemiskinan. Bidang kesehatan biasanya digunakan untuk mendeteksi daerah hotspot yang memiliki risiko penyebaran penyakit tertentu paling tinggi, seperti penelitian yang telah dilakukan oleh Ardiyanto (28). Statistik uji yang digunakan pada metode scan statistic yaitu dengan menggunakan rasio kemungkinan (likelihood ratio). Statistik uji yang digunakan adalah nilai logaritma dari rasio kemungkinan tersebut. Model yang biasa digunakan yaitu model Poisson dan Bernoulli. Berdasarkan Kuldroff (1997) hipotesis dalam model Bernoulli pada metode scan statistic yaitu, H : p = q dan H 1 : p > q. Statistik uji fungsi kemungkinan untuk model Bernoulli dapat dilihat pada persamaan berikut: L(Z) p n z(1-p) μ z -n zq n G-n z (1- ) ( ) ( ) (1) dengan, p = peluang atau proporsi di dalam area atau gerombol Z q = peluang atau proporsi di luar area atau gerombol μ Z = jumlah total objek yang berada pada setiap area n Z = jumlah kasus sukses pada area kecil atau gerombol
2 μ G = jumlah total obek pada seluruh area atau seluruh gerombol yang menjadi kandidat hotspot n G = jumlah kasus pada seluruh areaatau seluruh gerombol yang menjadi kandidat hotspot Fungsi kemungkinan maksimum ketika p = dan q = dapat dituliskan sebagai berikut: L(Z)=sup p>q L(Z)= ( ) ( ) (2) Nilai p ini yang selanjutnya akan diduga menggunakan pendugaan area kecil berdasarkan Beta-Binomial. Dengan demikian, statistik uji perbandingan kemungkinan maksimum sebagai berikut : = (,, ) = ( ), (3) dengan fungsi L adalah : = 1. (4) Untuk memperoleh nilai statistik uji dapat diperoleh berdasarkan nilai logaritma dari rasio kemungkinan ( Log Likelihood Ratio, LLR), sehingga diperoleh persamaan sebagai berikut : LLR = log ( )= Log L(Z) Log L. (5) Selain fungsi likelihood, terdapat nilai risiko relatif yang merepresentasikan seberapa besar risiko area atau gerombol tersebut terhadap kasus yang sedang dikaji. Jika nilai risiko relatif lebih besar dari 1 maka area tersebut memiliki risiko yang tinggi sedangkan jika nilai risiko relatif lebih kecil dari 1 menunjukkan risiko yang rendah terkena kasus yang dihadapi. Berdasarkan Kulldorf (26) nilai risiko relatif dapat diperoleh sebagai berikut: RR = n z / E(c), (6) dengan E(c) adalah nilai harapan dari jumlah kasus pada suatu lokasi yang didefinisikan sebagai berikut : E(c) = μ Z (n G / μ G ). (7). Model Beta-Binomial pada Pendugaan Area Kecil Small Area Estimation (SAE) atau pendugaan area kecil merupakan pendugaan parameter suatu area yang lebih kecil dengan memanfaatkan informasi dari luar, dari dalam area itu sendiri dan dari luar survey (Rao 23). Pendugaan parameter pada suatu domain dalam pendugaan area kecil dapat dilakukan dengan menggunakan pendugaan langsung (direct estimation) atau pendugaan tidak langsung (indirect estimation). Penduga langsung merupakan pendugaan pada suatu domain berdasarkan informasi data contoh dari domain tersebut. Sedangkan pendugaan tidak langsung yaitu pendugaan pada suatu domain dengan cara menghubungkan informasi pada area tersebut dengan area lain. Hal ini berarti bahwa dugaan tersebut mencakup data dari domain lain (Kurnia & Notodiputro, 26). Menurut Laksono (28) pendugaan EB dengan model Beta-Binomial mampu memperbaiki keragaman dari pendugaan langsung. Sehingga pada penelitian ini, menerapkan penduga tidak langsung berbasis model Beta-Binomial pada metode scan statistic. Model Beta-Binomial merupakan model untuk data cacahan {y i } yang terdiri dari dua tahap yaitu : 1. y iid i ~ Binomial (n i, ), i = 1,,m m= banyaknya area 2. iid ~ Beta (α, β) untuk α > dan β > dengan y i adalah banyaknya pengamatan pada suatu kasus (sukses) pada area ke-i dan menunjukkan proporsi pada area kecil ke-i yang sama dengan p = pada statistik uji scan statistic maka: = =, (8) dengan Y ij ~bernoulli ( ). Diketahui y i =, maka y i ~Binomial (ni, ) dan fungsi peluangnya adalah : f(y i )=C(n i,y i ) (1 ) (9) untuk y i =,2..n i. Sebaran prior bagi diasumsikan ~ Beta (α,β), α>, β> dengan fungsi kepekatan peluang bagi adalah : h( α,β) = Г( ) Г( )Г( ) α-1 (1- ) β-1 (1) untuk < <1.
3 Merujuk persamaan 9 dan 1 maka diperoleh sebaran posterior bagi adalah,α,β Beta-Binomial, dengan fungsi sebaran sebagai berikut : k( y i,α,β)= Г( ) Г( )Г( ) (1 ). (11) Penduga Bayes bagi proporsi, sebagai berikut : = E( y i,α,β)= ( ), (12) ( ) dan ragam posterior bagi adalah : V( y i,α,β)= ( )( β ) ( )( ). (13) Parameter α dan β pada persamaan (11) tidak diketahui sehingga harus dilakukan pendugaan. Berdasarkan penelitian Laksono (28), dugaan EB dengan menggunakan metode momen sudah cukup stabil dalam menduga proporsi pada kasus keluarga miskin. Berdasarkan kondisi tersebut, pada penelitian ini mencoba melakukan pendekatan sederhana dalam menduga parameter α dan β melalui metode momen. Murphy (27) mengajukan dugaan α dan β berdasarkan kondisi berikut : E(y i ) = n i α α β (14) V(y i )= αβ ( β) α β α β, (15) sehingga diperoleh E(y 2 i )= α( α β). (16) ( β)( α β) Dengan menyamakan momen contoh (m 1 = dan m 2 = ) dengan momen populasi, maka diperoleh dan sebagai berikut : = = ( ) ( ) (17) ( )( ) ( ). (18) Untuk selanjutnya, persamaan (17) dan (18) disubstitusikan pada persaman (12), maka diperoleh pendugaan empirical Bayes bagi proporsi yaitu : = ( ( ) ) + ( ( ) Jika dituliskan = dan = ( ) dugaan empirical Bayes menjadi : ). (19) maka = + (1- i ). (2) Nilai diperoleh dengan memberi bobot rata-rata pada penduga langsung, dan pada penduga sintetik, (Rao, 23). DATA DAN METODE Data Data yang digunakan dalam penelitian ini adalah data simulasi. Data ini dibangkitkan dengan disain simulasi sebagai berikut : 1. Populasi yang akan dibentuk sebagai kandidat hotspot terdiri dari area-area kecil sebanyak 3 area dimana untuk setiap area memiliki parameter. 2. Besar untuk area 1 sampai 29, dibangkitkan dengan asumsi bahwa proporsi menyebar U(.1,.3). 3. Besar ekstrim ditetapkan pada area ke- 3 dan dicoba secara bergantian dengan proporsi ekstrim yang berbeda yaitu.5,.7 dan.9. 4. Ukuran contoh (n) yang diambil terdiri dari 1, 2, 3 dan 4. 5. Untuk setiap area dibangkitkan data contoh dengan asumsi menyebar Bernoulli ( ). 6. Masing masing data contoh tersebut diulang sebanyak 1 kali. Metode Prosedur yang akan dilakukan pada penelitian ini sebagai berikut: 1. Membangkitkan Uni(.1,.3) sebanyak 29 dan pada area ke-3 diberikan nilai proporsi ekstrim, untuk pertama kali ditetapkan proporsi ekstrim sebesar.5. 2. Kemudian menghitung Risiko Relatif pada persamaan (6) yang dimodifikasi sesuai persamaan pada lampiran 1 dan statistik uji logaritma λ pada persamaan (5). 3. Membangkitkan membangkitkan contoh acak y ij pada setiap area dimana y ij menyebar Bernoulli dengan parameter yang telah dibangkitkan pada langkah 1, sebanyak n=1. = + ( ) ( )
4 4. Melakukan pendugaan langsung = pada masing-masing area kemudian mencari nilai risiko relatif pada persamaan ( 6) dan statistik uji pada persamaan (5). 5. Mencari m 1 dan m 2 kemudian melakukan pendugaan α dan β dengan menggunakan metode momen pada persamaan (17) dan (18). 6. Melakukan pendugaan tidak langsung sesuai dengan persamaan (19) dengan α dan β yang telah diperoleh pada langkah (5). Kemudian mencari nilai risiko relatif penduga tidak langsung berdasarkan persamaan (6) yang telah dimodifikasi menjadi RR i = dan statistik uji scan statistic penduga tidak langsung berdasarkan persamaan (5), dengan L(Z) dan L sebagai berikut : L(Z)= ( ) ( ) dengan = ( L =( ) (1 ) ) 7. Melakukan langkah 4 sampai 6 tersebut sebanyak r =1 ulangan. 8. Melakukan langkah 4 sampai 7 dengan kombinasi n yang berbeda n=2, 3, 4 secara bergantian. 9. Melakukan evaluasi terhadap pendugaan proporsi dengan menghitung jumlah kuadrat galat. 3 i i 1 2 = ( ). 1. Evaluasi kesesuaian hotspot yang dihasilkan dari data contoh dengan pendugaan langsung dan pendugaan EB terhadap hotspot yang dihasilkan dengan data populasi. 11. Menghitung nilai relatif bias pendugaan proporsi pada masing-masing area dari 1 ulangan. Relatif Bias = /1. 12. Melakukan langkah 2 sampai 11 dengan mengganti proporsi ekstrim pada area ke- 3 dengan nilai.7 dan.9 secara bergantian. ˆ i HASIL DAN PEMBAHASAN Pengujian Hotspot untuk Area ke-3 Dalam penelitian ini, populasi yang akan ditentukan sebagai kandidat hotspot dianggap terdiri atas 3 area kecil. Area ke-3 merupakan area yang secara sengaja ditetapkan sebagai area yang memiliki proporsi ekstrim. Proporsi ekstrim ini ditetapkan sebesar.5,.7 dan.9. Penetapan proporsi ekstrim pada satu area tersebut bertujuan mengetahui sejauh mana tingkat sensitifitas scan statistic sebagai alat penduga hotspot. Sebelum proporsi ekstrim ditetapkan pada salah satu area, proporsi masing-masing area dibangkitkan dari sebaran U(.1,.3). Hotspot yang dihasilkan teridentifikasi pada area ke-17, namun hotspot tersebut tidak nyata pada taraf.5. Kemudian pada saat proporsi ekstrim ditetapkan pada area ke-3, hotspot yang dihasilkan dapat dilihat pada Tabel 1. Tabel 1 Hasil Pengujian Hotspot untukarea ke-3 Proporsi Ekstrim pada Area ke-3.5.7.9 Hotspot 3 3 3 Risiko relatif 2.518 3.41 4.947 Tabel 1 menyajikan ketepatan hotspot pada saat proporsi ekstrim.5,.7 dan.9 ditetapkan pada area ke-3. Area yang teridentifikasi sebagai hotspot, tepat pada area yang ditetapkan proporsi ekstrim yaitu area ke-3. Nilai resiko relatif dari ketiga nilai proporsi ekstrim tersebut lebih dari 1. Berarti area tersebut memiliki risiko yang tinggi untuk terpilih sebagai area hotspot. Nilai risiko relatif juga semakin meningkat seiring meningkatnya proporsi ekstrim yang ditetapkan. Nilai risiko relatif tertinggi yang dihasilkan mencapai 4.947 yaitu pada saat proporsi ekstrim yang ditetapkan sebesar.9. Proporsi dan risiko relatif setiap area dapat dilihat secara lengkap pada Lampiran1 Evaluasi Hotspot Berdasarkan Data Contoh Penentuan hotspot data contoh berdasarkan simulasi seperti dijelaskan sebelumnya, diringkas pada Tabel 2.
5 Tabel 2 Hasil Evaluasi Hotspot yang Dihasilkan untuk Data Contoh Peluang Area Ke- 3.5.7.9 Ukuran Contoh (n) Persentase Ketepatan Hotspot Penduga Langsung dan Tidak Langsung 1 42.7 2 69.3 3 85.9 4 93.5 1 81.9 2 98.2 3 99.9 4 1 1 99.3 2 1 3 1 4 1 Tabel 2 menunjukkan persentase ketepatan yang menghasilkan hotspot area ke-3 dari 1 kali ulangan yang dilakukan. Penduga langsung dan tidak langsung menghasilkan persentase akurasi hotspot yang sama. Pada saat nilai proporsi ekstrim yang ditetapkan sebesar.5, persentasi akurasi hotspot pada saat ukuran contoh sebesar 1 menghasilkan nilai akurasi yang sangat rendah sebesar 42.7 %. Hal ini bahwa dari 1 ulangan yang dilakukan, sebanyak 427 ulangan yang tepat menghasilkan hotspot area ke-3. Nilai akurasi meningkat ketika jumlah contoh ditingkatkan sebesar 2, nilai akurasi yang dihasilkan mencapai 69.3 % dan semakin meningkat mencapai 8% hingga 9% saat ukuran contoh menjadi 3 dan 4. Pada saat proporsi ekstrim yang ditetapkan sebesar.7 dan.9 akurasi hotspot yang diperoleh sudah cukup memuaskan mencapai 8% hingga 9% walaupun ukuran contohnya kecil sebesar 1 dan 2. Akurasi semakin meningkat mencapai 1% ketika ukuran contoh ditingkatkan menjadi lebih besar yaitu 3 dan 4. Hal tersebut menunjukkan bahwa, peningkatan nilai proporsi ekstrim dan ukuran contoh dapat meningkatkan akurasi pendugaan hotspot. Hasil penelitian sebelumnya yang dilakukan Setiawan (29), menerangkan bahwa tingkat akurasi hotspot penduga langsung dan tidak langsung yang diperoleh sangat kecil. Hal tersebut diduga karena tidak ada proporsi ekstrim yang ditetapkan pada suatu area. Sehingga sulit untuk mengetahui sejauh mana tingkat sensitifitas scan statistic sebagai alat penduga hotspot. Pada penelitian ini, penduga lansung dan tidak langsung menghasilkan persentase ketepatan hotspot yang sama. Hal tersebut dikarenakan penduga langsung merupakan komponen dari penduga tidak langsung sesuai pada persamaan (19). Besarnya perbedaan proporsi penduga langsung dan tidak langsung tergantung nilai ˆ i yang diperoleh sesuai persamaan (2). Nilai ˆ i mendekati 1 akan mengakibatkan penduga tidak langsung mendekati penduga langsungnya sehingga akan berakibat juga terhadap pendugaan hotspot. Salah satu penyebab nilai ˆ i mendekati 1 adalah tergantung pada pendugaan dan. Menurut Rao (23), pendugaan menggunakan metode moment memiliki suatu keterbatasan yaitu nilai pendugaan menghasilkan nilai yang tidak unik. Hasil Pendugaan dan Jumlah Kuadrat Galat Proporsi Penggunaan pendekatan SAE untuk model Beta-Binomial diharapkan mampu meningkatkan akurasi dari pendugaan proporsi dibandingkan dengan pendugaan langsung. Untuk mengevaluasi presisi dari pendugaan proporsi dilakukan kajian terhadap nilai jumlah kuadrat galat () dari 1 ulangan yang dilakukan dalam simulasi. Sebaran secara visual dapat dilihat dalam bentuk kurva utuk setiap ukuran contoh (n) dari setiap proporsi ekstrim seperti pada Lampiran 5, Lampiran 6 dan Lampiran 7. Tabel 3 menyajikan ringkasan hasil yang disajikan dalam bentuk statistik deskriptif. Tabel 3 Ringkasan Hasil Jumlah Kuadrat Galat pada Proporsi Ekstrim.5 dari 1 Ulangan Ukuran Contoh Metode p 3=.5 Mean Min Q1 Q2 Q3 Max n=1 PL.4.17.31.38.46.9 PTL.36.14.28.34.42.84 n=2 PL.22.8.18.22.26.5 PTL.19.6.16.19.22.38 n=3 PL.15.6.13.15.18.31 PTL.14.5.12.14.16.29 n=4 PL.11.4.9.11.13.24 PTL.11.3.9.1.12.23 PL= Penduga Langsung, PTL= Penduga Tidak langsung.
6 Tabel 3 menunjukkan statistik deskriptif pada proporsi ekstrim.5. Perbedaan besar kecilnya penduga langsung dan penduga tidak langsung dapat dilihat berdasarkan nilai median atau Q2 yang diperoleh. Nilai Q2 penduga tidak langsung selalu lebih kecil dari pada penduga langsung. Hal tersebut dapat dilihat pada saat ukuran contoh sebesar 1, nilai Q2 penduga tidak langsung yang diperoleh sebesar.34. Hal ini bahwa 5% nilai penduga tidak langsung tepat dibawah.34. Nilai tersebut lebih kecil dibandingkan nilai Q2 penduga langsung sebesar.38. Selain itu, nilai mean, minimum dan maximum penduga tidak langsung selalu lebih kecil dibandingkan penduga langsung. Begitu juga pada saat ukuran contoh 2, 3 dan 4. Hal tersebut mengindikasikan bahwa penduga tidak langsung lebih kecil dibandingkan penduga langsung. Secara visual dapat dilihat juga kurva pada Lampiran 4 dan Box Plot pada Lampiran 7. Kurva dari setiap ukuran contoh, pendugaan tidak langsung terletak disebelah kiri dari pendugaan langsung. Begitu juga pada Box Plot, median (Q 2 ) pada penduga tidak langsung terletak lebih bawah dari penduga langsung. Berarti median penduga tidak langsung lebih kecil dibandingkan penduga langsung. Hal tersebut menunjukkan bahwa nilai penduga tidak langsung lebih kecil dari pada penduga langsung. Tabel 3 juga menunjukkan bahwa semakin besar ukuran contoh, nilai semakin kecil yang berarti presisi semakin meningkat seiring bertambahnya ukuran contoh. Tabel Ukuran Contoh 4 Ringkasan Hasil Jumlah Kuadrat Galat pada Proporsi Ekstrim.7 dari 1 Ulangan Meto de p 3=.7 Mean Min Q1 Q2 Q3 Max n=1 PL.37.13.28.35.44.81 PTL.27.12.22.26.3.5 n=2 PL.22.9.18.21.25.47 PTL.19.6.16.19.22.41 n=3 PL.15.5.12.15.18.32 PTL.14.5.11.13.16.29 n=4 PL.11.5.9.11.13.25 PTL.11.4.9.1.12.22 PL= Penduga Langsung, PTL= Penduga Tidak langsung. Tabel 4 dan Lampiran 5 menunjukkan ringkasan data dan kurva bagi jumlah kuadarat galat pada proporsi ekstrim.7. Sama halnya seperti proporsi ekstrim.5, nilai statistik deskriptif pada penduga tidak langsung baik nilai Q2, mean, minimum dan maximum dari setiap ukuran contoh selalu lebih kecil dibandingkan pada penduga langsung. Kurva penduga tidak langsung berada disebelah kiri penduga langsung. Hal tersebut menunjukkan bahwa nilai penduga tidak langsung lebih kecil dari pada penduga langsung. Nilai Q2 pada setiap ukuran contoh pada proporsi ekstrim.7 lebih kecil daripada proporsi ekstrim.5, berarti bahwa nilai proporsi ekstrim.7 lebih kecil dibandingkan.5. Tabel 5 Ringkasan Hasil Jumlah Kuadrat Galat pada Proporsi Ekstrim.9 dari 1 Ulangan Ukuran Contoh Metode p 3=.9 Mean Min Q1 Q2 Q3 Max n=1 PL.35.1.27.33.41.83 PTL.29.15.24.28.33.64 n=2 PL.21.8.17.21.25.45 PTL.2.8.16.2.23.43 n=3 PL.15.6.12.14.17.28 PTL.14.5.11.13.16.28 n=4 PL.11.4.9.11.13.23 PTL.11.4.9.1.12.21 PL= Penduga Langsung, PTL= Penduga Tidak langsung. Begitu juga pada proporsi ekstrim.9, pada penduga tidak langsung lebih kecil dibandingkan pada penduga langsung. Nilai tersebut tersaji pada Tabel 5 dan kurva pada Lampiran 6 serta box plot pada Lampiran 7. Selain itu, proporsi ekstrim.9 menghasilkan nilai lebih kecil dibandingkan dengan proporsi ekstrim.7 dan.5. Dari ketiga nilai proporsi ekstrim untuk setiap ukuran contoh, nilai dari penduga tidak langsung selalu lebih kecil dari pada penduga langsung. Hal tersebut mengindikasikan bahwa pendugaan tidak langsung untuk model Beta-Binomial mampu meningkatkan presisi pendugaan proporsi. Nilai semakin meningkat ketika proporsi ekstrim yang ditetapkan semakin kecil. terbesar terjadi pada saat proporsi ekstrim yang ditetapkan sebesar.5. Hal
7 tersebut sesuai dengan keragaman Binomial yang berbanding lurus dengan perkalian dan (1- ). Proporsi yang mengakibatkan perkalian dan (1- ) mencapai nilai maksimum adalah.5. Sehingga keragaman paling maksimum terjadi pada saat =.5 dan minimum pada saat =.9. Presisi semakin meningkat seiring bertambahnya ukuran contoh. Hal tersebut dapat ditunjukkan dengan semakin kecilnya nilai seiring bertambahnya ukuran contoh. Berarti bahwa dalam hal pendugaan proporsi, penduga tidak langsung dapat dikatakan lebih baik dibandingkan penduga langsung. Karena penduga tidak langsung telah mampu mengurangi galat dan bias penduga proporsi. Bias relatif penduga langsung dan tidak langsung dapat dilihat pada Lampiran 2 dan Lampiran 3. KESIMPULAN DAN SARAN Kesimpulan Terdapat indikasi bahwa metode scan statistic dapat diterapkan dengan menggunakan data contoh pada saat proporsi ekstrim terjadi pada suatu area. Hasil menunjukkan bahwa ketika proporsi ekstrim ditetapkan di suatu area tertentu sebesar.5, akurasi yang diperoleh belum memuaskan sebesar (42.7%). Namun demikian, jika proporsi ekstrim ditingkatkan menjadi.7 dan.9, akurasi hotspot yang diperoleh sudah cukup memuaskan mencapai (9%) walaupun ukuran contohnya kecil. Penerapan penduga langsung pada scan statistic memiliki akurasi yang sama dengan penduga tidak langsung dalam hal mendeteksi hotspot. Namun demikian, penduga tidak langsung dapat dikatakan lebih baik dibandingkan penduga langsung untuk pendugaan proporsi, karena telah mampu mengurangi galat dan bias penduga proporsi. Saran Kajian lebih lanjut mengenai penggunaan metode scan statistic untuk statistik area kecil dengan jumlah contoh n i yang berbeda pada setiap area belum dilakukan dalam penelitian ini. Selain itu, penggunaan metode pendugaan selain metode moment juga belum dipelajari lebih lanjut. Sehingga dapat dikembangkan untuk penelitian selanjutnya. Disease Hotspots Detection In West Java. [Skripsi]. Departemen Statistika FMIPA IPB, Bogor. Dewi, L. 26. Penerapan Metode Empirical Bayes pada Model Small Area Estimation dalam Pendugaan Pengeluaran Perkapita di Kota Bogor. [Skripsi]. Departemen Statistika FMIPA IPB, Bogor. Kuldroff, M. 1997. A Spatial Scan Statistic. Commun.Statist-Theory Meth, Vol. 26(6), p: 1481-1496. Kuldroff, M. 26. SaTScant User Guide for Version 7.. http://www.satscan.org/ [23 April 29]. Kurnia, A dan Notodiputro, KA. 26. Penerapan Metode Jacknife dalam Pendugaan Area Kecil. Forum Statistika dan Komputasi, April 26, p: 12-15. Laksono, WD. 28. Metode Pendugaan area Kecil dengan teknik Empirical bayes pada pendugaan Proporsi Keluarga Miskin di Kota Bogor. [Skripsi]. Departemen Statistika FMIPA IPB, Bogor. Murphy, KP. 27. Empirical Bayes For Beta Binomial Model. http://www.cs.ubc.ca/~murphyk/teaching/s tat46-spring7/reading/eb handout.pdf. [2 Mei 29]. Patil, GP. dan Taillie, C. 24. Upper Level Set Scan Statistic for Detecting Arbitrarily Shaped Hotspots. Environmental and Ecological Statistics, Vol. 11, p: 183-197. http://www.stat.psu.edu/~gpp/pdfs/tr22-61.pdf. [23 April 29]. Rao, JNK. 23. Small Area Estimation. New Jersey : John Willey & Sons, Inc. Setiawan, A. 29. Metode Scan Statistic untuk Statistik area Keci Study Kasus Poisson-Gamma. [Skripsi]. Departemen Statistika FMIPA IPB, Bogor. DAFTAR PUSTAKA Ardiyanto, D. 28. A space-time Permutation Scan Statistic For Measles
8 Lampiran 1 Nilai Proporsi (π i ) dan Resiko Relatif untuk Data Populasi Area π i RR Hotspot π i RR Hotspot π i RR Hotspot 1.166.912 3.166.88 3.166.835 3 2.192 1.57.192.937.192.968 3.139.766.139.679.139.72 4.234 1.285.234 1.139.234 1.177 5.218 1.197.218 1.61.218 1.97 6.189 1.41.189.923.189.954 7.255 1.4.255 1.241.255 1.283 8.214 1.177.214 1.43.214 1.78 9.279 1.535.279 1.36.279 1.46 1.14.768.14.68.14.73 11.25 1.372.25 1.216.25 1.257 12.186 1.22.186.96.186.936 13.172.947.172.839.172.867 14.142.78.142.691.142.714 15.145.799.145.78.145.732 16.17.934.17.828.17.855 17.281 1.547.281 1.371.281 1.417 18.184 1.1.184.895.184.925 19.216 1.189.216 1.54.216 1.89 2.115.634.115.562.115.581 21.178.976.178.865.178.895 22.186 1.22.186.96.186.936 23.111.69.111.54.111.558 24.134.737.134.653.134.675 25.213 1.17.213 1.37.213 1.72 26.142.78.142.692.142.715 27.184 1.13.184.898.184.928 28.225 1.238.225 1.98.225 1.134 29.197 1.84.197.961.197.993 3.9 4.947.7 3.41.5 2.518 Keterangan : Area 1 sampai area 29, Pi Uniform (.1, ) Risiko Relatif dimodifikasi dari rumus asalnya sehingga diperoleh formula sebagai berikut: = ( ) = = =. =. 1
9 Lampiran 2 Nilai Relatif Bias untuk Penduga Langsung Area Relatif Bias Penduga Langsung P3=.9 P3=.7 P3=.5 n=1 n=2 n=3 n=4 n=1 n=2 n=3 n=4 n=1 n=2 n=3 n=4 1.486.4.323.287.474.396.33.285.476.391.327.275 2.444.36.298.241.434.35.33.267.45.363.297.256 3.482.42.357.323.482.417.347.312.55.431.345.312 4.437.333.268.224.448.31.271.223.451.324.262.234 5.438.35.274.236.431.342.277.24.445.342.277.235 6.457.365.35.272.427.365.312.271.455.372.31.271 7.415.298.246.22.425.296.257.214.43.311.248.22 8.443.327.275.249.454.342.286.243.447.346.289.237 9.391.283.245.28.397.283.234.21.44.287.24.195 1.497.434.363.313.487.436.366.321.58.432.354.32 11.421.295.254.212.427.31.259.219.418.34.261.213 12.468.371.312.271.46.377.298.27.454.379.34.266 13.468.391.32.295.465.38.312.27.48.391.322.269 14.53.422.369.37.53.419.357.311.511.425.363.32 15.51.42.343.311.53.419.359.295.487.428.358.299 16.463.392.316.277.471.398.322.273.485.397.313.279 17.375.298.227.27.398.283.233.199.388.28.245.198 18.453.377.299.271.484.377.35.256.454.378.316.277 19.431.344.275.24.426.345.27.242.437.331.282.246 2.432.444.4.351.42.469.412.346.443.461.47.347 21.489.381.38.286.472.384.319.265.474.387.318.271 22.469.366.317.258.463.383.35.263.452.379.39.271 23.43.461.45.341.387.456.393.365.378.462.397.351 24.58.444.367.32.55.425.367.33.492.431.353.316 25.444.343.278.248.438.329.28.239.451.33.277.244 26.487.425.351.312.495.426.356.312.57.427.357.315 27.475.369.3.271.453.375.33.265.433.371.312.267 28.451.343.277.234.433.329.266.244.43.334.278.224 29.443.364.284.256.43.342.29.244.437.352.29.262 3.42.52.45.4.162.117.97.79.239.172.144.128 Ratarata.441.362.299.263.442.362.33.262.447.367.35.263
1 Lampiran 3 Nilai Relatif Bias untuk Penduga Tidak Langsung Area Relatif Bias Penduga Tidak Langsung P3=.9 P3=.7 P3=.5 n=1 n=2 n=3 n=4 n=1 n=2 n=3 n=4 n=1 n=2 n=3 n=4 1.393.391.312.269.394.358.32.267.43.36.319.262 2.41.346.287.233.47.335.292.253.48.347.286.248 3.46.45.343.35.399.387.334.293.42.386.334.293 4.374.322.264.217.389.286.263.212.39.32.255.227 5.39.341.258.228.388.39.261.233.41.32.262.231 6.414.352.291.259.396.342.3.259.44.346.287.259 7.378.294.235.216.375.292.245.28.396.296.237.213 8.4.321.261.239.41.39.266.232.49.318.275.23 9.361.276.235.23.371.278.227.195.382.275.229.194 1.47.418.35.295.413.396.345.32.399.394.337.298 11.37.291.24.21.392.286.25.219.387.297.256.28 12.416.358.291.258.412.345.282.252.49.346.288.252 13.39.382.291.286.46.34.297.265.43.354.35.262 14.413.46.354.29.41.383.336.293.392.391.333.288 15.423.386.323.299.388.393.334.281.386.4.33.285 16.395.382.37.268.44.358.33.261.49.353.35.266 17.358.29.215.2.374.271.226.195.375.269.243.195 18.47.365.278.26.426.346.28.246.418.346.294.265 19.389.337.259.227.383.317.256.236.394.311.268.238 2.399.433.376.327.395.427.38.328.388.416.37.316 21.417.371.292.279.44.35.297.26.423.35.294.265 22.415.353.296.248.422.349.286.25.411.349.297.255 23.396.451.385.325.382.424.374.345.374.429.373.33 24.425.428.359.36.414.381.356.314.392.382.341.299 25.395.34.26.236.388.36.263.231.398.312.258.24 26.414.48.338.294.42.387.336.295.41.391.336.298 27.41.356.28.26.49.342.283.25.4.337.293.252 28.383.334.266.235.383.36.256.241.389.313.261.219 29.47.354.278.25.395.323.28.239.41.338.278.256 3.256.58.77.61.269.158.115.95.315.26.164.137 Ratarata.394.352.287.253.393.336.288.252.396.341.29.253
11 Lampiran 4 Kurva Sebaran Jumlah Kuadrat Galat () Proporsi Ekstrim.5 14 12 1 8 6 n=1_.5 Variable _N1_.5 _N1_.5_1 Mean StDev N 669 143 1 675,622 1 18 16 14 12 1 8 n=2_.5 Variable _N2_.5_2 _N2_.5_3 Mean StDev N 21,5846 1 91,4493 1 4 6 2 4 2 12 1 8 6 n=3_.5 Variable _N3_.5_4 _N3_.5_5 Mean StDev N 54,479 1 387,3438 1 16 14 12 1 8 6 n=4_.5 Variable _N4_.5_6 _N4_.5_7 Mean StDev N 141,332 1 58,2715 1 4 4 2 2
12 Lampiran 5 Kurva Sebaran Jumlah Kuadrat Galat () Proporsi Ekstrim.7 _ n1 _.7 _n2_.7 16 Variable _N1_.7 _N1_.7ID 16 14 Variab le _N2_.7 _N2_.7ID 14 12 1 8 6 M ean StD ev N 65 152 1999 968 156 1 12 1 8 6 Mean StDev N 146,5795 1999 963,5216 1999 4 4 2 2 _n3_.7 _n4_.7 16 14 12 1 8 6 Variable _N3 _N3_.7 Mean StDev N 516,417 1 382,351 1 16 14 12 1 8 6 Variable _N4_.7 _N4_.7ID Mean StDev N 13,2973 1 56,2694 1 4 4 2 2
13 Lampiran 6 Kurva Sebaran Jumlah Kuadrat Galat () Proporsi Ekstrim.9 n=1 _N2_.9 12 1 Variable _n1_.9 12 1 Variable C1 C2 8 6 Mean StDev N 478 19 1 9,6649 1 8 6 Mean StDev N 125,5838 1 2,5495 1 4 4 2 2 n=3_.9 n=4_.9 12 1 8 6 Variable _n3_.9 _n3_p_id_1 Mean StDev N 454,3826 1 358,333 1 12 1 8 6 Variable _n4_.9_1 _n4_p_id Mean StDev N 116,389 1 58,2756 1 4 4 2 2
14 Lampiran 7 Box Plot Jumlah Kuadrat Galat () dari 1 Ulangan,9.5,9.7 Data Data, D_n1 ID_n1 D_n2 ID_n2 D_n3 ID_n3 D_n4 ID_n4, D_n1 ID_n1 D_n2 ID_n2 D_n3 ID_n3 D_n4 ID_n4.9,9 Data Keterangan: D= direct (penduga langsung) ID= indirect (penduga tidak langsung), D_n1 ID_n1 D_n2 ID_n2 D_n3 ID_n3 D_n4 ID_n4