BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. Pada bab ini akan dibahas mengenai latar belakang tema yang diambil dalam

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

BAB III PERLUASAN MODEL REGRESI COX PROPORTIONAL HAZARD DENGAN VARIABEL TERIKAT OLEH WAKTU

BAB I PENDAHULUAN. mengetahui fenomena yang akan terjadi pada periode mendatang akan

Pengujian Overdispersi pada Model Regresi Poisson (Studi Kasus: Laka Lantas Mobil Penumpang di Provinsi Jawa Barat)

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

PEMODELAN REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSION PADA REGRESI POISSON

BAB III REGRESI SPASIAL DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED POISSON REGRESSION (GWPR)

ESTIMASI PARAMETER MODEL REGRESI POISSON TERGENERALISASI TERBATAS DENGAN METODE MAKSIMUM LIKELIHOOD

BAB II TINJAUAN PUSTAKA

PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA

BAB 1 PENDAHULUAN. ii Bagaimana rata-rata atau nilai tengah dibuat oleh Stimulan eksternal.

BAB III REGRESI TERSENSOR (TOBIT) Model regresi yang didasarkan pada variabel terikat tersensor disebut

BAB III. Model Regresi Linear 2-Level. Sebuah model regresi dikatakan linear jika parameter-parameternya bersifat

E-Jurnal Matematika Vol. 3 (3), Agustus 2014, pp ISSN:

Pemodelan Jumlah Kematian Bayi Di Kabupaten Bojonegoro Dengan Menggunakan Metode Analisis Regresi Binomial Negatif

PEMODELAN JUMLAH KEMATIAN BAYI DI KOTA PADANG TAHUN 2013 DAN 2014 DENGAN PENDEKATAN REGRESI BINOMIAL NEGATIF

Prosiding Statistika ISSN:

BEBERAPA DISTRIBUSI KHUSUS DKINTINU DIKENAL

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

PENERAPAN REGRESI POISSON DAN BINOMIAL NEGATIF DALAM MEMODELKAN JUMLAH KASUS PENDERITA AIDS DI INDONESIA BERDASARKAN FAKTOR SOSIODEMOGRAFI

BAB III METODE THEIL. menganalisis hubungan antara variabel bebas dan variabel terikat yang dinyatakan

BAB I PENDAHULUAN 1.1 Latar Belakang

Prosiding Statistika ISSN:

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. menganalisis hubungan fungsional antara variabel prediktor ( ) dan variabel

Regresi Poisson dan Penerapannya Untuk Memodelkan Hubungan Usia dan Perilaku Merokok Terhadap Jumlah Kematian Penderita Penyakit Kanker Paru-Paru

PEMODELAN JUMLAH KASUS TETANUS NEONATORUM DENGAN MENGGUNAKAN REGRESI POISSON UNTUK WILAYAH REGIONAL 2 INDONESIA (SUMATERA)

BAB I PENDAHULUAN. 1.1 Latar belakang

Pemodelan Data Cacahan (Count Data) dalam GLM. Dr. Kusman Sadik, M.Si Sekolah Pascasarjana Departemen Statistika IPB Semester Genap 2017/2018

TINJAUAN PUSTAKA. mengestimasi parameter regresi. Distribusi generalized. digunakan dalam bidang ekonomi dan keuangan.

BAB II TINJAUAN PUSTAKA. (b) Variabel independen yang biasanya dinyatakan dengan simbol

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. 1.1 Latar Belakang

Analisis Regresi Nonlinear (I)

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

BAB I PENDAHULUAN. memperkecil atau meminimumkan ketidakpastian tersebut. Risiko dapat terjadi

Model Regresi Zero Inflated Poisson Pada Data Overdispersion

BAB I PENDAHULUAN. Analisis regresi merupakan suatu metode yang digunakan untuk

E-Jurnal Matematika Vol. 5 (4), November 2016, pp ISSN:

TUGAS AKHIR. Untuk Memenuhi Sebagian Persyaratan Memperoleh Gelar Sarjana Sains HASNARIKA NIM /2007

BAB I PENDAHULUAN. Dalam suatu penelitian, hubungan suatu variabel dependent atau

BAB II TINJAUAN PUSTAKA. variabel prediktor terhadap variabel respons. Hubungan fungsional

Dr. Kusman Sadik, M.Si Departemen Statistika IPB, 2017

BAB III LANDASAN TEORI. analisis kesintasan bertujuan menaksir probabilitas kelangsungan hidup, kekambuhan,

II. LANDASAN TEORI. beberapa konsep dan teori yang berkaitan dengan penduga parameter distribusi GB2

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

PENERAPAN HURDLE NEGATIVE BINOMIAL PADA DATA TERSENSOR

MODEL REGRESI POISSON YANG DIPERUMUM UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

INTERVAL KEPERCAYAAN

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN BAYI DI JAWA TENGAH MENGGUNAKAN REGRESI GENERALIZED POISSON DAN BINOMIAL NEGATIF

BAB III ESTIMASI BIAYA GARANSI TV. Pada bab ini akan dibahas tahapan-tahapan yang dilakukan untuk

LANDASAN TEORI. Generalized Lambda Distribution (GLD) awalnya diusulkan oleh Ramberg dan

BAB I PENDAHULUAN 1.1 Latar belakang Masalah Annisa Nurul Aini, 2013

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

TINJAUAN PUSTAKA Pemilihan Peubah Gizi Buruk

APLIKASI MODEL REGRESI POISSON TERGENERALISASI PADA KASUS ANGKA KEMATIAN BAYI DI JAWA TENGAH TAHUN 2007

GENERALIZED LINEAR MODELS (GLM) UNTUK DATA ASURANSI DALAM MENENTUKAN HARGA PREMI

BAB III MODEL REGRESI DATA PANEL. Pada bab ini akan dikemukakan dua pendekatan dari model regresi data

BAB II LANDASAN TEORI. landasan pembahasan pada bab selanjutnya. Pengertian-pengertian dasar yang di

Sem 7-4. Garis Besar Rencana Pembelajaran (GBRP)

BAB III KALMAN FILTER DISKRIT. Kalman Filter adalah rangkaian teknik perhitungan matematika (algoritma)

BAB II TINJAUAN PUSTAKA

FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA PENDERITA GIZI BURUK PADA BALITA DI PAPUA TAHUN 2015 DENGAN METODE REGRESI ZERO INFLATED POISSON (ZIP)

II. LANDASAN TEORI. sєs (S ruang sampel) dengan sebuah bilangan real. Salah satu peubah acak adalah

SBAB III MODEL VARMAX. Pengamatan time series membentuk suatu deret data pada saat t 1, t 2,..., t n

E-Jurnal Matematika Vol. 2, No.3, Agustus 2013, ISSN:

PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE) UNTUK MULTIPLE-RANDOM EFFECTS

PEMODELAN JUMLAH ANAK PUTUS SEKOLAH DI PROVINSI BALI DENGAN PENDEKATAN SEMI-PARAMETRIC GEOGRAPHICALLY WEIGHTED POISSON REGRESSION

I. PENDAHULUAN. Perkembangan teori statistika telah mempengaruhi hampir semua aspek. Dalam teori statistika dan peluang, distribusi gamma (

Pemodelan Data Besar Klaim Asuransi Kendaraan Bermotor Menggunakan Distribusi Mixture Erlang

Penerapan Hurdle Negative Binomial pada Data Tersensor

BAB 2 LANDASAN TEORI. 1. Analisis regresi linier sederhana 2. Analisis regresi linier berganda. Universitas Sumatera Utara

DAFTAR ISI. Halaman. viii

BAB III NONLINEAR GENERALIZED AUTOREGRESSIVE CONDITIONAL HETEROSKEDASTICITY (N-GARCH)

HASIL DAN PEMBAHASAN Model Regresi Poisson

BAB 1 PENDAHULUAN Latar Belakang

BAB III THRESHOLD AUTOREGRESSIVE CONDITIONAL HETEROCEDASTICTY (TARCH) Proses TARCH merupakan modifikasi dari model ARCH dan GARCH.

BAB III METODE PENELITIAN. No Kelas Jumlah 1 XII Busana XII Busana XII Busana 3 32 Jumlah 94 Tabel 3.1.

BAB III INTEGRATED GENERALIZED AUTOREGRESSIVE CONDITIONAL HETEROCEDASTICITY (IGARCH)

BAB IV HASIL PENELITIAN. Data yang dikumpulkan dalam penelitian ini terdiri dari tiga variabel yaitu

BAB II TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI. berkenaan dengan studi ketergantungan dari suatu varibel yaitu variabel tak bebas (dependent

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB II LANDASAN TEORI. : Ukuran sampel telah memenuhi syarat. : Ukuran sampel belum memenuhi syarat

PEMODELAN KEMATIAN BALITA MALNUTRISI DENGAN PENDEKATAN ZERO-INFLATED POISSON (ZIP) REGRESSION DI PROVINSI JAWA TENGAH

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Jurnal Dinamika, April 2015, halaman Vol. 06. No. 1 ISSN

PROSEDUR PENAKSIRAN PARAMETER MODEL MULTILEVEL MENGGUNAKAN TWO STAGE LEAST SQUARE DAN ITERATIVE GENERALIZED LEAST SQUARE

Kajian Generalisasi Distribusi Binomial yang Bertipe COM-Poisson dan Sifat-Sifatnya

BAB 2 LANDASAN TEORI

BAB 4 HASIL PENELITIAN

BAB 3 METODOLOGI. Penelitian ini menggunakan data sekunder yang berasal dari data Profil

BAB IV DESKRIPSI DAN ANALISIS DATA. evaluasi akhir pada materi Sistem Persamaan Linear Dua Variabel (SPLDV).

EARLY WARNING SYSTEM JUMLAH ANAK PUTUS SEKOLAH DENGAN METODE ZERO TRUNCATED NEGATIVE BINOMIAL

BAB I PENDAHULUAN. pertanyaan dalam penelitian dibidang ilmu sosial. (structural equation modeling, SEM), karena bisa dikatakan bahwa pemodelan

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III ANALISIS FAKTOR. berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal

Transkripsi:

BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON 3.1 Regresi Poisson Regresi Poisson merupakan salah satu model regresi dengan variabel responnya tidak berasal dari distribusi normal. Variabel respon dalam regresi Poisson ini berasal dari data hitung yang diharapkan jarang terjadi, seperti kecacatan dalam barang produksi, error dalam perangkat lunak (software), dan zat polutan dalam lingkungan. Fungsi peluang yang sering digunakan untuk data hitung adalah distribusi Poisson, yaitu: = ;=0,1,2,3! (3.1.1) Dengan parameter >0. Model dari regresi Poisson dapat dituliskan sebagai berikut. = + ; =1,2, (3.1.2) Ekspektasi dari variabel responnya dapat ditulis = (3.1.3) Dalam Generalized Linear Model (GLM), terdapat sebuah fungsi yang menghubungkan rata-rata dari variabel responnya dengan sebuah prediktor linear, yaitu: 19

= = + + + + = (3.1.4) Fungsi biasanya disebut fungsi penghubung (link function). Hubungan antara rata-rata dan prediktor linear adalah sebagai berikut. = = (3.1.5) Terdapat dua fungsi penghubung yang biasa digunakan dalam distribusi Poisson. Pertama adalah penghubung identitas (identity link). Kedua adalah penghubung log (log link). Fungsi penghubung identitas berbentuk: = = (3.1.6) Jika fungsi penghubung identitas ini digunakan, maka = = karena = = (3.1.7) Fungsi penghubung selanjutnya adalah penghubung log yang berbentuk =ln = (3.1.8) Untuk fungsi penghubung log dalam persamaan (3.1.8), hubungan antara rata-rata variabel respon dan prediktor linear adalah sebagai berikut. ln = e = =. (3.1.9) Fungsi penghubung log adalah fungsi penghubung yang lebih cocok digunakan karena fungsi log menjamin bahwa nilai yang diharapkan dari variabel responnya akan bernilai non negatif. Dalam pembahasan ini, fungsi penghubung yang dipilih adalah penghubung log. 20

6.2 Penaksir Parameter Regresi Poisson Metode yang digunakan untuk menaksir parameter pada regresi Poisson adalah metode kemungkinan maksimum. Misalkan terdapat sampel acak yang terdiri atas pengamatan pada variabel respon Y dan variabel prediktor X, maka fungsi kemungkinannya adalah sebagai berikut.,= =! = exp! Setelah fungsi penghubung dipilih, dalam hal ini adalah fungsi penghubung log, akan dimaksimumkan fungsi log-kemungkinannya ln, = ln ln! (3.2.1) Untuk menentukan penaksir kemungkinan maksimumnya, digunakan teknik iteratif yang cukup rumit. Beberapa perangkat lunak telah menyediakan fasilitas untuk menghitung penaksir bagi parameter regresi Poisson, di antaranya SAS, S- Plus, dan STATA. Dalam tugas akhir ini, perangkat lunak yang digunakan adalah SAS. Uji keberartian koefisien regresi juga akan dilakukan menggunakan SAS. Setelah diperoleh penaksir parameter, model regresi Poisson berbentuk = (3.2.2) Sebagai contoh, jika penghubung identitas digunakan, maka persamaannya menjadi: 21

= = (3.2.3) Dan jika penghubung log digunakan, maka = =exp (3.2.4) 6.3 Overdispersi pada Model Regresi Poisson Overdispersi merupakan sebuah kondisi yang dapat terjadi ketika pemodelan menggunakan distribusi Poisson. Hal ini terjadi karena distribusi Poisson memiliki rata-rata dan varians yang sama, yaitu =. Tetapi pada kenyataannya hal yang kadang terjadi adalah varians dari variabel responnya lebih besar daripada rata-ratanya, >, keadaan seperti ini disebut juga dengan overdispersi. Pengujian overdispersi pada regresi Poisson dilakukan dengan menggunakan statistik uji skor (C. B. Dean, 1992, dalam Utami, 2003:10). Prosedur yang akan dilakukan untuk melakukan pengujian tersebut sebagai berikut: 1. Perumusan Hipotesis H 0 : Tidak terdapat overdispersi pada model regresi Poisson H 0 : Terdapat overdispersi pada model regresi Poisson 2. Besaran-besaran yang digunakan a. Menghitung b. Menghitung 2 22

3. Statistik Uji Statistik uji yang digunakan adalah: = (3.4.1) 4. Kriteria Pengujian Dengan mengambil taraf nyata, maka tolak H 0 jika >. Dalam hal ini, diperoleh dari Tabel Distribusi Normal Baku dengan peluangnya. 5. Kesimpulan Penafsiran dari H 0 diterima atau ditolak. Jika H 0 ditolak, maka dalam model regresi Poisson terdapat overdispersi sehingga model regresi Poisson dapat dikatakan kurang tepat. 6.4 Distribusi Binomial Negatif Distribusi binomial negatif mempunyai peranan yang cukup penting dalam analisis statistika parametrik untuk data frekuensi yang mempunyai overdispersi. Misalkan bahwa variabel acak Y berdistribusi Poisson dengan parameter atau Poisson (). Akan tetapi, itu sendiri merupakan peubah acak dan diasumsikan berdistribusi gamma, yaitu: ~ ~, 23

di mana, adalah distribusi gamma dengan rata-rata = dan varian = dengan fungsi densitas seperti pada persamaan (2.4.1). Fungsi densitas bersama bagi Y dan, yaitu:,= Akan tetapi, karena tidak diamati, maka harus dipisahkan melalui distribusi marginalnya, yaitu:,,= =! =! (3.5.1) Integral di atas diselesaikan dengan menggunakan bantuan fungsi gamma, yaitu sepersi pada persamaan (2.4.1), sehingga bentuk integral dalam persamaan (3.5.1) dapat ditulis menjadi: = 1+ Dengan demikian distribusi marginalnya dapat ditulis menjadi :,,=! =! 1+ =! Untuk =0,1,2, (3.5.2) Schafer (2006) menyatakan bahwa distribusi tersebut mempunyai rata-rata: = == 24

Dan variannya dihitung sebagai berikut: = + = + =+ Untuk membangun model regresi, wajar untuk menyatakan distribusi binomial negatif dalam parameter = dan =, sehingga rata-rata dan varians menjadi: = (3.5.3) dan =+ (3.5.4) Sehingga fungsi densitas dari peubah acak Y adalah:,,=! (3.5.5) Fungsi peluang pada persamaan (3.5.5) merupakan fungsi peluang dari distribusi binomial negatif dengan parameter dan. Penaksir kemungkinan maksimum dari parameter dengan fungsi densitas seperti dalam persamaan (3.5.5) adalah: == (3.5.6) Sementara itu penaksir kemungkinan maksimum untuk parameter. adalah solusi dari persamaan (3.5.7) dengan terlebih dahulu mensubstitusikan persamaann (3.5.6) ke persamaan (3.5.7). + ln 1+ + =0 (3.5.7) 25

6.5 Regresi Binomial Negatif Misalkan adalah nilai dari variabel respon untuk pengamatan ke- dan adalah vektor dari nilai variabel bebas untuk pengamatan ke- dengan = 1, 2,,. Model regresi binomial negatif mengasumsikan bahwa variabel respon ke- mengikuti distribusi binomial negatif dengan parameter dan., yang dinotasikan oleh ~, (Zafatia, 2003). Regresi binomial negatif mengasumsikan suatu model berbentuk: = = = = = + + + + 3.5.1 Taksiran Parameter Model Regresi Binomial Negatif Dengan mengabaikan konstanta! pada persamaan (3.5.2), fungsi log kemungkinan pengamatan ke- untuk model regresi binomial negatif adalah: l =Γ 1 + Γ 1 + 1 + 1 1 (3.6.1.1) dimana = exp Jika nilai diketahui, maka parameter model regresi binomial negatif dapat ditaksir dengan menggunakan metode Fisher Scoring. Nilai taksiran untuk satu iterasinya adalah: = 1 (3.6.1.1) di mana: = 2 1 (3.6.1.2) dan 26

= + (3.6.1.3) Seperti yang telah dikemukakan pada persamaan (3.5.4), di bawah fungsi penghubung log = 1, maka nilai bobotnya adalah: = 2 (3.6.1.4) dan = + (3.6.1.5) 3.5.2 Uji Kecocokan Model Regresi Binomial Negatif Untuk melakukan uji kecocokan model regresi binomial negatif, maka perumusan hipotesisnya sebagai berikut: H 0 : Model regresi binomial negatif cocok dengan data H 1 : Model regresi binomial negatif tidak cocok dengan data Statistik uji yang digunakan adalah: = (3.6.2.1) dengan residual Pearson pengamatan ke- atau adalah: = (3.6.2.2) Dalam uji kecocokan model regresi binomial negatif dapat juga digunakan nilai devians. Nilai devians untuk pengamatan ke- adalah: 27

Jika > 0 = 2 + + 1 1 1 (3.6.2.3) Jika = 0 = 2 1 log 1+ (3.6.2.4) Sehingga nilai devians untuk pengamatan adalah: 2 = 1 = 2 + + 1 1 0 1 + 2 1 log 1+ 0 (3.6.2.5) Untuk kedua statistik uji di atas, dengan H 0 bahwa model regresinya adalah binomial negatif, maka tolak H 0 jika nilai yang ada pada persamaan (3.6.2.1) dan (3.6.2.5) lebih besar dari tabel dengan derajat kebebasan,dimana adalah banyak parameter dalam model. 28