Model Regresi Zero Inflated Poisson Pada Data Overdispersion

dokumen-dokumen yang mirip
PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA

E-Jurnal Matematika Vol. 5 (4), November 2016, pp ISSN:

E-Jurnal Matematika Vol. 2, No.3, Agustus 2013, ISSN:

PEMODELAN JUMLAH KEMATIAN AKIBAT DIFTERI DI PROVINSI JAWA TIMUR DENGAN REGRESI BINOMIAL NEGATIF DAN ZERO-INFLATED POISSON

BAGAN KENDALI ZERO INFLATED POISSON ADRIAN MATANDUNG. Pembimbing 1. Dr. Erna Tri Herdiani, M.Si, 2. Dr. La Podje Talangko, M.Si.

E-Jurnal Matematika Vol. 3 (3), Agustus 2014, pp ISSN:

Pengujian Overdispersi pada Model Regresi Poisson (Studi Kasus: Laka Lantas Mobil Penumpang di Provinsi Jawa Barat)

Penaksiran Parameter Regresi Linier Logistik dengan Metode Maksimum Likelihood Lokal pada Resiko Kanker Payudara di Makassar

PEMODELAN REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSION PADA REGRESI POISSON

BAB I PENDAHULUAN. yang mendapat perhatian dari masyarakat internasional. Menurut data World

PENERAPAN HURDLE NEGATIVE BINOMIAL PADA DATA TERSENSOR

PENERAPAN REGRESI POISSON UNTUK MENGETAHUI FAKTOR-FAKTOR YANG MEMENGARUHI JUMLAH SISWA SMA/SMK YANG TIDAK LULUS UN DI BALI

ESTIMASI PARAMETER MODEL REGRESI ZERO-INFLATED POISSON (ZIP) MENGGUNAKAN METODE BAYESIAN

Kata Kunci Overdispersi, regresi Zero-Inflated Generalized Poisson (ZIGP), Tetanus Neonatorum.

ESTIMASI PARAMETER MODEL REGRESI POISSON TERGENERALISASI TERBATAS DENGAN METODE MAKSIMUM LIKELIHOOD

E-Jurnal Matematika Vol. 2, No.2, Mei 2013, ISSN:

JURNAL SAINS DAN SENI POMITS Vol. 3, No.2, (2014) ( X Print)

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA PENDERITA GIZI BURUK PADA BALITA DI PAPUA TAHUN 2015 DENGAN METODE REGRESI ZERO INFLATED POISSON (ZIP)

Sarimah. ABSTRACT

ESTIMASI PARAMETER MODEL REGRESI COM-POISSON UNTUK DATA TERSENSOR KANAN MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD. Oleh DIAN ANGGRAENI NIM.

MODEL REGRESI POISSON YANG DIPERUMUM UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

Penerapan Hurdle Negative Binomial pada Data Tersensor

PEMODELAN INFANT MORTALITY RATE (IMR) DENGAN PENDEKATAN ZERO INFLATED POISSON REGRESSION BERBASIS ALGORITMA EM

PENERAPAN REGRESI POISSON DAN BINOMIAL NEGATIF DALAM MEMODELKAN JUMLAH KASUS PENDERITA AIDS DI INDONESIA BERDASARKAN FAKTOR SOSIODEMOGRAFI

PENERAPAN REGRESI GENERALIZED POISSON UNTUK MENGATASI FENOMENA OVERDISPERSI PADA KASUS REGRESI POISSON

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN BAYI DI JAWA TENGAH MENGGUNAKAN REGRESI GENERALIZED POISSON DAN BINOMIAL NEGATIF

(M.9) PEMODELAN MELEK HURUF DAN RATA-RATA LAMA STUDI DENGAN PENDEKATAN MODEL BINER BIVARIAT

(R.6) REGRESI MULTILEVEL ZERO INFLATED POISSON UNTUK PEMODELAN DATA RESPON COUNT (Studi Kasus: Kejadian Kematian Bayi)

BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

PERBANDINGAN REGRESI ZERO INFLATED POISSON (ZIP) DAN REGRESI ZERO INFLATED NEGATIVE BINOMIAL (ZINB) PADA DATA OVERDISPERSION

BAB II TINJAUAN PUSTAKA

METODE KEMUNGKINAN MAKSIMUM UNTUK KOREKSI SEBARAN BERSYARAT PADA ANALISIS KORELASI

Kajian Generalisasi Distribusi Binomial yang Bertipe COM-Poisson dan Sifat-Sifatnya

PEMODELAN KEMATIAN BALITA MALNUTRISI DENGAN PENDEKATAN ZERO-INFLATED POISSON (ZIP) REGRESSION DI PROVINSI JAWA TENGAH

BAB I PENDAHULUAN. 1.1 Latar belakang

E-Jurnal Matematika Vol. 4 (2), Mei 2015, pp ISSN:

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

MODEL REGRESI ZERO INFLATED GENERALIZED POISSON

PENGUJIAN KESAMAAN BEBERAPA MODEL REGRESI NON LINIER GEOMETRI (Studi Kasus : Data Emisi CO 2 dan Gross Nation Product di Malaysia, Bhutan, dan Nepal)

Pemodelan Jumlah Kematian Bayi Di Kabupaten Bojonegoro Dengan Menggunakan Metode Analisis Regresi Binomial Negatif

MODEL ASURANSI KENDARAAN BERMOTOR MENGGUNAKAN DISTRIBUSI MIXED POISSON ABSTRACT

KAJIAN METODE IMPUTASI DALAM MENANGANI MISSING DATA. Triyani Hendrawati Staf Pengajar Statistika Universitas Padjadjaran

BAB III REGRESI SPASIAL DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED POISSON REGRESSION (GWPR)

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

Generalized Ordinal Logistic Regression Model pada Pemodelan Data Nilai Pesantren Mahasiswa Baru FMIPA Universitas Islam Bandung Tahun 2017

APLIKASI REGRESI BINOMIAL NEGATIF DAN GENERALIZED POISSON DALAM MENGATASI OVERDISPERSION PADA REGRESI POISSON

Penaksiran Parameter Model Kalibrasi Linier yang Berdistribusi Skew-Normal dengan Algoritma-EM

BAB I PENDAHULUAN. 1.1 Latar Belakang

ESTIMASI PARAMETER MODEL MIXTURE AUTOREGRESSIVE (MAR) MENGGUNAKAN ALGORITMA EKSPEKTASI MAKSIMISASI (EM) Abstract

IDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI MAHASISWA PASCASARJANA IPB BERHENTI STUDI MENGGUNAKAN ANALISIS CHAID DAN REGRESI LOGISTIK

PUSPA DEWI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Dosen Pembimbing : Dr. Purhadi, M.Sc

PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE) UNTUK MULTIPLE-RANDOM EFFECTS

Prosiding Statistika ISSN:

ESTIMASI EROR STANDAR PARAMETER REGRESI LOGISTIK MENGGUNAKAN METODE BOOTSTRAP

Regresi Poisson dan Penerapannya Untuk Memodelkan Hubungan Usia dan Perilaku Merokok Terhadap Jumlah Kematian Penderita Penyakit Kanker Paru-Paru

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Pada Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

PEMODELAN JUMLAH KASUS TETANUS NEONATORUM DENGAN MENGGUNAKAN REGRESI POISSON UNTUK WILAYAH REGIONAL 2 INDONESIA (SUMATERA)

BAB III PERLUASAN MODEL REGRESI COX PROPORTIONAL HAZARD DENGAN VARIABEL TERIKAT OLEH WAKTU

PENERAPAN REGRESI ZERO INFLATED POISSON DENGAN METODE BAYESIAN

KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD)

PERBANDINGAN KINERJA DIAGRAM KONTROL MULTIVARIAT UNTUK VARIABILITAS BERDASARKAN MATRIKS KOVARIANSI DAN MATRIKS KORELASI. Abstrak

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman Online di:

Algoritma Expectation-Maximization(EM) Untuk Estimasi Distribusi Mixture

(R.2) KAJIAN PREDIKSI KLASIFIKASI OBYEK PADA VARIABEL RESPON BINER

MODEL REGRESI DATA TAHAN HIDUP TERSENSOR TIPE III BERDISTRIBUSI EKSPONENSIAL. Jln. Prof. H. Soedarto, S.H., Tembalang, Semarang.

GENERALIZED POISSON REGRESSION (GPR)

Informasi Fisher pada Algoritme Fisher Scoring untuk Estimasi Parameter Model Regresi Logistik Ordinal Terboboti Geografis (RLOTG)

MASALAH NILAI AWAL ITERASI NEWTON RAPHSON UNTUK ESTIMASI PARAMETER MODEL REGRESI LOGISTIK ORDINAL TERBOBOTI GEOGRAFIS (RLOTG)

PEMODELAN JUMLAH KEMATIAN BAYI DI KOTA PADANG TAHUN 2013 DAN 2014 DENGAN PENDEKATAN REGRESI BINOMIAL NEGATIF

BAB II TINJAUAN PUSTAKA

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

(R.1) KAJIAN MODEL GEOGRAPHICALLY WEIGHTED POISSON REGRESSION UNTUK MASALAH DATA SPASIAL DISKRIT

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

PEMODELAN JUMLAH ANAK PUTUS SEKOLAH DI PROVINSI BALI DENGAN PENDEKATAN SEMI-PARAMETRIC GEOGRAPHICALLY WEIGHTED POISSON REGRESSION

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

Kata Kunci: Model Regresi Logistik Biner, metode Maximum Likelihood, Demam Berdarah Dengue

ANALISIS REGRESI LOGISTIK ORDINAL PADA FAKTOR-FAKTOR BERPENGARUH TERHADAP PENYAKIT MATA KATARAK BAGI PASIEN PENDERITA DI KLINIK MATA UTAMA GRESIK

PENAKSIR MAKSIMUM LIKELIHOOD DENGAN METODE ITERASI NEWTON - RAPHSON

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEPUTUSAN KONSUMEN MEMBELI SUATU PRODUK DENGAN METODE ANALISIS REGRESI LOGISTIK ORDINAL

ESTIMASI PARAMETER DISTRIBUSI BINOMIAL NEGATIF-GENERALIZED EKSPONENSIAL (BN-GE) PADA DATA OVERDISPERSI

REGRESI LOGISTIK UNTUK PEMODELAN INDEKS PEMBANGUNAN KESEHATAN MASYARAKAT KABUPATEN/KOTA DI PULAU KALIMANTAN

MODEL REGRESI PROBIT BIVARIAT

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI DI KOTA SEMARANG MENGGUNAKAN BOOSTSTRAP AGGREGATTING REGRESI LOGISTIK MULTINOMIAL

ESTIMASI PARAMETER MODEL REGRESI ZERO ADJUSTED INVERSE GAUSSIAN (ZAIG) UNTUK MENENTUKAN BESAR KLAIM

E-Jurnal Matematika Vol. 2, No.3, Agustus 2013, ISSN:

PEMODELAN DISPARITAS GENDER DI JAWA TIMUR DENGAN PENDEKATAN MODEL REGRESI PROBIT ORDINAL

MODEL REGRESI LOGISTIK BINER DENGAN METODE PENALIZED MAXIMUM LIKELIHOOD. Edi Susilo, Anna Islamiyati, Muh. Saleh AF. ABSTRAK

MENAKSIR PARAMETER µ DARI N( µ, ) DENGAN METODE BAYES

KAJIAN DATA KETAHANAN HIDUP TERSENSOR TIPE I BERDISTRIBUSI EKSPONENSIAL DAN SIX SIGMA. Victoria Dwi Murti 1, Sudarno 2, Suparti 3

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

ISSN: Vol. 1 No. 1 Agustus 2012

Regresi Logistik Binomial, Model untuk Toksisitas Logam Berat Timbal Pb terhadap Larva Udang Vannamae

REGRESI LOG-LOGISTIK UNTUK DATA TAHAN HIDUP TERSENSOR TIPE I. oleh NANDA HIDAYATI M

BAB 1 PENDAHULUAN. ii Bagaimana rata-rata atau nilai tengah dibuat oleh Stimulan eksternal.

BAB III REGRESI TERSENSOR (TOBIT) Model regresi yang didasarkan pada variabel terikat tersensor disebut

BAB 2 LANDASAN TEORI

Transkripsi:

Model Regresi Zero Inflated Poisson Pada Data Overdispersion Wirajaya Kusuma Fakultas MIPA, Universitas Mataram e-mail: Kusuma_Wirajaya@yahoo.co.id Desy Komalasari Fakultas MIPA, Universitas Mataram e-mail: Desi_its@yahoo.com Mustika Hadijati Fakultas MIPA, Universitas Mataram e-mail: Ika_wikan@yahoo.co.id Abstract: Overdispersion is a phenomenon of the data variance greater than the average. One of the causes of overdispersion is too many zero value (excess zero) on the response variable. Zero inflated Poisson regression model (ZIP) is one of the method that can be used to overcome problems due to excess zeros. The purpose of this research is to estimate the regression parameters model Zero -inflated Poisson (ZIP) and applying to the data of unsuccessful students in national examinations in senior high school and vocational school in the city of Mataram. Parameter estimation Zero inflated Poisson regression model using the maximum likelihood and maximization expectation algorithm with Newton Rhapson approach. Zero inflated Poisson regression model obtained on the data is: dan With is school accreditation; and is the proportion of teachers who are already certified Keywords: Zero Inflated Poisson, Overdispersion, Maximization Expectation, Newton Rhapson, unsuccessful students SMA/SMK 1. Pendahuluan Analisis regresi adalah suatu metode yang digunakan untuk menganalisis hubungan antara variabel dependent dan variabel independent. Salah satu model regresi yang dapat digunakan untuk menganalisis hubungan antara variabel dependent yang berupa data diskrit dan variabel independent berupa data kontinyu, diskrit, atau campuran adalah model regresi Poisson. Dalam model regresi Poisson terdapat beberapa asumsi, salah satu asumsi yang harus terpenuhi adalah variansi dari variabel dependent sama dengan rataannya (equidispersion). 71

Kusuma, W., Komalasari, D., Hadijati, M./Model Regresi Zero Inflated Poisson pada Data Namun, dalam analisis data sering dijumpai data yang variansinya lebih kecil atau lebih besar dari rataannya. Keadaan ini lebih dikenal dengan underdispersion atau overdispersion. Salah satu penyebab terjadinya overdispersion adalah terlalu banyak nilai nol (excess zero) pada variabel respon. Model regresi Zero Inflated Poisson (ZIP) merupakan salah satu metode yang dapat digunakan untuk mengatasi masalah overdispersion akibat excess zeros pada data respon bertipe diskrit. Pada regresi ZIP terdapat dua parameter yang akan diestimasi yaitu parameter μ yang mewakili variabel yang mempengaruhi zero state dan parameter ω yang mewakili variabel yang mempengaruhi Poisson state. Permasalahan yang diangkat dalam penelitian ini yaitu bagaimana menaksir parameter model regresi Zero Inflated Poisson (ZIP) dalam mengatasi overdispersion; dan bagaimana menerapkannya pada data. Sehingga yang menjadi tujuan pada penelitian ini yaitu menaksir parameter model regresi Zero Inflated Poisson (ZIP); dan menerapkan pada data ketidaklulusan siswa SMA/SMK di Kota Mataram. 2. Tinjauan Pustaka 2.1 Regresi Poisson Regresi Poisson termasuk kedalam Generalized linier model (GLM) dan merupakan salah satu bentuk regresi yang digunakan untuk model data cacah. Variabel dependent dalam persamaan tersebut menyatakan data cacah (Hilbe [4]). GLM didefinisikan ke dalam tiga komponen yaitu komponen acak, komponen sistematis dan fungsi penghubung. Komponen acak adalah suatu komponen yang mengidentifikasikan distribusi peluang dari variabel respon diasumsikan saling bebas dan memiliki distribusi yang termasuk dalam keluarga eksponensial dengan fungsi kepadatan peluang sebagai berikut: * + (2.1) Parameter disebut parameter natural dan parameter disebut dengan parameter dispersi. Komponen sistematis dari komponen model linier umum yang menghubungkan vektor [ ] kepada sekumpulan variabel prediktor melalui model linier dimana adalah matriks rancangan yang berisi nilainilai variabel prediktor untuk buah pengamatan, adalah vektor dari parameter dalam model dan vektor disebut prediktor linier. Komponen ketiga dari GLM yaitu fungsi link yang menghubungkan komponen acak dengan komponen sistematis. Suatu fungsi disebut fungsi link kanonik jika: (2.2) dengan merupakan parameter kanonik (Agresti [1]). 72

Jika merupakan variabel acak untuk data cacah dengan, dimana menyatakan banyaknya data dan berdistribusi Poisson maka fungsi kepadatan peluangnya adalah: (2.3), dengan merupakan rataan dari variabel dependen. Fungsi peluang Poisson termasuk keluarga eksponensial sehingga dapat ditulis: ( ) (2.4) Dengan menggunakan fungsi link diperoleh model regresi Poisson berikut: (2.5) Asumsi yang harus dipenuhi pada model regresi Poisson yaitu: = Dengan matriks yang berukuran yang menjelaskan variabel independen dan adalah vektor berukuran yang merupakan parameter regresi. Sehingga fungsi kepadatan peluang pada regresi Poisson adalah sebagai berikut: [( ] (2.6) Nilai harapan bergantung pada variabel independen adalah. Taksiran parameter koefisien regresi Poisson dapat dilakukan dengan menggunakan Maximum Likelihood Estimation (MLE) (Hilbe [4]). 2.2 Overdispersion Fenomena overdispersion dapat ditulis: (2.7) Taksiran dispersi dapat diukur dengan nilai deviance dan pearson chi-square. Data dikatakan overdispersion jika taksiran dispersi lebih besar dari 1 dan underdispersion jika taksiran dispersi kurang dari 1 (Khoshgoftaar, et al. [8]). Terdapat dua cara yang dapat digunakan untuk mendeteksi overdispersion, yaitu: 1. Deviance { } (2.8) dimana db = dengan merupakan banyak parameter termasuk konstanta, merupakan banyaknya pengamatan dan adalah nilai deviance (Hilbe [4]). 73

Kusuma, W., Komalasari, D., Hadijati, M./Model Regresi Zero Inflated Poisson pada Data 2. Pearson chi-square untuk menguji asumsi equidispersion pada regresi Poisson dilakukan dengan melihat nilai statistik Pearson chi-square yang dibagi dengan derajat bebasnya. (2.9) dimana dengan merupakan banyak parameter termasuk konstanta, merupakan banyaknya pengamatan dan adalah nilai pearson chi-square. Jika nilai dan bernilai lebih dari satu maka terjadi overdispersion pada data. 2.3 Regresi Zero-Inflated Poisson (ZIP) Salah satu penyebab terjadinya overdispersion adalah lebih banyak observasi bernilai nol daripada yang ditaksir. Salah satu metode yang diusulkan untuk menaksir yaitu model regresi Zero Inflated Poisson (ZIP) (Jansakul & Hinde [7]). Jika adalah variabel random yang mempunyai distribusi ZIP, nilai nol pada observasi diduga muncul dalam dua cara yang sesuai untuk keadaan (state) yang terpisah. Keadaan pertama disebut zero state terjadi dengan probabilitas dan menghasilkan hanya observasi bernilai nol, sementara keadaan kedua disebut Poisson state terjadi dengan probabilitas dan berdistribusi Poisson dengan mean (Jansakul & Hinde [7]). Proses dua keadaan ini memberikan distribusi campuran dua komponen dengan fungsi probabilitas sebagai berikut: { Lambert [9] menyarankan model gabungan untuk µ dan ω, yakni: (µ) (2.11) dengan adalah matriks variabel prediktor, β dan adalah vektor parameter yang akan ditaksir, dan adalah probabilitas observasi bernilai nol (Ismail & Zamani [6]). 2.4 Metode Maksimum Likelihood Pandang suatu sampel random dari suatu distribusi yang memiliki p.d.f, dimana merupakan suatu parameter yang tidak diketahui dan adalah ruang parameter. Karena sampel random, maka p.d.f bersama dari adalah: 74

(2.12) Fungsi likelihood didefinisikan sebagai fungsi peluang bersama dari yang dapat dianggap sebagai fungsi dari. Misalkan fungsi likelihood: (2.13) Penaksiran maksimum likelihood yang memaksimumkan fungsi likelihood disebut taksiran maksimum likelihood dari. Nilai yang memaksimumkan dapat diperoleh dengan mencari solusi dari persamaan 2.5 Algoritma EM (Hoog & Craig [5]). Algoritma EM diperkenalkan oleh Dempster, Laird dan Rubin [2], merupakan salah satu metode optimasi yang digunakan sebagai alternatif dalam memaksimumkan fungsi likelihood yang mengandung data missing. Dua tahap dilakukan dalam Algoritma EM, yaitu tahap Ekspektasi dan Maksimalisasi. Misal diasumsikan terdapat data observasi x berdistribusi tertentu yang mengandung data missing y. mengatasinya dibentuk distribusi gabungan antara x dan y, yaitu: ( ) ( ) ( ) (2.14) Langkah E pada algoritma EM adalah menghitung complete data likelihood. L(θ x, y), yaitu menghitung ekspektasi dari missing data dengan diketahui data yang ada (tidak missing). Berikut langkah-langkah algoritma EM diantaranya Menentukan inisialisasi parameter ; Langkah ekspektasi yaitu Menghitung complate data likelihood dengan cara substitusi pada fungsi ( ) ( ) ; Langkah maksimalisasi dilakukan dengan mengacu pada kondisi ( ) untuk mendapatkan inisialisasi yang baru; Langkah E dan M dilakukan secara iteratif sampai didapatkan perbedaan antara ( ) lebih kecil dari kriteria tertentu yang bernilai kecil sehingga diperoleh yang konvergen dan memenuhi numerik dapat dilakukan pada langkah M. 3. Metode Penelitian Berikut tahapan penelitian meliputi: 1. Menaksir Parameter Model Regresi Zero Inflated Poisson ( ). Optimasi secara menaksir parameter model regresi Zero Inflated Poisson digunakan maximum likelihood estimation (MLE) dengan langkah-langkahnya sebagai berikut: 75

Kusuma, W., Komalasari, D., Hadijati, M./Model Regresi Zero Inflated Poisson pada Data Menentukan fungsi probabilitas variabel respon dari model regresi zero-inflated Poisson; Membentuk fungsi likelihood; Menentukan fungsi ln-likelihood; Membentuk distribusi dari variabel ; Membentuk distribusi gabungan antara dan ; Menentukan turunan parsial pertama dan kedua dari fungsi ln-likelihood distribusi gabungan dan ; Tahap ekspektasi; dan Tahap maksimalisasi dengan iterasi Newton-rhapson. 2. Penerapannya Pada Data Pada penelitian ini, diterapkan pada data ketidaklulusan Siswa SMA/SMK dalam Ujian Nasional di Kota Mataram Tahun 2012. Data diambil dari DIKPORA Kota Mataram yang memuat 42 data sekolah dimana variabel yang digunakan dalam penelitian ini berupa Variabel Respon yaitu Jumlah siswa SMA/SMK yang tidak lulus UN di Kota Mataram tahun 2012; dan Variabel prediktor meliputi (jumlah peserta UN pada tiap SMA/SMK di Kota Mataram); (akreditasi sekolah SMA/SMK di kota Mataram) yang dibagi sebagai berikut: { dan (presentasi proporsi guru yang sudah sertifikasi pada tiap SMA/SMK di kota Mataram). 4. Hasil dan Pembahasan 4.1 Menaksir Parameter Model Regresi Zero-inflated Poison (ZIP) Jika adalah variabel random yang mempunyai distribusi ZIP, nilai nol pada observasi diduga muncul dalam dua cara yang sesuai untuk keadaan (state) yang terpisah. Keadaan pertama disebut zero state terjadi dengan probabilitas dan menghasilkan observasi bernilai nol, sementara keadaan kedua disebut poisson state terjadi dengan probabilitas (1- ) dan berdistribusi Poisson dengan mean. Proses dua keadaan ini memberikan distribusi campuran dua komponen dengan fungsi probabilitas sebagai berikut: { Lambert [9] menyarankan model gabungan untuk µ dan ω, yakni: (µ ) (ω) (4.2) Dengan adalah matriks variabel prediktor, β dan γ adalah vektor parameter yang akan ditaksir, dan ω adalah probabilitas observasi bernilai nol. 76

Maka dapat ditentukan nilai sebagai berikut: µ ( ) nilai disubstitusikan yaitu: ( ) ( ) ( ) ( ) ( )( ) { Jika buah pengamatan diasumsikan saling bebas, maka fungsi likelihood diperoleh dengan mengalikan semua fungsi probabilitas dari yaitu: ( ) [ ( ) [ ( ) ] ( ) ( )( ) ( ) Dibentuk fungsi ln-likelihood sebagai berikut: ( ) ( ) ] ( ( )) ( ) ( ) ( ) { [ ( )( ) ( ) ]} ( ) ( ) (4.6) 77

Kusuma, W., Komalasari, D., Hadijati, M./Model Regresi Zero Inflated Poisson pada Data Total ln-likelihood dapat diberikan oleh ( ) ( ) yaitu: ( ( )) ( ) ( ) ( ) (4.7) Pada persamaan (4.7) tidak diketahui mana nilai nol yang berasal dari zero state dan mana yang berasal dari poisson state sehingga menyulitkan perhitungan dan fungsi ln-likelihood ini tidak dapat diselesaikan dengan metode numerik biasa. memaksimalkan fungsi ln-likelihood digunakan algoritma expectation maximization (EM) yang merupakan salah satu metode optimasi yang banyak digunakan sebagai alternatif dalam memaksimumkan fungsi likelihood yang mengandung data hilang (missing)). Misalkan untuk setiap berkaitan dengan variabel indikator yaitu: { Dapat dibentuk distribusi dari indikator P dan P Sehingga ~ binomial (1, ). yaitu: Jika nilai variabel respon = 1,2,3,..., maka nilai = 0. Sedangkan jika nilai variabel respon, maka nilai mungkin 0 atau 1. Jadi untuk variabel respon, maka nilai belum bisa ditentukan. Oleh karena itu dibentuk distribusi gabungan antara dan sebagai berikut: ( ) { ( ) ( ) ( ) ( )( ) { ( ) (4.9) Jika buah pengamatan diasumsikan saling bebas, maka fungsi likelihood diperoleh dengan mengalikan semua fungsi probabilitas dari sebagai berikut: ( ) ( ) [ ( ) ( ) ] 78

( ) [ ( )( ) ( ) ] Digunakan fungsi ln-likelihood untuk mempermudah perhitungan sebagai berikut: ( ) ( ) ( ) ( ) ( ) ( ) (4.12) Sehingga total ln-likelihood nya dapat diberikan oleh ( ) ( ) yaitu: [ ( )] (( ) Persamaan ini disebut complate data likelihood. Persamaan ini dimaksimumkan menggunakan algoritma EM, dimana parameter dan dapat diestimasi secara terpisah. Sehingga dapat ditulis sebagai berikut: (4.13) dengan : [ ( )] (4.14) dan (( ) (4.15) 79

Kusuma, W., Komalasari, D., Hadijati, M./Model Regresi Zero Inflated Poisson pada Data Taksiran maksimum likelihood dan, sebagai berikut: Misalkan dan turunan pertama dari terhadap maka: ( ) (4.16) ( ) Misalkan dan turunan pertama dari terhadap maka : [ ( )] [ ( )] (4.17) Selanjutnya turunan pasial kedua dari terhadap dan terhadap yaitu: Misalkan adalah turunan parsial kedua dari terhadap dimana maka: [ ( )] Misalkan adalah turunan parsial kedua dari terhadap dimana maka: ( ) 80

Atau dapat ditulis dalam bentuk matriks: [ ] Tahap ekspektasi: Mengganti variabel dengan yang merupakan ekspektasi dari ( ( ( ) ) ( ( )) ) Tahap maksimalisasi untuk parameter (4.18) (4.19) mencari taksiran maksimum likelihood ( dan ) digunakan metode newton-rhapson dengan prosedur sebagai berikut: 1. Pilih taksiran awal dari [ ] yaitu dan [ ] yaitu [ ] [ ] 2. Tentukan taksiran dari pada iterasi ke- yaitu ( dan ), secara iteratif menggunakan formula: [ ( )] ( ) (4.20) dan [ ( )] ( ) (4.21) dengan : adalah masing-masing taksiran dari dan pada iterasi ke. 81

Kusuma, W., Komalasari, D., Hadijati, M./Model Regresi Zero Inflated Poisson pada Data ( ), ( ) adalah masing-masing vektor turunan parsial pertama dari dan dengan elemen dan (dengan ) dihitung pada dan. ( ), ( ) adalah masing-masing matriks turunan parsial kedua dari dan dengan elemen dan (dengan ) dihitung pada dan. 3. Ganti dan dengan dan pada iterasi selanjutnya kemudian kembali lakukan tahap ekspektasi. 4. Tahap ke- 2 dan ke- 3 dilakukan secara berulang-ulang. Hentikan proses iterasi jika, lalu ambil sebagai taksiran dan sebagai taksiran. Dengan menggunakan taksiran maksimum likelihood dan dapat dibentuk model ZIP nya yaitu: dan ( ) (4.22) ( ) (4.23) menyelesaikan persamaan iterasi pada umumnya digunakan software. 4.1.2 Taksiran Matriks Variansi-Kovariansi Taksiran matriks variansi-kovariansi dan dinyatakan dengan ( ) dan ( ): ( ) [ ( )] dan ( ) [ ( )] (4.24) Elemen diagonal utama ke- masing-masing matriks ( ) dan ( ) menunjukkan taksiran variansi dari dan yang dinyatakan dengan ( ) dan ( ), elemen non diagonalnya menunjukkan taksiran kovariansi dari ( ) dan ( ) yang dinyatakan dengan ( ) dan ( );. Dari matriks ( ) dan ( ) diperoleh taksiran standar error dari dan yaitu: ( ) ( ) dan ( ) ( ) (4.25) Nilai ( ) dan ( ) akan digunakan dalam pengujian signifikansi dari tiap parameter dalam model. 82

4.2 Penerapan Pada Data 4.2.1 Model Zero-Inflated Poisson (ZIP) Data mengalami overdispersion maka untuk menganalisisnya digunakan ZIP. Dengan menggunakan software diperoleh estimasi parameter model regresi ZIP sebagai berikut: (µ ) Selanjutnya diuji signifikansi model apakah model tersebut dapat digunakan untuk menggambarkan hubungan antara jumlah siswa yang tidak lulus UN dengan jumlah peserta UN, akreditasi sekolah dan proporsi guru yang sudah sertifikasi. Menggunakan nilai fits statistics regresi ZIP diperoleh -2 Log Likelihood sebesar 35,20; nilai AIC sebesar 51,2; nilai AICC sebesar 55,6; dan nilai BIC sebesar 65,1. Sehingga diperoleh nilai ditolak yang artinya model regresi Poisson signifikan dan model ZIP dapat digunakan untuk menggambarkan hubungan antara jumlah siswa yang tidak lulus UN dengan jumlah peserta UN, akreditasi sekolah dan proporsi guru yang sudah sertifikasi. Selanjutnya akan diuji signifikansi dari tiap parameter model regresi Poisson menggunakan uji Wald untuk model. Diperoleh hanya parameter yang signifikan pada sedangkan parameter yang lain tidak signifikan. Berdasarkan kesimpulan tersebut didapat model sebagai berikut: Dengan adalah akreditasi sekolah SMA/SMK. model ; Pengujian signifikansi parameter secara individu digunakan uji Wald. Diperoleh hanya parameter yang signifikan pada sehingga dapat dibentuk model logitnya sebagai berikut: dengan adalah proporsi guru tiap SMA/SMK yang sudah sertifikasi. 4.2.2. Interpretasi Hasil Berdasarkan uji signifikansi parameter regresi ZIP diperoleh model (µ ) dan Artinya bahwa setiap sekolah yang terakreditasi A menyebabkan penurunan nilai harapan siswa yang tidak lulus sebesar kali sekolah yang 83

Kusuma, W., Komalasari, D., Hadijati, M./Model Regresi Zero Inflated Poisson pada Data terakreditasi selain A dan penambahan proporsi guru SMA/SMK yang sudah sertifikasi sebesar 1% akan menurunkan jumlah siswa yang tidak lulus UN sebesar ( ) ). 5. Kesimpulan dan Saran Kesimpulan Saran Berdasarkan hasil penelitian dapat disimpulkan bahwa: 1. Hasil estimasi parameter pada model regresi ZIP berbentuk implisit. Metode yang digunakan yaitu Algoritma Expectation Maximization (EM). Pada tahapan maksimalisasi digunakan pendekatan Newton Rhapson untuk memaksimalkan fungsi Likelihood yang diperoleh dari tahapan Ekspektasi. 2. Model regresi Zero Inflated Poisson yang diperoleh pada data ketidaklulusan siswa SMA/SMK di Kota Mataram tahun 2012 sebagai berikut: (µ ) dan dengan adalah akreditasi sekolah SMA/SMK adalah proporsi guru SMA/SMK yang sudah sertifikasi Penelitian lanjutan dapat menggunakan model regresi Zero Inflated Negative Binomial (ZINB) dan model regresi Zero Inflated Generalized Poisson (ZIGP) untuk mengatasi masalah overdispersion pada regresi Poisson. Daftar Pustaka [1] Agresti, A. 1990. Categorical Data Analysis. New York: John Wiley & Sons, Inc. [2] Dempster, A. P, Laird, N. M, Rubin, D. B. Maximum Likelihood from Incomplete Data via the EM Algorithm. Journal of the Royal Statistical Society. Series B (Methodological). 1977. Vol. 39. No. 1: 1-38. [3] Hall, D, B and Shen, J. Robust Estimation for Zero-Inflated Poisson Regression. Scandinavian Journal of Statistics, Blackwell Publishing Ltd. 2009: 1-16. [4] Hilbe, J, M. 2011. Negatif Binomial Regression 2 nd Edition. Cambridge: Cambridge University Press. [5] Hoog, R, V and Craig, A, T. 1995. Introduction to Mathematical Statistics. New Jersey: Prentice-Hall Inc. 84

[6] Ismail, N and Zamani, H. 2013. Estimation of Claim Count Data using Negative Binomial, Generalized Poisson, Zero-Inflated Negative Binomial and Zero-Inflated generalized Poisson Regression Models. Casualty Actuarial Society E-Forum. 41(20): 1-28. [7] Jansakul, N and Hinde, J, P. Score Tests for Zero-Inflated Models. Computational Statistics and Data Analysis. 2002. Vol. 40: 75-96. [8] Khoshgoftaar TM, Gao K, Szabo RM. 2004. Comparing Software Fault Predictions of Pure and Zero-Inflated Poisson Regression Models. International Journal of System Science 36(11): 705-715. [9] Lambert, D. Zero-Inflated Poison Regression with an Application to Defects in Manufacturing. Technometrics. 1992. Vol.34: 1-14. 85