Pemodelan Data Cacahan (Count Data) dalam GLM. Dr. Kusman Sadik, M.Si Sekolah Pascasarjana Departemen Statistika IPB Semester Genap 2017/2018

dokumen-dokumen yang mirip
Dr. Kusman Sadik, M.Si Departemen Statistika IPB, 2017

Model Log-Linear (Bagian 2) Dr. Kusman Sadik, M.Si Program Studi Magister (S2) Departemen Statistika IPB, 2017/2018

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

Regresi Logistik Nominal dengan Fungsi Hubung CLOGLOG

BAB 4 HASIL DAN PEMBAHASAN. mahasiswa lulusan yang berasal dari School of Computer Science BINUS. datanya adalah seperti yang tertera pada Tabel 4.1.

BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

PENGARUH MIXED DISTRIBUTION PADA PENDEKATAN QUASI-LIKELIHOOD DALAM MODEL LINEAR 1)

GENERALIZED LINEAR MODELS (GLM) UNTUK DATA ASURANSI DALAM MENENTUKAN HARGA PREMI

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEPUTUSAN KONSUMEN MEMBELI SUATU PRODUK DENGAN METODE ANALISIS REGRESI LOGISTIK ORDINAL

PENERAPAN REGRESI POISSON DAN BINOMIAL NEGATIF DALAM MEMODELKAN JUMLAH KASUS PENDERITA AIDS DI INDONESIA BERDASARKAN FAKTOR SOSIODEMOGRAFI

E-Jurnal Matematika Vol. 3 (3), Agustus 2014, pp ISSN:

BAB I PENDAHULUAN. mengetahui fenomena yang akan terjadi pada periode mendatang akan

BAB I PENDAHULUAN. Pada bab ini akan dibahas mengenai latar belakang tema yang diambil dalam

Model Log-Linear (Bagian 1) Dr. Kusman Sadik, M.Si Program Studi Magister (S2) Departemen Statistika IPB, 2017/2018

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

PUSPA DEWI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI DI KOTA SEMARANG MENGGUNAKAN BOOSTSTRAP AGGREGATTING REGRESI LOGISTIK MULTINOMIAL

Pengujian Overdispersi pada Model Regresi Poisson (Studi Kasus: Laka Lantas Mobil Penumpang di Provinsi Jawa Barat)

PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN BAYI DI JAWA TENGAH MENGGUNAKAN REGRESI GENERALIZED POISSON DAN BINOMIAL NEGATIF

PENERAPAN HURDLE NEGATIVE BINOMIAL PADA DATA TERSENSOR

Model Log-Linier dan Regresi Logistik

ESTIMASI PARAMETER MODEL REGRESI ZERO ADJUSTED INVERSE GAUSSIAN (ZAIG) UNTUK MENENTUKAN BESAR KLAIM

Resume 2 : Analysis of sex sequences by means of generalized linear mixed models. Yenni Angraini G

E-Jurnal Matematika Vol. 5 (4), November 2016, pp ISSN:

PENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

E-Jurnal Matematika Vol. 2, No.2, Mei 2013, ISSN:

ANALISIS DATA STATUS PEKERJAAN DENGAN MODEL NONLINIER TERGENERALISIR (Studi Kasus di Kabupaten Banyuwangi)

Penerapan Hurdle Negative Binomial pada Data Tersensor

PEMODELAN REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSION PADA REGRESI POISSON

ESTIMASI BIAYA KLAIM ASURANSI MENGGUNAKAN MODEL REGRESI ZERO-ADJUSTED INVERSE GAUSSIAN (ZAIG)

PEMODELAN JUMLAH KEMATIAN BAYI DI KOTA PADANG TAHUN 2013 DAN 2014 DENGAN PENDEKATAN REGRESI BINOMIAL NEGATIF

BAB I PENDAHULUAN 1.1 Latar Belakang

EARLY WARNING SYSTEM JUMLAH ANAK PUTUS SEKOLAH DENGAN METODE ZERO TRUNCATED NEGATIVE BINOMIAL

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS PEUBAH RESPONS KONTINU NON NEGATIF DENGAN REGRESI INVERSE GAUSSIAN SKRIPSI

Regresi Poisson dan Penerapannya Untuk Memodelkan Hubungan Usia dan Perilaku Merokok Terhadap Jumlah Kematian Penderita Penyakit Kanker Paru-Paru

Model Regresi untuk Data Deret Waktu. Kuliah 8 Metode Peramalan Deret Waktu

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Pemodelan Jumlah Kematian Bayi Di Kabupaten Bojonegoro Dengan Menggunakan Metode Analisis Regresi Binomial Negatif

PEMODELAN JUMLAH KASUS TETANUS NEONATORUM DENGAN MENGGUNAKAN REGRESI POISSON UNTUK WILAYAH REGIONAL 2 INDONESIA (SUMATERA)

BAB I PENDAHULUAN. 1.1 Latar Belakang

KAJIAN FUNGSI nls( ) DAN fsrr( ) TERHADAP MODEL MICHEALIS-MENTEN PADA REGRESI NONLINIER. Sudarno 1. Abstrak

MODUL 3 GENERALIZED LINEAR MODELS

Model Regresi Zero Inflated Poisson Pada Data Overdispersion

Generalized Ordinal Logistic Regression Model pada Pemodelan Data Nilai Pesantren Mahasiswa Baru FMIPA Universitas Islam Bandung Tahun 2017

PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE) UNTUK MULTIPLE-RANDOM EFFECTS

BAB I PENDAHULUAN. yang perlu diketahui, yang disebut sebagai variabel. Variabel adalah sebuah

PENERAPAN REGRESI POISSON UNTUK MENGETAHUI FAKTOR-FAKTOR YANG MEMENGARUHI JUMLAH SISWA SMA/SMK YANG TIDAK LULUS UN DI BALI

BAB 1 PENDAHULUAN. ii Bagaimana rata-rata atau nilai tengah dibuat oleh Stimulan eksternal.

ANALISIS KORELASI & REGRESI. Kompilasi Kelompok 6 dan 8

S - 14 PEMODELAN REGRESI POISSON, BINOMIAL NEGATIF DAN PADA KASUS KECELAKAAN KENDARAAN BERMOTOR DI LALU LINTAS SUMATERA BARAT

ANALISIS DATA UJI HIDUP

Penaksiran Parameter Regresi Linier Logistik dengan Metode Maksimum Likelihood Lokal pada Resiko Kanker Payudara di Makassar

STK511 Analisis Statistika. Pertemuan 12 Nonparametrik-Kategorik-Logistik

MODEL REGRESI POISSON YANG DIPERUMUM UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

Penerapan Model ARIMA

E-Jurnal Matematika OPEN JOURNAL SYSTEMS Journal Help USER Username Password 1 of 3 3/17/2015 1:27 PM

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

PEMODELAN JUMLAH KEMATIAN AKIBAT DIFTERI DI PROVINSI JAWA TIMUR DENGAN REGRESI BINOMIAL NEGATIF DAN ZERO-INFLATED POISSON

ESTIMASI PARAMETER MODEL REGRESI COM-POISSON UNTUK DATA TERSENSOR KANAN MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD. Oleh DIAN ANGGRAENI NIM.

SATUAN ACARA PERKULIAHAN MATA KULIAH : ANALISIS DATA UJI HIDUP KODE MATA KULIAH : MAA SKS

PENDUGAAN PARAMETER REGRESI LOGISTIK DENGAN JARINGAN SYARAF TIRUAN. Anik Djuraidah Jurusan Statistika FMIPA Institut Teknologi Sepuluh Nopember

ANALISIS PEUBAH RESPONS KATEGORIK DENGAN MODEL REGRESI ORDINAL

REGRESI LOGISTIK UNTUK PEMODELAN INDEKS PEMBANGUNAN KESEHATAN MASYARAKAT KABUPATEN/KOTA DI PULAU KALIMANTAN

Model Campuran Linear Terampat dalam pemodelan spesies dan stok ikan di Sungai Na Thap - Thailand Selatan

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

MASALAH NILAI AWAL ITERASI NEWTON RAPHSON UNTUK ESTIMASI PARAMETER MODEL REGRESI LOGISTIK ORDINAL TERBOBOTI GEOGRAFIS (RLOTG)

Komputasi Statistika dengan Software R

Prosiding Statistika ISSN:

BAB I PENDAHULUAN. banyak orang agar mau menjadi pemegang polis pada perusahaan tersebut. Salah

PEMODELAN REGRESI MULTILEVEL ORDINAL PADA DATA PENDIDIKAN DI JAWA BARAT

IDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI MAHASISWA PASCASARJANA IPB BERHENTI STUDI MENGGUNAKAN ANALISIS CHAID DAN REGRESI LOGISTIK

REGRESI BINOMIAL NEGATIF SEBAGAI MODEL ALTERNATIF UNTUK MENGHINDARI MASALAH OVERDISPERSSION PADA REGRESI POISSON NOVIRA SARTIKA

ESTIMASI PARAMETER DISTRIBUSI BINOMIAL NEGATIF-GENERALIZED EKSPONENSIAL (BN-GE) PADA DATA OVERDISPERSI

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

PENAKSIR RATA-RATA DISTRIBUSI EKSPONENSIAL TERPOTONG. Agustinus Simanjuntak ABSTRACT

PERBANDINGAN ANTARA MODEL LINIER DENGAN FAKTOR TETAP (GLM) DENGAN MODEL LINIER DENGAN FAKTOR TETAP DAN ACAK (GLMM) WULAN METAFURRY

FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA PENDERITA GIZI BURUK PADA BALITA DI PAPUA TAHUN 2015 DENGAN METODE REGRESI ZERO INFLATED POISSON (ZIP)

Pendekatan Model Multilevel pada Analisis Regresi Poisson untuk Data Longitudinal

MODEL ASURANSI KENDARAAN BERMOTOR MENGGUNAKAN DISTRIBUSI MIXED POISSON ABSTRACT

BAB I PENDAHULUAN 1.1 Latar Belakang

Kontrak Kuliah Metode Statistika 2

HASIL DAN PEMBAHASAN Model Regresi Poisson

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

Sem 5-4. Garis Besar Rencana Pembelajaran (GBRP)

BAB II TINJAUAN PUSTAKA. penulisan skripsi. Teori penunjang tersebut adalah: Regresi logistik, analisis survival,

APLIKASI REGRESI BINOMIAL NEGATIF DAN GENERALIZED POISSON DALAM MENGATASI OVERDISPERSION PADA REGRESI POISSON

KAJIAN OVERDISPERSI PADA REGRESI POISSON BERDASARKAN MODEL GENERALIZED POISSON MARTISAH

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Pemodelan Logit, Probit dan Complementary Log-Log pada Studi Kasus Partisipasi Perempuan dalam Pembangunan Ekonomi di Kalimantan Selatan

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II TINJAUAN PUSTAKA

ESTIMASI PARAMETER MODEL REGRESI POISSON TERGENERALISASI TERBATAS DENGAN METODE MAKSIMUM LIKELIHOOD

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Transkripsi:

Pemodelan Data Cacahan (Count Data) dalam GLM Dr. Kusman Sadik, M.Si Sekolah Pascasarjana Departemen Statistika IPB Semester Genap 2017/2018

Pendahuluan Pada model linear klasik, seperti regresi linear, memerlukan asumsi bahwa peubah respon y menyebar Normal. Pada kenyataanya banyak ditemukan bahwa peubah respon y tidak menyebar Normal. Misalnya menyebar Binomial, Poisson, Gamma, Eksponensial, dsb. Maka dikembangkan Model Linear Terampat (GLM) untuk mengatasi masalah ini. 2

Tiga Komponen dalam GLM 1. Komponen Acak (Random Component) Komponen acaknya adalah peubah respon y. Dalam GLM, peubah respon diasumsikan mempunyai sebaran yang termasuk ke dalam keluarga eksponensial (exponential family), yaitu : 3

lanjutan 2. Komponen Sistematik (Systematic Component) Komponen sistematik adalah kombinasi linear dari kovariat x 1, x 2,, x p. Sehingga dapat dituliskan sebagai berikut: i = ( i x i ) i disebut juga sebagai penduga linear (linear predictor), i adalah konstanta. 4

lanjutan 3. Fungsi Hubung (Link Function) Yaitu fungsi yang menghubungkan antara komponen acak dengan komponen sistematik. Misalkan E(y i ) = i, selanjutnya dapat dibuat hubungan sebagai berikut : g( i ) = i = ( i x i ) g(.) disebut sebagai fungsi hubung. Fungsi ini harus bersifat terdiferensialkan monoton (monotonic differentiable) 5

Normal Binomial Multinomial Sebaran Keluarga Eksponensial Poisson Gamma Eksponensial Negatif Binomial Dsb. 6

Fungsi Hubung Natural/Kanonik Sebaran y Normal Binomial Gamma Poisson Multinomial Negatif Binomial Inverse Gaussian Fungsi Hubung Identitas Logit Invers Log Logit Kumulatif Log Invers Kuadrat 7

8 Pendugaan Parameter Metode Fisher Scoring L(,y) adalah fungsi kemungkinan (likelihood), I disebut matrik informasi Fisher. Maka penduga secara iteratif adalah sebagai berikut : s r r r y L E y L U ), ( ; ), ( 2 I 1) ( 1) ( 1) ( ) ( 1) ( ˆ ˆ k k k k k U β I β I 1) ( 1) ( 1) ( ) ( ) ( ˆ ˆ k k k k U I β β -

Pengukuran Kelayakan Model Kelayakan model (goodness of fit) pada GLM dapat diukur berdasarkan Deviance (D). Deviance adalah dua kali perbedaan antara log likelihood nilai aktual dengan log likelihood nilai dugaan. Nilai deviance dapat digunakan sebagai statistik uji mengenai kelayakan model. Deviance merupakan peubah acak yang sebarannya mendekati sebaran 2. 9

Sebaran asimptotik bagi deviance (D) adalah 2 (n-p) dimana n adalah banyaknya data, sedangkan p adalah banyaknya parameter dalam model. 10

Uji hipotesis untuk vektor r p = [ r : p-r ] H o : r = 0 H 1 : r 0 11

Peubah Respon Poisson Respon yang diukur (y) berupa banyaknya kejadian selama selang waktu tertentu atau dalam luas area tententu. Misalnya, banyaknya pengunjung mal per hari, banyaknya bakteri dalam kultur biakan, dsb. Peubah respon y yang demikian disebut menyebar Poisson 12

Karakteristik Sebaran Keluarga Eksponensial 13

14

GLM untuk Sebaran Poisson 15

16

17

Model Log-Linear 18

Masalah Overdispersi 19

Studi Kasus McCullagh dan Nelder (hlm. 204) 20

Data 21

Pemodelan 22

23

Implementasi dalam Program R : Syntax ## 6.3.2. A study of wave damage to cargo ships ## McCullagh dan Nelder (hlm.204) shipku <- read.csv(file='1-data.ship.accident.mccullagh.csv', header=true) tipe <- factor(shipku[,2]) # Kategorik tahun <- factor(shipku[,4]) # Kategorik periode <- factor(shipku[,6]) # Kategorik service <- shipku[,7] # Kontinu incidents <- shipku[,8] # Kontinu ## Menentukan kategori pembanding tipe tahun periode <- relevel(tipe, ref="a") <- relevel(tahun, ref="1960-64") <- relevel(periode, ref="1960-74") data.frame(tipe,tahun,periode,service,incidents) 24

## We model the rate of damage incidents per month of service, so ## log(service) is an offset. ## We expect overdispersion, so we fit by quasi-likelihood using ## the quasipoisson family. ## The number of damage incidents must be zero for any observation ## with zero aggregated months of service (whether they corrspond ## to "necessarily empty" or "accidentally empty cells." These ## "observations" are not useful in fitting the model, and so are ## omitted using the subset argument. model <- glm(incidents ~ tipe + tahun + periode, offset = log(service), family = quasipoisson("link"=log), subset = (service!= 0)) summary(model) 25

Keluaran Program R: (1) > data.frame(tipe,tahun,periode,service,incidents) tipe tahun periode service incidents 1 A 1960-64 1960-74 127 0 2 A 1960-64 1975-79 63 0 3 A 1965-69 1960-74 1095 3 4 A 1965-69 1975-79 1095 4 5 A 1970-74 1960-74 1512 6 6 A 1970-74 1975-79 3353 18 7 A 1975-79 1960-74 0 0 8 A 1975-79 1975-79 2244 11... 37 E 1970-74 1960-74 1157 5 38 E 1970-74 1975-79 2161 12 39 E 1975-79 1960-74 0 0 40 E 1975-79 1975-79 542 1 26

Keluaran Program R: (2) Deviance Residuals: Min 1Q Median 3Q Max -1.6768-0.8293-0.4370 0.5058 2.7912 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -6.40590 0.28276-22.655 < 2e-16 *** tipeb -0.54334 0.23094-2.353 0.02681 * tipec -0.68740 0.42789-1.607 0.12072 tiped -0.07596 0.37787-0.201 0.84230 tipee 0.32558 0.30674 1.061 0.29864 tahun1965-69 0.69714 0.19459 3.583 0.00143 ** tahun1970-74 0.81843 0.22077 3.707 0.00105 ** tahun1975-79 0.45343 0.30321 1.495 0.14733 periode1975-79 0.38447 0.15380 2.500 0.01935 * ---------------- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 (Dispersion parameter for quasipoisson family taken to be 1.691028) Null deviance: 146.328 on 33 degrees of freedom Residual deviance: 38.695 on 25 degrees of freedom 27

Contoh Topik Riset dalam Jurnal 28

Contoh 1: 29

Contoh 2: 30

Contoh 3: 31

Contoh 4: 32

Contoh 5: 33

Contoh 6: 34

Contoh 7: 35

Pustaka Utama McCullagh, P. and Nelder, J.A. (1989) Generalized Linear Models, 2 nd. C&H. Dobson and Barnett. (2008). An Introduction to Generalized Linear Models, New York: C&H, 3rd ed. Agresti, A. (2015). Foundations of Linear and Generalized Linear Models. New Jersey: Wiley. 36

Pustaka Tambahan Jiang, J. (2007). Linear and Generalized Linear Mixed Models and Their Applications, Springer. McCulloch, C.E. and Searle, S.R. (2001) Generalized, Linear, and Mixed Models, Wiley Pawitan, Y. (2001) In All Likelihood. Oxford. Lee, Y., Nelder, J.A. and Pawitan, Y. (2006). Generalized Linear Models with Random Effects. C&H. 37

Materi ini bisa di-download di: kusmansadik.wordpress.com 38

39