Jl. Tamansari No.1 Bandung

dokumen-dokumen yang mirip
Masalah Overdispersi dalam Model Regresi Logistik Multinomial

Prosiding Statistika ISSN:

Pemodelan Data Curah Hujan Menggunakan Proses Shot Noise Modeling Rainfall Data Using a Shot Noise Process

PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA

Generalized Ordinal Logistic Regression Model pada Pemodelan Data Nilai Pesantren Mahasiswa Baru FMIPA Universitas Islam Bandung Tahun 2017

PENERAPAN REGRESI GENERALIZED POISSON UNTUK MENGATASI FENOMENA OVERDISPERSI PADA KASUS REGRESI POISSON

E-Jurnal Matematika Vol. 5 (4), November 2016, pp ISSN:

Penaksiran Parameter Regresi Linier Logistik dengan Metode Maksimum Likelihood Lokal pada Resiko Kanker Payudara di Makassar

PENERAPAN REGRESI POISSON DAN BINOMIAL NEGATIF DALAM MEMODELKAN JUMLAH KASUS PENDERITA AIDS DI INDONESIA BERDASARKAN FAKTOR SOSIODEMOGRAFI

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

E-Jurnal Matematika Vol. 2, No.3, Agustus 2013, ISSN:

E-Jurnal Matematika Vol. 3 (3), Agustus 2014, pp ISSN:

BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

E-Jurnal Matematika Vol. 2, No.2, Mei 2013, ISSN:

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Model Regresi Zero Inflated Poisson Pada Data Overdispersion

BAB I PENDAHULUAN. Pada bab ini akan dibahas mengenai latar belakang tema yang diambil dalam

Kata Kunci: Model Regresi Logistik Biner, metode Maximum Likelihood, Demam Berdarah Dengue

PENERAPAN REGRESI POISSON UNTUK MENGETAHUI FAKTOR-FAKTOR YANG MEMENGARUHI JUMLAH SISWA SMA/SMK YANG TIDAK LULUS UN DI BALI

(R.2) KAJIAN PREDIKSI KLASIFIKASI OBYEK PADA VARIABEL RESPON BINER

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014 ISSN

Pengujian Overdispersi pada Model Regresi Poisson (Studi Kasus: Laka Lantas Mobil Penumpang di Provinsi Jawa Barat)

PENERAPAN HURDLE NEGATIVE BINOMIAL PADA DATA TERSENSOR

PEMODELAN REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSION PADA REGRESI POISSON

ESTIMASI PARAMETER MODEL REGRESI ZERO-INFLATED POISSON (ZIP) MENGGUNAKAN METODE BAYESIAN

BAB I PENDAHULUAN. mengetahui fenomena yang akan terjadi pada periode mendatang akan

Prosiding Statistika ISSN:

ESTIMASI TOTAL DAYA LISTRIK YANG HILANG MELALUI PROSES POISSON TERPANCUNG MAJEMUK

PENAKSIRAN PARAMETER REGRESI LINIER DENGAN METODE BOOTSTRAP MENGGUNAKAN DATA BERDISTRIBUSI NORMAL DAN UNIFORM

Prosiding Statistika ISSN:

Prosiding Statistika ISSN:

Pengantar Statistika Matematika II

MODEL REGRESI COX PROPORTIONAL HAZARD PADA LAJU TAMAT MAHASISWA JURUSAN MATEMATIKA UNIVERSITAS ANDALAS

BAB 1 PENDAHULUAN. ii Bagaimana rata-rata atau nilai tengah dibuat oleh Stimulan eksternal.

PEMODELAN REGRESI TIGA LEVEL PADA DATA PENGAMATAN BERULANG. Indahwati, Yenni Angraeni, Tri Wuri Sastuti

PENERAPAN METODE BOOTSTRAP RESIDUAL DALAM MENGATASI BIAS PADA PENDUGA PARAMETER ANALISIS REGRESI

PEMODELAN JUMLAH KEMATIAN AKIBAT DIFTERI DI PROVINSI JAWA TIMUR DENGAN REGRESI BINOMIAL NEGATIF DAN ZERO-INFLATED POISSON

BAB 2 LANDASAN TEORI

ESTIMASI PARAMETER UNTUK DISTRIBUSI HALF LOGISTIK. Jl. A. Yani Km. 36 Banjarbaru, Kalimantan Selatan

Inferensia Statistik parametrik VALID?? darimana sampel diambil

ANALISIS HUBUNGAN ANTARA LAMA STUDI, JALUR MASUK DAN INDEKS PRESTASI KUMULATIF (IPK) MENGGUNAKAN MODEL LOG LINIER

Pengantar Statistika Matematika II

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

Penerapan Hurdle Negative Binomial pada Data Tersensor

GENERALIZED LINEAR MODELS (GLM) UNTUK DATA ASURANSI DALAM MENENTUKAN HARGA PREMI

BAB II LANDASAN TEORI. landasan pembahasan pada bab selanjutnya. Pengertian-pengertian dasar yang di

Model Poisson. Inferensi likelihood. Andi Kresna Jaya November 19, Jurusan Matematika

ESTIMASI PARAMETER µ DAN σ 2 PADA DISTRIBUSI EKSPONENSIAL TERGENERALISIR DUA VARIABEL MENGGUNAKAN FUNGSI PEMBANGKIT MOMEN SKRIPSI

Peranan dari Pemilihan Level sebagai Referensi pada Variabel Bebas Bertipe Kategori terhadap Derajat Multikolinieritas dalam Model Regresi Linier

Distribusi Diskrit dan Kontinu yang Penting. Oleh Azimmatul Ihwah

ALGORITMA PENENTUAN UKURAN SAMPEL EKSAK UNTUK DISTRIBUSI NORMAL, DISTRIBUSI POISSON DAN DUA DISTRIBUSI BINOMIAL DALAM MODEL KELUARGA EKSPONENSIAL

BAB 2 LANDASAN TEORI

PENGARUH MIXED DISTRIBUTION PADA PENDEKATAN QUASI-LIKELIHOOD DALAM MODEL LINEAR 1)

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

MODEL REGRESI LOGISTIK BINER DENGAN METODE PENALIZED MAXIMUM LIKELIHOOD. Edi Susilo, Anna Islamiyati, Muh. Saleh AF. ABSTRAK

Non Linear Estimation and Maximum Likelihood Estimation

III. METODE PENELITIAN. Penelitian ini dilaksanakan di SMP Negeri 19 Bandar Lampung yang terletak di

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

PEMODELAN JUMLAH KEMATIAN BAYI DI KOTA PADANG TAHUN 2013 DAN 2014 DENGAN PENDEKATAN REGRESI BINOMIAL NEGATIF

PENERAPAN METODE PENDUGAAN AREA KECIL (SMALL AREA ESTIMATION) PADA PENENTUAN PROPORSI RUMAH TANGGA MISKIN DI KABUPATEN KLUNGKUNG

E-Jurnal Matematika Vol. 2, No.3, Agustus 2013, ISSN:

MODEL REGRESI POISSON YANG DIPERUMUM UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

MA4181 MODEL RISIKO Risk is managed, not avoided

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

MA4183 MODEL RISIKO Control your Risk!

ESTIMASI PARAMETER MODEL REGRESI ZERO ADJUSTED INVERSE GAUSSIAN (ZAIG) UNTUK MENENTUKAN BESAR KLAIM

PENERAPAN REGRESI ZERO INFLATED POISSON DENGAN METODE BAYESIAN

statistika untuk penelitian

PERBANDINGAN REGRESI ZERO INFLATED POISSON (ZIP) DAN REGRESI ZERO INFLATED NEGATIVE BINOMIAL (ZINB) PADA DATA OVERDISPERSION

ESTIMASI PARAMETER DISTRIBUSI BINOMIAL NEGATIF-GENERALIZED EKSPONENSIAL (BN-GE) PADA DATA OVERDISPERSI

MASALAH NILAI AWAL ITERASI NEWTON RAPHSON UNTUK ESTIMASI PARAMETER MODEL REGRESI LOGISTIK ORDINAL TERBOBOTI GEOGRAFIS (RLOTG)

Catatan Kuliah. MA4183 Model Risiko

Medan, Juli Penulis

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI DI KOTA SEMARANG MENGGUNAKAN BOOSTSTRAP AGGREGATTING REGRESI LOGISTIK MULTINOMIAL

Informasi Fisher pada Algoritme Fisher Scoring untuk Estimasi Parameter Model Regresi Logistik Ordinal Terboboti Geografis (RLOTG)

PEMAKAIAN VARIABEL INDIKATOR DALAM PEMODELAN. Mike Susmikanti *

APLIKASI MODEL REGRESI POISSON TERGENERALISASI PADA KASUS ANGKA KEMATIAN BAYI DI JAWA TENGAH TAHUN 2007

STATISTIKA UNIPA SURABAYA

STATISTIKA II IT

ESTIMASI PARAMETER MODEL REGRESI POISSON TERGENERALISASI TERBATAS DENGAN METODE MAKSIMUM LIKELIHOOD

SIMULASI INTENSITAS SENSOR DALAM PENDUGAAN PARAMATER DISTRIBUSI WEIBULL TERSENSOR KIRI. Abstract

BAB I PENDAHULUAN. Analisis regresi merupakan suatu metode yang digunakan untuk

Kajian Generalisasi Distribusi Binomial yang Bertipe COM-Poisson dan Sifat-Sifatnya

PERBANDINGAN DISTRIBUSI BINOMIAL DAN DISTRIBUSI POISSON DENGAN PARAMETER YANG BERBEDA

STATISTIKA. Muhamad Nursalman Pendilkom/Ilkom UPI

Statistika Farmasi

E-Jurnal Matematika Vol. 4 (2), Mei 2015, pp ISSN:

Pemodelan Jumlah Kematian Bayi Di Kabupaten Bojonegoro Dengan Menggunakan Metode Analisis Regresi Binomial Negatif

PERBANDINGAN REGRESI METODE ROBUST DENGAN METODE OLS STUDY KASUS PENGARUH INFLASI DAN PDRB TERHADAP PENGANGGURAN TERBUKA DI PROVINSI JAWA TEGAH

PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN

Distribusi probabilitas dan normal. Statisitik Farmasi 2015

MODEL REGRESI PROBIT BIVARIAT

Catatan Kuliah. MA4183 Model Risiko Forecast, assess, and control your risk. Dosen: Khreshna I.A. Syuhada, MSc. PhD.

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

Metode Statistika (STK 211) Pertemuan ke-5

BAB II TINJAUAN PUSTAKA. level, model regresi tiga level, penduga koefisien korelasi intraclass, pendugaan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

IDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI MAHASISWA PASCASARJANA IPB BERHENTI STUDI MENGGUNAKAN ANALISIS CHAID DAN REGRESI LOGISTIK

Transkripsi:

Prosiding Statistika ISSN: 2460-6456 Penerapan Distribusi Zero Inflated Binomial untuk Mengatasi Masalah Overdispersi dalam Data Status Kelulusan Mata Kuliah Pada Mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 Application Of The Zero Inflated Binomial Distribution To Overcome The Problem Of Overdispersion In The Data On The Graduate Status Of The Courses In The Student Of FMIPA UNISBA 2016/2017 Academic Year 1 Sintia Sri Novianti, 2 Nusar Hajarisman 1,2 Prodi Statistika, FakultasMatematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung, Jl. Tamansari No.1 Bandung 40116 Email: 1 sintiasri16.ssn@gmail.com, 2 nusarhajarisman@yahoo.com Abstract. Binary data is the data which values are categorized only with the symbol 1 or 0. In general, binary data will be binomial distributed. Binomial distribution has several assumptions that must be fulfilled, namely random variables that are mutually independent, and the chance of success or constant for each experiment. But in reality often these assumptions are violated, such as the correlation between observations. Which will produce a variance value that is greater than the variance under binomial sampling. Where this is an indication of an overdispersion problem. Overdispersion will be result in invalid variance estimation. Then the solution is using the Zero Inflated Binomial distribution, which is used in the data that contains a lot of zero and has overdispersion problems. In this thesis, will discuss the use of Zero Inflated Binomial distribution on the data of Course Graduation Status in FMIPA UNISBA Students 2016/2017 Academic Year. Parameter estimation is performed using the maximum likelihood method. And calculating the chisquare value is done to see if there is oversids. Estimating parameters by using the distribution Zero Inflated Binomial explains that the distribution is suitable for overcoming the problem of overdispersion in the data on the graduation status of the subjects at the FMIPA UNISBA 2016/2017 Academic Year students. Keywords: Binary data, Distribusi Binomial Overdispersion, Zero Inflated Binomial Distribution, Chi-Kuadrat Abstrak. Data biner adalah data yang nilainya dikategorikan hanya dengan simbol 1 atau 0. Pada umumnya data biner akan berdistribusi binomial. Distribusi binomial memiliki beberapa asumsi yang harus dipenuhi yaitu variabel acak yang saling bebas, dan peluang sukses sama atua konstan untuk setiap percobaan. Namun pada kenyataannya seringkali asumsi tersebut dilanggar, seperti adanya korelasi antar pengamatan. Yang mana akan menghasilkan nilai varians yang lebih besar dari varians dibawah sampling binomial. Dimana hal tersebut merupakan indikasi adanya masalah overdispersi. Overdispersi akan mengakibatkan hasil dari penaksiran varians tidak valid. Maka solusi yang digunakan adalah dengan menggunakan distribusi Zero Inflated Binomial, yang mana distribusi ini digunakan pada data yang berisi banyak nol dan mengalami masalah overdispersi. Dalam skripsi ini, akan membahas penggunaan distribusi Zero Inflated Binomial pada data Status Kelulusan Mata Kuliah Pada Mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017. Penaksiran parameter dilakukan menggunakan metode kemungkinan maksimum. Dan dilakukan perhitungan nilai chi-kuadrat untuk meliat adanya oversidspersi. Penaksiran parameter dengan menggunakan distribusi Zero Inflated Binomial menjelaskan bahwa distribusi tersebut cocok digunakan untuk mengatasi masalah overdispersi pada data status kelulusan mata kuliah pada mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017. Kata kunci: Data biner, Distribusi Binomial, Overdispersi, Distribusi Zero Inflated Binomial, Chi- Kuadrat A. Pendahuluan Data yang biasa dijumpai dalam analisis statistika adalah berupa data biner. Data biner adalah data yang nilainya dikategorikan hanya dengan simbol 1 atau 0. Data biner biasanya akan mengikuti distribusi Bernoulli ketika hanya dilakukan dalam 1 kali percobaan. Tetapi jika percobaan diulang sebanyak n kali maka akan menjadi distribusi Binomial. 136

Penerapan Distribusi Zero Inflated Binomial untuk Mengatasi... 137 Distribusi Binomial memiliki beberapa asumsi yang harus dipenuhi, yaitu variabel acak yang saling bebas, dan peluang sukses sama/konstan untuk setiap pengamatan. Namun jika asumsi tidak terpenuhi, maka akan mengalami overdispersi. Akibatnya, data biasanya menunjukkan varians yang lebih besar daripada varians yang diizinkan oleh model Binomial. Berdasarkan hal tersebut, maka perlu dicari suatu metode statistika yang tepat untuk dapat digunakan dalam menentukan taksiran peluang bagi parameter, dimana ada masalah overdispersi didalamnya. Salah satu cara untuk mengatasi masalah overdispersi dalam data berdistribusi Binomial adalah menggunakan distribusi Zero Inflated Binomial. Pemilihan distribusi ini didasarkan pada karakteristik data yang mana digunakan pada saat data berisi banyak nilai 0. Data yang akan digunakan pada skripsi ini adalah data jumlah mata kuliah yang tidak lulus pada mahasiswa Tahun Akademik 2016/2017 Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung. Berdasarkan latar belakang yang telah diuraikan, maka perumusan masalah dalam makalah ini adalah: 1. Bagaimana mendeteksi masalah overdispersi dalam data status kelulusan mata kuliah pada mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 dengan menggunakan distribusi Binomial 2. Bagaimana mengatasi masalah overdispersi dalam dalam data status kelulusan mata kuliah pada mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 dengan menggunakan distribusi Zero Inflated Binomial B. Landasan Teori Distribusi Binomial Misalkan x 1, x 2,, x n menyatakan respons untuk n buah percobaan yang identik dan saling bebas sedemikian rupa sehingga : P(x i = 1) = π dan P(x i = 0) = 1 π Di sini digunakan label yang sangat umum untuk menyatakan angka 1 sebagai peristiwa sukses dan 0 untuk menyatakan peristiwa gagal. Percobaan yang identik mempunyai makna bahwa peluang sukses π adalah sama untuk setiap percobaan. Sedangkan percobaan yang saling bebas mempunyai makna bahwa {x i } merupakan variabel acak yang saling bebas. Fungsi massa peluang untuk variabel acak x 1, x 2,, x n yang berdistribusi Binomial adalah sebagai berikut : f(x) = ( n x )πx (1 π) n x, untuk x = 0,1,2,, n (1) Dimana koefisien Binomial ( n x ) = n! x!(n x)! n x i Distribusi Binomial untuk X = i=1 mempunyai rata-rata dan varians sebagai berikut: E(X) = n π (2) dan Var(X) = nπ(1 π) (3) Penulisan notasi dari peubah acak X yang berdistribusi Binomial adalah B(X; n, π), artinya peubah acak X berdistribusi Binomial dengan banyak pengulangan eksperimen sebanyak n kali, peluang terjadi peristiwa sukses sebesar π, dan banyak peristiwa sukses terjadi ada sebanyak x. Statistika, Gelombang 2, Tahun Akademik 2017-2018

138 Sintia Sri Novianti, et al. Metode Kemungkinan Maksimum Untuk Parameter Binomial Bagian dari fungsi kemungkinan maksimum yang menyangkut parameter disebut kernel. Oleh karena memaksimumkan fungsi kemungkinan terhadap parameter, maka bagian lainnya menjadi tidak penting untuk dibahas. Untuk mengilustrasikan hal tersebut, perhatikan distribusi Binomial dalam pers.(2.4). Dimana koefisien ( n ) tidak berpengaruh pada maksimum terhadap x parameter π. Jadi, untuk selanjutnya koefisien Binomial dapat diabaikan, dan memperoleh kernel sebagai fungsi kemungkinan. Fungsi kemungkinan Binomial adalah sebagai berikut: n L(π) = i=1 [π x (1 π) n x ] = π x i(1 π) n2 x i (4) Selanjutnya fungsi log-kemungkinan Binomial adalah sebagai berikut : l(π) = ln[π x i(1 π) n2 x i ] = x i ln(π) + (n 2 x i ) ln(1 π) (5) Kemudian, dengan menurunkan terhadap π akan menghasilkan : l(π) = x i (n 2 x i ) = ( x i n 2 π) (6) (π) π (1 π) π(1 π) Bentuk di atas disamakan dengan 0, maka akan memberikan solusi dari persamaan kemungkinan sebagai π = x, proporsi sukses sampel dari n buah percobaan. n Overdispersi Fenomena overdispersi terjadi jika nilai varians yang dihasilkan lebih dari varians pada distribusi Binomial yang berlaku atau Var(x) > nπ(1 π). Overdispersi terjadi pada data yang memiliki korelasi antar pengamatan, atau tidak adanya kebebasan antar pengamatan atau variabel ataupun juga jika terdapat peluang yang berbeda satu sama lain dalam 1 kelompok. Pada kasus Binomial dengan overdispersi dapat ditandai dalam dua momen pertama. Misalkan X adalah variabel acak Binomial yang mewakili jumlah keberhasilan dari uji coba sebanyak n. Kemudian, E(X) = nπ (7) dan Var(X) = n(1 π){1 + ρ 2 (n 1)} (8) dimana π mewakili probabilitas keberhasilan setiap percobaan Bernoulli. Perhatikan bahwa nilai harapan atau rata-rata dari X cocok dengan model Binomial, akan tetapi varians yang diberikan dalam persamaan (8) lebih besar daripada varians yang dimodelkan oleh model Binomial karena faktor {1 + ρ 2 (n 1)} lebih besar dari satu. Variabel acak X dengan mean dan varians, seperti pada persamaan (7) dan (8), dikatakan memiliki overdispersi atau variasi ekstra relatif terhadap model Binomial. Chi-kuadrat Pearson Terdapat sejumlah alternatif untuk mengukur kecocokan model, dan salah satu yang paling populer adalah statistik chi-kuadrat pearson yang didefinisikan sebagai berikut: Volume 4, No. 2, Tahun 2018

Penerapan Distribusi Zero Inflated Binomial untuk Mengatasi... 139 X 2 n = (O i E i ) 2 i=0 (9) E i Dimana O i adalah nilai observasi ke i dan E i adalah frekuensi harapan dari observasi ke i. Pada saat nilai X 2 dibagi dengan derajat bebasnya mempunyai nilai yang lebih besar dari 1, maka akan berarti bahwa distribusi tersebut tidak cocok untuk data dan data memiliki overdispersi. Dengan demikian, dapat dikatakan bahwa statistik X 2 ini digunakan untuk mengukur kecocokan distribusi dan mendeteksi adanya overdispersi. Distribusi Zero Inflated Binomial Distribusi Zero Inflated Binomial merupakan distribusi yang digunakan untuk data yang berisi banyak 0 dan mengalami overdispersi, juga jika data mengikuti distribusi Binomial. Distribusi diskrit yang mendasarinya adalah Binomial(π; n) pada (1), yang diperbaharui menjadi distribusi Zero-inflated Binomial (ZIB) dengan fungsi probabilitas Pr(X = x) = ω( n x )πx (1 π) n x + (1 ω)i(x = 0), x = 0, 1, 2,, n (10) dimana I(.) adalah fungsi indikator atau fungsi penghubung. Perhatikan bahwa distribusi ZIB adalah gabungan dari dua distribusi, yaitu Binomial (π; n) dengan probabilitas "ω", dan distribusi indikator dengan probabilitas "1-ω". Di bawah parameterisasi π = P + θ(1 P) dan ω = P dengan 0 θ 1, fungsi probabilitas (10) dapat ditulis sebagai π P θ(1 P) Pr(X = x) = Pr(X = x) + I(x = 0), x= 0, 1,, n (11) P+θ(1 P) P+θ(1 P) dimana X ~ Binomial {P + θ(1 P); n}. Bila θ = 0, persamaan (11) akan menjadi distribusi Binomial (P; n). Di sisi lain, kasus θ = 1 akan menimbulkan distribusi Zero Degenerate. Jika X memiliki fungsi probabilitas seperti pada (11), X akan didistribusikan sebagai distribusi ZIB(P, θ; n). Dapat ditunjukkan bahwa dua momen pertama dari distribusi ZIB adalah E(X) = np (12) dan Var(X) = np(1 P){1 + θ(n 1)} (13) Dengan demikian, distribusi Zero-inflated Binomial memiliki overdispersi yang relatif terhadap distribusi Binomial. Perhatikan bahwa parameter overdispersi θ pada (13) mewakili parameter ρ 2 pada persamaan (8). Deskripsi Data Data yang diperoleh adalah data hasil penilaian mata kuliah pada semester 1 dan 2 mahasiswa FMIPA Universitas Islam Bandung dengan jumlah mahasiswa sebanyak 267 orang. Presentase jumlah mata kuliah yang tidak lulus pada mahasiswa Fakultas MIPA dapat di lihat pada Tabel 1. Tabel 1. Persentase Jumlah Mata Kuliah Yang Tidak Lulus Pada Semester 1 dan Semester 2 Mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 Jumlah Mata kuliah yang tidak lulus 0 1 2 3 Jumlah Mahasiswa 234 26 6 1 Persentase (%) 87,64 9,74 2,25 0,37 Dari Tabel 1 terlihat bahwa dari total 267 mahasiswa fakultas MIPA pada semester 1 dan 2 Tahun Akademik 2016/2017 terdapat 87,64% atau setara dengan 234 Statistika, Gelombang 2, Tahun Akademik 2017-2018

140 Sintia Sri Novianti, et al. mahasiswa yang tidak memiliki mata kuliah yang tidak lulus atau belum tuntas; 9,74% atau setara dengan 26 mahasiswa memiliki 1 mata kuliah yang tidak lulus; 2,25% mahasiswa yang memiliki 2 mata kuliah yang tidak lulus; dan 0,37% mahasiswa yang memiliki lebih dari atau sama dengan 3 mata kuliah yang tidak lulus. Hasil Penaksiran Parameter Dengan Distribusi Binomial Penaksiran parameter dengan menggunakan distribusi Binomial diperoleh dari hasil perhitungan yang akan disajikan pada Tabel 2. Dimana perhitungan dilakukan menggunakan program SAS. Tabel 2. Hasil Penaksiran Parameter Distribusi Binomial Penaksir 0.05119 Galat baku taksiran 0.007787 Db 4 t value 6,57 Pr > t 0,0028 Batas Bawah 0,02957 Batas Atas 0,07281-2 log likelihood 253,3 π Dari hasil di atas didapat nilai taksiran dari π (peluang mata kuliah yang tidak lulus pada semester 1 dan semester 2 mahasiswa Tahun Akademik 2016/2017 FMIPA UNISBA) sebesar 0,05119. Besarnya nilai galat baku taksiran, yang digunakan untuk pengujian hipotesis, untuk π sebesar 0,007787, dan nilai t value sebesar 6,57. Dengan nilai t value sebesar 6,57 didapat nilai Pr > t sebesar 0,0028. Adapun nilai bagi selang kepercayaan dengan batas bawah untuk π sebesar 0,02957 dan nilai batas atas sebesar 0,07281. Hasil Mendeteksi Adanya Overdispersi Untuk memeriksa adanya overdispersi dalam data jumlah mata kuliah yang tidak lulus pada semester 1 dan semester 2 mahasiswa Tahun Akademik 2016/2017 Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Islam Bandung dengan menggunakan distribusi Binommial, maka akan dihitung nilai chi kuadrat dengan menggunakan persamaan (9). Sehingga didapat nilai frekuensi harapan dan chi-kuadrat seperti yang disajikan pada Tabel 3. Volume 4, No. 2, Tahun 2018

Penerapan Distribusi Zero Inflated Binomial untuk Mengatasi... 141 Tabel 3. Nilai Frekuensi Harapan dan Chi-Kuadrat dari Distribusi Binomial x O i π (X = x) E i = n. π (X = x) 0 234 0,8764 228,0628 1 26 0,0959 36,91017 2 6 0,0255 1,991207 3 1 0,0023 0,035807 χ 2 37,41362 Db 2 χ 2 / db 18,70681 Berdasarkan Tabel 4.3. dapat dilihat pada distribusi Binomial dengan jumlah observasi ketika t = 0 adalah sebesar 234 dan nilai peluang (π) sebesar 0,8764 akan menghasilkan nilai frekuensi harapan (E i ) sebesar 228,0628. Yang artinya dari 234 mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 yang diketahui memperoleh nilai lulus semua pada mata kuliah semester 1 dan semester 2, dengan menggunakan distribusi Binomial dengan nilai peluang sebesar 0,8764 ditaksir ada 228,0628 mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 memperoleh nilai lulus semua pada mata kuliah semester 1 dan semester 2. Didapat nilai χ 2 (2) dari distribusi Binomial sebesar 18,70681 yang berarti tedapat overdispersi pada data karena nilai χ 2 (2) > 1. Sehingga distribusi Binomial tidak cocok untuk data jumlah mata kuliah yang tidak lulus pada semester 1 dan semester 2 Mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017. Hasil Penaksiran Parameter Dengan Distribusi Zero Inflated Binomial Penaksiran parameter dengan menggunakan distribusi Zero Inflated Binomial diperoleh dari hasil perhitungan yang akan disajikan pada Tabel 4. Dimana perhitungan dilakukan menggunakan program SAS. Tabel 4. Hasil Penaksiran Parameter Distribusi Zero Inflated Binomial P θ Penaksir 0.05119 0.1672 Galat baku taksiran 0.008995 0.07620 Db 4 4 t value 5,69 5,37 Pr > t 0,0047 0,0058 Batas Bawah 0.02621 0.1973 Batas Atas 0.07616 0,6204-2 log likelihood 239,9 Statistika, Gelombang 2, Tahun Akademik 2017-2018

142 Sintia Sri Novianti, et al. Dari hasil di atas didapat nilai taksiran dari P (peluang mata kuliah yang tidak lulus pada semester 1 dan semester 2 mahasiswa Tahun Akademik 2016/2017 FMIPA UNISBA) sebesar 0,05119 dan nilai penaksir untuk θ (korelasi antara satu mata kuliah dengan mata kuliah yang lain pada seorang mahasiswa) pada distribusi Zero Inflated Binomial sebesar 0,1672. Besarnya nilai galat baku taksiran, yang digunakan untuk pengujian hipotesis, untuk P sebesar 0,008995, dan nilai galat baku taksiran untuk θ pada distribusi Zero Inflated Binomial sebesar 0,07620. Didapat pula nilai t value sebesar 5,69 dan Pr > t sebesar 0,0047 untuk P, dan nilai t value sebesar 5,37 dan Pr > t sebesar 0,058 untuk θ pada distribusi Zero Inflated Binomial. Nilai-nilai tersebut dapat digunakan untuk pengujian hipotesis bagi parameter-parameter π dan θ. Adapun nilai bagi selang kepercayaan dengan batas bawah untuk P sebesar 0,02621 dan nilai batas atas sebesar 0,07616. Dan Nilai batas bawah untuk θ pada distribusi Zero Inflated Binomial sebesar 0,01973 dan nilai batas atas sebesar 0,6204. Setelah dilakukan penaksiran dengan menggunakan distribusi Binomial dan distribusi Zero Inflated Binomial, didapat nilai penaksir peluang baik menggunakan distribusi Binomial maupun distribusi Zero Inflated Binomial sebesar 0,5119. Karena besarnya nilai penaksir peluang bagi kedua distribusi sama besar, maka untuk melihat adanya perbedaan antara distribusi Binomial dan distribusi Zero Inflated Binomial akan dilihat perbandingan antara nilai selisih dari -2 log likelihood antara kedua distribusi dengan nilai χ 2. Sehigga diperoleh hasil sebagai berikut : 1;0,05 D = ( 2 log likelihood(binomial)) ( 2 log likelihood(zero Inflated Binomial)) D = 253,3 239,9 = 13,4 Dengan nilai χ 2 1;0,05 = 3,84146, maka terlihat bahwa nilai D > χ2. Hal ini 1;0,05 menunjukkan bahwa terdapat perbedaan antara distribusi Binomial dan distribusi Zero Inflated Binomial. Pengujian Hipotesis bagi Parameter P dan θ Terdapat 2 buah parameter yang didapat pada distribusi Zero Inflated Binomial, yaitu P dan θ. Akan dilakukan pengujian apakah parameter-parameter tersebut signifikan atau tidak signifikan secara statistik dengan menggunakan uji t. a. Untuk P pada distribusi Zero Inlfated Binomial dengan Hipotesis sebagai berikut: H 0 P = 0; peluang seorang mahasiswa Tahun Akademik 2016/2017 FMIPA UNISBA memperolah nilai mata kuliah tidak lulus pada semester 1 dan 2 dari distribusi Zero Inflated Binomial sama dengan nol H 1 P 0; peluang seorang mahasiswa Tahun Akademik 2016/2017 FMIPA UNISBA memperolah nilai mata kuliah tidak lulus tidak lulus mata kuliah pada semester 1 dan 2 dari distribusi Zero Inflated Binomial tidak sama dengan nol Dengan statistika uji pada α = 0,05 dengan nilai t = 0,05119 0,0088995 Volume 4, No. 2, Tahun 2018 = 5,69 dan diperoleh nilai Pr > t = 0,0047. nilai penaksir P Galat baku taksiran = Dimana kriteria uji: tolak H 0 jika nilai Pr > t < α. Sehingga didapat kesimpulan, H 0 ditolak karena 0,0047 < α, yang artinya bahwa peluang seorang mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 memperolah nilai mata kuliah tidak lulus pada semester 1 dan 2 dari distribusi Zero Inflated Binomial tidak sama dengan nol dengan α = 5%.

Penerapan Distribusi Zero Inflated Binomial untuk Mengatasi... 143 b. Untuk θ pada distribusi Zero Inflaetd Binomial dengan Hipotesis sebagai berikut: H 0 θ = 0, tidak ada hubungan antara satu mata kuliah dengan mata kuliah yang lain dari seorang mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 H 1 θ 0, ada hubungan antara satu mata kuliah dengan mata kuliah yang lain dari seorang mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 Dengan statistika uji pada α sebesar 0,10 dengan nilai t = 0,1672 0,07620 = 5,37 dan diperoleh nilai Pr > t sebesar 0,0058. nilai penaksir θ Galat baku taksiran = Dimana kriteria uji: tolak H 0 jika nilai Pr > t < α. Sehingga didapat kesimpulan, H 0 ditolak karena 0,0058 < α, yang artinya ada hubungan antara satu mata kuliah dengan mata kuliah yang lain dari seorang mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 dengan α = 10%. Hasil Mendeteksi Overdispersi Pada Distribusi Zero Inflated Binomial Untuk memastikan apakah dengan menggunakan distribusi Zero Inflated Binomial data jumlah mata kuliah yang tidak lulus pada semester 1 dan semester 2 mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 sudah tidak memiliki overdispersi, maka akan dihitung nilai chi kuadrat dengan menggunakan persamaan (9). Sehingga didapat nilai Frekuensi harapan dan chi-kuadrat seperti yang disajikan pada Tabel 5. Tabel 5. Nilai Frekuensi Harapan dan Chi-Kuadrat dari Distribusi Zero Inflated Binomial X O i π (X = x) E i = n. π (X = x 0 234 0,8542 234 1 26 0,1382 25,60147 2 6 0,00746 6,797038 3 1 0,00013 0,601524 χ 2 0,363634 db 1 χ 2 / db 0,,363634 Dari Tabel di atas dapat dilihat dengan jumlah observasi ketika x = 0 adalah sebesar 234 dan nilai peluang (π) sebesar 0,8542 akan menghasilkan nilai frekuensi harapan (E i ) sebesar 234. Yang artinya dari 234 mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 yang diketahui memperoleh nilai lulus semua pada mata kuliah semester 1 dan semester 2, dengan menggunakan distribusi Binomial dengan nilai peluang sebesar 0,8542 ditaksir ada 234 mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 memperoleh nilai lulus semua pada mata kuliah semester 1 dan semester 2. Dengan menggunakan distribusi Zero Inflated Binomial nilai χ 2 (1) menjadi sebessar 0,36 yang mana lebih kecil dari 1, sehingga memiliki arti bahwa dengan menggunakan distribusi Zero Inflated Binomial data tidak memiliki overdispersi dan distribusi Zero Inflated Binomial lebih cocok untuk digunakan pada data tersebut. Statistika, Gelombang 2, Tahun Akademik 2017-2018

144 Sintia Sri Novianti, et al. Nilai Peluang Distribusi Zero Inflated Binomial Untuk melihat nilai taksiran peluang dari distribusi Zero Inflated Binomial, maka akan disajikan Tabel 6. yang berisi nilai peluang untuk setiap x dengan menggunakan distribusi Binomial dan distribusi Zero Inflated Binomial. Tabel 6. Nilai Peluang Untuk Setiap x dengan Menggunakan Distribusi Zero Inflated Binomial Volume 4, No. 2, Tahun 2018 x Zero Inflated Binomial 0 0,861282441 1 0,090846735 2 0,036760081 3 0,011110743 Dilihat dari tabel di atas, didapat bahwa pada saat t semakin besar maka nilai peluang baik pada distribusi Zero Inflated Binomial semakin kecil. Hal ini menunjukkan bahwa dengan menggunakan distribusi Zero Inflated Binomial, peluang sukses bahwa mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 memperoleh nilai mata kuliah tidak lulus akan semakin kecil seiring bertambahnya jumlah mata kuliah yang diambil. Dapat dilihat pula, dengan menggunakan distribusi Zero Inflated Binomial peluang mahasiswa FMIPA UNISBA Tahun Akademik 2016/2017 memperoleh 1 nilai mata kuliah yang tidak lulus sebesar 0,090846735. C. Kesimpulan dan Saran Kesimpulan 1. Setelah dilakukan penaksiran peluang menggunakan distribusi Binomial didapat taksiran peluang sebesar 0,5119. Tetapi pada saat dilakukan perhitungan nilai χ 2, didapat nilai χ 2 (2) pada distribusi Binomial sebesar 18,70681 yang berarti tedapat overdispersi pada data dengan distribusi Binomial karena χ 2 (2) > 1. Yang artinya terdapat masalah overdispersi pada data status kelulusan mahasiswa FMIPA UNISBA pada semester 1 dan semester 2 Tahun Akademik 2016/2017 yang mengikuti distribusi Binomial, sehingga distribusi ini tidak cocok untuk data tersebut. 2. Setelah menggunakan penaksiran peluang dengan distribusi Zero Inflated Binomial didapat nilai taksiran untuk P atau peluang sukses sebesar 0,5119 dan nilai taksiran untuk θ sebesar 0,1672. Dilakukan pula pendeteksian overdispersi dengan menghitung nilai χ 2 untuk meyakinkan bahwa distribusi Zero Inflated Binomial memang cocok untuk data status kelulusan mahasiswa FMIPA UNISBA pada semester 1 dan semester 2 Tahun Akademik 2016/2017. Didapat nilai χ 2 (1) sebesar 0,36 yang mana lebih kecil dari 1, sehingga tidak terdapat masalah overdispersi pada data status kelulusan mahasiswa FMIPA UNISBA pada semester 1 dan semester 2 Tahun Akademik 2016/2017 yang mengikuti distribusi Zero Inflated Binomial dan distribusi Zero Inflated Binomial lebih cocok untuk digunakan pada data tersebut. Karena setelah dilakukan penaksiran dengan menggunakan distribusi Binomial dan distribusi Zero Inflated Binomial, didapat nilai penaksir peluang sebesar 0,5119. Maka untuk melihat adanya perbedaan antara distribusi Binomial dan distribusi Zero Inflated Binomial dihitung nilai perbandingan antara nilai selisih dari -2 log likelihood antara kedua distribusi dan didapat bahwa nilai D > χ 2. Hal ini menunjukkan bahwa terdapat 1;0,05 perbedaan antara distribusi Binomial dan distribusi Zero Inflated Binomial.

Penerapan Distribusi Zero Inflated Binomial untuk Mengatasi... 145 Saran 1. Selain distribusi Zero Inflated Binomial, masih banyak distribusi lain yang dapat digunakan sebagai solusi untuk mengatasi masalah overdispersi dalam data biner seperti distribusi Random-Clumped Binomial, distribusi Beta-Binomial, dan distribusi A Generalized of The Binomial. Untuk itu para pembaca dapat menggunakan distribusi-distribusi tersebut yang sesuai dengan karakteristik data dalam mengatasi masalah overdispersi. 2. Dalam skripsi ini penulis tidak membahas model, sehingga dapat diimplementasikan kedalam model dan dapat dilihat faktor-faktor apa saja yang berpengaruh terhadap model. Daftar Pustaka Agresti,A. (1990). Categorical Data Analysis. New York: John Wiley and Sons. Collet, D. (1991). Modeling Binary Data. London: Champman and Hall. Hajarisman, N. (1998), Kajian Perbandingan Model Regresi Beta-Binomial dengan Model Regresi Logistik dan Penerapannya untuk Menduga Pola Kelulusan Mahasiswa TPB-IPB. Hajarisman, N. (2009), Analisis Data Kategorik. Bandung: Pusat Penerbitan Unisba. Kusuma, Komalasari, dan Hadijati. 2013. Model Regresi Zero Inflated Poisson Pada Data Overdispersion. https://ojs.unud.ac.id/index.php/jmat/article/view/16570/10863. Diakses Pada Tanggal 2 Mei 2018. McCullagh, P., and J.A. Nelder (1989). Generalized Linear Models. (Second Edition).New York: Chapman and Hall. Wilson Morel, Jorge G., and Neerchal, Nagaraj K. (2011). Overdispersion Models in SAS. Cary, NC, USA: SAS Institute Inc. Sunendiari, S. (2012), Statistika Matematika II. Bandung: Pusat Penerbitan Unisba. Statistika, Gelombang 2, Tahun Akademik 2017-2018