Regresi Logistik 4.1 INTERPRETING THE LOGISTIC REGRESSION MODEL 4.2 INFERENCE FOR LOGISTIC REGRESSION

dokumen-dokumen yang mirip
Kasus. Survey terhadap remaja usia tahun apakah pernah melakukan kerja paruh waktu (part-time)??

STK511 Analisis Statistika. Pertemuan 12 Nonparametrik-Kategorik-Logistik

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

Sering dibahas. Asosiasi 2 peubah Y Z

Tabel Kontingensi 2x2 (4)

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEPUTUSAN KONSUMEN MEMBELI SUATU PRODUK DENGAN METODE ANALISIS REGRESI LOGISTIK ORDINAL

Tabel Kontingensi 2x2 (4)

Regresi Logistik Nominal dengan Fungsi Hubung CLOGLOG

III. METODE PENELITIAN. Penelitian ini menggunakan data primer dan data sekunder. Data primer merupakan

BAB III METODE PENELITIAN

MAKALAH REGRESI LOGISTIK DAN REGRESI DENGAN VARIABLE DUMMY

III. METODOLOGI PENELITIAN. penelitian ini, penulis menggunakan dua sumber data, yaitu :

BAB IV HASIL DAN PEMBAHASAN

BAB II TINJAUAN PUSTAKA

ANALISIS REGRESI LOGISTIK UNTUK MENGETAHUI FAKTOR FAKTOR YANG MEMPENGARUHI FREKUENSI KEDATANGAN PELANGGAN DI PUSAT PERBELANJAAN X

BAB III METODE PENELITIAN. Jenis penilitian yang digunakan dalam penelitian ini merupakan penelitian

Non Linear Estimation and Maximum Likelihood Estimation

Generalized Ordinal Logistic Regression Model pada Pemodelan Data Nilai Pesantren Mahasiswa Baru FMIPA Universitas Islam Bandung Tahun 2017

Model Regresi Binary Logit (Aplikasi Model dengan Program SPSS)

BAB III LANDASAN TEORI. A. Regresi

ANALISIS REGRESI LOGISTIK ORDINAL PADA FAKTOR-FAKTOR BERPENGARUH TERHADAP PENYAKIT MATA KATARAK BAGI PASIEN PENDERITA DI KLINIK MATA UTAMA GRESIK

UKURAN ASOSIASI DALAM EPIDEMIOLOGI. Putri Handayani, M. KKK

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI REGRESI LOGISTIK MULTINOMIAL

MODEL REGRESI LOGISTIK BINER UNTUK MENENTUKAN FAKTOR YANG BERPENGARUH TERHADAP ANAK PUTUS SEKOLAH DI SULAWESI TENGAH

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Inferensia Statistik parametrik VALID?? darimana sampel diambil

PENERAPAN ANALISIS REGRESI LOGISTIK PADA PEMAKAIAN ALAT KONTRASEPSI WANITA

BINARY LOGISTIC REGRESSION (BLR) TERHADAP STATUS BEKERJA DI KOTA SURABAYA

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB III METODOLOGI PENELITIAN DAN DATA

BAB IV ANALISIA HASIL DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

REGRESI LOGISTIK (LOGISTIC REGRESSION)

BAB III METODOLOGI PENELITIAN. memilih sampel seluruh perusahaan di BEI periode adalah karena

Tabel Kontingensi 2x2 (3)

Tabel Kontingensi 2x2 (3) Rasio Odds dan Uji Kebebasan Khi- Kuadrat

BAB IV ANALISA HASIL DAN PEMBAHASAN. Tabel 4.1. Pada table 4.1 diatas menunjukan bahwa hasil uji statistik deskriptif untuk

Uji statistik multivariat digunakan untuk menguji

BAB IV HASIL PENGUJIAN. Pada penelitian ini, peneliti menggunakan sampel perusahaan manufaktur

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

IV. METODE PENELITIAN

BAB III METODE PENELITIAN. Berdasarkan permasalahan dan hipotesis penelitian, penelitian ini

BAB III METODA PENELITIAN. Dalam penelitian ini digunakan variabel-variabel untuk melakukan analisis data.

ANALISIS PENGARUH STATUS BEKERJA TERHADAP JENIS KELAMIN DAN UMUR DENGAN PENDEKATAN BINARY LOGISTIC REGRESSION

BAB III METODOLOGI PENELITIAN. Sakit At-Turrots Al-Islamy, PKU Muhammadiyah Gamping, Puskesmas

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

10 Departemen Statistika FMIPA IPB

BAB 3 METODE PENELITIAN

BAB III METODE PENELITIAN. Penelitian ini menggunakan pendekatan kuantitatif untuk menjawab

BAB III REGRESI TERSENSOR (TOBIT) Model regresi yang didasarkan pada variabel terikat tersensor disebut

MODEL REGRESI LOGISTIK BINER DENGAN METODE PENALIZED MAXIMUM LIKELIHOOD. Edi Susilo, Anna Islamiyati, Muh. Saleh AF. ABSTRAK

DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB III METODOLOGI PENELITIAN

PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA

Gambaran Duplikasi Penomoran Rekam Medis. Gambaran Kualifikasi Pendidikan. Gambaran Pengetahuan. Statistics pemberian nomor. N Valid 60.

(R.2) KAJIAN PREDIKSI KLASIFIKASI OBYEK PADA VARIABEL RESPON BINER

BAB III METODE PENELITIAN

EKO ERTANTO PEMBIMBING

Analisis Faktor-Faktor yang Mempengaruhi Tingkat Kelahiran di Kabupaten Brebes dengan Pendekatan Regresi Logistik Biner

BAB IV HASIL DAN PEMBAHASAN

Regresi Logistik Binomial, Model untuk Toksisitas Logam Berat Timbal Pb terhadap Larva Udang Vannamae

BAB III METODOLOGI PENELITIAN

BAB IV ANALISIS DATA DAN PEMBAHASAN. mahasiswa. Setiap responden mempunyai karakteristik yang berbeda. Oleh

BAB III METODE PENELITIAN. menyebabkan, kebutuhan pangan tidak hanya sebatas produk pelengkap dengan

BAB V HASIL DAN PEMBAHASAN

BAB II TINJAUAN PUSTAKA

BAB III METODOLOGI PENELITIAN

Pertemuan 10 STATISTIKA INDUSTRI 2. Multiple Linear Regression. Multiple Linear Regression. Multiple Linear Regression 19/04/2016

Analisis Data Kategorikal

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI DI KOTA SEMARANG MENGGUNAKAN BOOSTSTRAP AGGREGATTING REGRESI LOGISTIK MULTINOMIAL

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. Hasil pemilihan sampel dengan metode purposive sampling terhadap

Analisis Chi-Square (x 2 )

BAB IV ANALISIS HASIL DAN PEMBAHASAN. Proses pemilihan sampel menggunakan metode sampel bertujuan (purposive sampling), dimana

10+ Departemen Statistika FMIPA IPB

BAB IV ANALISIS DATA

KETEPATAN KLASIFIKASI KEIKUTSERTAAN KELUARGA BERENCANA MENGGUNAKAN REGRESI LOGISTIK BINER DAN REGRESI PROBIT BINER

STK 511 Analisis statistika. Materi 7 Analisis Korelasi dan Regresi

BAB IV ANALISIS HASIL DAN PEMBAHASAN

Saintia Matematika ISSN: Vol. 02, No. 04 (2014), pp

BAB III METODE PENELITIAN

di masa yang akan datang dilihat dari aspek demografi dan kepuasannya. PENDAHULUAN

BAB III METODE PENELITIAN. hipotesis. Pengujian hipotesis dilakukan pada variabel Profitabilitas,

BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI

E-Jurnal Matematika Vol. 2, No.3, Agustus 2013, ISSN:

GENERALIZED LINEAR MODELS (GLM) UNTUK DATA ASURANSI DALAM MENENTUKAN HARGA PREMI

Pemodelan. The model should be complex enough to fit the data well, but simpler models are easier to interpret

Lampiran Hasil Output SPSS. Statistics. Skor Kepuasan Pasien Rawat Jalan. Valid 200 Missing 0 Mean Skor Kepuasan Pasien Rawat Jalan Frequenc y

Analisis Regresi Logistik Ordinal Pada Tingkat Kepuasaan Pengguna Jasa Terhadap Pelayanan di Bandara Internasional Sam Ratulangi Manado

Kegiatan Anak Usia Tahun di Jawa Timur Menggunakan Regresi Logistik Multinomial: Suatu Peranan Urutan Kelahiran

Nama : Farisah Hasniar NPM : Fakultas : Ekonomi Jurusa : Akuntansi Dosen Pembimbing : Dr. Widyatmini

Sem 5-4. Garis Besar Rencana Pembelajaran (GBRP)

BAB III PEMBAHASAN. extended untuk mengatasi nonproportional hazard dan penerapannya pada kasus

(Studi Kasus Siswa SMP Kelas VIII di SMPN 1 Tajinan Malang) *Wuri Graita Gayuh Palupi *Abadyo

Transkripsi:

Respon Biner

Regresi Logistik 4.1 INTERPRETING THE LOGISTIC REGRESSION MODEL 4.2 INFERENCE FOR LOGISTIC REGRESSION

Model regresi logistik menggunakan peubah penjelas, baik kategorik atau kontinu, untuk memprediksi peluang dari hasil yang spesifik. Dengan kata lain, regresi logistik dirancang untuk menggambarkan peluang yang terkait dengan nilainilai peubah respon.

Kurva regresi logistik dan regresi linier

β>0 maka kurva akan naik β<0 maka kurva akan turun Jika β= 0 maka nilai π (x) tetap pada berapapun nilai x kurva akan menjadi garis horisontal

4.1 INTERPRETING THE LOGISTIC REGRESSION MODEL X Peubah penjelas kuantitatif Y Peubah respon biner π(x) peluang sukses peubah X Model Logit (log odds)

Interpretasi β Odds akan meningkat secara multiplikatif sebesar e β untuk setiap kenaikan 1 unit x e β rasio odds RasioOdds odds( X x 1) odds( X x) Not familiar Interpretasi alternatif logit akan meningkat sebesarβ untuk setiap kenaikan 1 cm x

What Is an Odds Ratio? An odds ratio indicates how much more likely, with respect to odds, a certain event occurs in one group relative to its occurrence in another group. Example: How much more likely are females to purchase 100 dollars or more in products compared to males?

4.1.1 Linear Approximation Interpretations β 0, kurva datar horizontal β = 0, Y bebas terhadap X Β > 0, kurva π(x) membentuk fkp sebaran logistik Kemiringan curam terjadi pada x yang π (x) = 0,50. Nilai x tersebut berhubungan dengan p arameter regresi logistik dengan x =-α / β. nilai x ini disebut tingkat median efektif (EL 50 ). Ini merupakan tingkat di mana masing-masing Hasil memiliki kesempatan 50%.

ilustrasi 4.1.2 Horseshoe Crabs: Viewing and Smoothing a Binary Outcome The study investigated factors that affect whether the female crab had any other males, called satellites, residing nearby her. The response outcome for each female crab is her number of satellites. An explanatory variable thought possibly to affect this was the female crab s shell width, which is a summary of her size. In the sample, this shell width had a mean of 26.3 cm and a standard deviation of 2.1 cm. Y indicate whether a female crab has any satellites (other males who could mate with her). That is, Y = 1 if a female crab has at least one satellite, and Y = 0 if she has no satellite.we first use the female crab s width (in cm) as the sole predictor.

ilustrasi Suatu penelitian mengenai faktor-faktor yang mempengaruhi banyaknya satellite yang dipunyai kepiting betina (Y) Y= 1 jika kepiting betina memiliki paling tidak 1 satellite Y=0 jika tidak memiliki satellite. X= lebar cangkang kepiting betina (dalam cm)

Data yang belum dikelompokkan

Data crab; input width sat; datalines; 28.3 1 26.0 1 25.6 0... 24.5 0 ; proc logistic data=crab descending; model sat=width/expb; run; Syntax SAS

Output At the minimum width in this sample of 21.0 cm, the estimated probability is exp( 12.351 + 0.497(21.0))/[1 + exp( 12.351 + 0.497(21.0))] = 0.129 At the maximum width of 33.5 cm, the estimated probability equals exp( 12.351 + 0.497(33.5))/[1 + exp( 12.351 + 0.497(33.5))] = 0.987

lebar minimum x= 21 cm, = 0.129 lebar maksimum x= 33.5 cm = 0.987

Interpretasi Output Dugaan π(x) =0.5 saat Dugaan odds = exp x ˆ / ˆ 12.351/ 0.497 24.8 ˆ exp 0.497 1. 64 kepiting betina yang memiliki lebar 1 cm lebih besar, memiliki kecenderungan 1.64 kali mempunyai satelit

Pada mean sampel lebar 26,3 cm, π (x) = 0,674. (Bab 4.1.1), perubahan kenaikan peluang pada titik mean ˆ ˆ x 1 ˆ x 0.497 (0.674) (0.326) = 0.11 Untuk kepiting betina dengan lebar badan dekat lebar rata-rata, peluang kenaikan satelit pada tingkat 0,11 per 1 cm peningkatan lebar. tingkat dugaan perubahan terbesar pada nilai x (24,8) di mana π (x) = 0,50; peluang diperkirakan meningkat pada tingkat (0,497) (0,50) (0,50) = 0,12 per 1 cm peningkatan lebar

Berbeda dengan model peluang linier, model regresi logistik memungkinkan laju perubahan bervariasi sebagaimana perubahan x

Regression Fit Model paling sederhana untuk interpretasi adalah model peluang π(x) = α + βx. Menggunakan pendekatan OLS (software GLM dengan asumsi respon normal dengan fungsi penghubung identitas) menghasilkan model

proc genmod data=crab; model sat=width/ dist = nor link = identity lrci; run; Proc GLM

4.1.3 Horseshoe Crabs: Interpreting the Logistic Regression Fit π(x) adalah peluang kepiting betina memiliki satelit dengan lebar badan x cm Dugaan peluang (adanya) satelit akan meningkat 0.092 untuk setiap peningkatan 1 cm lebar badan kepiting Interpretasi lebih sederhana, namun tidak sesuai untuk nilai ekstrim Misalkan pada contoh ini lebar badan maksimal 33.5 cm. Dugaan peluangnya= 1.766 + 0.092(33.5) = 1.3.

Grouping Untuk mendapatkan gambar dengan bentuk yang lebih jelas, dilakukan pengelompokan untuk lebar badan kepiting betina sbb: Lalu hitung rataan contoh di masing-masing kategori

Figure 4.2 contains eight dots representing the sample proportions of female crabs having satellites plotted against the mean widths for the eight categories.

4.1.4 Odds Ratio Interpretation Odds Odds sukses (respon =1) x 26.3 ; ˆ 0.674 1 0.674 x 27.3 ; ˆ x 0.773 0.773; odds 3. 1 773 3.4 RasioOdds 1.64 26.3 2.07 x 0.674; odds 2. 07 40 However, this is a 64% increase;

4.1.5 Logistic Regression with Retrospective Studies Regresi logistik juga dapat digunakan pada data hasil studi restrospektif Peubah X yang acak (bukan peubah Y) Dapat digunakan bila salah satu respon kategori jarang terjadi, dan sebuah studi prospektif mungkin memiliki terlalu sedikit kasus untuk untuk dapat menduga pengaruh dari prediktor dengan baik.

Retros pective Y 1(kasus) dan 0(kontrol) X diamati Case-control biomedis Odds Ratio

Inferensia Regresi Logistik

4.2 INFERENCE FOR LOGISTIC REGRESSION 4.2.1 Binary Data can be Grouped or Ungrouped 254 subjects reported snoring every night, of whom 30 had heart disease

Data crab grup data crab2; input width y n; cards; 22.69 5 14 23.84 4 14 24.78 17 28 25.84 21 39 26.79 15 22 27.74 20 24 28.67 15 18 30.41 14 14 ; proc logistic data=crab2; model y/n=width/influence stb expb; output out=predict p=pi_hat lower=lcl upper=lcl; run;

confidence interval for effect A large-sample Wald confidence interval for the parameter β in the logistic regression model, logit[π(x)] = α + βx, is ˆ z 2 SE

Ilustrasi data kepiting Selang kepercayaan 95% untuk β adalah 0.497± 1.96(0.102) = [0.298, 0.697]

Selang kepercayaan berdasarkan likelihood ratio = (0.308, 0.709). Interval likelihood ratio untuk pengaruh pada odds setiap kenaikan 1 cm lebar cangkang = (e 308, e 709 )= (1.36, 2.03). Berarti setiap kenaikan 1 cm lebar cangkang, akan menaikkan odds satellite paling sedikit 1.36 kali dan paling banyak 2 kali

Hypothesis Testing about Effect of X Test for parameter model ( ). Simultanious test G-test Partial test Wald-test

Uji Simultan Statistik uji-g adalah uji rasio kemungkinan (likelihood ratio test) yang digunakan untuk menguji peranan variabel penjelas di dalam model secara bersama-sama (Hosmer & Lemeshow, 1989). Rumus umum uji-g untuk menguji hipotesis : H0 : 1 = 2 = = k = 0 H1 : minimal ada satu yang tidak sama dengan 0 adalah likelihood G 2ln likelihood tan pa dengan peubah peubah bebas bebas Statistik G ini, secara teoritis mengikuti sebaran 2 dengan derajat bebas k.

Partial Test Sementara itu, uji Wald digunakan untuk menguji parameter i secara parsial. Hipotesis yang diuji adalah: H0 : i = 0 H1 : i 0 Formula statistik Wald adalah: Secara teori, statistik Z ini mengikuti sebaran normal baku jika H0 benar. Z ˆ i SE( ˆ ) i Atau menggunakan statistik uji mengikuti sebaran dengan db=1 yang

Uji Hipotesi Data Kepiting Hipotesis H 0 : = 0 vs H 1 : 0 Statistik Uji : Z= 0.497/0.102 = 4.9. (This shows strong evidence of a positive effect of width on the presence of satellites (P <0.0001)) The equivalent chi-squared statistic, z 2 = 23.9, has df = 1. Software reports that the maximized log likelihoods equal L0 = 112.88 under H0: β = 0 and L1 = 97.23 for the full model. The likelihood-ratio statistic equals 2(L0 L1) = 31.3, with df = 1. This also provides extremely strong evidence of a width effect (P < 0.0001).

Confidence Intervals for Probabilities Ilustrasi dengan memperkirakan probabilitas dari satelit untuk kepiting betina lebar x = 26,5, yang dekat lebar rata-rata Persamaan regresi logistiknya: πˆ = exp( 12.351 + 0.497(26.5))/[1 + exp( 12.351 + 0.497(26.5))] = 0.695 Output software: selang kepercayaan 95% untuk probability sesungguhnya (0.61, 0.77).

Kenapa menggunakan model untuk menduga peluang??

X=26,5 cm 6 kepiting, 4 memiliki satelit Binom p= 4/6=0.67 SK 95% untuk π(x) : (0.22, 0.96)

Reality is more complicated. In practice, any model will not exactly represent the true relationship between π(x) and x.

Ilustrasi Menggunakan SAS

Data CHD; input age $ CHD @@; cards; <=55 1 <=55 1 >55 1 >55 0 >55 0 <=55 1 <=55 0 >55 1 >55 0 >55 0 <=55 1 <=55 0 >55 1 >55 0 >55 0 <=55 1 <=55 0 >55 1 >55 0 >55 0 <=55 1 <=55 0 >55 1 >55 0 >55 0 <=55 1 <=55 0 >55 1 >55 0 >55 0 <=55 1 <=55 0 >55 1 >55 0 >55 0 <=55 1 >55 1 >55 1 >55 0 >55 0 <=55 1 >55 1 >55 1 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 <=55 1 >55 1 >55 0 >55 0 >55 0 ;

proc freq data=chd; tables age; tables CHD; tables age*chd/nopercent nocol norow expected chisq; run; proc logistic data=chd; class age; model chd=age/expb; run;

Tabulasi Silang

Tugas Kelompok Kelompok 1 Prediktor Kategorik Uji Cochran-Mantel Haenszel Uji Kehomogenan Rasio Odd (Bab 4.3) Kelompok 2 (RegLog Berganda) Contoh Regresi Logistik Ganda Pembandingan Model (4.4.1, 4.4.2)

Tugas Kelompok (lanjutan) Kelompok 3 (RegLog Berganda) Prediktor Kuantitatif dalam Regresi Logistik Model dengan Interaksi (Bab 4.4.3, 4.4.4) Kelompok 4 Strategi Pemilihan Model Pemeriksaan Kecocokan Model (Bab 5.1, 5.2)