BAB II TINJAUAN PUSTAKA

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. logistik didasarkan pada pendekatan analisis regresi linear merupakan metode yang

BOOTSTRAP AGGREGATING (BAGGING) REGRESI LOGISTIK ORDINAL UNTUK MENGKLASIFIKASIKAN STATUS GIZI BALITA DI KABUPATEN KLUNGKUNG

METODE BOOTSTRAP AGGREGATING REGRESI LOGISTIK BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI

BAB II TINJAUAN PUSTAKA

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

BAB II TINJAUAN PUSTAKA

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI DI KOTA SEMARANG MENGGUNAKAN BOOSTSTRAP AGGREGATTING REGRESI LOGISTIK MULTINOMIAL

BAB II TINJAUAN PUSTAKA

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

BAB 1 PENDAHULUAN Latar Belakang

ANALISIS PELUANG STATUS GIZI ANAK DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK MULTINOMIAL BERBASIS KOMPUTER

BAB III METODE PENELITIAN

ANALISIS REGRESI LOGISTIK ORDINAL PADA FAKTOR-FAKTOR BERPENGARUH TERHADAP PENYAKIT MATA KATARAK BAGI PASIEN PENDERITA DI KLINIK MATA UTAMA GRESIK

BAB I PENDAHULUAN 1.1 Latar Belakang

MODEL REGRESI LOGISTIK BINER DENGAN METODE PENALIZED MAXIMUM LIKELIHOOD. Edi Susilo, Anna Islamiyati, Muh. Saleh AF. ABSTRAK

Kata Kunci: Model Regresi Logistik Biner, metode Maximum Likelihood, Demam Berdarah Dengue

BAB III PERLUASAN MODEL REGRESI COX PROPORTIONAL HAZARD DENGAN VARIABEL TERIKAT OLEH WAKTU

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI REGRESI LOGISTIK MULTINOMIAL

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman Online di:

BAB II LANDASAN TEORI. landasan pembahasan pada bab selanjutnya. Pengertian-pengertian dasar yang di

ANALISIS PENDUDUK BEKERJA BERDASARKAN SEKTOR PEKERJAAN DAN JAM KERJA MENGGUNAKAN REGRESI PROBIT BIVARIAT DI PROVINSI ACEH

BOOTSTRAP AGGREGATING (BAGGING) REGRESI LOGISTIK ORDINAL UNTUK MENGKLASIFIKASIKAN STATUS GIZI BALITA DI KABUPATEN KLUNGKUNG KOMPETENSI STATISTIKA

PEMODELAN JUMLAH KASUS TETANUS NEONATORUM DENGAN MENGGUNAKAN REGRESI POISSON UNTUK WILAYAH REGIONAL 2 INDONESIA (SUMATERA)

BAB II LANDASAN TEORI

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEPUTUSAN KONSUMEN MEMBELI SUATU PRODUK DENGAN METODE ANALISIS REGRESI LOGISTIK ORDINAL

BAB II TINJAUAN PUSTAKA. level, model regresi tiga level, penduga koefisien korelasi intraclass, pendugaan

Statistika ITS Surabaya

PENERAPAN ANALISIS REGRESI LOGISTIK PADA PEMAKAIAN ALAT KONTRASEPSI WANITA

BAB II KAJIAN TEORI. Analisis survival atau analisis ketahanan hidup adalah metode yang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

REGRESI LOGISTIK UNTUK PEMODELAN INDEKS PEMBANGUNAN KESEHATAN MASYARAKAT KABUPATEN/KOTA DI PULAU KALIMANTAN

BAB III MODEL GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION SEMIPARAMETRIC (GWLRS)

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

Pemodelan Ketahanan Pangan Rumah Tangga Penderita Tuberkulosis Paru Menggunakan Regresi Logistik Biner

Hary Mega Gancar Prakosa Dosen Pembimbing Dr. Suhartono, S.Si, M.Sc Co Pembimbing Dr. Bambang Wijanarko Otok, S.Si, M.

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 : PENDAHULUAN. Millenuim Development Goals (MDGs) adalah status gizi (SDKI, 2012). Status

Generalized Ordinal Logistic Regression Model pada Pemodelan Data Nilai Pesantren Mahasiswa Baru FMIPA Universitas Islam Bandung Tahun 2017

Kata Kunci Keparahan Korban Kecelakaan Lalu Lintas, Model Log Linier, Regresi Logistik Multinomial. H 1 Ada hubungan antara dua variabel yang diamati

Pemodelan Logit, Probit dan Complementary Log-Log pada Studi Kasus Partisipasi Perempuan dalam Pembangunan Ekonomi di Kalimantan Selatan

di masa yang akan datang dilihat dari aspek demografi dan kepuasannya. PENDAHULUAN

IV. METODE PENELITIAN. Penelitian ini dilakukan di Desa Purwasari, Kecamatan Dramaga

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III METODE PENELITIAN

BAB II TINJAUAN PUSTAKA. Ki Hajar Dewantara (Bapak Pendidikan Nasional Indonesia, )

BAB I PENDAHULUAN. Indonesia (SDKI) tahun 2012 AKI di Indoensia mencapai 359 per jumlah

MODEL REGRESI COX PROPORTIONAL HAZARD PADA LAJU TAMAT MAHASISWA JURUSAN MATEMATIKA UNIVERSITAS ANDALAS

III. METODE PENELITIAN

BAB III REGRESI TERSENSOR (TOBIT) Model regresi yang didasarkan pada variabel terikat tersensor disebut

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

BAB II TINJAUAN PUSTAKA

Dosen Pembimbing : Dr. Purhadi, M.Sc

BAB III PEMBAHASAN. extended untuk mengatasi nonproportional hazard dan penerapannya pada kasus

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 4, Tahun 2015, Halaman Online di:

Faktor Risiko Penyakit Anemia Gizi Besi pada Ibu Hamil di Jawa Timur Menggunakan Analisis Regresi Logistik

IDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI MAHASISWA PASCASARJANA IPB BERHENTI STUDI MENGGUNAKAN ANALISIS CHAID DAN REGRESI LOGISTIK

BAB III METODE PENELITIAN. Berdasarkan permasalahan dan hipotesis penelitian, penelitian ini

(M.9) PEMODELAN MELEK HURUF DAN RATA-RATA LAMA STUDI DENGAN PENDEKATAN MODEL BINER BIVARIAT

FAKTOR-FAKTOR YANG MEMPENGARUHI RUMAH TANGGA NELAYAN BERPERILAKU HIDUP BERSIH DAN SEHAT DENGAN ANALISIS REGRESI LOGISTIK

PEMODELAN JUMLAH KEMATIAN BAYI DI KOTA PADANG TAHUN 2013 DAN 2014 DENGAN PENDEKATAN REGRESI BINOMIAL NEGATIF

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman Online di:

Faktor yang Mempengaruhi Terjangkitnya Penyakit Diare pada Balita di Propinsi Nanggroe Aceh Darussalam

Sarimah. ABSTRACT

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

IV METODE PENELITIAN

BAB 1 PENDAHULUAN. 1.1 Latar belakang

EKO ERTANTO PEMBIMBING

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

DAFTAR ISI. Halaman. viii

BAB 1 PENDAHULUAN Latar Belakang. Gizi merupakan faktor penting untuk mewujudkan manusia Indonesia.

BAB V HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

III. METODOLOGI PENELITIAN. penelitian ini, penulis menggunakan dua sumber data, yaitu :

Pemodelan Angka Putus Sekolah Tingkat SLTP dan sederajat di Jawa Timur Tahun 2012 dengan Menggunakan Analisis Regresi Logistik Ordinal

ANALISIS REGRESI LOGISTIK UNTUK MENGETAHUI FAKTOR FAKTOR YANG MEMPENGARUHI FREKUENSI KEDATANGAN PELANGGAN DI PUSAT PERBELANJAAN X

1 BAB I 2 PENDAHULUAN. sangat diperlukan dalam kehidupan sehari-hari. Begitu pula dalam penelitian

BAB III REGRESI SPASIAL DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED POISSON REGRESSION (GWPR)

Pengaruh brand image IM3terhadap keputusan pembelian simcard Gambar 7. Kerangka pemikiran

BAB 1 PENDAHULUAN 1.1 Latar Belakang

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENERIMAAN PESERTA DIDIK SMA NEGERI 2 SEMARANG MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL

BAB I PENDAHULUAN. Masalah gizi khususnya balita stunting dapat menghambat proses

BAB 2 LANDASAN TEORI

ANALISIS REGRESI MULTIVARIAT BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHI DERAJAT KESEHATAN DI PROVINSI JAWA TIMUR

TINJAUAN PUSTAKA. i dari yang terkecil ke yang terbesar. Tebaran titik-titik yang membentuk garis lurus menunjukkan kesesuaian pola

IV. METODE PENELITIAN. Kawasan ini dipilih secara sengaja (purposive) dengan pertimbangan bahwa

PEMODELAN DISPARITAS GENDER DI JAWA TIMUR DENGAN PENDEKATAN MODEL REGRESI PROBIT ORDINAL

RMSE = dimana : y = nilai observasi ke-i V PEMBAHASAN. = Jenis kelamin responden (GENDER) X. = Pendidikan responden (EDU) X

BAB II TINJAUAN PUSTAKA. konsep-konsep dasar pada QUEST dan CHAID, algoritma QUEST, algoritma

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

Peluang Kejadian Anemia pada Ibu Hamil di Kabupaten Grobogan dengan PendekatanRegresi Logistik

BAB III METODE PENELITIAN

BAB 1 PENDAHULUAN. beberapa zat gizi tidak terpenuhi atau zat-zat gizi tersebut hilang dengan

BAB II TINJAUAN PUSTAKA. penulisan skripsi. Teori penunjang tersebut adalah: Regresi logistik, analisis survival,

BAB I PENDAHULUAN. Statistika adalah salah satu cabang ilmu yang mempelajari prosedur-prosedur

BAB I PENDAHULUAN. negara berkembang termasuk Indonesia. Masalah gizi menjadi penyebab

III. KERANGKA PEMIKIRAN

ISSN InfoDATIN PUSAT DATA DAN INFORMASI KEMENTERIAN KESEHATAN RI SITUASI GIZI. di Indonesia. 25 Januari - Hari Gizi dan Makanan Sedunia

IV. METODOLOGI PENELITIAN. wisata tirta. Lokasi penelitian ini dapat dilihat pada Lampiran 1.

Memodelkan regresi logistik biner data set hasil sampel bootstrap B.

Transkripsi:

BAB II TINJAUAN PUSTAKA 2.1 Regresi Logistik Menurut Hosmer dan Lemeshow (2000) tujuan melakukan analisis data kategori menggunakan regresi logistik adalah mendapatkan model terbaik dan sederhana untuk menjelaskan hubungan antara keluaran dari variabel respons (Y) dengan variabel-variabel prediktornya (X). Variabel respons dalam regresi logistik dapat berupa kategori atau kualitatif, sedangkan variabel prediktornya dapat berupa kualitatif dan kuantitatif. Jika variabel Y merupakan variabel biner atau dikotomi dalam artian variabel respons terdiri dari dua kategori yaitu sukses (Y = 1) atau gagal (Y = 0), maka variabel Y mengikuti sebaran Bernoulli yang memiliki fungsi densitas peluang: f(y i ) = π(x i ) y i(1 π(x i )) 1 y i, ; y i = 0,1 (2.1) sehingga diperoleh: Untuk y i = 0, maka f(0) = π(x i ) 0 (1 π(x i )) 1 0 = 1 π(x i ), untuk y i = 1, maka f(1) = π(x i ) 1 (1 π(x i )) 1 1 = π(x i ). Misalkan probabilitas dari variabel respons Y untuk nilai x yang diberikan, dinotasikan sebagai π(x). Model umum π(x) dinotasikan sebagai berikut: π(x) = exp(β 0 + β 1 x 1 + β 2 x 2 + + β p x p ) 1 + exp(β 0 + β 1 x 1 + β 2 x 2 + + β p x p ), (2.2) Persamaan (2.2) disebut fungsi regresi logistik yang menunjukkan hubungan antara variabel prediktor dan probabilitas yang tidak linear, sehingga untuk mendapatkan 8

9 hubungan yang linear dilakukan transformasi yang sering disebut dengan transformasi logit. Bentuk logit dari π(x) dinyatakan sebagai g(x), yaitu: logit [π(x)] = g(x) = ln ( π(x) 1 π(x) ) = β 0 + β 1 x 1 + β 2 x 2 + + β p x p. (2.3) Persamaan (2.3) merupakan bentuk fungsi hubungan model regresi logistik yang disebut model regresi logistik berganda (Hosmer dan Lemeshow, 2000). 2.2 Regresi Logistik Ordinal Regresi logistik adalah model regresi yang digunakan apabila variabel respons bersifat kualitatif. Model ini terdiri dari regresi logistik sederhana yang bersifat dikotomus yang mensyaratkan variabel respons terdiri dari dua kategori, dan regresi logistik polytomous dengan variabel respons lebih dari dua kategori. Regresi logistik polytomous dengan variabel respons bertingkat dikenal dengan regresi logistik ordinal. Variabel prediktor yang dapat disertakan dalam model berupa data kategori dan kontinu yang terdiri atas dua variabel atau lebih (Hosmer dan Lemeshow, 2000). 2.2.1 Model Odd Proporsional Suatu variabel respons Y berskala ordinal dapat terdiri dari K + 1 dan dinyatakan dengan 0,1,2,..., K. Ekspresi umum peluang bersyarat Y = k pada vektor x dari p variabel prediktor adalah Pr[Y = k x] = φ k (x). Misalkan φ k (x) = π k (x), maka untuk K = 0,1,2, model yang terbentuk dijelaskan oleh persamaan berikut:

10 P(Y = 0 x) = P(Y = 1 x) = P(Y = 2 x) = 1 1 + e g 1 (x) + e g 2 (x) = φ 0(x) e g 1 (x) 1 + e g 1 (x) + e g 2 (x) = φ 1(x) e g 2 (x) 1 + e g 1 (x) + e g 2 (x) = φ 2(x), sehingga bentuk persamaan tersebut adalah sebagai berikut: P(Y = k x) = dengan g 0 (x) = 0, dan k = 0,1,, K. e g k (x) K e g i (x), (2.4) Model logit garis dasar mempunyai K(p + 1) koefisien, bentuk ini muncul dari fakta bahwa model biasanya diparameterisasi, sehingga koefisien-koefisien log odds membandingkan kategori y = k dengan kategori dasar y = 0. g k (x) = ln [ φ k(x) φ 0 (x) ] P(Y = k x) = ln [ P(Y = 0 x) ] = β k0 + x β k, k = 0,1,2,, K, (2.5) persamaan (2.5) disebut model logit dasar (baseline logit model), dengan β k0 sebagai intersep. Pada regresi logistik ordinal, model dapat diperoleh dengan model odds proporsional (proportional odds model). Model logit ini merupakan model yang didapatkan dengan membandingkan peluang kumulatif yaitu peluang kurang dari atau sama dengan kategori respons ke-k pada p variabel prediktor yang dinyatakan dalam vektor x, P(Y k x), dengan peluang yang lebih besar dari kategori respons ke-k, P(Y > k x) yang didefinisikan sebagai berikut:

11 P(Y k x) logit P(Y k x) = c k (x) = ln [ P(Y > k x) ] φ 0 (x) + φ 1 (x) + + φ k (x) = ln [ φ k+1 (x) + φ k+2 (x) + + φ K (x) ] = τ k x β, (2.6) untuk k = 0,1,2,... K 1 (Hosmer dan Lemeshow, 2000). 2.3 Pendugaan Parameter Metode yang paling umum digunakan untuk menduga parameter pada model regresi logistik adalah metode maksimum likelihood (method of maximum likelihood). Langkah awal untuk menerapkan metode maksimum likelihood adalah dengan membentuk sebuah fungsi yang disebut fungsi likelihood. Fungsi ini menggambarkan fungsi peluang dari data-data yang diamati sebagai fungsi dari penduga parameter (Hosmer dan Lemeshow, 2000). Secara umum fungsi likelihood didefinisikan sebagai fungsi peluang bersama dari variabel acak yang dibentuk oleh sampel. Khusus untuk sampel berukuran n dengan amatannya (y 1, y 2,, y n ) berkoresponden dengan variabel acak (Y 1, Y 2,, Y n ). Selama Y i dianggap independen, maka fungsi densitas peluang bersamanya adalah sebagai berikut: g(y 1, Y 2,, Y n ) = n f(y i ). (2.7) Metode yang digunakan untuk mencocokkan setiap model didasarkan penyesuaian pada multinomial likelihood. Bentuk umum dari likelihood untuk sampel dari n amatan yang saling bebas (z i, x i ), i = 1,2,, n; adalah sebagai berikut:

12 n l(β) = [φ 0 (x i ) z 0i φ 1 (x i ) z 1i φ K (x i ) z Ki], (2.8) dengan φ k (x) merupakan fungsi dari parameter yang tidak diketahui dan z = (z 0, z 1, z k ) dibentuk dari respons yang ordinal. Metode kemungkinan maksimum memberikan nilai penduga dari vektor β k = (β 0k, β 1k, β pk ) dengan memaksimumkan fungsi kemungkinan bersama pada persamaan (2.8). Logaritma dari fungsi kemungkinan bersamanya dapat ditulis sebagai berikut: n L(β) = i=0 z 0i ln [φ 0 (x i )] + + z Ki ln[φ Ki (x i )]. (2.9) Untuk mendapatkan nilai penduga dari β k = (β 0k, β 1k, β pk ) yang memaksimalkan L(β), didapat dengan cara menurunkan persamaan disamakan dengan nol (Hosmer dan Lemeshow, 2000), persamaan-persamaan yang diperoleh adalah sebagai berikut: n L(β) = x β ki (z ji φ ji ) = 0, jk (2.10) dengan j = 1,2,, J 1 dan k = 0,1,2,..., p dengan x 0i = 1 untuk masingmasing subjek. Metode penduga ragam dan koragam dari koefisien penduga diperoleh berdasarkan teori penduga maksimum. Penduga ragam dan koragam yang diperoleh adalah suatu matriks yang berasal dari turunan parsial kedua dari persamaan (2.10) (Hosmer dan Lemeshow, 2000). Bentuk umum dari elemen dalam matriks turunan parsial kedua sebagai berikut:

13 2 L(β) β jk β jk n = x k i x kiφ ji (1 φ ji ), (2.11) dan n 2 L(β) = x β jk β k j k i x kiφ ji φ j i, (2.12) untuk j dan j = 1,2 dan k dan k = 0,1,2,..., p. Selanjutnya didefinisikan I(β) suatu matriks berukuran 2(p + 1) 2(p + 1) yang elemen-elemennya adalah negatif dari nilai pada persamaan (2.11) dan (2.12). Matriks tersebut disebut dengan matriks informasi. Matriks koragam dari penduga maksimum likelihood merupakan invers dari matriks informasi, (β) = I(β) 1. Penduga dari matriks informasi dan koragam diperoleh dengan mengganti parameter dengan nilai dugaannya. 2.4 Pengujian Parameter Pengujian terhadap parameter-parameter estimasi model dilakukan untuk mengetahui peran seluruh variabel prediktor baik secara simultan (bersama-sama) maupun secara parsial. Menurut Hosmer dan Lemeshow (2000), untuk pengujian parameter secara bersama dapat digunakan uji keberartian model yaitu uji G dengan hipotesis: H 0 : β 1 = β 2 = = β p = 0 (tidak ada pengaruh sekumpulan variabel bebas terhadap variabel respons), H 1 : minimal ada satu β i 0.

14 Statistik uji G dinotasikan sebagai berikut: G = 2 ln [ L 0 L k ]. (2.13) Keterangan: L 0 = fungsi kemungkinan maksimum tanpa variabel prediktor L k = fungsi kemungkinan maksimum dengan variabel prediktor Dengan mengambil taraf signifikansi α, hipotesisi nol (H 0 ) ditolak apabila 2 G > χ db,α atau p Value < α. Derajat kebebasan ((K + 1) 2) p, (K + 1) merupakan jumlah variabel respons dan p adalah jumlah variabel prediktor. Sedangkan pengujian parameter β secara parsial dilakukan dengan membandingkan model terbaik yang dihasilkan oleh uji simultan terhadap model tanpa variabel bebas di dalam model terbaik. Pengujian hipotesis yang dilakukan yaitu: H 0 : β i = 0 (tidak ada pengaruh variabel bebas yang diuji terhadap variabel respons), H 1 : β i 0 (terdapat pengaruh variabel bebas yang diuji terhadap variabel respons). Statistik ujinya adalah: W = β i SE(β i ). (2.14) Statistik uji Wald mengikuti sebaran normal baku Z, H 0 akan ditolak jika W > Z α/2 atau p Value < α.

15 2.5 Interpretasi Koefisien Pada regresi logistik dengan suatu variabel bebas (β i ) menunjukkan perubahan nilai logit untuk setiap unit perubahan pada variabel x. Interpretasi regresi logistik ordinal dapat dijelaskan dengan odds rasio. Nilai odds rasio yaitu nilai yang menunjukkan perbandingan tingkat kecenderungan dari dua kategori dalam satu variabel prediktor dengan salah satu kategorinya dijadikan pembanding kategori dasar (Hosmer dan Lemeshow, 2000). Tabel 2.1 Nilai-Nilai dari Model Logistik Variabel bebas Variabel respons x = a x = b Y = 2 φ 2 (a) = eg 2 (a) 3 e g i (a) φ 2 (b) = eg 2 (b) 3 e g i (b) Y = 1 φ 1 (a) = eg 1 (a) 3 e g i (a) Y = 0 φ 0 (a) = eg 0 (a) 3 e g i (a) φ 1 (b) = φ 0 (b) = eg 1 (b) 3 e g i (b) eg 0 (b) 3 e g i (b) Secara umum, nilai odds rasio pada model ke-j dapat dicari dengan OR k (a, b) = P(Y = k x = a)/p(y = 0 x = a) P(Y = k x = b)/p(y = 0 x = b). (2.15) Misalkan nilai a = 1 dan b = 0 kemudian ingin dicari nilai odd pada saat Y = 3 dengan Y = 0 untuk nilai x = 1 dan x = 0 adalah OR 3 (1,0) = P(Y = 3 x = 1)/P(Y = 0 x = 1) P(Y = 3 x = 0)/P(Y = 0 x = 0) = φ 3(1)/[φ 0 (1)] φ 3 (0)/[φ 0 (0)] = exp(β 31 ), (2.16)

16 φ 3 (1) [φ ln(or 3 (1,0)) = ln ( 0 (1)] φ 3 (0)/[φ 0 (0)] ) = ln(exp(β 31 )) = β 31. (2.17) Model logistik dengan satu variabel bebas dikotomi, koefisien β k1 adalah beda logit sedangkan exp(β k1 ) adalah nilai odds rasio (Hosmer dan Lemeshow, 2000). Berdasarkan persamaan (2.17), dapat diinterpretasikan bahwa rasio odds (OR 3 (1,0)) = 1 berarti bahwa individu dengan nilai x = 1 mempunyai peluang yang sama dengan individu dengan nilai x = 0 dalam kaitannya dengan Y = 3. Apabila (OR 3 (1,0)) > 1 maka individu dengan nilai x = 1 mempunyai peluang yang lebih besar dibandingkan dengan x = 0 terhadap Y = 3. Sebaliknya apabila 0 (OR 3 (1,0)) < 1 individu x = 1 mempunyai peluang yang lebih kecil dibandingkan dengan x = 0 untuk Y = 3. 2.6 Prosedur Klasifikasi Menurut Johnson dan Wichern (2007) prosedur klasifikasi adalah suatu evaluasi untuk melihat peluang kesalahan klasifikasi (misclassification) yang dilakukan oleh suatu fungsi klasifikasi. Prosedur klasifikasi yang baik ditentukan dengan nilai misklasifikasi yang kecil. Satu hal penting untuk menghasilkan prosedur klasifikasi ialah dengan menghitung tingkat error atau probabilitas kesalahan klasifikasi (misklasifikasi). Terdapat alat ukur yang dapat digunakan untuk menentukan kesalahan klasifikasi

17 yang tidak bergantung pada distribusi populasi dan dapat mempermudah perhitungan berbagai prosedur klasifikasi. Salah satu ukuran yang apa digunakan adalah apparent error rate (APER) yang merupakan fraksi observasi dalam sampel yang salah diklasifikasikan atau misclasified pada fungsi klasifikasi. Penentuan kesalahan pengklasifikasian dapat diketahui melalui tabel klasifikasi. Tabel klasifikasi merupakan tabel kontingensi (k k) berdasarkan data empiris dari variabel respons. Tabel 2.1 Tabel Klasifikasi Keanggotaan Keanggotaan prediksi sebenarnya π 1 π 2 π 3 Total π 1 n 11 n 12 n 13 A π 2 n 21 n 22 n 23 B π 3 n 31 n 32 n 33 C Total D E F G Keterangan: n 11 : jumlah y i dari π 1 yang tepat diklasifikasikan sebagai π 1 n 12 : jumlah y i dari π 1 yang tidak tepat diklasifikasikan sebagai π 2 n 13 : jumlah y i dari π 1 yang tidak tepat diklasifikasikan sebagai π 3 n 21 : jumlah y i dari π 2 yang tidak tepat diklasifikasikan sebagai π 1 n 22 : jumlah y i dari π 2 yang tepat diklasifikasikan sebagai π 2 n 23 : jumlah y i dari π 2 yang tidak tepat diklasifikasikan sebagai π 3 n 31 : jumlah y i dari π 3 yang tidak tepat diklasifikasikan sebagai π 1 n 32 : jumlah y i dari π 3 yang tidak tepat diklasifikasikan sebagai π 2 n 33 : jumlah y i dari π 3 yang tepat diklasifikasikan sebagai π 3

18 Sehingga diperoleh rumus kesalahan klasifikasi secara keseluruhan nilai APER adalah: APER = ( n 12 + n 13 + n 21 + n 23 + n 31 + n 32 ). G (2.18) Kemudian, untuk mendapatkan nilai ketepatan klasifikasi (correct classification) digunakan rumus: 1 APER. 2.7 Bootstrap Aggregating (Bagging) Bagging merupakan sebuah metode yang diusulkan oleh Breiman (1994). Metode ini digunakan sebagai alat untuk memperbaiki stabilitas dan kekuatan prediksi dengan cara mereduksi variansi dari suatu prediktor pada metode klasifikasi dan regresi yang penggunaannya tidak dibatasi hanya untuk memperbaiki estimator. Versi berganda dibentuk dengan replikasi bootstrap dari sebuah data set. Pada beberapa kasus, bagging pada data set real atau simulasi dapat meningkatkan akurasi. Jika perubahan pada data set menyebabkan perubahan yang signifikan maka bagging dapat meningkatkan akurasi. Ide dasar dari bagging adalah menggunakan bootstrap resampling untuk membangkitkan prediktor dengan versi berganda, di mana ketika dikombinasikan seharusnya hasilnya lebih baik dibandingkan dengan prediktor tunggal yang dibangun untuk menyelesaikan masalah yang sama (Breiman, 1996). Tabel 2.3 Skema proses Bagging Data set tunggal (data asli): L = {(y i, x i ), i = 1,2,, n} Bootstrap resampling 1, 2, 3, 4, 5, 6, 7, 8 L 1 = (y 1, x 1 ) 2, 7, 8, 3, 7, 6, 3, 1 L 2 = (y 2, x 2 ) 7, 8, 5, 6, 4, 2, 7, 1 L 3 = (y 3, x 3 ) 3, 6, 2, 7, 5, 6, 2, 2 L i = (y i, x i ) 4, 5, 1, 4, 6, 4, 3, 8

19 Sebuah data set L terdiri dari data {(y n, x n ), n = 1,, N} dengan y dapat berupa kelas label atau respons numerik. Jika input adalah x maka y diprediksi dengan φ(x, L) di mana φ(x, L) adalah prediktor. Prediktor diperoleh dengan melakukan replikasi bootstrap dari data asli L k yang kemudian disebut φ(x, L k ). Replikasi bootstrap dilakukan sebanyak B kali sehingga {L (B) } dari L (data set) dan dibentuk prediktor {φ(x, L (B) )}. Pengulangan {L (B) } adalah resampling dengan pengembalian (Breiman,1996). Ambil bootstrap sampel dengan pengulangan {L (B) } dari L dan membentuk {φ(x, L (B) )}. Jika y merupakan data numerik, diberikan φ B sebagai φ B (x) = average B φ(x, L (B) ), (2.19) Jika y merupakan kelas label, maka untuk menentukan kategori dengan melakukan vote pada{φ(x, L (B) )} dari φ B (x). Metode bootstrap yang seperti ini dinamakan bagging (bootstrap aggregating). Bagging bekerja dengan baik pada metode yang bersifat tidak stabil, yang mana perubahan kecil pada data set akan menghasilkan perubahan besar pada model yang diperoleh. Beberapa metode yang tidak stabil adalah neural networks, regresi, klasifikasi, dan regresi pohon (regression tree). Sedangkan contoh metode yang stabil adalah k-nearest neighboor (Breiman, 1996). 2.7.1 Estimasi Probabilitas Bagging Class Beberapa metode klasifikasi mengestimasi probabilitas p (k x) suatu objek dengan memprediksi vector x termasuk dalam kelas k. Kemudian kelas yang sesuai

20 x ditaksir sebagai arg max k p (k x). Pada metode bagging, dari semua replikasi bootstrap diperoleh estimasi p B(k x) yang kemudian digunakan untuk memprediksi kelas arg max k p B(k x). Dari hasil prediksi kelas, dilakukan perhitungan kesalahan klasifikasi untuk setiap replikasi B kali. Terdapat dua cara berbeda dalam mendapatkan nilai kesalahan klasifikasi pada bagging untuk klasifikasi, yaitu dengan majority voting dan average. Hasil proses voting ataupun average dalam hal ini (e B) ditentukan dari prediksi kelas label tiap-tiap replikasi B kali. Penentuan e B dengan voting ataupun average pada bagging memiliki hasil yang hampir sama (Breiman, 1996). Breiman (1996) menyatakan bahwa bagging mengestimasi lebih akurat daripada estimator tunggal. Hal tersebut ditunjukkan dengan membandingkan nilai estimasi error antara estimator tunggal dengan estimator bagging. Algoritma bagging untuk regresi logistik ordinal adalah sebagai berikut: 1. Mengambil sampel bootstrap L B sebanyak n dari data set L, pengambilan sampel dengan pengembalian untuk setiap replikasi sebanyak B. 2. Memodelkan regresi logistik ordinal pada sampel bootstrap L B. 3. Menentukan prediksi variabel respons dari model bagging regresi logistik ordinal untuk setiap replikasi. 4. Mengulang langkah 1 sampai langkah 4 sebanyak B kali. 5. Menentukan prediksi kelas maksimum dengan majority voting dan menghitung nilai kesalahan klasifikasi bagging (e B) dari nilai prediksi kelas maksimum setiap pengulangan sampai B kali.

21 2.8 Akaike s Information Criterion (AIC) Metode AIC secara umum dianggap sebagai kriteria pemilihan model yang sampai saat ini terus berkembang dan dipergunakan sebagai salah satu metode dalam pemilihan model terbaik. Metode AIC didasarkan pada metode maximum likelihood estimation (MLE). Untuk menghitung nilai AIC digunakan rumus sebagai berikut (Grasa dalam Fathurahman, 2009): AIC = e n 2 2k/n u i, n (2.20) dengan: k = banyak parameter yang diestimasi dalam model regresi n = banyak observasi e = 2,718 u = sisa (residual) Berdasarkan nilai AIC, suatu model regresi dikatakan sebagai model terbaik adalah jika model regresi memiliki nilai AIC terkecil (Widarjono dalam Fathurahman, 2009). 2.9 Status Gizi Salah satu indikator kesehatan yang dinilai pencapaiannya dalam MDG s adalah status gizi balita (Dinas Kesehatan Provinsi Bali, 2014). Upaya perbaikan gizi dilakukan untuk mengatasi masalah gizi dan sekaligus untuk meningkatkan status gizi serta derajat kesehatan masyarakat. Gizi yang baik pada balita sangat penting bagi pertumbuhan dan perkembangan tubuh balita. Pada balita kurang gizi ada kecenderungan kurang gairah dan lincah, serta terhambat dalam belajar karena

22 gizi kurang akan memengaruhi pertumbuhan otak balita sehingga berakibat dalam merugikan usaha mencerdaskan bangsa (Roedjito, 1989). Status gizi balita merupakan hal yang harus diketahui oleh setiap orang tua. Perlunya perhatian lebih dalam tumbuh kembang di usia balita didasarkan fakta bahwa kurang gizi yang terjadi pada masa emas ini, bersifat irreversible (Mufida dkk., 2015). Menurut Kementerian Kesehatan (2013), status gizi balita dapat diukur berdasarkan umur, berat badan (BB), dan tinggi badan (TB). Variabel umum, BB dan TB ini disajikan dalam bentuk tiga indikator antropometri, yaitu: berat badan menurut umur (BB/U), tinggi badan menurut umur (TB/U), dan berat badan menurut tinggi badan (BB/TB). Masing-masing indikator tersebut memiliki pembagian kategori sebagai berikut: a. BB/U: indeks ini diperoleh dari perbandingan antara berat badan dengan umur yang dapat digunakan untuk menilai kemungkinan anak dengan kategori gizi buruk atau gizi kurang. b. TB/U: indeks ini diperoleh dari perbandingan antara tinggi badan dengan umur yang dapat digunakan untuk menggambarkan keadaan kurang gizi kronis yaitu pendek (stunting). c. BB/TB: indeks ini diperoleh dari perbandingan antara berat badan dengan tinggi badan yang dapat digunakan untuk menilai kemungkinan anak dengan kategori kurus atau sangat kurus yang merupakan masalah gizi akut.

23 2.9.1 Balita Anak bawah lima tahun atau sering disingkat sebagai anak balita adalah anak yang telah menginjak usia di atas satu tahun atau lebih populer dengan pengertian usia anak di bawah lima tahun (Muaris dalam Depkes, 2015) atau biasa digunakan perhitungan bulan yaitu 12-59 bulan. Para ahli menggolongkan usia balita sebagai tahapan perkembangan anak yang cukup rentan terhadap berbagai serangan penyakit. Setiap tahun lebih dari sepertiga kematian anak di dunia berkaitan dengan masalah kurang gizi (Depkes, 2015). 2.9.2 Stunting pada Balita Indikator tinggi badan menurut umur (TB/U) digunakan untuk menggambarkan keadaan kurang gizi pendek. Balita pendek (stunting) adalah balita yang mengalami kegagalan untuk mencapai pertumbuhan yang optimal. Stunting dapat mengindikasikan adanya gangguan kronis pada pertumbuhan anak akibat tidak terpenuhinya suplai makanan dalam waktu lama, adanya penyakit infeksi atau kondisi kesehatan lingkungan buruk yang disebabkan oleh kemiskinan (SCN Task Force dalam Tahir, 2012). Berdasarkan Kementerian Kesehatan (2013), pada anak balita masalah stunting lebih banyak dibandingkan dengan masalah kurang gizi lainnya. Di Provinsi Bali pada tahun 2013 kejadian stunting terjadi sebanyak 32,6% lebih tinggi dibandingkan kejadian gizi buruk 13,2% dan kurus 8,8%.

24 2.9.3 Status Anemia Ibu Ibu hamil yang mengalami anemia dapat mengakibatkan janin dalam tubuh ibu mengalami hambatan pertumbuhan, lahir prematur, bayi dengan berat badan lahir rendah (BBLR), serta lahir dengan cadangan zat besi kurang sampai dengan kematian janin di dalam kandungan. Sedangkan bagi ibu hamil sendiri akan menyebabkan komplikasi, gangguan pada saat persalinan dan dapat membahayakan kondisi ibu seperti badan lemah, pingsan hingga menyebabkan mudahnya terinfeksi penyakit (Sulistyoningsih, 2011). 2.9.4 Pengukuran LILA Ibu Pengukuran lingkar lengan atas (LILA) dilakukan ibu hamil untuk mengetahui risiko kekurangan energi kronis (KEK) pada ibu tersebut. KEK merupakan suatu keadaan yang menunjukkan kekurangan energi dan protein dalam jangka waktu yang lama (Kemenkes R.I. dalam Suciari, 2015). 2.9.5 Berat Badan Lahir Berat badan lahir sangat terkait dengan pertumbuhan dan perkembangan jangka panjang pada balita. Menurut Unicef dan WHO (2004) bayi dengan berat badan lahir rendah (BBLR) merupakan hasil dari kelahiran prematur atau dikarenakan terhambatnya pertumbuhan janin dalam kandungan. BBLR telah didefinisikan oleh WHO sebagai bayi yang lahir dengan berat lahir kurang dari 2500 gr. BBLR berkaitan erat dengan kematian dan morbiditas dari janin dan neonatus, terhambatnya pertumbuhan dan perkembangan kognitif, dan timbulnya

25 penyakit kronis di kemudian hari. Banyak faktor yang menyebabkan BBLR yaitu, durasi kehamilan dan perkembangan janin. Hal tersebut berkaitan dengan bayi, ibu, atau lingkungan fisik dan memainkan peranan penting dalam menentukan berat badan lahir dan masa depan kesehatan bayi. 2.9.6 Panjang Badan Lahir Asupan gizi yang kurang adekuasi sebelum masa kehamilan gangguan pertumbuhan pada janin sehingga dapat menyebabkan bayi lahir dengan panjang badan lahir pendek. bayi yang dilahirkan memiliki panjang badan lahir normal bila panjang badan lahir bayi tersebut berada pada panjang 48-52 cm (Kemenkes R.I. dalam Suciari, 2015). 2.9.7 MP-ASI Makanan pendamping ASI (MP-ASI) merupakan makanan pendamping ASI, bukan makanan pengganti ASI. Dikatakan pendamping, berarti bila sudah waktunya diberikan makanan pendamping ini, bukan berarti pemberian ASI harus dihentikan. Umpasi (Umur Pemberian Usia MP-ASI) pada usia 6 bulan dianggap merupakan saat yang tepat untuk pemberian MP-ASI. Pada usia ini, saluran pencernaan bayi sudah cukup mampu untuk menerima makanan selain ASI dan kebutuhan bayi sudah tidak lagi tercukupi hanya dengan pemberian ASI, sehingga dibutuhkan sumber nutrisi lain untuk mencukupi kebutuhannya (Nopri, 2013).