Efisiensi Generalized Estimating Equations Orde 1 (GEE1) dan Orde 2 (GEE2) untuk Data Longitudinal

dokumen-dokumen yang mirip
PENDEKATAN GENERALIZED ESTIMATING EQUATIONS ORDE 2 (GEE2) UNTUK DATA LONGITUDINAL SKRIPSI

PENGARUH MIXED DISTRIBUTION PADA PENDEKATAN QUASI-LIKELIHOOD DALAM MODEL LINEAR 1)

PEMODELAN REGRESI 2-LEVEL DENGAN METODE ITERATIVE GENERALIZED LEAST SQUARE (IGLS) (Studi Kasus: Tingkat pendidikan Anak di Kabupaten Semarang)

PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA

PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT (LMS-MCD) DALAM REGRESI KOMPONEN UTAMA

BAB 2 LANDASAN TEORI

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Pada Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

Pertemuan 10 STATISTIKA INDUSTRI 2. Multiple Linear Regression. Multiple Linear Regression. Multiple Linear Regression 19/04/2016

PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE) UNTUK MULTIPLE-RANDOM EFFECTS

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah

ESTIMASI PARAMETER PADA MODEL REGRESI LINIER MULTILEVEL DENGAN METODE RESTRICTED MAXIMUM LIKELIHOOD (REML) abang Semarang SKRIPSI.

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. lebih variabel independen. Dalam analisis regresi dibedakan dua jenis variabel

MODEL REGRESI ROBUST MENGGUNAKAN ESTIMASI S DAN ESTIMASI GS

PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA

REGRESI ROBUST MM-ESTIMATOR UNTUK PENANGANAN PENCILAN PADA REGRESI LINIER BERGANDA

PERBANDINGAN REGRESI METODE ROBUST DENGAN METODE OLS STUDY KASUS PENGARUH INFLASI DAN PDRB TERHADAP PENGANGGURAN TERBUKA DI PROVINSI JAWA TEGAH

ESTIMASI PARAMETER PADA SISTEM PERSAMAAN SIMULTAN DENGAN METODE LIMITED INFORMATION MAXIMUM LIKELIHOOD (LIML) SKRIPSI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA

STK 511 Analisis statistika. Materi 7 Analisis Korelasi dan Regresi

PEMODELAN PENDAPATAN ASLI DAERAH (PAD) DI KABUPATEN DAN KOTA DI JAWA TENGAH MENGGUNAKAN GEOGRAPHICALLY WEIGHTED RIDGE REGRESSION

PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA

PENERAPAN METODE GENERALIZED RIDGE REGRESSION DALAM MENGATASI MASALAH MULTIKOLINEARITAS

1) Kriteria Ekonomi Estimasi model dikatakan baik bila hipotesis awal penelitian terbukti sesuai dengan tanda dan besaran dari penduga.

PENERAPAN REGRESI POISSON DAN BINOMIAL NEGATIF DALAM MEMODELKAN JUMLAH KASUS PENDERITA AIDS DI INDONESIA BERDASARKAN FAKTOR SOSIODEMOGRAFI

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

MASALAH NILAI AWAL ITERASI NEWTON RAPHSON UNTUK ESTIMASI PARAMETER MODEL REGRESI LOGISTIK ORDINAL TERBOBOTI GEOGRAFIS (RLOTG)

Kata Kunci: Autokorelasi, Heteroskedastisitas, Metode Kuadrat Terkecil, Metode Newey West

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

BAB I PENDAHULUAN. Statistika adalah salah satu cabang ilmu yang mempelajari prosedur-prosedur

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. untuk membentuk model hubungan antara variabel dependen dengan satu atau

Non Linear Estimation and Maximum Likelihood Estimation

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PEMBENTUKAN MODEL DATA PANEL FIXED EFFECT MENGGUNAKAN GUI MATLAB

II. TINJAUAN PUSTAKA. Dalam proses penelitian untuk mengkaji karakteristik penduga GMM pada data

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

BAB 1 PENDAHULUAN. Perkembangan dunia teknologi berkembang sangat pesat di dalam kehidupan

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB III MODEL REGRESI DATA PANEL. Pada bab ini akan dikemukakan dua pendekatan dari model regresi data

SIMULASI DAMPAK MULTIKOLINEARITAS PADA KONDISI PENYIMPANGAN ASUMSI NORMALITAS

Kata Kunci: Analisis Regresi Linier, Penduga OLS, Penduga GLS, Autokorelasi, Regresor Bersifat Stokastik

STATISTIKA INDUSTRI 2 TIN 4004

PERBANDINGAN REGRESI ROBUST DENGAN OLS PADA PRODUKSI UBI JALAR PROVINSI JAWA TENGAH TAHUN 2015

MODEL REGRESI PROBIT BIVARIAT

PEMILIHAN PARAMETER PENGHALUS DALAM REGRESI SPLINE LINIER. Agustini Tripena Br.Sb.

BAB II METODE ANALISIS DATA. memerlukan lebih dari satu variabel dalam membentuk suatu model regresi.

SBAB III MODEL VARMAX. Pengamatan time series membentuk suatu deret data pada saat t 1, t 2,..., t n

Pemodelan Regresi 2-Level Dengan Metode Iterative Generalized Least Square (IGLS) (Studi Kasus: Tingkat Pendidikan Anak di Kabupaten Semarang)

Estimasi Model Seemingly Unrelated Regression (SUR) dengan Metode Generalized Least Square (GLS)

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Ketakbiasan Dalam Model Analisis Faktor Konfirmatori (CFA) Pada Metode Pendugaan Kuadrat Terkecil Terboboti (Weighted Least Square) Untuk Data Ordinal

MODEL REGRESI NONPARAMETRIK BERDASARKAN ESTIMATOR POLINOMIAL LOKAL KERNEL PADA KASUS PERTUMBUHAN BALITA

Analisis Regresi: Regresi Linear Berganda

Lampiran 2. Fungsi dari masing-masing pernyataan yang digunakan dalam PROC MIXED

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. dependen disebut dengan regresi linear sederhana, sedangkan model regresi linear

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 4, Tahun 2015, Halaman Online di:

BAB 2 LANDASAN TEORI. digunakan sebagai konsep statistik pada tahun 1877 oleh Sir Francis Galton. Dia

BAB VI ANALISIS REGRESI LINEAR GANDA

E-Jurnal Matematika Vol. 3 (3), Agustus 2014, pp ISSN:

PENERAPAN REGRESI GENERALIZED POISSON UNTUK MENGATASI FENOMENA OVERDISPERSI PADA KASUS REGRESI POISSON

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

SIMULASI PENGUKURAN KETEPATAN MODEL VARIOGRAM PADA METODE ORDINARY KRIGING DENGAN TEKNIK JACKKNIFE

TINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

Model Regresi Zero Inflated Poisson Pada Data Overdispersion

Analisis Multivariat Analisis multivariat adalah suatu studi tentang bb beberapa variabel random dependent d secara simultan. Analisis ini merupakan a

PEMODELAN UPAH MINIMUM KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHINYA MENGGUNAKAN REGRESI RIDGE

PENERAPAN METODE BOOTSTRAP RESIDUAL DALAM MENGATASI BIAS PADA PENDUGA PARAMETER ANALISIS REGRESI

BAB II TINJAUAN PUSTAKA. keuntungan atau coumpouding. Dari definisi di atas dapat disimpulkan bahwa

E-Jurnal Matematika Vol. 5 (4), November 2016, pp ISSN:

TINJAUAN PUSTAKA TIMSS 2007

PENAKSIRAN PARAMETER PERSAMAAN SIMULTAN DENGAN METODE KUADRAT TERKECIL DUA TAHAP SKRIPSI ANDRIAN SURYA

III. METODE PENELITIAN

BAB I Pendahuluan. 1. Mengetahui pengertian penelitian metode regresi. 2. Mengetahui contoh pengolahan data menggunakan metode regresi.

Analisis Data Panel Tidak Lengkap Model Komponen Error Dua Arah dengan Metode Minimum Variance Quadratic Unbiased Estimation (MIVQUE) SKRIPSI

MODEL REGRESI POISSON YANG DIPERUMUM UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

I. PENDAHULUAN. Perkembangan teori statistika telah mempengaruhi hampir semua aspek. Dalam teori statistika dan peluang, distribusi gamma (

BAB IV HASIL ANALISIS DAN PEMBAHASAN. Tabel 4. Berdasarkan tabel diatas dapat diketahui bahwa variabel harga saham (Y)

Pertemuan 4-5 ANALISIS REGRESI SEDERHANA

BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Karakteristik Pendugaan Emperical Best Linear Unbiased Prediction (EBLUP) Pada Pendugaan Area Kecil

PEMODELAN REGRESI LINIER MULTIVARIAT DENGAN METODE PEMILIHAN MODEL FORWARD SELECTION

III. METODOLOGI PENELITIAN. Modal, Dinas Penanaman Modal Kota Cimahi, Pemerintah Kota Cimahi, BPS Pusat

BAB III METODE PENELITIAN. Metode menurut Sugiyono (2007:1) pada dasarnya merupakan cara ilmiah

BAB IV HASIL DAN ANALISIS

Transkripsi:

Jurnal ILMU DASAR, Vol.15 No.1, Januari 2014: 29-35 29 Efisiensi Generalized Estimating Equations Orde 1 (GEE1) dan Orde 2 (GEE2) untuk Data Longitudinal The Efficiency of First (GEE1) and Second (GEE2) Order Generalized Estimating Equations for Longitudinal Data Rizka Dwi Hidayati, I Made Tirta* ) dan Yuliani Setia Dewi Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Jember *E-mail: itirta.fmipa@unej.ac.id ABSTRACT The approach of GEE focuses on a linear model for the mean of the observations in the cluster without full specification the distribution or the likelihood. GEE is a marginal model which is not based on the full likelihood of the response, but only based on the relationship between the mean (first moment) and variance (second moment) as well as the correlation matrix. The advantage of GEE is that the mean of parameter are estimated consistently regardless whether the correlation structure is specified correctly or not, as long as the mean has the correct specifications. However, the efficiency may be reduced when the working correlation structure is wrong. GEE was designed to focus on the marginal mean and correlation structure is treated as nuisance. Implementation of GEE is usually limited to a number of working correlation structure (eg AR-1, exchangeable, independent, m-dependent and unstructured). To increase the efficiency of the GEE, has been introduced an extension called the Generalized Estimating Equations order 2 (GEE2). GEE2 was introduced to overcome the problem that considers correlation GEE as nuisance, by applying the second equation to estimate covariance parameters and solved it simultaneously with the first equation. This study explore the efficiency of the GEE and GEE2 by using simulation data which are designed based on the the AR-1 and Exchangeable correlation structure. The results show that true specification of correlation structure and correlation link affects the efficiency of the model estimation in that the estimates with the true specification of correlation and correlation link have smaller standard errors. Keywords: Longitudinal data, generalized estimating equation, marginal model PENDAHULUAN Seiring dengan kemajuan ilmu pengetahuan dan teknologi, khususnya bidang komputasi, analisis regresi juga mengalami perkembangan yang cukup pesat dan banyak digunakan dalam berbagai bidang. Analisis regresi merupakan salah satu analisis dalam statistika yang bertujuan untuk mengestimasi atau menyelidiki hubungan antara variabel prediktor dengan variabel respon melalui pengamatan kecenderungan pola hubungan yang ada. Analisis regresi yang mengandung kombinasi linier parameter dengan prediktornya, sering disebut sebagai model linier. Pada awalnya model linier disyaratkan harus memiliki galat berdistribusi normal yang independen (saling bebas). Namun dalam kenyataan di lapangan, asumsi tersebut sering tidak terpenuhi. Atas dasar itulah kemudian model linier berkembang dan bisa menangani data yang tidak berdistribusi normal (tetapi masih dalam keluarga eksponensial). Walaupun bisa memiliki galat yang tidak berdistribusi normal, namun masih harus saling independen. Model linier seperti ini disebut Generalized Linier Model (GLM) (McCullagh & Nelder, 1989). Dalam hal pengamatan yang dilakukan secara berulang (longitudinal), atau data yang mengandung klaster, maka akan didapatkan respon yang mutivariat yang kemungkinan besar antar pengamatan, tidak saling independen. Hal ini disebabkan respon yang diperoleh secara berulang cenderung memiliki hubungan atau berkorelasi antara satu respon dengan yang lainnya. Pengamatan yang menghasilkan respon seperti itu akan bertentangan dengan asumsi GLM. Kasus tersebut mungkin bisa diselesaikan dengan metode multivariat biasa, namun metode biasa hanya mendeskripsikan hubungan antar variabel saja sehingga pola korelasi yang

30 Efisiensi Generalized Estimating Equations (Hidayati, dkk) terbentuk dari pengamatan tersebut tidak terlihat dan cenderung melibatkan jumlah parameter yang berlebih. Salah satu cara untuk menangani data seperti ini adalah dengan menerapkan model linier yang disebut Generalized Estimating Equation (GEE), yang diperkenalkan oleh Liang & Zeger (1986). Model linier ini mengatasi ketidaksalingbebasan data dengan menerapkan struktur korelasi yang berbeda-beda bergantung pada matriks ragam-koragamnya, sehingga pola korelasi yang terbentuk dari respon pengamatan dapat diktetahui. Pendekatan GEE fokus pada model linier untuk mean dari pengamatan berkorelasi dalam kluster tanpa spesifikasi distribusi bersama pada secara penuh. GEE merupakan model marjinal yang tidak didasarkan atas bentuk likelihood lengkap dari respon, tetapi hanya berdasarkan hubungan antar nilai tengah (momen pertama) dan ragamnya (momen kedua) serta bentuk matriks korelasinya (Halekoh et al., 2006 ). GEE diklaim robust terhadap kesalahan spesifikasi struktur korelasi (Overall, 2004 ), yaitu dengan GEE diklaim parameter mean dapat diestimasi secara konsisten terlepas dari apakah struktur korelasinya ditentukan dengan benar atau tidak, selama mean mempunyai spesifikasi yang benar. Namun ada kekhawatiran efisiensi estimasi menurun/ hilang ketika struktur working correlation tidak ditentukan dengan benar (Crespi et al., 2009). GEE didesain untuk fokus pada mean marjinal dan memperlakukan struktur korelasi sebagai nuisance, sehingga implementasi dari GEE biasanya terbatas pada sejumlah struktur working correlation (misalnya AR-1, exchangeable, independence, m-dependence dan unstructured) (Crespi et al., 2009).. Untuk menambah efisiensi dari GEE, Prentice & Zhao (1991) memperkenalkan sebuah pengembangan dari GEE yang selanjutnya dikenal dengan Generalized Estimating Equations orde 2 (GEE2). GEE2 diperkenalkan untuk mengatasi masalah pada GEE yang menganggap korelasi sebagai nuisance dengan menerapkan persamaan estimasi kedua untuk parameter kovarian dan diselesaikan secara bersamaan dengan persamaan estimasi pertama, singkatnya persamaan GEE2 adalah perpanjangan dari GEE dengan solusi simultan dari persamaan estimasi untuk mean dan persamaan estimasi untuk kovarian (Lane, 2007) METODE Data yang digunakan dalam penelitian ini adalah data simulasi dengan cara membangkitkan data secara random berdasarkan struktur data yang digunakan oleh Yan (2002) dengan perubahan pada distribusinya, dimana banyak data 200 data respon yang terbagi dalam 50 subjek dengan variabel-variabel sebagai berikut: a. x 1,dan x 2 merupakan variabel bebas b. y merupakan variabel respon yang diukur dalam empat (4) kali visitasi, sedangkan identitas subjek diberi kode id. Struktur data yang disimulasikan dengan varabelnya dapat ditunjukan pada Tabel 1. Sedangkan langkah-langkah simulasinya diberikan pada Gambar 1. Rincian prosedur simulasi dan analisis datanya adalah seperti berikut ini. Tabel 1. Ideintifikasi variabel Visit Subyek id -------------------------------- x 1 x 2 y 1 y 2 y 3 y 4 1 1 y 11 y 12 y 13 y 14 x 11 x 12 2 2 y 21 y 22 y 23 y 24 x 21 x 22 3 3 y 31 y 32 y 33 y 34 x 31 x 32 : : : : : : : : n n y n1 y n2 y n3 y n4 x n1 x n2 Tahap Simulasi Pada tahap ini dibangkitkan dua set data masing-masing dengan respon antar visit 1 sampai dengan 4 memiliki struktur korelasi AR-1 dan exchangeable yang merupakan matriks simmetris dengan bentuk umum seperti berikut. Untuk AR-1 2 p1 1 p2 1, p3 R( ) 1 1 dan 1 1 R( ) 1 1 untuk exchangeable

Jurnal ILMU DASAR, Vol.15 No.1, Januari 2014: 29-35 31 Gambar 2. Eksplorasi data simulasi dengan Korelasi AR-1 Gambar 1. Prosedur simulasi dan analisis data Pada penelitian ini dipilih nilai = 0,4729753 untuk struktur korelasi AR-1 dan = 0,4088738 untuk korelasi Exchangeable. Tahap analisis a. Masing-masing data di analisis dengan metode GEE, dengan fungsi gee() dan GEE2, dengan fungsi geese() untuk melihat perbedaan adanya pemodelan link korelasi dan tanpa link korelasi. b. Pada penggunaan GEE dan GEE2, masingmasing set data dianalisis dengan menggunakan pilihan correlation structure exchangeable dan AR-1 untuk membandingkan hasil ketika corelation structure-nya ditetapkan secara benar dan ketika ditetapkan secara tidak benar. c. Hasil analisis dibandingkan terutama nilai estimasi parameter, AIC dan standard error (kesalahan baku)-nya. HASIL DAN PEMBAHASAN Hasil eksplorasi grafis dari data simulasi yang digunakan ditunjukkan oleh Gambar 2 (model AR-1) dan Gambar 3 (exchangeable). Kedua gambar menunjukkan adanya indikasi bahwa dilihat dari respon y data memiliki sebaran yang tidak sepenuhnya saling bebas (memiliki pola). Pola akan lebih jelas terlihat jika dilakukan plot indeks pada y. Plot indeks untuk variabel y dengan struktur korelasi AR-1 diberikan pada Gambar 4a dan Gambar 4b sedangkan plot index variabel y dengan struktur korelasi Exchangeable disajikan dalam Gambar 4c dan Gambar 4d. Gambar tersebut mengindikasikan adanya korelasi pada respon, hal ini dilihat dari sebaran data yang cenderung tidak acak dan membentuk suatu pola dimana y berkorelasi dengan dirinya sendiri (autokorelasi). Sebaran data tersebut sesuai dengan desain dari struktur korelasi yang digunakan. Gambar 3. Eksplorasi data simulasi dengan KorelasiExchangeable Sebagaimana disebutkan sebelumnya, untuk setiap data diterapkan 2 (dua) metode estimasi yaitu GEE dan GEE2, dengan 2 (dua) pilihan struktur korelasi. Hal ini bertujuan untuk mengetahui ada tidaknya pengaruh antara link korelasi dimodelkan dengan tidak dimodelkan dan struktur korelasi yang benar dan tidak benar. Link korelasi yang digunakan dalam metode GEE2 yaitu link identity. Keefisienan estimasi dilihat dari nilai standard error yang lebih kecil, sedangkan pemilihan model terbaik berdasarkan nilai AIC. Hasil yang diperoleh dengan menggunakan metode GEE dan GEE2 sebagai berikut.

32 Efisiensi Generalized Estimating Equations (Hidayati, dkk) Tabel 3. Standar error dan uji Z Tipe Korelasi Variabel Naive S.E Naive Z Robust Robust Z S.E AR-1 Intercept 0,2736411 2,801722 0,1983451 3,865314 X1 0,09958396 22,808990 0,1328778 17,093977 X2 0,39008315-8,069556 0,3355657-9,380572 Exchangeable Intercept 0,2819451 2,676549 0,221743 3,403659 X1 0,1038594 21,782881 0,1314054 17,216631 X2 0,3858488-8,125191 0,3518367-8,910654 Data dengan Struktur Korelasi Exchangeable Untuk data dengan struktur korelasi Exchangeable, hasil estimasi parameter regresi dan standard error-nya diberikan pada Tabel 4 dan Tabel 5. Gambar 4. Plot indeks variabel y dua model korelasi Plot a. AR-1 b. Exchangeable Hasil Estimasi dengan GEE Pada tahap ini kedua data di analisis dengan memilih model AR-1 dan exchangeable, untuk membandingkan hasil estimasi parameter pada saat struktur korelasi ditentukan dengan benar atau salah (misspesification). Selanjutnya untuk melihat apakah GEE bisa mendeteksi struktur korelasi yang lebih sesuai. Infrensi GEE yang disediakan R meliputi Naive SE, Naive z, Robust SE, Robust z dan Scale Parameter (parameter skala). Naive SE merupakan standar kesalahan dalam penduga naive menggunakan log-likelihood. Naive z merupakan nilai z untuk penduga naive. Robust SE merupakan standar kesalahan dalam penduga robust menggunakan penduga kuadrat terkecil yang terboboti (weighted least-square) pada varian, Robust z merupakan nilai z untuk penduga robust. Data dengan Struktur Korelasi AR-1 Untuk data dengan struktur korelasi AR-1, hasil estimasi parameter dan standard error-nya diberikan pada Tabel 2 dan Tabel 3. Tabel 2. Estimasi β dengan korelasi AR-1 dan korelasi exchangeable Tipe korelasi Variabel Estimate AR-1 Intercept 0,7666662 X1 2,2740097 X2-3,147979 Exchangeable Intercept 0,7546400 X1 2,262358 X2-3,135095 Tabel 4. Estimasi koefisien regresi Tipe korelasi Variabel Estimate AR-1 Intercept 0,7666662 X1 2,2740097 X2-3,147979 Exchangeable Intercept 0,7546400 X1 2,262358 X2-3,135095 Tabel 5. Standar error Tipe Korelasi Variabel Naive S.E Naive Z Robust S.E Robust Z AR-1 Intercept 0,2478506 4,140071 0,2423303 4,234381 X1 0,1106409 18,403113 0,1584906 12,847055 X2 0,3380998-8,940712 0,03243872-9,318657 Exchangeable Intercept 0,2468469 4,238913 0,2392704 4,373139 X1 0,1076846 18,489790 0,1531813 12,998091 X2 0,3223487-9,347052 0,3123651-9,645795 Hasil Estimasi dengan GEE2 Data dengan Struktur Korelasi AR-1 Hasil estimas yang disediakan untuk GEE2 meliputi san.se, wald dan p, dimana san.se merupakan penduga sandwich atau yang lebih dikenal dengan matriks kovarian empiris, wald adalah uji signifikansi paramater atau yang sering disebut uji wald, sedangkan p adalah nilai p value dari masing-masing variabel. Penduga matriks korelasi terdapat dua jenis yakni Naive/model-based estimator dan Robust/empirical/ sandwich estimator. Pada prosedur GEE penduga matriks korelasi menggunakan Naive/model-based estimator sedangkan pada GEE2 lebih menggunakan Robust/empirical/sandwich estimator. Hasil estimasi dengan GEE2 untuk data dengan struktur korelasi AR-1 diberikan pada Tabel 6 untuk koefisien regresi dan Tabel 7 untuk standar error-nya. Tipe korelasi Tabel 6. Hasil koefisien regresi (GEE2) Link Korelasi Variabel Estimate Dispersi AR-1 identity Intercept 1,014051 0,8035262 X1 2,161674 X2-3,369774 Exchangeable Intercept 0,9846712 identity X1 2,1094860 0,7944896 X2-3,310939

Jurnal ILMU DASAR, Vol.15 No.1, Januari 2014: 29-35 33 Tabel 7. Nilai standard error dengan link korelasi identity GEE dan GEE2 seperti pada tabel Tabel 12 dan Tabel 13: Tipe Korelasi Variabel Sand. S.E Wald P AR-1 Intercept 0,1670100 36,86675 1,264845e-09 X1 0,1229261 309,23735 0,000000e+00 X2 0,2632458 163,86217 0,000000e+00 Exchangeable Intercept 0,201507 23,87821 1,026289e-06 X1 0,1263943 278,54712 0,000000e+00 X2 0,2871256 132,97153 0,000000e+00 a. Standard Error GEE dan GEE2 untuk data dengan struktur korelasi AR-1 Tabel 12. Standar Error GEE dan GEE2 Sedangkan hasil estimasi parameter korelasinya, diberikan pada Tabel 8. Tabel 8. Nilai estimasi untuk korelasi Tipe Korelasi Koef Sand. S.E Wald P Korelasi AR-1 0,6381885 0,0679042 88,3287 0 Exchangeable 0,4945328 0,0729258 45,98637 1,190792e-11 Data dengan Struktur Korelasi Exchangeable Hasil estimasi parameter regresi untuk data dengan struktur korelasi AR-1 diberikan pada Tabel 9 dan Tabel 10, sedangkan hasil estmasi untuk parameter korelasi diberikan pada Tabel 11. Tipe korelasi Tabel 9. Estimasi koefisien regresi Link Variabel Estimate Dispersi Korelasi AR-1 identity Intercept 1,014253 X1 2,090146 1,014269 X2-3,076242 Exchangeable Intercept 1,045919 identity X1 2,018462 1,020294 X2-3,074195 Tabel 10. Nilai standar error dengan link korelasi identity Tipe Korelasi Variabel Sand. S.E Wald P AR-1 Intercept 0,1918365 27,95311 1,2429e-07 X1 0,1251906 278,74678 0,000000e+00 X2 0,3144923 95,67991 0,000000e+00 Exchangeable Intercept 0,1828997 32,70167 1,07445e-08 X1 0,1178171 293,51090 0,000000e+00 X2 0,2901770 112,23719 0,000000e+00 Tabel 11. Nilai estimasi koefisien korelasi Tipe Estimate Sand. SE Wald P Korelasi AR-1 0,4417912 0,07921034 31,10787 2,440792e-08 Exchangeable 0,3294760 0,07267385 20,55376 5,797984e-06 Dari hasil yang disampaikan sebelumnya kita dapat merangkum standar error untuk metode GEE GEE2 Variabel AR-1 Exchangeable AR-1 Exchangeable Intercept 0,27364111 0,2819451 0,1670100 0,2015071 X1 0,09958396 0,1038594 0,1229261 0,1263943 X2 0,39008315 0,3858488 0,2632458 0,2871256 - - 0,0679042 0,0729258 AIC 988,3708 989,0583 574,4881 577,9208 b. Standard Error GEE dan GEE2 untuk data dengan Struktur korelasi Exchangeable Tabel 13. Standar Error GEE dan GEE2 GEE GEE2 Variabel AR-1 Exchangeable AR-1 Exchangeable Intercept 0,2478506 0,2478506 0,1918365 0,18289997 X1 0,1106409 0,1076846 0,1251906 0,1178171 X2 0,3380998 0,3223487 0,3144923 0,2901770 - - 0,07921034 0,07267385 AIC 695,3979 689,1450 443,3828 440,9040 Berdasarkan hasil analisis data menggunakan software R baik menggunakan prosedur GEE maupun menggunakan prosedur GEE2, dapat diperoleh beberapa penjelasan yang berkaitan dengan analisis data simulasi dengan respon diasumsikan berkorelasi sebagai berikut. Dari Tabel 2 dan Tabel 4 dapat disimpulkan bahwa metode GEE (GEE1 maupun GEE2) tetap mengestimasi koefisien regresi secara relatif konsisten terlepas dari struktur korelasinya ditentukan dengan benar atau tidak. Hal ini dilihat dari besarnya hasil estimasi koefisien regresi. Struktur korelasi yang sesuai dengan desain data simulasi pertama adalah AR-1 namun estimasi dengan struktur korelasi exchangeable nilai estimasinya tidak jauh berbeda dengan yang dihasilkan oleh struktur korelasi AR-1. Begitu juga sebaliknya dengan data yang didesain berdasarkan struktrur korelasi exchangeable ketika diestimasi menggunakan struktur korelasi AR-1 menghasilkan nilai estimasi yang tidak jauh berbeda pula (Tabel 6 dan Tabel 9). Meskipun penggunaan struktur korelasi yang tidak sesuai dengan desain awal tetap mengasilkan nilai estimasi yang konsisten. Namun ketika struktur korelasinya tidak sesuai, estimasi-estimasi tersebut menghasilkan nilai standard error yang cenderung lebih tinggi dibandingkan dengan estimasi menggunakan struktur korelasi yang sesuai,

34 Efisiensi Generalized Estimating Equations (Hidayati, dkk) baik menggunakan metode GEE maupun GEE2 (Tabel 3 dan Tabel 5 untuk metode GEE, sedangkan untuk metode GEE2 pada Tabel 7 dan Tabel 10). Data yang didesain berdasarkan struktur korelasi AR-1, dianalisis dengan struktur korelasi exchangeable, menghasilkan nilai standard error untuk cenderung lebih besar dibandingkan dengan struktur korelasi AR-1 dan begitu juga sebaliknya. Sehingga keefisienan estimasi tersebut dapat dikatakan berkurang meskipun menghasilkan nilai estimasi yang tidak jauh berbeda. Selain itu nilai AIC yang dihasilkan juga menunjukan bahwa nilai AIC model dengan struktur korelasi AR-1 (untuk data yang didesain berdasarkan struktur korelasi AR-1) nilainya lebih kecil baik dengan menggunakan metode GEE maupun GEE2 (Tabel 12) begitu pula dengan model yang didesain sesuai dengan struktur korelasi exchangeable memberikan nilai AIC yang dihasilkan juga lebih kecil dibandingkan dengan model dengan struktur korelasi AR-1 (Tabel 13). Kedua hal tersebut (standard error dan nilai AIC) menunjukkan bahwa dengan penggunaan struktur korelasi yang salah koefisien regresi masih diestimasi secara konsisten, namun keefisienan modelnya dapat dikatakan kurang baik. Berdasarkan hasil analisis Tabel 12 dan Tabel 13 dapat dikatakan bahwa link korelasi juga mempengaruhi keefisienan model, hal ini terlihat dari nilai standard error untuk model dengan link korelasi dimodelkan (metode GEE2) memberikan nilai yang lebih kecil dibandingkan dengan link korelasi yang tidak dimodelkan baik dengan menggunakan struktur korelasi AR-1 maupun exchangeable. Sehingga dapat dikatakan metode GEE2 mengestimasi parameter dengan keefisienan yang lebih baik, dari GEE, hal ini ditunjukkan dengan nilai standard error metode GEE2 lebih kecil dibandingkan metode GEE. Selain itu nilai AIC untuk metode GEE2 juga jauh lebih kecil dibandingkan dengan GEE, hal ini menunjukkan model dengan metode GEE2 lebih baik (Tabel 12 dan Tabel 13). Pada metode GEE koefisien korelasi tidak diestimasi, nilai hanya ditunjukan pada struktur korelasinya saja. Sedangkan pada GEE2 koefisien korelasi diestimasi sama seperti dengan memberikan nilai standard error, uji wald dan nilai p-valuenya sehingga dapat dibandingkan keefisienan pada kedua struktur korelasi yang digunakan. Untuk data dengan desain korelasi AR-1, Tabel 12 menunjukkan nilai koefisien korelasi untuk AR-1 mempunyai nilai yang lebih mendekati nilai 1 dibandingkan struktur korelasi exchangeable dengan nilai estimasinya sebesar 0,6381885 serta nilai uji wald menunjukan signifikan dengan nilai standard error lebih minimum yaitu 0,0679042, sedangkan untuk data dengan desain struktur korelasi exchangeable mempunyai nilai sebesar 0,3294760 dengan nilai standard error-nya 0,07267385 yang jauh lebih kecil dibandingkan dengan struktur korelasi pembandingnya (Tabel 13). KESIMPULAN DAN SARAN Kesimpulan Dari hasil dan pembahasan sebelumnya diperoleh kesimpulan sebagai berikut ini. a. Metode GEE (GEE dan GEE2) tetap mengestimasi secara konsisten terlepas dari struktur korelasinya ditentukan dengan benar atau tidak, namun namun estimasi lebih efisien saat struktur korelasi ditentukan dengan benar. b. Link korelasi juga mempengaruhi keefisienan model yang ditunjukan dengan nilai standard error yang dihasilkan oleh metode GEE2 lebih kecil dibandingkan dengan metode GEE yang tidak memodelkan korelasi. Begitu juga dengan nilai AICnya, metode GEE2 menghasilkan nilai AIC yang lebih kecil dibandingkan dengan metode GEE. Saran Bagi para peneliti yang menerapkan analisis regresi dengan respon yang berkorelasi disarankan untuk menggunakan GEE2, karena GEE2 menyediakan pilihan yang lebih fleksibel untuk model maupun link korelasinya. Lebih-lebih, analisis tersebut telah ada pada software statistika yang tersedia secara bebas dalam bentuk open source yang mudah diakses. DAFTAR PUSTAKA Crespi.,Wong & Shiraz. 2009. Using Second Order GEE to Model Heterogeneous Intra Class Correlation in Cluster Randomized Trials.NIH Public Access.28(5)-814. Halekoh, Hojsgaard & Yan. 2006. The R Package geepack for Generalized Estimating Equations.

Jurnal ILMU DASAR, Vol.15 No.1, Januari 2014: 29-35 35 Journal of Statistics Software. Vol. 15 (2):1-11. Lane,S. 2007. Generalized Estimating Equations for Pedigree Analysis. Department of Mathematics and Statistics:University of Melbourne. Liang, K-Y & Zeger, S. 1986. Longitudinal data analysis using Generalized Linear Model, Biometrika, 73:13-22 McCullagh, P. & Nelder J.A. 1989. Generalized Linear Models, Chapman & Hall Overall, J E & Tonidandel, S. 2004. Robustness of Generalized Estimating Equation (GEE) Test of Significance against Misspecification of the Error Structure Model. Biometrical Journal. 2:203-213 Prentice R.L. & Zhao, L.P. 1991. Estimating Equations for Parameters in Means and Covariances of Multivariate Discrete and Continuous Responses. Biometrics. 47: 825-839. Yan, J 2002 geepack: Yet Another Package for Generalized Estimating Equations R-News, 2(3):12-14

36 Efisiensi Generalized Estimating Equations (Hidayati, dkk)