BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam penelitian-penelitian di bidang kesehatan sering dijumpai salah satu jenis data yang disebut dengan data antar kejadian atau data survival. Data survival adalah data tentang pengamatan jangka waktu dari awal pengamatan sampai terjadinya peristiwa. Contoh data antar kejadian ini antara lain data lama waktu kambuhnya penyakit seorang pasien setelah diberi pengobatan, data waktu kematian pasien setelah didiagnosis suatu penyakit, dan data lama waktu sembuhnya pasien setelah melakukan terapi. Data antar kejadian dapat pula ditemui dalam bidang-bidang lain, seperti dalam bidang demografi, ekonomi dan ilmu perekayasaan. Analisis survival hanya melihat suatu event gagal atau tidak karena satu penyebab, misalkan seorang pasien yang terkena kanker akan diteliti sepuluh tahun ke depan, apakah selama sepuluh tahun ke depan pasien tersebut telah terkena event meninggal atau tidak. Jika ia meninggal maka sukses dan jika tidak maka gagal. Model regresi yang biasa digunakan untuk data survival yaitu regresi Cox yang melibatkan komponen yang disebut baseline hazard. Namun setelah didiagnosis kanker, tidak dapat diketahui dengan pasti bahwa pasien tersebut meninggal akibat terkena kanker atau ada penyebab yang lain. Terkadang informasi penyebab kematian tidak tersedia sehingga diperlukan metode untuk menganalisis tersebut. Berkson (1942) memperkenalkan suatu konsep tingkat survival relative atau corrected untuk kelompok pasien. Relative survival ini bisa digunakan untuk mempekirakan akibat dari penyakit tertentu dalam mortalitas, ketika penyebab kematian tidak diketahui kebenarannya namun waktu kematiannya diketahui. Ada beberapa alasan kenapa digunakan metode relative survival yaitu: (1) Untuk mengestimasi kematian yang berhubungan dengan diagnosis fakta-fakta tentang penyakit tanpa membutuhkan informasi penyebab kematian. (2) Kualitas dari informasi penyebab kematian berbeda, antara tipe penyakit dan antara daerah 1
2 atau negara. (3) Banyak registrasi dari penyakit tidak dicatat penyebab kematiannya. Fungsi relative survival digunakan ketika informasi penyebab kematian tidak akurat atau tidak ada. Relative survival umumnya diestimasi menggunakan metode life table. Terdapat 3 metode life table, yaitu metode Ederer I, Ederer II, dan Hakulinen. Selain dengan metode life table, relative survival juga dapat diestimasi dengan model regresi relative survival. Umumnya regresi relative survival dinyatakan sebagai model aditif (Additive Relative Survival). Untuk memodelkannya beberapa metode yaitu Generalized Linear Model Poisson, metode ini mengasumsikan banyaknya individu yang meninggal mengikuti distribusi Poisson, Hakulinen-Tenkanen, metode ini mengasumsikan banyaknya individu yang meninggal mengikuti distribusi binomial, Esteve Additive, metode ini menggunakan pendekatan maximum likelihood. Untuk kasus ini, baseline hazard yang digunakan dalam model excess hazard pada regresi relative survival dinamakan baseline excess hazard. Pada model Cox mengasumsikan variabel prediktor harus memenuhi asumsi proportional hazard, artinya hazard ratio haruslah konstan sepanjang waktu. Dalam prakteknya, asumsi untuk mengestimasi baseline hazard dirasa tidak mudah karena hanya diinterpretasikan sebagai rata-rata selama selang waktu tertentu. Sementara itu pada model regresi, kebanyakan peneliti sering berkonsentrasi pada estimasi koefisiennya, padahal informasi dari baseline hazard sangat penting untuk mengetahui gambaran keseluruhan dalam menginterpretasi model agar dapat menghindari kesalahan estimasi. Oleh karena itu, Pohar et al. (2009) mengusulkan sebuah pendekatan untuk memodelkan regresi relative survival yang lebih fleksibel dengan tidak memerlukan asumsi tentang bentuk baseline excess hazard. Model ini diestimasi berdasarkan algoritma EM dengan variabel penyebab kematian yang lain diperlakukan sebagai variabel yang hilang. Pada metode ini, baseline excess hazard diestimasi bersamaan dengan koefisien dalam model regresi melalui algoritma EM.
3 1.2 Tujuan Penulisan Berdasarkan latar belakang di atas, penulisan skripsi ini mempunyai beberapa tujuan antara lain: 1. mempelajari tentang excess hazard pada regresi relative survival yang menginterpretasikan resiko terkait efek kovariat; 2. mempelajari penggunaan algoritma EM untuk mengestimasi baseline excess hazard dan koefisien regresi dalam pemodelan excess hazard pada regresi relative survival; 3. menerapkan model tersebut pada data Colon Carcinoma Cancer di Finlandia. 1.3 Pembatasan Masalah Dalam penulisan skripsi ini, pembatasan masalah sangat diperlukan agar pembahasan yang disampaikan jelas dan fokus pada tujuan. Skripsi ini akan fokus dalam pembahasan excess hazard pada regresi relative survival yang menginterpretsikan resiko terkait efek kovariat melalui pendekatan algoritma EM dan aplikasinya untuk kasus data tersensor kanan pada data Colon Carcinoma Cancer di Finlandia. 1.4 Metode Penulisan Metode yang dipakai dalam penulisan skripsi ini yaitu dengan menggunakan metode studi literatur, baik itu yang diperoleh dari buku-buku, jurnal-jurnal, maupun situs-situs internet yang sesuai dengan tema skripsi ini. Pengolahan data dalam skripsi ini menggunakan software R versi 3.1.3 untuk mencari model excess hazard pada regresi relative survival dengan algoritma EM sebagai pendekatan estimasi. 1.5 Tinjauan Pustaka Suryani (2008) dalam skripsinya Model Regresi Relative Survival membahas tentang model relative survival dengan metode Esteve Additive sebagai metode pendekatan estimasi dengan menggunakan fungsi likelihood.
4 Pratesa (2014) dalam tesisnya Estimasi Relative survival dengan Life Table dan Hakulinen-Tenkanen membahas tentang estimasi relative survival menggunakan metode Ederer II dan metode Hakulinen-Tenkanen yang mengasumsikan angka kematian berdistribusi binomial sebagai metode pendekatan estimasi. Dickman (2015) dalam tulisannya Estimating and Modelling Relative Survival membahas tentang relative survival secara umum, metode untuk mencari nilai relative survival dengan Life Table dan model regresi. Pohar (2006) dalam tulisannya Relative survival analysis in R membahas tentang model regresi relative survival dengan beberapa metode antara lain, Hakulinen-Tenkanen, additive survival method, Esteve additive survival model, glm model with the Poisson error structure, Andersen multiplicative model, transformation approach. Fawzi (2015) dalam skripsinya yang berjudul Regresi Relative Survival dengan Metode Generalized Linear Model Poisson (GLMP) membahas tentang pemodelan relative survival dengan Generalized Linear Model Poisson yang mengasumsikan banyaknya individu yang meninggal mengikuti distribusi Poisson. Dalam penyusunan skripsi ini penulis menggunakan sumber pustaka utama yaitu jurnal yang berjudul An Approach to Estimation in Relative Survival Regression oleh Pohar et al. (2009) yang membahas tentang pemodelan excess hazard pada regresi relative survival dengan pendekatan algoritma EM. 1.6 Sistematika Penulisan Skripsi ini akan dibahas secara rinci dalam lima bab, sebagai berikut: BAB I PENDAHULUAN Bab ini membahas latar belakang masalah, tujuan penulisan, pembatasan masalah, metode penulisan, tinjauan pustaka, dan sistematika penulisan. BAB II DASAR TEORI Bab ini berisi kumpulan teori yang menunjang pembahasan materi. Teoriteori yang disajikan antara lain mengenai ekspektasi dan variansi, data dan variabel random survival, fungsi survival dan fungsi hazard, data tersensor, regresi Cox, metode Partial Likelihood, algoritma EM, dan metode Newton Raphson.
5 BAB III PEMBAHASAN Bab ini membahas tentang konsep dasar relative survival, model excess hazard, estimasi parameter regresi dengan algoritma EM dengan diawali dari tahap E (Ekspektasi) yaitu mencari nilai ekspektasi dari loglikelihood, lalu pada tahap M (Maksimisasi) menggunakan Newton- Raphson untuk mencari nilai estimasi parameternya, dan pemilihan model terbaik. BAB IV STUDI KASUS Bab ini membahas tentang aplikasi regresi relative survival dengan pendekatan algoritma EM untuk mengestimasi nilai excess hazard pada data Colon Carcinoma Cancer, interpretasi model yang didapatkan, membandingkan regresi relative survival dengan regresi Cox, dan menentukan model terbaik berdasarkan AIC. BAB V PENUTUP Bab ini membahas tentang kesimpulan dan saran dari hasil pembahasan bab-bab sebelumnya.