BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Analisis survival adalah analisis data yang memanfaatkan informasi kronologis dari suatu kejadian atau peristiwa (event). Respon yang diperhatikan adalah waktu sampai terjadinya suatu event, sehingga analisis survival sering disebut juga analisis antar kejadian (time-to-event analysis). Waktu suatu objek telah bertahan selama periode pengamatan atau sampai terjadinya suatu event yang diinginkan disebut survival time atau failure time. Dengan kata lain, survival time adalah suatu variabel yang mengukur waktu dari sebuah titik awal tertentu sampai dengan sebuah titik akhir yang ingin diperhatikan. Waktu dapat berupa tahun, bulan, hari, jam, atau bahkan menit yang diukur sejak pengamatan dimulai hingga muncul kejadian. Kejadian yang diamati dapat berupa kematian, insiden penyakit, kekambuhan penyakit, atau penyembuhan penyakit. Analisis survival banyak digunakan pada bidang-bidang terapan seperti ilmu kedokteran, ekonomi, sosiologi, psikologi, teknik dan berbagai bidang lain. Kejadian (event) dapat dianggap sebagai suatu kegagalan (failure), karena event yang diperhatikan biasanya berupa kematian pasien, kambuhnya penyakit setelah perawatan, kerusakan mesin, dan lain sebagainya. Disamping itu, terdapat juga kasus kegagalan yang kejadiannya positif, seperti sembuhnya seseorang setelah dilakukan operasi. Beberapa metode analisis tersedia untuk mendapatkan informasi dari data survival, misalnya metode non-parametrik dengan menggunakan estimasi Kaplan- Meier maupun Nelson-Aalen. Akan tetapi, hanya melihat waktu survival saja tidak bisa mengakomodir keberadaan informasi dari pengukuran lainnya. Metode parametrik, misalnya dengan regresi, memberikan hasil yang lebih baik. Hal ini dikarenakan pada regresi parametrik dapat diketahui pola dan kekuatan hubungan 1

2 antara waktu kejadian dengan satu atau lebih variabel prediktor (covariate) yang terukur pada saat dilakukan penelitian. Analisis survival mengenal dua terminologi yaitu fungsi survival (survival function) yang diberi simbol dengan S(t) dan fungsi hazard (hazard function) yang diberi simbol h(t). Fungsi survival atau S(t) menjelaskan probabilitas seseorang untuk survive lebih lama dari waktu spesifik t. Pada analisis survival selalu terjadi data tersensor (censored data), yaitu ada informasi mengenai waktu ketahanan individu tetapi tidak diketahui secara pasti berapa lama waktu ketahanannya (Kleinbaum, 1996). Penyebab terjadinya adalah hingga studi berakhir belum muncul kejadian yang diinginkan, hilang dari pengamatan, atau mengalami kejadian yang tidak berhubungan dengan substansi yang diteliti. Kasus tersensor tidak dibuang tetapi tetap diperhitungkan karena minimum hingga titik tertentu masih dapat dilihat belum mengalami kejadian dan dengan asumsi kejadian sensor dalam rentang waktu tertentu terjadi secara merata. Disebut sensor apabila misalnya suatu studi berakhir tetapi tidak muncul kejadian yang diinginkan atau subjek yang diteliti pergi tanpa pesan atau subyek mengundurkan diri karena suatu alasan atau dapat pula subyek mendapatkan kejadian yang bukan merupakan fokus penelitian. Berikut contoh penjelasan mengenai pengertian kejadian, sensor dan waktu ketahanan (survival time). Kleinbaum, 1996 menyatakan bahwa kegunaan analisis survival pertama adalah untuk memperkirakan probabilitas ketahanan suatu kejadian menurut waktu. Kedua, dapat untuk menyimpulkan status kesehatan penduduk. Ketiga, membandingkan ketahanan suatu kejadian antar kelompok. Keempat, mengidentifikasi laju suatu kejadian yang dialami penduduk dalam periode waktu tertentu. Dalam penelitian analisis survival tidak bisa digunakan analisis regresi klasik, karena data waktu hidup jarang dijumpai yang berdistribusi normal. Salah satu asumsi dari analisis regresi klasik adalah datanya berdistribusi normal, sehingga jika dipaksakan untuk tetap menggunakan model regresi linear maka

3 model tersebut tidak terlalu bagus untuk menggambarkan data. Selain itu, dalam analisis survival data yang digunakan tidak berasal dari satu orang tetapi dari beberapa pasien yang memiliki kriteria yang berbeda-beda sehingga uji univariatnya tidak dapat digunakan dan masih banyak faktor lain yang menyebabkan analisis regresi klasik tidak dapat digunakan untuk menganalisis data survival. Salah satu model regresi yang sering digunakan dalam analisis survival adalah regresi Cox. Seperti halnya regresi klasik, regresi Cox mempunyai variabel dependen, yang berupa data waktu hidup, dan variabel independen atau kovariat. Pengaruh kovariat-kovariat pada data survival dapat dilakukan dengan memodelkan conditional hazard sebagai fungsi dari kovariat-kovariatnya. Conditional hazard dari individu dengan kovariat-kovariat merupakan produk dari baseline hazard dan fungsi eksponen kovariat-kovariatnya. Baseline hazard merupakan fungsi yang bergantung pada waktu dan tidak melibatkan kovariat. Sedangkan bagian ekspresi eksponensial merupakan fungsi yang bergantung pada kovariat tanpa melibatkan waktu. Oleh karena itu, model regresi Cox lebih dikenal sebagai model semi-parametrik. Tujuan dari metode regresi Cox adalah untuk mengetahui hubungan antara waktu survival dengan variabel-variabel prediktor. Dalam regresi Cox, fungsi hazard secara penuh dipengaruhi oleh vektor kovariat sehingga jika terdapat kovariat yang tak teramati maka akan menimbulkan kerancuan. Model regresi Cox berbeda dengan model parametrik, dimana baseline hazard pada model parametrik mempunyai bentuk yang jelas. Dalam kenyataannya, data yang dimiliki tidak diketahui distribusinya, sehingga bentuk baseline hazard juga tidak dapat diketahui. Model semi-parametrik lebih sering digunakan, karena walaupun bentuk fungsional baseline hazard tidak diketahui, tetapi model regresi Cox ini tetap dapat memberikan informasi yang berguna, berupa hazard ratio (HR) yang tidak bergantung pada baseline hazard. Hazard ratio untuk dua individu dengan nilai kovariat yang berbeda tidak akan

4 dipengaruhi oleh waktu. Dengan kata lain, hazard untuk satu individu proporsional dengan hazard individu lainnya dengan keproporsionalan yang konstan. Oleh sebab itu, model regresi Cox juga dikenal dengan nama model regresi Cox Proportional Hazard. Ketika model regresi Cox Proportional Hazard diterapkan pada data survival, hal yang harus dipenuhi adalah bahwa data harus memenuhi asumsi proportional hazard. Proportional hazard yang tidak signifikan dapat menyebabkan tidak adanya perbedaan dalam interpretasi data terutama untuk ukuran sampel yang besar. Model regresi Cox seperti yang dijelaskan diatas hanya dapat digunakan untuk data dengan event tunggal. Pada penelitian tentang penyakit-penyakit kronis seperti kanker seringkali dilihat juga event-event selain kematian, misalnya pertama kali menderita kanker, kembali menjalani perawatan di rumah sakit, atau kenaikan stadium dari kanker tersebut. Kasus-kasus seperti di atas dapat dimodelkan menggunakan model multistatus. Model multistatus merupakan salah satu metode dalam analisis survival di mana event yang menjadi perhatian lebih dari satu. Model multistatus dapat diestimasi menggunakan beberapa metode, yaitu metode Markov, Non-Markov, maupun Semi-Markov. Dari ketiga metode tersebut, metode Markov merupakan metode yang banyak digunakan dalam pemodelan multistatus karena kesederhanaan modelnya (Meira-Machado dkk., 2009). Model multistatus Markov paling sederhana yaitu model multistatus Markov waktu homogen (time homogeneous multistate Markov model), di mana intensitas transisi diasumsikan konstan sepanjang waktu (Andersen dan Keiding, 2002; Meira-Machado dkk., 2009). Asumsi kehomogenan intensitas transisi terhadap waktu memudahkan untuk mengestimasi model multistatus. Berdasarkan uraian latar belakang tersebut, maka dalam penelitian ini penulis bermaksud mengusulkan untuk menggabungkan model Cox Proportional Hazard dan model Markov untuk penilaian waktu kelangsungan hidup seorang

5 pasien. Model Cox Proportional Hazard mengestimasi pengaruh berbagai ciri-ciri pada saat hazard rate, sedangkan model Markov menganalisis bagaimana perkembangan pasien, misalnya pasien dislipidemia pada penyakit jantung koroner dalam hal mengubah kadar LDL kolesterol dan konsumsi statin, mempengaruhi waktu kelangsungan hidup pasien tersebut. Penulis juga menggunakan koneksi matematika antar dua model tersebut untuk menggabungkan hasil keduanya dan untuk memperkuat kesimpulan yang diperoleh. Penggunaan analisis dengan proses markov ini bertujuan untuk mengetahui perkiraan waktu kelangsungan hidup pasien, estimasi total waktu di setiap state selama sisa hidup pasien, probabilitas transisi antar state, dan lain-lain. Penggunaan model ini efektif untuk empat tujuan. Pertama, model ini dianggap tepat untuk analisis yang berdiri sendiri, karena tidak berdasarkan asumsi mengenai bentuk yang mendasari distribusi waktu kelangsungan hidup, dan mempertimbangkan data tersensor pasien yang masih hidup pada akhir penelitian. Kedua, Jika beberapa faktor resiko dapat diasumsikan statis atau permanen (misalnya, terdiagnosanya penyakit diabetes) dapat mempengaruhi tingkat bahaya atau hazard rate yang signifikan, hal ini menunjukkan bahwa model Markov harus diterapkan secara terpisah untuk masing-masing tingkat (misalnya, penderita diabetes dan non-diabetes). Ketiga, penting untuk menyadari bahwa faktor-faktor sebelum deteksi mempengaruhi tingkat bahaya atau hazard rate karena faktor-faktor ini dianggap mencakup bagian-bagian dalam rantai Markov (Markov Chain), yang bertujuan untuk model evolusi sepanjang waktu dari deteksi. Keempat, jika perkiraan fungsi baseline hazard tidak bergantung pada waktu maka distribusi waktu kelangsungan hidupnya adalah eksponensial, yang memvalidasi asumsi stasioneritas dari model Markov, seperti yang akan dijelaskan pada bagian selanjutnya. 1.2 Rumusan Masalah Berdasarkan latar belakang di atas, rumusan masalah dari penelitian ini adalah sebagai berikut:

6 1. Bagaimana hasil analisis survival dengan menggunakan model Cox proportional hazard? 2. Bagaimana hasil estimasi parameter dalam model Cox proportional hazard pada model? 3. Bagaimana hasil matriks transisi probabilitas dengan menggunakan model Markov? 4. Bagaimana hasil gabungan analisis survival dengan menggunakan model Cox proportional hazard dan model Markov? 5. Bagaimana inferensi parameter model tersebut? 1.3 Tujuan dan Manfaat Berdasarkan rumusan masalah di atas, maka tujuan dari penelitian ini adalah sebagai berikut: 1. Mengetahui hasil analisis survival dengan menggunakan model Cox proportional hazard. 2. Mengetahui hasil estimasi parameter dalam model Cox proportional hazard pada model. 3. Mengetahui hasil matriks transisi probabilitas dengan menggunakan model Markov. 4. Mengetahui hasil gabungan analisis survival dengan menggunakan model Cox proportional hazard dan model Markov. 5. Mengetahui inferensi parameter pada model tersebut. Selanjutnya, hasil dari penelitian ini diharapkan menambah wawasan bagi siapa saja, terutama yang mendalami bidang analisis data survival sehingga dapat digunakan sebagai batu pijakan untuk penelitian lebih lanjut. 1.4 Pembatasan Masalah Pada penelitian ini, batasan masalah sangat diperlukan supaya tidak terjadi penyimpangan dari tujuan awal. Oleh karena itu, pembahasan hanya akan

7 difokuskan pada hasil analisis survival menggunakan gabungan model Cox proportional hazard dan model Markov. 1.5 Tinjauan Pustaka Literatur utama yang menjadi acuan dalam penelitian ini adalah artikel yang ditulis oleh Michal Shauly, Gad Rabinowitz, Harel Gilutz, dan Yisrael Parmet (2011). Jurnal utama yang akan dibahas dalam tesis ini berjudul Combined survival analysis of cardiac patients by a PH Cox model and a Markov chain yang membahas tentang kombinasi analisis survival pada pasien jantung koroner dengan model Cox proportional hazard dan model Markov. Selain menggunakan jurnal, penelitian ini juga menggunakan beberapa buku sebagai acuan. Buku-buku yang digunakan antara lain buku berjudul Analysis of Survival Data yang ditulis oleh Cox dan Oakes (1984), Introduction to Probability Model (10th Edition). karya Ross (2010), dan Statistical Methods for Survival Data Analysis (3rd Edition) karya Lee dan Wang (2003) yang merupakan rujukan dalam definisi, teorema, regresi cox, dan proses stokastik.. Definisi dan konsep-konsep dasar dari penelitian ini diperoleh dari rujukan berupa buku teks. Beberapa buku yang digunakan yaitu Empirical Likelihoood Methods yang ditulis oleh Rao dan Wu (2008), dan Introduction to Probability and Mathematical Statistics yang ditulis oleh Bain dan Engelhardt (1992). 1.6 Metodologi Penelitian Metode yang dilakukan dalam penelitian ini adalah studi literatur, dan pengolahan data. Sumber literatur diperoleh dari buku, artikel, dan jurnal yang terkait dengan tema penelitian yaitu analisis mengenai model Cox Proportional Hazard dan model Markov. Selanjutnya hasil dari kedua model tersebut digabungkan sehingga diperoleh kesimpulan yang saling melengkapi dalam mengestimasi fungsi survival. Setelah itu dilakukan simulasi atau studi kasus untuk memperoleh hasil analisis dari kombinasi kedua model tersebut.

8 1.7 Sistematika Penulisan Penulisan Tesis ini terdiri atas 5 (lima) bab dengan pembagian sebagai berikut: BAB I PENDAHULUAN Bab pertama berisi tentang latar belakang masalah, rumusan masalah, tujuan dan manfaat penelitian, pembatasan masalah, tinjauan pustaka, metodologi penelitian dan sistematika penulisan. BAB II LANDASAN TEORI Bab kedua berisi tentang teori-teori yang akan dgunakan dalam pembahasan, di antaranya Variabel Random, Harga Harapan, Fungsi Likelihood, Estimasi Titik, Metode Maksimum Likelihood, Data Survival, Data Tersensor, Data Multistatus, Fungsi Survival dan Fungsi Hazard, Model Cox Proportional Hazard, Estimasi Parameter, Prosedur Newton-Raphson, Pengujian Parameter, Proses Stokastik, Rantai Markov, Model Multistatus, Probabilitas Transisi, Matriks Probabilitas Transisi, dan Klasifikasi Status dari Rantai Markov. BAB III PEMBAHASAN Bab ketiga berisi penjelasan mengenai model Cox proporsional hazard dan model Markov beserta kaitan keduanya. BAB IV STUDI KASUS Bab keempat berisi simulasi dan studi kasus. BAB V PENUTUP Bab kelima berisi Kesimpulan dan Saran yang memuat rangkuman hasil penelitian dan saran bagi penelitian selanjutnya.