BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Dalam kehidupan sehari-hari manusia selalu dihadapkan dengan berbagai macam kejadian/peristiwa (event). Meskipun begitu, tidak semua peristiwa tersebut menjadi perhatian manusia. Hanya peristiwa yang dianggap menarik saja yang biasanya menjadi perhatian manusia. Sebagai contoh, sering ditemui bahwa manusia cenderung memperhatikan permasalahan yang berkaitan dengan peristiwa kematian, kelulusan dari suatu perguruan tinggi, daya tahan suatu peralatan elektronik, terjangkit penyakit, kesembuhan dari penyakit, dan lain sebagainya. Berdasarkan contoh-contoh tersebut, hal yang cukup penting untuk diamati adalah lama waktu sampai terjadinya suatu event pada suatu unit penelitian / individu. Metode yang dapat digunakan untuk menganalisis data lama waktu tersebut adalah metode analisis data survival. Analisis data survival merujuk pada sekumpulan metode statistik untuk menganalisis data antar kejadian, yaitu data lama waktu sampai terjadinya suatu event. Istilah survival sendiri muncul karena pada mulanya, metode analisis ini digunakan untuk menyelidiki event kematian (Singh dan Mukhopadhyay, 2011). Sesuai dengan pengertian di atas, terdapat banyak metode dalam analisis data survival. Pada dasarnya, semua metode tersebut digunakan untuk menganalisis dua hal yang menjadi ciri khas dari analisis data survival, yaitu: a. Fungsi survival, yaitu probabilitas suatu individu tidak mendapatkan event (survive) lebih lama dari suatu waktu. b. Fungsi hazard, yaitu tingkat (rate) terjadinya suatu event pada suatu waktu. 1
2 Fungsi survival dan fungsi hazard dapat diestimasi menggunakan metode parametrik. Pada metode parametrik diasumsikan bahwa data antar kejadian berdistribusi tertentu. Estimasi fungsi survival dan fungsi hazard dengan metode parametrik terkadang tidak mudah dilakukan, terutama untuk distribusi-distribusi dengan fungsi densitas yang cukup kompleks. Selain itu, pada estimasi fungsi survival dan hazard yang diperoleh akan masih terdapat parameter dari distribusi yang juga harus diestimasi. Oleh karena itu tidak jarang digunakan metode nonparametrik untuk mengestimasi fungsi survival dan hazard. Metode estimasi nonparametrik yang cukup dikenal dan banyak digunakan adalah estimator Kaplan- Meier (Product-Limit estimator) dan estimator Nelson-Aalen. Dalam analisis data survival, masalah yang sering ditemui adalah adanya pengamatan yang tidak lengkap karena terdapat unit penelitian yang sampai akhir pengamatan tidak diketahui apakah mengalami event atau tidak. Kasus tersebut sering disebut dengan observasi tersensor. Pada estimator Kaplan-Meier dan Nelson- Aalen, nilai estimasi fungsi survival pada saat tersensor tersebut diasumsikan sama dengan fungsi survival pada saat sebelumnya. Akan lebih baik jika terdapat estimasi yang lebih presisi terhadap fungsi survival pada saat tersensor tersebut sehingga dapat diperoleh hasil yang lebih akurat. Oleh karena itu dalam tesis ini akan dibahas metode estimasi yang baru untuk fungsi survival, dimana fungsi survival pada saat tersensor tidak diasumsikan sama dengan fungsi survival saat sebelumnya, tetapi memiliki nilai estimasinya sendiri. Estimator yang baru tersebut diperoleh dengan memanfaatkan sifat dari model Koziol-Green. Model Koziol-Green dipilih karena di dalam model tersebut terdapat sebuah parameter censoring sehingga diharapkan dapat mengatasi masalah karena adanya observasi yang tersensor. Pada tahap selanjutnya akan dibandingkan hasil estimasi berdasarkan model Koziol-Green dengan metode estimator yang sudah ada, untuk mengetahui estimator mana yang memberikan hasil yang lebih baik.
3 1.2. Tujuan dan Manfaat Penelitian Berdasarkan latar belakang masalah di atas, tujuan dari penelitian ini adalah sebagai berikut: a. Mempelajari konsep model Koziol-Green untuk mengestimasi fungsi survival secara nonparametrik pada data antar kejadian, terutama untuk kasus data tersensor kanan. b. Membandingkan hasil estimasi fungsi survival menggunakan Kaplan-Meier dan Nelson Aalen dengan hasil estimasi fungsi survival menggunakan model Koziol Green. Selanjutnya hasil dari penelitian ini diharapkan menambah wawasan bagi siapa saja, terutama yang mendalami bidang analisis data survival sehingga dapat digunakan sebagai batu pijakan untuk penelitian yang lebih lanjut. 1.3. Pembatasan Masalah Pada penelitian ini, batasan masalah sangat diperlukan supaya tidak terjadi penyimpangan dari tujuan awal. Oleh karena itu, pembahasan hanya akan difokuskan pada penerapan model Koziol-Green untuk mengestimasi fungsi survival pada data antar kejadian, terutama untuk kasus data tersensor kanan. Data tersensor kanan yang dimaksud merupakan salah satu kasus khusus observasi tidak lengkap pada data antar kejadian. 1.4. Tinjauan Pustaka Model Koziol-Green (1976) menggambarkan keadaan khusus yang terjadi karena adanya observasi yang tersensor. Misal F adalah fungsi distribusi kumulatif
4 dari variabel random time to event dan G adalah fungsi distribusi kumulatif dari variabel random waktu tersensor. Dalam model Koziol-Green diasumsikan bahwa F dan G memenuhi 1 1, dimana merupakan parameter censoring. Model tersebut telah beberapa kali dimanfaatkan dalam penelitian yang berhubungan dengan analisis data survival. Pawlitschko (2000) memanfaatkan model Koziol- Green untuk mengestimasi fungsi survival pada kasus data terpotong kiri. Dari penelitian tersebut diperoleh kesimpulan bahwa estimator yang baru lebih efisien dibandingkan dengan estimator Kaplan-Meier. Penelitian tentang pemanfaatan model Koziol-Green untuk analisis data survival juga dilakukan oleh Wu (2001). Pada salah satu penelitiannya dibahas tentang penerapan model Koziol-Green untuk menguji apakah terdapat perbedaan mean, median, atau distribusi pada beberapa grup (perlakuan) yang diamati. Selain itu, dalam penelitiannya yang lain dibahas tentang estimasi koefisien parameter model regresi tersensor menggunakan model Koziol- Green. Dalam tesis ini juga akan dibahas mengenai aplikasi model Koziol-Green, yaitu untuk mengestimasi fungsi survival secara nonparametrik khususnya pada observasi yang tersensor kanan. Dalam mengestimasi fungsi survival berdasarkan model Koziol-Green tersebut, probabilitas survive pada titik yang tersensor tidak diasumsikan bernilai sama dengan saat sebelumnya, tetapi memiliki nilai estimasinya sendiri. Selanjutnya nilai variansi dari estimator baru tersebut juga akan dihitung. 1.5. Metodologi Penelitian Metode yang digunakan dalam penelitian ini adalah studi literatur, yaitu mempelajari buku-buku dan jurnal-jurnal yang berkaitan dengan model Koziol- Green, terutama dalam hal penerapannya untuk analisis data survival. Yang pertama dilakukan adalah mempelajari konsep dari model Koziol-Green. Selanjutnya dari model Koziol-Green tersebut dilakukan proses matematis sehingga diperoleh formula
5 untuk mengestimasi fungsi survival. Setelah diperoleh formula untuk mengestimasi fungsi survival, dilakukan simulasi atau studi kasus untuk membandingkan hasil antara model Koziol-Green dengan metode estimasi yang sudah ada, seperti Kaplan- Meier. 1.6. Sistematika Penulisan Tesis 1 ini disusun dengan sistematika penulisan sebagai berikut: BAB I PENDAHULUAN Bab ini berisi tentang latar belakang masalah, tujuan dan manfaat penelitian, pembatasan masalah, tinjauan pustaka, metodologi penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Bab ini berisi tentang teori-teori yang akan digunakan dalam pembahasan, di antaranya Data Survival, Jenis-jenis Data Tersensor, Fungsi Survival dan Fungsi Hazard, Estimator Kaplan-Meier dan Nelson Aalen. BAB III MODEL KOZIOL-GREEN UNTUK ESTIMASI FUNGSI SURVIVAL PADA OBSERVASI TERSENSOR KANAN Bab ini membahas tentang pembatasan masalah, yaitu estimasi fungsi survival pada observasi yang tersensor kanan berdasarkan model Koziol-Green.
6 BAB IV SIMULASI DAN STUDI KASUS Bab ini membahas tentang aplikasi model Koziol-Green untuk mengestimasi fungsi survival berdasarkan data simulasi dan data antar kejadian yang diperoleh berdasarkan kasus yang nyata. Data studi kasus yang digunakan adalah data waktu survive pasien penderita kanker paru-paru, dimana data penelitian tersebut tercantum dalam The Statistical Analysis of Failure Time Data (Kalbfleisch dan Prentice, 1980) dan dapat diperoleh melalui software R pada library survival. Selain itu, studi kasus juga dilakukan menggunakan data waktu survive pasien penderita melanoma berdasarkan penelitian yang dilakukan oleh Richard Ishmael (Lee dan Wang, 2003). BAB V KESIMPULAN DAN SARAN Bab ini berisi tentang kesimpulan yang diperoleh berdasarkan pembahasan, simulasi dan studi kasus yang dilakukan. Selain itu, disampaikan pula saran-saran yang muncul akibat dari kekurangan dan kendala yang ditemui selama proses pemecahan masalah.