BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN. Waktu hidup adalah waktu terjadinya suatu peristiwa. Peristiwa yang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

terdefinisi. Oleh karena itu, estimasi resiko kematian pasien dapat diperoleh berdasarkan nilai hazard ratio. Model hazard proporsional parametrik

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II KAJIAN TEORI. Analisis survival atau analisis ketahanan hidup adalah metode yang

BAB II TINJAUAN PUSTAKA. diperhatikan adalah jangka waktu dari awal pengamatan sampai suatu event

BAB III LANDASAN TEORI. analisis kesintasan bertujuan menaksir probabilitas kelangsungan hidup, kekambuhan,

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Analisis Regresi Spline Kuadratik

BAB I PENDAHULUAN 1.1 Latar Belakang

MODEL REGRESI DATA TAHAN HIDUP TERSENSOR TIPE III BERDISTRIBUSI EKSPONENSIAL. Jln. Prof. H. Soedarto, S.H., Tembalang, Semarang.

BAB I PENDAHULUAN Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Cure rate models merupakan model survival yang memuat cured fraction dan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. tinjauan pustaka dan sistematika penulisan Tesis yaitu sebagai berikut.

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah

REGRESI SEMIPARAMETRIK SPLINE TRUNCATED DENGAN SOFTWARE R. Abstract. Keywords: Spline Truncated, GCV, Software R.

PENENTUAN MODEL REGRESI SPLINE TERBAIK. Agustini Tripena 1

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB II LANDASAN TEORI

MODEL REGRESI DATA TAHAN HIDUP TERSENSOR TIPE III BERDISTRIBUSI EKSPONENSIAL SKRIPSI

BAB III PERLUASAN MODEL REGRESI COX PROPORTIONAL HAZARD DENGAN VARIABEL TERIKAT OLEH WAKTU

REGRESI SPLINE BIRESPON UNTUK MEMODELKAN KADAR GULA DARAH PENDERITA DIABETES MELITUS

BAB I PENDAHULUAN. bersifat tetap ( bukan

BAB 2 LANDASAN TEORI. 2.1 Analisis Survival

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB III PEMBAHASAN. extended untuk mengatasi nonproportional hazard dan penerapannya pada kasus

BAB I PENDAHULUAN. Menurut Lee (2001), terdapat tiga faktor yang dibutuhkan dalam menentukan waktu survival, yaitu:

Model Cox Extended dengan untuk Mengatasi Nonproportional Hazard pada Kejadian Bersama

BAB I PENDAHULUAN. menganalisis hubungan fungsional antara variabel prediktor ( ) dan variabel

PEMILIHAN PARAMETER PENGHALUS DALAM REGRESI SPLINE LINIER. Agustini Tripena Br.Sb.

II. TINJAUAN PUSTAKA. Dalam proses penelitian untuk mengkaji karakteristik penduga GMM pada data

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB III REGRESI SPLINE = + dimana merupakan fungsi pemulus yang tidak spesifik, dengan adalah

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

PROSIDING Kajian Ilmiah Dosen Sulbar ISBN: FAKTOR-FAKTOR YANG MEMPENGARUHI WAKTU SEMBUH ALERGI DENGAN ANALISIS SURVIVAL

BAB II TINJAUAN PUSTAKA. (b) Variabel independen yang biasanya dinyatakan dengan simbol

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

PREDIKSI INFLASI DI INDONESIA MENGGUNAKAN REGRESI NONPARAMETRIK B-SPLINE

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

GENERALIZED CROSS VALIDATION DALAM REGRESI SMOOTHING SPLINE

BAB I PENDAHULUAN. bisnis, ekonomi, ilmu-ilmu pengetahuan sosial, kesehatan, dan biologi.

ESTIMASI EROR STANDAR PARAMETER REGRESI LOGISTIK MENGGUNAKAN METODE BOOTSTRAP

BAB 1 PENDAHULUAN Latar Belakang

BAB III METODE PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Analisis regresi merupakan suatu metode yang digunakan untuk

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

PEMODELAN REGRESI SPLINE (Studi Kasus: Herpindo Jaya Cabang Ngaliyan)

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

ESTIMASI PARAMETER REGRESI RANK BERDISTRIBUSI EKSPONENSIAL DENGAN MENGGUNAKAN METODE KUADRAT TERKECIL TERBOBOTI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

Regresi Cox pada Survei Kompleks (Studi Kasus: Lama Pemberian ASI)

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

PEMODELAN HARGA CABAI DI KOTA SEMARANG TERHADAP HARGA INFLASI MENGGUNAKAN REGRESI SEMIPARAMETRIK POLINOMIAL LOKAL

Aplikasi Spline Kuadrat Terkecil dalam Pemodelan Pertumbuhan Anak Berdasarkan Indeks Antropometri

II. TINJAUAN PUSTAKA. Analisis survival (survival analysis) atau analisis kelangsungan hidup bertujuan

SATUAN ACARA PERKULIAHAN MATA KULIAH : ANALISIS DATA UJI HIDUP KODE MATA KULIAH : MAA SKS

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODE PENELITIAN. Pemerintah Daerah Kabupaten Lampung Barat tahun 2007 sampai dengan 2012.

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. menganalisis data dimana variabel yang diperhatikan adalah jangka waktu

BAB I PENDAHULUAN. Dalam penelitian di dunia teknologi, khususnya bidang industri dan medis

BAB I PENDAHULUAN Latar Belakang Masalah

PEMODELAN KURS RUPIAH TERHADAP MATA UANG EURO DENGAN PENDEKATAN REGRESI SPLINE. Sulton Syafii Katijaya 1, Suparti 2, Sudarno 3.

PEMODELAN REGRESI SPLINE UNTUK RATA- RATA BANYAK ANAK YANG DILAHIRKAN HIDUP DI KOTA SURABAYA, KABUPATEN SITUBONDO DAN KABUPATEN BANGKALAN

RESIDUAL COX-SNELL DALAM MENENTUKAN MODEL TERBAIK DALAM ANALISIS SURVIVAL

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

KONSEP DASAR TERKAIT METODE BAYES

BAB II TINJAUAN PUSTAKA. penulisan skripsi. Teori penunjang tersebut adalah: Regresi logistik, analisis survival,

BAB II TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI. Definisi 1 Himpunan semua hasil yang mungkin dari suatu percobaan disebut ruang sampel dan dinyatakan dengan S.

BAB 1 PENDAHULUAN. hubungan antara variabel respon dengan satu atau beberapa variabel prediktor.

BAB III PEMBAHASAN. Metode kriging digunakan oleh G. Matheron pada tahun 1960-an, untuk

BAB II LANDASAN TEORI. Data merupakan bentuk jamak dari datum. Data merupakan sekumpulan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Transkripsi:

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan Estimasi fungsi survival atau biasa disebut regresi fungsi survival merupakan bagian penting dari analisis survival. Estimasi ini biasa digunakan dalam analisis survival dimana kovariat merupakan parameter dari estimasi tersebut, sehingga estimasi tersebut tergantung pada hasil kovariatnya. Estimasi regresi fungsi survival dapat dibedakan menjadi beberapa model yaitu model parametrik, model semiparametrik, dan model non-parametrik. Model survival parametrik merupakan salah satu model regresi fungsi survival dimana data yang digunakan memiliki variansi yang rendah dan memenuhi asumsi distribusi atau fungsi probabilitas tertentu. Data yang digunakan dalam analisis regresi fungsi survival ini harus memenuhi asumsi tersebut agar bias pada regresi ini dapat diperkecil secara maksimal tetapi apabila data tersebut tidak memenuhi maka model dapat dikatakan buruk dikarenakan bias akan semakin besar, oleh karena itu model regresi ini biasanya digunakan pada data yang sudah diketahui secara spesifik distribusinya. Selain itu pada model ini untuk mendapatkan nilai estimasi yang memilki nilai bias yang kecil maka dilakukan seleksi variabel dimana dipilih variabel yang paling signifikan pada model regresi tersebut. Pemilihan variabel ini selain dapat meminimumkan nilai eror juga membutuhkan waktu yang lebih lama dari peneliti untuk melakukan seleksi variabel juga informasi variabel independen tidak seluruhnya terpenuhi walaupun diusahakan oleh peneliti agar informasi variabel independen tidak berkurang secara signifikan. Berdasarkan penjelasan mengenai model regresi fungsi survival parametrik dimana terdapat beberapa kelemahan maka para peneliti ingin mengurangi kelemahan pada model parametrik tersebut khususnya pada asumsi dimana data harus berdistribusi tertentu sehingga dibentuklah model regresi fungsi survival 1

2 nonparametrik. Model regresi nonparametrik dapat mengabaikan asumsi-asumsi tersebut dimana apabila asumsi untuk model parametrik tidak terpenuhi maka nilai bias dengan menggunakan model survival nonparametrik dapat diperkecil dan memiliki parameter tak terhingga sehingga model ini dapat diaplikasikan pada seluruh data. Salah satu model survival nonparametrik yang dapat meminimumkan nilai bias adalah dengan menggunakan fungsi spline untuk fungsi log-hazard. Walaupun model ini sudah dapat megurangi kelemahan pada model regresi fungsi survival parametrik, model ini tetap memiliki kelemahan yaitu hanya bagus untuk data yang berjumlah besar dan apabila metode nonparametrik ini digunakan untuk data yang memiliki distribusi yang jelas (memenuhi semua asumsi untuk metode parametrik) maka bias dan variansinya akan sangat besar dibandingkan dengan menggunakan metode lain terutama apabila dibandingkan dengan menggunakan model parametrik. Melihat kelemahan yang ada pada model regresi fungsi survival parametrik maupun nonparametrik maka dikembangkan kembali model regresi fungsi survival gabungan dari model parametrik dan model nonparametrik yaitu model regresi fungsi survival semi-parametrik. Model regresi semi-parametrik pada saat ini yang sering digunakan adalah estimasi dengan pendekatan model hazard proporsional yang dikombinasikan dengan estimasi baseline pada fungsi hazardnya model ini biasa disebut regresi Cox. Walaupun model ini merupakan gabungan dari model parametrik serta nonparametrik, model ini masih mempunyai asumsi yang harus terpenuhi yaitu asumsi bahwa data memiliki hazard proporsional yang sama untuk setiap sampel tetapi seperti yang sudah diketahui bahwa model regresi fungsi survival semiparametrik dapat menjadi estimasi yang buruk apabila asumsi hazard proporsional tidak terpenuhi sehingga model ini masih memiliki kelemahan. Oleh karena itu diperlukan estimator yang lebih fleksibel dibandingkan metode-metode yang sudah disebutkan tersebut. Regresi fungsi survival biasanya hanya menggunakan satu model baik parametrik, nonparametrik, maupun semi-parametrik dengan seleksi kovariat-kovariat

3 pada model tersebut sehingga hanya kovariat yang signifikan yang digunakan, tetapi seperti yang disebutkan bahwa perlu adanya estimator yang fleksibel dibandingkan model-model yang sudah disebutkan di atas. Estimator yang fleksibel ini diharapkan dapat digunakan ketika data dapat memenuhi sebagian besar asumsi untuk model parametrik dan model semi-parametrik juga dapat menutupi kelemahan model nonparametrik. Oleh karena itu dibandingkan memilih salah satu model tersebut maka dipilih untuk mengkombinasikan model-model tersebut dengan menentukan bobot untuk masing-masing model sehingga membentuk model baru. Pendekatan untuk mengkombinasikan beberapa model tersebut adalah menggunakan metode stacked yaitu dengan menggabungkan beberapa model regresi fungsi survival dimana setiap model memiliki bobot masing-masing. Penentuan bobot untuk masing-masing model tersebut berdasarkan nilai minimum eror pada model gabungan tersebut. Breiman (1996) sudah memperlihatkan bahwa untuk model regresi biasa, dengan mengunakan metode stacked dapat memperkecil nilai eror dibandingkan dengan menggunakan salah satu model saja. Model stacked untuk data survival dimana terdapat data tersensor maka memiliki pendekatan yang berbeda dengan analisis regresi biasa. Untuk pendekatan model stacked digunakan estimasi regresi fungsi survival dengan waktu yang kontinu dimana dapat meminimumkan nilai eror dari model tersebut. Fungsi kerugian yang digunakan untuk mendapatkan nilai eror tersebut adalah Brier score dimana digunakan untuk data tanpa sensor sedangkan untuk data survival dengan data tersensor menggunakan Inverse Probability of Censoring Weights (IPCW) Brier score sebagai pendekatannya untuk menentukan bobot masing-masing model. Model stacked tidak menggunakan seleksi variabel independen tetapi menggunakan metode n-fold-validation untuk evaluasi estimasi pada regresi fungsi survival yang sudah dibentuk sehingga dengan tidak adanya seleksi variabel independen diharapkan pada regresi fungsi survival ini tidak ada informasi yang hilang untuk data yang digunakan. Model regresi fungsi survival ini merupakan model yang dapat digunakan untuk semua kriteria data terutama data yang tidak memiliki distribusi yang spesifik dan memiliki variabel

4 independen yang banyak, model ini juga memiliki eror yang relatif kecil sehingga dapat dikatakan estimator model yang lebih fleksibel dibandingkan model lainnya. 1.2. Tujuan Penulisan Berdasarkan latar belakang di atas, penulisan skripsi ini mempunyai beberapa tujuan antara lain: 1. mempelajari dan memahami tentang regresi fungsi survival menggunakan metode stacked; 2. mempelajari dan memahami tentang Brier score dan Inverse Probability of Censoring Weights (IPCW) untuk memodelkan regresi survival dengan metode stacked; 3. menerapkan regresi survival dengan metode stacked untuk data Laporan Kerja Praktek Dimyati (2014) yang berisi tentang daya tahan hidup pasien (data survival dengan event meninggalnya pasien) penderita kanker pada Klinik Edward Health Care (EHC) dan data dari buku Applied Survival Analysis: Regression Modeling of Time to Event Data: Second Edition (Hosmer dkk, 2008) yaitu data yang dipublikasikan oleh German Breast Cancer study. 1.3. Manfaat Penelitian Manfaat dari penulisan skripsi ini adalah: 1. menambah pengetahuan mengenai statistika dalam bidang epidemiologi dan kesehatan terutama pada analisis survival dengan metode stacked serta metode estimasi parameter dan bobot; 2. memperkenalkan metode stacked untuk kombinasi metode parametrik, semi-parametrik dan non parametrik pada analisis regresi fungsi survival; 3. mengaplikasikan metode stacked untuk kombinasi metode parametrik, semiparametrik dan nonparametrik pada analisis regresi fungsi survival untuk menyelesaikan permasalahan pada studi kasus.

5 1.4. Pembatasan Masalah Dalam penulisan skripsi ini, pembatasan masalah sangat diperlukan agar pembahasan yang disampaikan jelas dan fokus pada tujuan. Skripsi ini akan fokus dalam pembahasan regresi fungsi survival dengan menggunakan metode stacked dengan mengkombinasikan model parametrik, nonparametrik, dan semi-parametrik serta aplikasinya dengan menganalisis data Laporan Kerja Praktek Dimyati (2014) yang berisi tentang daya tahan hidup pasien (data survival dengan event meninggalnya pasien) penderita kanker pada Klinik Edward Health Care (EHC) dan data dari buku Applied Survival Analysis: Regression Modeling of Time to Event Data: Second Edition (Hosmer dkk, 2008) yaitu data yang dipublikasikan oleh German Breast Cancer study. 1.5. Tinjauan Pustaka Breiman (1992) dalam paper nya membahas mengenai stacked regression untuk regresi linear berganda menggunakan kombinasi linear dimana kombinasi linear ini berdasarkan cross-validation data dan minimum kuadrat untuk kombinasi linear koefisien non-negatif. Hothorn (2006) membahas mengenai survival ensembles yaitu metode survival dengan algoritma bersama-sama (ensembles) untuk data tersensor, Polley dan Van der Laan (2011) menyebutkan metode stacking untuk data yang tersensor secara umum dan memberikan contoh untuk estimasi fungsi hazard dengan fungsi survival untuk time-event diskrit. 1.6. Metode Penelitian Metode yang dipakai dalam penulisan skripsi ini yaitu dengan menggunakan metode studi literatur, baik itu diperoleh dari buku-buku, jurnal-jurnal, maupun situssitus internet yang sesuai dengan tema skripsi ini. Pengolahan data dalam skipsi ini menggunakan software R untuk mencari model regresi fungsi survival serta masingmasing bobotnya dengan metode stacked dimana menggunakan Inverse Probability of Censoring Weights Brier score (IPCW) sebagai pendekatan bobot untuk estimasi.

6 Data yang digunakan dalam penelitian adalah data Laporan Kerja Praktek Dimyati (2014) yang berisi tentang daya tahan hidup pasien (data survival dengan event meninggalnya pasien) penderita kanker pada Klinik Edward Health Care (EHC) dan data dari buku Applied Survival Analysis: Regression Modeling of Time to Event Data: Second Edition (Hosmer dkk, 2008) yaitu data yang dipublikasikan oleh German Breast Cancer study. 1.7 Sistematika Penulisan Skripsi ini akan dibahas secara rinci dalam lima bab, sebagai berikut: BAB I PENDAHULUAN Bab ini membahas latar belakang, tujuan penulisan, pembatasan masalah, tinjauan pustaka, metode penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Bab ini membahas tentang beberapa definisi dan teorema yang berhubungan dengan skripsi, antara lain variable random, konsep dasar survival, fungsi hazard, hubungan antara fungsi survival dengan fungsi hazard, estimasi fungsi survival dan hazard, model survival parametrik, model survival semi-parametrik, model survival nonparametrik, cross validation, dan n-fold validation. BAB III KOMBINASI METODE PARAMETRIK, SEMI-PARAMETRIK, DAN NONPARAMETRIK PADA REGRESI FUNGSI SURVIVAL DENGAN METODE STACKED Bab ini membahas tentang konsep dasar model regresi fungsi survival stacked, Brier score, Inverse Probability of Censoring Weights (IPCW), mean integrated squared error stacked survival model, sifat asimtotik model fungsi survival dengan metode stacked. BAB IV STUDI KASUS MODEL FUNGSI SURVIVAL STACKED

7 Bab ini membahas tentang aplikasi stacked survival function dengan pendekatan Inverse Probability of Censoring Weights (IPCW) Brier score untuk mengestimasi nilai stacked survival function pada data Laporan Kerja Praktek Dimyati (2014) yang berisi tentang daya tahan hidup pasien (data survival dengan event meninggalnya pasien) penderita kanker pada Klinik Edward Health Care (EHC) dan data dari buku Applied Survival Analysis: Regression Modeling of Time to Event Data: Second Edition (Hosmer dkk, 2008) yaitu data yang dipublikasikan oleh German Breast Cancer study, interpretasi model yang didapatkan pada masing-masing data, membandingkan model regresi fungsi survival stacked dengan regresi parametrik, semiparametrik, dan nonparametrik menggunakan ISSE. BAB V PENUTUP Bab ini membahas tentang kesimpulan dan saran dari hasil pembahasan bab-bab sebelumnya.