BAB I PENDAHULUAN. Cure rate models merupakan model survival yang memuat cured fraction dan

dokumen-dokumen yang mirip
BAB II KAJIAN TEORI. Analisis survival atau analisis ketahanan hidup adalah metode yang

terdefinisi. Oleh karena itu, estimasi resiko kematian pasien dapat diperoleh berdasarkan nilai hazard ratio. Model hazard proporsional parametrik

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB III PERLUASAN MODEL REGRESI COX PROPORTIONAL HAZARD DENGAN VARIABEL TERIKAT OLEH WAKTU

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB III LANDASAN TEORI. analisis kesintasan bertujuan menaksir probabilitas kelangsungan hidup, kekambuhan,

DAFTAR ISI. Halaman. viii

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA. diperhatikan adalah jangka waktu dari awal pengamatan sampai suatu event

BAB I PENDAHULUAN 1.1 Latar Belakang

MODEL REGRESI DATA TAHAN HIDUP TERSENSOR TIPE III BERDISTRIBUSI EKSPONENSIAL SKRIPSI

BAB I PENDAHULUAN. Waktu hidup adalah waktu terjadinya suatu peristiwa. Peristiwa yang

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

Penerapan Model Frailty Weibull-Eksponensial pada Data Tabel Mortalitas Indonesia Tahun 1999

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

MODEL REGRESI DATA TAHAN HIDUP TERSENSOR TIPE III BERDISTRIBUSI EKSPONENSIAL. Jln. Prof. H. Soedarto, S.H., Tembalang, Semarang.

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA. penulisan skripsi. Teori penunjang tersebut adalah: Regresi logistik, analisis survival,

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

BAB I PENDAHULUAN. 1.1 Latar Belakang

ANALISIS CURE RATE PENDERITA KANKER PAYUDARA BERDASAR PEMODELAN REGRESI COX

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

BAB I PENDAHULUAN. menganalisis data dimana variabel yang diperhatikan adalah jangka waktu

BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

BAB 2 LANDASAN TEORI. 2.1 Analisis Survival

ANALISIS DATA UJI HIDUP

SATUAN ACARA PERKULIAHAN MATA KULIAH : ANALISIS DATA UJI HIDUP KODE MATA KULIAH : MAA SKS

BAB 1 PENDAHULUAN. Penyakit Tuberkulosis atau yg lebih dikenal dengan nama TB Paru merupakan

REGRESI COX MULTIVARIAT DENGAN DISTRIBUSI WIEBULL MULTIVARIAT

ISSN: JURNAL GAUSSIAN, Volume 5, Nomor 4, Tahun 2016, Halaman Online di:

BAB I PENDAHULUAN Latar Belakang Masalah

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. namun adakalanya angka-angka tersebut semata-mata dikumpulkan tanpa maksud atau

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

ANALISIS SURVIVAL UNTUK MENGETAHUI LAJU KESEMBUHAN PENYAKIT TB PARU di JAKARTA BERBASIS DESKTOP APPLICATION

Penaksiran Parameter Regresi Linier Logistik dengan Metode Maksimum Likelihood Lokal pada Resiko Kanker Payudara di Makassar

BAB I PENDAHULUAN 1.1. Latar Belakang

KAJIAN METODE IMPUTASI DALAM MENANGANI MISSING DATA. Triyani Hendrawati Staf Pengajar Statistika Universitas Padjadjaran

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

PEMODELAN REGRESI COX DAN REGRESI WEIBULL WAKTU SEMBUH DIARE PADA BALITA

BAB I PENDAHULUAN. Menurut Lee (2001), terdapat tiga faktor yang dibutuhkan dalam menentukan waktu survival, yaitu:

ESTIMASI INTERVAL KEPERCAYAAN (CONFIDENCE INTERVAL) PARAMETER MODEL PROSES GEOMETRIK WEIBULL PADA ANALISIS UJI HIDUP UNTUK DATA TERSENSOR TIPE II

BAB I PENDAHULUAN. tinjauan pustaka dan sistematika penulisan Tesis yaitu sebagai berikut.

II. TINJAUAN PUSTAKA. Analisis survival (survival analysis) atau analisis kelangsungan hidup bertujuan

MODEL REGRESI COX PROPORSIONAL HAZARD PADA DATA KETAHANAN HIDUP. Abstract

PRODI S1 STATISTIKA FMIPA-ITS RENCANA PEMBELAJARAN Analisis Survival Kode/SKS: SS / (2/1/0) Dosen : SWP Semester :

BAB I PENDAHULUAN. statistik untuk menganalisis data dengan variabel terikat yang diperhatikan berupa

PROSIDING Kajian Ilmiah Dosen Sulbar ISBN: FAKTOR-FAKTOR YANG MEMPENGARUHI WAKTU SEMBUH ALERGI DENGAN ANALISIS SURVIVAL

II. TINJAUAN PUSTAKA. Ruang sampel S adalah himpunan semua hasil dari suatu percobaan. Kejadian E

BAB I PENDAHULUAN. yang perlu diketahui, yang disebut sebagai variabel. Variabel adalah sebuah

RESIDUAL COX-SNELL DALAM MENENTUKAN MODEL TERBAIK DALAM ANALISIS SURVIVAL

BAB III PEMBAHASAN. extended untuk mengatasi nonproportional hazard dan penerapannya pada kasus

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

KONSEP DASAR TERKAIT METODE BAYES

OLEH : Riana Ekawati ( ) Dosen Pembimbing : Dra. Farida Agustini W, M.S

BAB II TINJAUAN PUSTAKA. (Kleinbaum dan Klein, 2005). Persson (2002) mengatakan data sintasan adalah

BAB I PENDAHULUAN. Dalam penelitian di dunia teknologi, khususnya bidang industri dan medis

BAB 4 ANALSIS DAN BAHASAN. Tuberculosis (TB Paru) berdasarkan variabel usia, jenis kelamin, perilaku

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB II TINJAUAN PUSTAKA. variabel prediktor terhadap variabel respons. Hubungan fungsional

BAB III SURVIVAL ANALYSIS UNTUK MENGUJI RELIABILITAS PRODUK DAN PENENTUAN GARANSI PRODUK 3.1 Garansi

KAJIAN DATA KETAHANAN HIDUP TERSENSOR TIPE I BERDISTRIBUSI EKSPONENSIAL DAN SIX SIGMA. Victoria Dwi Murti 1, Sudarno 2, Suparti 3

Analisis Survival Parametrik Pada Data Tracer Study Universitas Sriwijaya

PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE) UNTUK MULTIPLE-RANDOM EFFECTS

Penaksiran Parameter Model Kalibrasi Linier yang Berdistribusi Skew-Normal dengan Algoritma-EM

BAB IV HASIL DAN PEMBAHASAN

MODEL REGRESI DATA TAHAN HIDUP TERSENSOR TIPE III BERDISTRIBUSI LOG-LOGISTIK ABSTRAK

ESTIMASI PARAMETER DISTRIBUSI WEIBULL DENGAN TRANSFORMASI MODEL REGRESI MENGGUNAKAN METODE KUADRAT TERKECIL LINIER

BAB I PENDAHULUAN. 1.1 Latar belakang

Algoritma Expectation-Maximization(EM) Untuk Estimasi Distribusi Mixture

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

ANALISA KEANDALAN PADA PERALATAN UNIT PENGGILINGAN AKHIR SEMEN UNTUK MENENTUKAN JADWAL PERAWATAN MESIN (STUDI KASUS PT. SEMEN INDONESIA PERSERO TBK.

Model Regresi Zero Inflated Poisson Pada Data Overdispersion

BAB IV KESIMPULAN DAFTAR PUSTAKA LAMPIRAN... 64

ESTIMASI PARAMETER DISTRIBUSI WEIBULL DENGAN TRANSFORMASI MODEL REGRESI MENGGUNAKAN METODE KUADRAT TERKECIL LINIER

ESTIMASI CONFIDENCE INTERVAL BOOTSTRAP UNTUK ANALISIS DATA SAMPEL TERBATAS

APLIKASI METODE KAPLAN MEIER UNTUK MENDUGA SELANG WAKTU KETAHANAN HIDUP (Studi Kasus: Pasien Kanker Payudara di Rumah Sakit Panti Rapih Yogyakarta)

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

ESTIMASI PARAMETER MODEL REGRESI ZERO-INFLATED POISSON (ZIP) MENGGUNAKAN METODE BAYESIAN

REGRESI LOG-LOGISTIK UNTUK DATA TAHAN HIDUP TERSENSOR TIPE I. oleh NANDA HIDAYATI M

BAB II TINJAUAN PUSTAKA

PERBANDINGAN PENAKSIR KAPLAN MEIER DAN BERLINER HILL PADA ANALISIS TAHAN HIDUP PENDERITA KANKER PAYUDARA

PENDUGAAN DATA HILANG DENGAN MENGGUNAKAN DATA AUGMENTATION. Abstract

BAB 2 LANDASAN TEORI. Definisi 1 Himpunan semua hasil yang mungkin dari suatu percobaan disebut ruang sampel dan dinyatakan dengan S.

BAB III NONLINEAR GENERALIZED AUTOREGRESSIVE CONDITIONAL HETEROSKEDASTICITY (N-GARCH)

II. TINJAUAN PUSTAKA. Dalam bab ini akan dijelaskan pengertian tentang distribusi Weibull, maximum

ADLN Perpustakaan Universitas Airlangga

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Transkripsi:

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Cure rate models merupakan model survival yang memuat cured fraction dan uncured fraction. Model ini dikembangkan untuk estimasi proporsi pasien yang sembuh (cure) dalam studi klinik. Model ini selain digunakan untuk mengestimasi proporsi pasien yang sembuh juga digunakan untuk mengestimasi probabilitas survival pasien yang tak sembuh sampai pada batas waktu yang diberikan. Oleh karena itu, model ini dinamakan model mixture. Model ini telah dikembangkan oleh Boag (1949) untuk mengestimasi proporsi pasien penderita kanker yang sembuh pada treatment yang dilakukan. Beberapa penelitian yang telah dilakukan terkait analisis berdasar model mixture di luar studi klinik dan pada studi klinik disajikan pada Tabel 1.1 dan 1.2. Tabel 1.1. Penelitian Terkait dengan Analisis Data Berdasar Model Mixture di Luar Studi Klinik No Peneliti Fokus Penelitian Model yang Digunakan 1. Lachlan dan Peel (2000) kasus kesalahan kain tenun kasus uji klinis betablocker model mixture regresi Poisson model mixture regresi logistik 2. Hum et al (2000) kasus pencemaran karbondioksida kasus kecelakaan di Michigan kasus aset finansial 3. Muthen dan Masyn (2005) kasus melanjutkan sekolah model mixture regresi linier model mixture regresi Poisson model mixture regresi logistik model mixture untuk waktu diskret 1

Tabel 1.2. Penelitian Terkait dengan Analisis Data Berdasar Model Mixture pada Studi Klinik No Peneliti Fokus Penelitian Model yang Digunakan 1. Boag (1949) estimasi proporsi model mixture parametrik penderita kanker yang sembuh pada treatment penderita kanker mulut dan kerongkongan, leher, kandungan, dan payudara 2. Farewell (1986) studi klinik penderita kanker payudara (PKPD) model mixture parametrik dengan algoritma EM (expectation maximization algorithm) dan asumsi PH 3. Kuk dan Chen (1992) pada distribusi failure time pasien tak sembuh 4. Maller dan Zhou (1992); Sposto et al (1992) analisis cure rate 5. Taylor (1995) estimasi distribusi failure time pasien tak sembuh 6. Ando et al (2004) analisis pada beberapa jenis penyakit kanker (tanpa missing data) metode nonparametrik dengan aplikasi asumsi PH (proportional hazard) estimator nonparametrik berdasar estimator Kaplan- Meier model mixture nonparametrik menggunakan estimator survivor Kaplan-Meier dan algoritma EM model kernel mixture survival Metode statistik standar dikembangkan untuk analisis himpunan data yang disusun dalam tabel kontingensi. Baris dari matriks data menyatakan unit, atau sering juga disebut kasus, atau subjek, tergantung pada konteks, dan kolom menyatakan variabel terukur untuk setiap unit. Entri dalam matriks data adalah bilangan real yang menyatakan nilai esensial variabel kontinu, seperti usia dan income; atau menyatakan kategori dari respon yang mungkin terurut, seperti level dalam pendidikan, atau tak terurut seperti jenis kelamin. Kadangkala nilai pada matriks data tidak terobservasi, sehingga terjadi missing data (data hilang). Missing data merupakan bagian pada hampir semua penelitian dari waktu ke waktu (Jamshidian, 2005). Missing data dapat terjadi karena suatu peralatan/perlengkapan 2

tidak berfungsi, suatu keadaan yang menakutkan, orang yang sedang diteliti tiba-tiba sakit atau meninggal (hilang dari pengamatan) atau pemasukan data yang tidak benar. Beberapa responden dalam suatu survey mungkin menolak melaporkan pendapatan (income) mereka, sehingga terjadi missing data. Pada percobaan industrial, missing data dapat terjadi karena kerusakan mesin atau mekanik berhenti bekerja sebelum proses eksperimen selesai. Pada survey yang menjaring opini, mungkin beberapa responden tidak dapat menyatakan pendapat mereka, sehingga tidak memberikan respon yang diinginkan. Salah satu metode yang dapat digunakan untuk analisis missing data adalah algoritma EM (Expectation Maximization Algorithm). Metode ini didasarkan pada 2 (dua) langkah yaitu: E-step dan M-step. Pada (1) E-step, menentukan distribusi missing data berdasar nilai observasi yang diketahui dan mengestimasi parameternya, dan (2) M-step yaitu substitusi missing data dengan nilai ekpektasi yang sudah diperoleh dari langkah (1). Pada studi pendahuluan untuk penderita kanker payudara (PKPD) yang dilakukan di RSUP Dr Sardjito Yogyakarta, ditemukan adanya missing data. Hal ini terungkap dari medical record five-years pasien PKPD di rumah sakit tersebut. Ada pasien-pasien yang meninggalkan kota, berpindah rumah sakit, atau berhenti berobat dalam jangka waktu tertentu, ada yang melanjutkan kembali proses perawatan dan berpotensi untuk sembuh, tetapi ada juga yang tidak diketahui status kesembuhannya. Analisis dengan model mixture yang ada, menggunakan data lengkap atau tersensor, sedangkan model mixture untuk analisis cure rate dengan missing data belum ada. Oleh karena itu, perlu dikembangkan model mixture untuk analisis cure rate dengan missing data. Pada model yang dikembangkan, algoritma EM diaplikasikan untuk mengestimasi parameter dalam model dengan langkah (1). E-step, menghitung ekspekstasi fungsi log-likelihood untuk estimasi fungsi densitas, fungsi survival dan mixture weight. M-step memuat maksimasi 3

fungsi log-likelihood terkait dengan estimasi fungsi densitas, fungsi survival dan mixture weight. Pada algoritma EM, baseline survival function tidak dapat dieliminasi secara lengkap. Untuk estimasi baseline survival function digunakan asumsi PH sebagaimana yang digunakan dalam model PH Cox. 1.2. Permasalahan Berdasarkan uraian pada latar belakang, masalah yang diteliti difokuskan pada pengembangan model mixture untuk analisis cure rate dengan missing data. Sebagai penuntun di dalam melakukan penelitian, dikemukakan pertanyaan-pertanyaan penelitian sebagai berikut. (1) Bagaimana model mixture untuk analisis cure rate dengan missing data? (2) Bagaimana mengestimasi parameter dalam model mixture untuk analisis cure rate dengan missing data? (3) Bagaimana sifat estimator dalam model mixture untuk analisis cure rate dengan missing data? (4) Bagaimana aplikasi model mixture untuk analisis cure rate PKPD dengan missing data? 1.3. Batasan Penelitian Penelitian ini merupakan penelitian yang cukup luas dan membutuhkan fasilitas yang cukup banyak, diantaranya hasil-hasil penelitian yang telah dilakukan peneliti sebelumnya, yang dipublikasikan di jurnal, data hasil studi klinik dan medical record PKPD, maupun software yang berhubungan dengan permasalahan di atas. Oleh karena itu, perlu diberikan 4

batasan ruang lingkup permasalahan agar lebih terfokus sesuai dengan interval waktu yang direncanakan. Adapun batasan penelitian sebagai berikut. (1) Model mixture dikembangkan dari model yang sudah ada baik model parametrik (menggunakan distribusi probabilitas standar seperti distribusi eksponensial, Weibull, Gompertz, generalized F, dan generalized gamma) maupun nonparametrik (tanpa menggunakan distribusi probabilitas standar) (2) Model ini diaplikasikan untuk estimasi cure rate PKPD dengan missing data berdasar data nyata dari studi klinik dan medical record PKPD tahun 2004-2009 yang berobat di RSUP Dr Sardjito Yogyakarta. 1.4. Keaslian Penelitian Diskusi tentang model mixture parametrik dapat dilihat pada Boag (1949), Jones et al (1981), Farewell (1982, 1986), Cantor dan Shuster (1992), Ghitany et al (1994), serta Denham (1996). Secara spesifik, Farewell (1986) mengaplikasikan model ini untuk analisis pada studi klinik PKPD. Model yang telah dikembangkan, didasarkan pada data tanpa ada missing data. Model mixture nonparametrik dikembangkan oleh Kuk dan Chen (1992) untuk data lengkap, dengan mengaplikasikan asumsi PH ke distribusi failure time pasien yang tak sembuh. Metode yang digunakan analog dengan yang digunakan dalam model PH Cox. Walaupun demikian hasil dari metode ini tak dapat lepas dari pendekatan Monte-Carlo dalam hal fungsi likelihood yang sering digunakan. Taylor (1995) menggunakan estimator survivor Kaplan-Meier untuk mengestimasi distribusi failure time pasien yang tak sembuh dan algoritma EM, tetapi model ini tak menyertakan kovariat dalam distribusi failure time pasien yang tak sembuh. 5

Sebagaimana dikemukakan pada latar belakang, dalam praktek terutama pada studi klinik sering ditemukan adanya missing data. Hasil-hasil penelitian yang telah dilakukan (Tabel 1.1 dan 1.2) menunjukkan, analisis dengan model mixture yang tersedia menggunakan data tanpa missing data, sedangkan model mixture untuk analisis cure rate dengan missing data belum ada. Oleh karena itu, pada penelitian ini dikembangkan model mixture untuk analisis cure rate dengan missing data, disertai aplikasinya untuk analisis cure rate PKPD berdasar data nyata dari studi klinik dan medical record PKPD di RSUP Dr Sardjito Yogyakarta. 1.5. Manfaat Penelitian Pada penelitian ini ada 2 (dua) kajian utama, yaitu: kajian teoritik dan kajian aplikasi (terapan). Berdasar dua kajian tersebut diharapkan dapat memberikan manfaat sebagai berikut. (1) Hasil kajian dapat dimanfaatkan sebagai salah satu prosedur yang dapat memberi kemudahan penelitian lebih lanjut tentang analisis survival, khususnya yang terkait dengan model mixture. (2) Hasil kajian ini dapat dimanfaatkan untuk solusi problematika terkait dengan cure rate untuk pasien berpotensi sembuh, terutama jika terdapat missing data. (3) Hasil kajian ini merupakan sumbangan bagi pengembangan ilmu pengetahuan dan teknologi, terkait dengan analisis statistika dalam ilmu perilaku (behavioral science) dan studi klinik terkait dengan pasien dengan waktu penyembuhan yang lama (seperti kanker, tumor, HIV, dan sebagainya) 6

(4) Hasil analisis data berdasarkan medical record PKPD di RSUP Dr Sardjito Yogyakarta memberikan sumbangan untuk cleaning data yang sangat berguna untuk analisis terkait dengan pengobatan PKPD di RSUP Dr Sardjito Yogyakarta. (5) Pemrograman iterasi Newton Raphson berbantuan soft-ware Matlab yang dihasilkan dapat dimanfaatkan untuk analisis cure rate berdasar model mixture Weibull dan memberi inspirasi untuk pengembangan soft-ware yang lain untuk analisis pada model mixture untuk kasus yang berbeda. 1.6. Tujuan Penelitian Penelitian ini bertujuan untuk mengembangkan model mixture untuk analisis cure rate dengan missing data, melalui cara: (1) menentukan model mixture untuk analisis cure rate dengan missing data (2) melakukan estimasi parameter dalam model mixture untuk analisis cure rate dengan missing data (3) mengkaji sifat-sifat estimator yang diperoleh dalam model mixture untuk analisis cure rate dengan missing data (4) mengaplikasikan model mixture untuk analisis cure rate berbasis missing data berdasar data nyata yang diperoleh dari studi klinik dan medical record PKPD di RSUP Dr Sardjito Yogyakarta 1.7. Tinjauan Pustaka Model mixture pada awalnya dikembangkan oleh Boag (1949) untuk mengestimasi proporsi pasien yang sembuh pada treatment penderita kanker mulut dan kerongkongan, leher, kandungan, dan payudara. Model ini dinamakan model mixture karena dapat 7

mengestimasi proporsi pasien yang sembuh dan fungsi survival pasien tak sembuh. Dalam perkembangannya dikenal model mixture parametrik dan model mixture nonparametrik. Model mixture dikatakan model (cure) mixture parametrik jika menggunakan distribusi probabilitas standar seperti distribusi eksponensial, Weibull, Gompertz, dan generalized F. Secara umum, distribusi yang digunakan dalam model mixture parametrik adalah generalized gamma. Diskusi tentang model mixture parametrik dapat dilihat pada Boag (1949), Jones et al (1981), Farewell (1982, 1986), Cantor dan Shuster (1992), Ghitany et al (1994) serta Denham et al (1996). Model mixture tanpa menggunakan distribusi probabilitas standar dinamakan model (cure) mixture nonparametrik. Model mixture nonparametrik dikembangkan oleh Kuk dan Chen (1992), dengan mengaplikasikan asumsi PH pada distribusi failure time pasien tak sembuh. Metode ini analog dengan model PH Cox (nonparametrik) yang tak lepas dari pendekatan Monte-Carlo dan fungsi likelihood. Taylor (1995) menggunakan estimator survivor Kaplan-Meier untuk mengestimasi distribusi failure time pasien tak sembuh dan algoritma EM, tetapi model ini tidak menyertakan kovariat dalam distribusi failure time pasien yang tak sembuh. Farewell (1986) mengembangkan model mixture parametrik untuk analisis waktu kambuh atau meninggal untuk 3 (tiga) treatment theraphy 139 penderita kanker payudara sebagai kasus khusus. Pada studi yang dilakukan, Farwell juga mengamati 4 (empat) faktor lain yang diperkirakan mempengaruhi ketahanan hidup penderita kanker payudara, yaitu : clinical stage, pathological stage, histological stage dan banyak lymph nodes yang tertular. Problem yang menarik pada studi klinik tersebut adalah proporsi pasien yang mungkin sembuh dan efek treatment serta faktor-faktor yang mempengaruhi ketahanan hidup penderita kanker payudara serta distribusi failure time pasien yang tak sembuh (uncured). 8

Model mixture yang dikembangkan, didasarkan pada distribusi tahan hidup Weibull tanpa adanya missing data. Dalam perkembangannya, model mixture tidak hanya digunakan untuk pemodelan pada studi klinik, tetapi juga digunakan untuk studi di luar klinik sebagaimana dapat dilihat pada Tabel 1.1 dan Tabel 1.2 di atas. Model yang digunakan meliputi model mixture parametrik dan model mixture non parametrik. Aplikasi model mixture untuk berbagai kasus terkait memberikan inspirasi untuk penelitian lanjutan. Untuk mengestimasi parameter dalam model mixture dapat menggunakan metode maksimum likelihood (ML). Dempster et al (1977) menguraikan metode umum untuk menentukan MLE (maximum-likelihood estimates) jika ada missing data. Metode ini dapat digunakan seperti pada metode parametrik dengan asumsi model mixture untuk data dengan distribusi berbeda untuk cluster dan proporsi data hilang yang tak diketahui. Selain ML, metode yang dapat digunakan adalah algoritma EM (Expectation Maximization). Metode ini didasarkan pada 2 (dua) langkah, yaitu: (1) Epectation Step untuk menentukan distribusi missing data berdasar nilai observasi yang diketahui dan mengestimasi parameternya, dan (2) Maximization Step, yaitu subtitusi data hilang dengan nilai ekpektasi yang sudah diperoleh dari langkah (1) Algoritma EM merupakan pendekatan iterasi untuk mempelajari model dari data dengan nilai hilang melalui 4 (empat) langkah, yaitu (1) memilih himpunan inisial dari parameter untuk sebuah model, (2) menentukan nilai ekspektasi untuk data hilang, (3) membuat induksi parameter model baru dari gabungan nilai ekspekstasi dan data asli, dan (4) mengulangi langkah 2 menggunakan model baru jika parameter tidak converged. Jika statistik cukup dari data lengkap merupakan fungsi linier dari data, maka algoritmanya dapat dipecahkan dengan sederhana. Dalam E-step, observasi dengan missing 9

data, ekspektasi bersyarat dari data observasi yang diberikan ditukarkan dengan vektor parameter. Pada M-step, perbedaan dibuat antara data observasi dan data yang berkaitan. Schafer (1999) mengembangkan algoritma EM untuk data hilang. Jika diketahui nilai data yang hilang, maka estimasi model parameter menjadi sangat mudah. Demikian juga jika parameter model diketahui, maka estimasi tak bias untuk nilai data yang hilang dapat diperoleh. Metode yang dilakukan adalah dengan mengestimasi parameter pada basis data, kemudian mengestimasi data hilang pada basis data untuk parameter terkait. Dari langkah ini diperoleh estimasi varians, kovarians dan mean berdasar listwise deletion. Hasil estimasi digunakan untuk menentukan koefisien regresi, kemudian digunakan untuk mengestimasi data hilang berdasar koefisien regresi tersebut. Ada alternatif lain untuk MLE yang lebih baik dibandingkan dengan hasil dari algoritma EM, tetapi harus dipenuhi asumsi model (biasanya berdistribusi normal multivariat) untuk distribusi dari variabel dengan missing data. Alternatif untuk MLE tersebut dikenal dengan Multiple Imputation yang didasarkan pada matriks kovarians dan vektor mean. Di bawah model normal multivariat, imputasi dari observasi didasarkan pada regresi dari variabel dengan missing data atas variabel lain pada data set. 1.8. Outline Disertasi Disertasi ini terdiri dari 6 (enam) bab bahasan. Bab I, pendahuluan, mencakup tentang latar belakang masalah, permasalahan, batasan penelitian, keaslian penelitian, manfaat penelitian, tujuan penelitian, tinjauan pustaka dan outline disertasi. Bab II, konsep dasar analisis survival, berisi tentang teori-teori dan hasil-hasil penelitian terdahulu yang mendukung penyelesaian permasalahan penelitian dalam disertasi. Pada bab ini dikemukakan tentang konsep dasar distribusi tahan hidup, analisis survival penderita kanker payudara, 10

distribusi Weibull, missing data, dan model proporsional hazard Cox. Bab III, analisis survival berdasar model mixture, berisi model mixture, algoritma EM untuk model mixture, proporsional hazard untuk model mixture, serta metode Kuk dan Chen. Bab IV, model mixture untuk analisis cure rate jika ada missing data, berisi tentang model mixture untuk analisis cure rate jika ada missing data, estimasi parameter dalam model mixture untuk analisis cure rate jika ada missing data, dan kajian sifat-sifat estimator dalam model mixture untuk analisis cure rate jika ada missing data. Bab V, aplikasi model mixture untuk analisis cure rate dengan missing data berdasar data nyata yang diperoleh dari studi klinik PKPD. Pada bab ini diuraikan kajian tentang kanker payudara dan aplikasi model mixture untuk analisis cure rate PKPD dengan missing data. Bab VI, penutup, berisi simpulan dan masalah terbuka untuk penelitian lanjutan. 11