Judul : Aplikasi Model Regresi Semiparametrik Spline Truncated (Studi Kasus: Pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja) Nama : Ni Wayan Merry Nirmala Yani Pembimbing : 1. I.Gst. Ayu Made Srinadi, S.Si.,M.Si. 2. I Wayan Sumarjaya, S.Si.,M.Stats. ABSTRAK Regresi semiparametrik merupakan model regresi yang memuat komponen parametrik dan komponen nonparametrik dalam suatu model. Pada penelitian ini digunakan model regresi semiparametrik spline truncated dengan studi kasus pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja periode bulan Januari sampai bulan Maret 2015. Estimasi model regresi terbaik didapat dari pemilihan titik knot optimal dengan melihat nilai Generalized Cross Validation (GCV) yang minimum. Komponen parametrik pada penelitian ini terdiri dari umur (tahun), suhu tubuh ( 0 C), trombosit ( 10 3 /μl), dan kadar hematokrit (%) sebagai komponen nonparametrik dengan nilai GCV minimum sebesar 0,03552045 dicapai pada titik knot 39,6; nilai MSE sebesar 0,0296922; dan nilai koefisien determinasi sebesar 98,91%, yang diperoleh dari model regresi semiparametrik spline truncated linear (orde 2) dengan satu titik knot. Kata Kunci : regresi semiparametrik, spline, knot, GCV v
Title Name Supervisor : Application of Truncated Spline Semiparametric Regression Model (Case Study: Patients with Dengue Hemorrhagic Fever (DHF) at Puri Raharja Hospital) : Ni Wayan Merry Nirmala Yani : 1. I.Gst. Ayu Made Srinadi, S.Si.,M.Si. 2. I Wayan Sumarjaya, S.Si.,M.Stats. ABSTRACT Semiparametric regression is a regression model that includes parametric components and nonparametric components in a model. The regression model in this research is truncated spline semiparametric regression with case studies of patients with Dengue Hemorrhagic Fever (DHF) at Puri Raharja Hospital during the period of January to March 2015. The best regression model estimation is obtained from the selection of optimal knots which has minimum Generalized Cross Validation (GCV) is. Parametric components in this research include age (years), body temperature ( 0 C), platelets ( 10 3 /μl), and hematocrit (%) as a nonparametric component. The minimum value of GCV is 0.03552045 achieved at the point of 39.6 knots, MSE value of 0.0296922; and the value of coefficient determination is 98.91%, obtained from semiparametric regression model truncated linear spline (order 2) with a single point of knots. Keywords : semiparametric regression, spline, knots, GCV vi
KATA PENGANTAR Puja dan puji syukur penulis panjatkan kehadapan Ida Sang Hyang Widhi Wasa/Tuhan Yang Maha Esa karena atas berkat-nya tugas akhir dengan judul Aplikasi Model Regresi Semiparametrik Spline Truncated (Studi Kasus: Pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja) dapat terselesaikan tepat pada waktunya. Pada kesempatan ini penulis mengucapkan terima kasih kepada berbagai pihak yang telah memberikan bantuan sehingga tugas akhir ini dapat tersusun dengan baik, antara lain: 1. Ibu Desak Putu Eka Nilakusumawati, S.Si, M.Si. selaku Ketua Jurusan Matematika FMIPA Universitas Udayana yang telah membantu dalam kelancaran tugas akhir ini. 2. Ibu I Gusti Ayu Made Srinadi, S.Si.,M.Si. selaku pembimbing I yang telah banyak membantu dan membimbing dalam pelaksanaan penelitian dan penyusunan tugas akhir ini. 3. Bapak I Wayan Sumarjaya, S.Si.,M.Stats. selaku pembimbing II yang telah banyak memberikan bimbingan, dukungan, dan arahan, hingga terselesaikannya penelitian dan tugas akhir ini. 4. Bapak/Ibu dari Komisi Seminar dan Tugas Akhir Jurusan Matematika yang telah banyak membantu dalam kelancaran tugas akhir ini dan memberikan dukungan moral dalam penyelesaian tugas akhir ini. vii
5. Bapak Ir. I Komang Gde Sukarsa, M.Si. selaku dosen penguji yang telah banyak memberi kritikan, saran dan masukan yang membangun guna menyempurnakan tugas akhir ini. 6. Bapak Ir. I Putu Eka Nila Kencana, M.T. selaku dosen penguji yang telah banyak memberi kritikan, saran dan masukan yang membangun guna menyempurnakan tugas akhir ini. 7. Ibu Ni Ketut Tari Tastrawati, S.Si.,M.Si. selaku dosen penguji yang telah banyak memberi kritikan, saran dan masukan yang membangun guna menyempurnakan tugas akhir ini. 8. Keluarga dan khususnya Bapak I Made Yasa dan Ibu Suartini sebagai orang tua yang selalu mendoakan, memberikan motivasi dan pengorbanannya baik dari segi moril maupun materi sehingga penulis dapat menyelesaikan tugas akhir ini. 9. Kakak Senior Hardi Karmana yang telah banyak membantu dalam penyelesaian tugas akhir ini. 10. Teman-teman di Jurusan Matematika Udayana dan KKN UNUD periode XI Desa Ped Nusa Penida yang telah banyak membantu dan memberikan dukungan moral dalam penyelesaian tugas akhir ini. viii
Penulis menyadari bahwa masih terdapat banyak kekurangan dalam penyusunan tugas akhir ini. Oleh karena itu, penulis mengharapkan saran dan kritik yang membangun dari berbagai pihak guna menyempurnakan tugas akhir ini. Denpasar, Desember 2016 (Penulis) ix
BIODATA ALUMNI Nama Lengkap : Ni Wayan Merry Nirmala Yani NIM : 1208405025 Jenis Kelamin : Perempuan Tempat/Tanggal Lahir : Denpasar, 16 Desember 1994 Alamat Asal : Jl. Nagasari No.72 Denpasar Alamat Sekarang : Jl. Nagasari No.72 Denpasar Agama : Hindu Tanggal Lulus : 2 Desember 2016 Kompotensi : Statistika IP Kumulatif : 3,57 Predikat Kelulusan : Dengan Pujian Nilai TOELF Lokal : 513 Alamat Email : merrynirmala72@gmail.com No Hp : 08970860532 Nama Ayah : I Made Yasa Nama Ibu : Ni Wayan Suartini Alamat Ayah/Ibu : Jl. Nagasari No.72 Denpasar Telepon : (0361) 464722 x
DAFTAR TABEL Tabel 2. 1 Tabel ANOVA bagi model regresi parametrikerror! Bookmark not defined. Tabel 2. 2 Tabel aturan keputusan uji d Durbin-WatsonError! Bookmark not defined. Tabel 4. 1 Statistika deskriptif data pasien Demam Berdarah Dengue (DBD)... Error! Bookmark not defined. Tabel 4. 2 Komponen parametrik dan komponen nonparametrik regresi semiparametrik spline truncated... Error! Bookmark not defined. Tabel 4. 3 Nilai (GCV) dari variasi titik dan orde. Error! Bookmark not defined. Tabel 4. 4 Analisis variansi regresi semiparametrik spline truncated linear. Error! Bookmark not defined. Tabel 4. 5 Uji individu estimasi model regresi semiparametrik spline truncated linear... Error! Bookmark not defined. xi
DAFTAR GAMBAR xii
xiii
xiv
xv
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Analisis regresi merupakan suatu studi yang digunakan untuk melihat hubungan dalam bentuk fungsi antara variabel respons pada satu atau lebih variabel prediktor. Hasil dari analisis regresi adalah suatu persamaan yang disebut dengan persamaan regresi. Analisis regresi sering digunakan dalam berbagai bidang ilmu, seperti ekonomi, bisnis, administrasi, kesehatan, biologi, dan ilmu pengetahuan sosial. Terdapat dua pendekatan dalam analisis regresi untuk mengestimasi kurva regresi, yaitu pendekatan regresi parametrik dan regresi nonparametrik. Model regresi parametrik mengasumsikan bahwa pola fungsi diketahui seperti linear, kuadratik, kubik, polinomial derajat-p, eksponensial, dan lain-lain. Asumsi pada pendektan parametrik tersebut berdasarkan pada teori atau tersedianya sumbersumber lain yang dapat memberi suatu informasi yang terperinci. Pada regresi parametrik informasi dari penelitian sebelumnya yang rinci tentang karakteristik data sangat diperlukan untuk dapat memperoleh model yang baik. Apabila dalam analisis regresi bentuk atau pola kurva tidak diketahui maka pendekatan model regresi tersebut disebut regresi nonparametrik. Metode regresi nonparametrik merupakan metode pendekatan regresi yang digunakan ketika kurva regresi antara variabel prediktor dengan variabel respons tidak diketahui bentuk atau polanya. Regresi nonparametrik memiliki fleksibilitas 1
2 yang tinggi di mana data diharapkan mencari sendiri bentuk estimasi kurva regresinya. Dalam regresi nonparametrik terdapat beberapa teknik estimasi seperti pendekatan histogram, estimator kernel, estimator deret orthogonal, analisis wavelet, estimator MARS, estimator deret Fourier, estimator spline, dan lain-lain. Pendekatan spline memiliki suatu basis fungsi, di mana basis fungsi yang biasa digunakan antara lain spline truncated dan B-spline (Lyche and Morken 2008). Spline adalah salah satu jenis piecewise polinomial (Eubank 1988). Maksud piecewise polinomial ini adalah polinomial yang memiliki sifat tersegmen atau sifat terpotong-potong. Model polinomial dengan sifat tersegmen ini menyebabkan spline memiliki fleksibilitas yang lebih tinggi dari model polinomial biasa, sehingga menyebabkan regresi spline dapat menyesuaikan diri secara lebih efektif terhadap karakteristik lokal suatu fungsi data atau dengan kata lain regresi spline dapat menghasilkan suatu fungsi regresi yang sesuai dengan data. Selain memiliki fleksibilitas yang tinggi regresi spline juga memiliki kelebihan lain seperti memiliki interpretasi visual dan interpretasi statistika yang baik, mampu menangani data atau fungsi yang mulus (smooth), mampu menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu dengan baik dan mampu menggeneralisasikan pemodelan statistika yang kompleks dan rumit dengan baik. Namun, pada saat regresi spline memiliki orde yang tinggi, knot yang terlalu dekat, dan knot yang terlalu banyak menyebabkan suatu perhitungan matriks yang singular, sehingga dapat menyebabkan persamaan normal tidak dapat diselesaikan. Apabila pada sebuah model regresi terdapat komponen model yang diestimasi secara parametrik dan komponen lain menggunakan pendekatan nonparametric
3 terbentuklah model regresi semiparametrik. Penelitian sebelumnya mengenai pemodelan menggunakan regresi semiparametrik spline pernah dilakukan oleh Marina & Budiantara (2013) yang memodelkan faktor-faktor yang memengaruhi persentase kriminalitas di Jawa Timur dengan pendekatan regresi semiparametrik spline. Penelitian tersebut menggunakan regresi semiparamterik linear dan dengan tiga titik knot (r = 1,2,3). Laome (2009) memodelkan regresi semiparametrik spline untuk data longitudinal pada kadar CD4 penderita HIV. Sugiantari & Budiantara (2013) meneliti analisis faktor-faktor yang memengaruhi angka harapan hidup di Jawa Timur menggunakan regresi semiparametrik spline, pada penelitian tersebut menggunakan Generalized Cross Validation (GCV) dalam pemilihan titik knot optimal pada spline linear satu knot, dua knot, dan tiga knot. Wibowo et al. (2013) meneliti estimasi parameter dalam regresi semiparametrik spline. Penelitian tersebut mengatakan bahwa pendekatan reproducing kernel Hilbert space memberikan estimator yang bersifat lebih umum dibandingkan dengan estimator yang diperoleh dengan metode kuadrat terkecil maupun dengan kuadrat terkecil terpenalti. Penelitian ini akan digunakan regresi semiparametrik spline truncated dengan studi kasus pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja yang nanti hasilnya akan dibandingkan dengan estimasi regresi semiparametrik menggunakan estimator kernel uniform yang sebelumnya telah dianalisis oleh Fitriani (2015). Penyakit Demam Berdarah Dengue (DBD) yang disebabkan oleh virus dengue yang termasuk kelompok B Arthropod virus yang dikenal sebagai genus Flavivirus dengan family Flaviviride. Virus Dengue mempunyai empat jenis serotype yaitu
4 DEN-1, DEN-2, DEN-3, dan DEN-4. Terdapat tiga faktor pemegang peran dalam penularan infeksi virus dengue yaitu manusia, virus, dan vektor perantara. Virus dengue yang menular ke manusia ditularkan oleh gigitan nyamuk Aedes aegypty (Departemen Kesehatan Republik Indonesia 2004). 1.2. Rumusan Masalah Berdasarkan latar belakang yang telah dipaparkan di atas, maka dapat dirumuskan permasalahan yaitu bagaimana menentukan estimasi model regresi semiparametrik dengan spline truncated pada data pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja dan mengetahui variabel-variabel apa saja yang berpengaruh signifikan terhadap lama rawat inap pada pasien Demam Berdarah Dengue (DBD)? 1.3. Tujuan Penelitian Berdasarkan rumusan masalah yang telah dipaparkan sebelumnya, adapun tujuan pada penelitian ini yaitu menentukan estimasi model regresi semiparametrik dengan spline truncated pada data pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja dan mengetahui variabel-variabel apa saja yang berpengaruh signifikan. 1.4. Manfaat Penelitian Adapun dalam penelitian ini, penulis berharap dapat memberikan manfaat sebagai berikut: 1. mampu menambah pemahaman mengenai regresi semiparametrik spline truncated;
5 2. sebagai referensi untuk penelitian selanjutnya tentang faktor-faktor yang memengaruhi lama kesembuhan pasien rawat inap pada pasien Demam Berdarah Dengue (DBD);