ESTIMASI MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN ESTIMATOR KERNEL UNIFORM (Studi Kasus : Pasien DBD di RS Puri Raharja) KOMPETENSI STATISTIKA ANNA FITRIANI 1108405001 JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS UDAYANA BUKIT JIMBARAN 2015 i
LEMBAR PERSEMBAHAN Sesungguhnya hati memiliki keinginan, kepedulian, dan keengganan. Maka, datangilah ia dari arah kesenangan dan kepeduliannya. Sebab, jika hati itu dipaksakan, ia akan buta. (Ali bin Abi Thalib) Aku mengamati semua sahabat, dan tidak menemukan sahabat yang lebih baik daripada menjaga lidah. Aku memikirkan tentang semua pakaian, tetapi tidak menemukan pakaian yang lebih baik daripada takwa. Aku merenungkan segala jenis amal baik, namun tidak mendapatkan yang lebih baik daripada memberi nasihat baik. Aku mencari segala bentuk rezki, tapi tidak menemukan rezki yang lebih baik daripada sabar. (Umar bin Khatab) Karya ini ku persembahkan untuk: Allah S.W.T atas segala karunia-nya pada penulis. Kedua orang tuaku tercinta, kakak dan adikku tersayang, dan my sweet love untuk doa, nasihat dan semangatnya. Untuk karmana, Iin, Kis, Anggi atas semangat, dukungan, doa dan segalanya. Tidak lupa juga untuk para dosen pembimbing dan penguji yang sudah sangat baik membantu dalam penyelesaian tugas akhir ini. Teman-teman di Matematika khususnya angkatan 2011 yang juga telah banyak mendukung. Dan untuk semua teman-teman yang telah memberikan semangat yang tidak dapat disebutkan satu persatu. ii
ESTIMASI MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN ESTIMATOR KERNEL UNIFORM (Studi Kasus : Pasien DBD di RS Puri Raharja) KOMPETENSI STATISTIKA [SKRIPSI] Sebagai syarat untuk memperoleh gelar Sarjana bidang Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana Tulisan ini merupakan hasil penelitian yang belum pernah dipublikasikan ANNA FITRIANI 1108405001 Pembimbing II Pembimbing I Made Susilawati, S.Si., M.Si. NIP. 197109021998022001 I Gusti Ayu Made Srinadi, S.Si., M.Si. NIP. 197112131997022001 iii
LEMBAR PENGESAHAN TUGAS AKHIR Judul Kompetensi Nama : Estimasi Model Regresi Semiparametrik Menggunakan Estimator Kernel Uniform (Studi Kasus : Pasien DBD di RS Puri Raharja) : Statistika : Anna Fitriani NIM : 1108405001 Tanggal seminar : 9 Oktober 2015 Pembimbing II Disetujui oleh: Pembimbing I Made Susilawati, S.Si., M.Si. NIP. 197109021998022001 I Gusti Ayu Made Srinadi, S.Si.,M.Si. NIP. 197112131997022001 Penguji I I Wayan Sumarjaya, S.Si., M.Stats. NIP. 197704212005011001 Penguji III Penguji II Desak Putu Eka Nilakusmawati, S.Si.,M.Si. NIP. 197106111997022001 Mengetahui Jurusan Matematika FMIPA Unud Ketua, Ni Made Asih, S.Pd., M.Si. NIP. 197703142006042001 Ir. Komang Dharmawan, M.Math., Ph.D. NIP.196202181988031001 iv
Judul Nama Pembimbing : Estimasi Model Regresi Semiparametrik Menggunakan Estimator Kernel Uniform (Studi Kasus : Pasien DBD di RS Puri Raharja) : Anna Fitriani : 1. I Gusti Ayu Made Srinadi, S.Si., M.Si. 2. Made Susilawati, S.Si., M.Si. ABSTRAK Pendekatan model regresi semiparametrik merupakan pendekatan model yang mengkombinasikan model regresi parametrik dan regresi nonparametrik. Pada regresi semiparametrik, sebagian variabel penjelasnya bersifat parametrik dan sebagian lain bersifat nonparametrik. Regresi semiparametrik digunakan jika pola hubungan antara sekumpulan variabel bebas dan variabel terikat diketahui dan ada pula yang tidak diketahui. Teknik pemulusan (smoothing) kurva regresi pada komponen nonparametrik yang digunakan pada penelitian ini menggunakan fungsi kernel uniform. Pendugaan kurva regresi semiparametrik yang optimal ditentukan dengan ukuran bobot atau bandwidth (h) yang optimal. Pemilihan bandwidth yang optimal akan menghasilkan pendugaan kurva regresi yang mulus sesuai dengan pola data. Pemilihan bandwidth yang optimal ditentukan berdasarkan kriteria nilai GCV yang minimum. Tujuan penelitian ini adalah untuk mengetahui estimasi fungsi regresi semiparametrik kasus DBD menggunakan estimator kernel uniform. Respon dari data yang digunakan adalah data lama kesembuhan pasien Demam Berdarah Dengue (DBD). Terdapat 6 variabel bebas yaitu umur (tahun), suhu tubuh ( 0 C), nadi (kali/menit), kadar hematokrit (%), trombosit, dan lama demam (hari). Umur, suhu tubuh, nadi, trombosit, dan lama demam merupakan komponen parametrik dan kadar hematokrit merupakan komponen nonparametrik. Bandwidth (h) optimal berdasarkan kriteria GCV minimum diperoleh sebesar 0,005. Nilai MSE yang dihasilkan menggunakan analisis regresi linear berganda sebesar 0,031. Sedangkan dengan regresi semiparametrik sebesar 0,00437119. Kata kunci: Regresi Semiparametrik, Kernel, Bandwidth, GCV v
Title Name Supervisors : Estimation of Semiparametric Regression Model Using Uniform Kernel Estimator (Case Study : Dengue Fever Patients in Puri Raharja Hospital) : Anna Fitriani : 1. I Gusti Ayu Made Srinadi, S.Si, M.Si : 2. Made Susilawati, S.Si., M.Si. Abstract Semiparametric regression model estimation is an estimation that combines both parametric and nonparametric regression model. In semiparametric regression, some of the variables are parametrics and the others are nonparametrics. Semiparametric regression is used when relationship pattern between independent and depentdent variables is half known and half unknown. Regression curve smoothing technique in nonparametric components in this study is using uniform kernel function. The optimal semiparametric regression curve estimation is obtained by optimal bandwidth. By choosing optimal bandwidth, we will obtain a smooth regression curve estimation in respect to data pattern. In choosing optimal bandwidth, we use minimum GCV as a criteria. The aim of study to estimate the semiparametric regression function of dengue fever case using uniform kernel estimator. There are 6 independent variables namely age (in years) body temperature (in Celcius), heartbeat (in times/minutes) hematocryte ratio (in percent), amount of trombocyte ( 10 3 /ul) and fever duration ( in days). Age, body temperature, heartbeat, amount of trombosyte and fever duration are parametric components and hematocryte ration is a nonparametric component. The optimal bandwidth (h) which is obtained with minimum GCV is 0,005. The value of MSE which is obtained by using multiple linear regression analysis is 0,031 and by using semiparametric regression is 0,00437119. Keywords: Semiparametric Regression, Kernel, Bandwidth, GCV vi
BIODATA ALUMNI Nama Lengkap : Anna Fitriani NIM : 1108405001 Kompetensi : Statistika Jenis Kelamin : Perempuan Tempat/Tanggal Lahir : Bima, 5 Januari 1994 Alamat Asal : Jl. Gajah Mada RT 11/ RW 04 Penaraga, Bima NTB Alamat Sekarang : Jl. Waturenggong gang II Denpasar, Bali Agama : Islam Tanggal Lulus : 9 Oktober 2015 Tanggal Wisuda : 20 November 2015 IP Komulatif : 3,39 Predikat Kelulusan : Sangat Memuaskan Nilai TOEFL Lokal : 453 Alamat Email : annafitrianipangestu@gmail.com Telepon/HP : 08776608602 Nama Ayah : Abdul Wahab S.Pd Nama Ibu : St. Rukmini Alamat Ayah/Ibu : Jl. Gajah Mada RT 11/ RW 04 Penaraga, Bima NTB Telepon/Hp : 081353917070 vii
KATA PENGANTAR Puji syukur penulis panjatkan kehadapan Tuhan Yang Maha Esa, karena atas berkat dan rahmat-nya, penulis dapat menyelesaikan Tugas Akhir yang berjudul Estimasi Model Regresi Semiparametrik Menggunakan Penduga Kernel Uniform (Studi Kasus : Pasien DBD di RS Puri Raharja). Sehubungan dengan telah terselesaikannya Tugas Akhir ini, maka melalui kesempatan ini penulis menyampaikan penghargaan dan ucapan terima kasih kepada berbagai pihak yang telah membantu penyusunan Tugas Akhir ini, antara lain: 1. Bapak Ir. Komang Dharmawan, M.Math, Ph.D selaku Ketua Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana. 2. Ibu I Gusti Ayu Made Srinadi, S.Si, M.Si selaku Dosen Pembimbing I yang telah dengan sabar memberikan bimbingan, saran, dan nasehat yang sangat membantu bagi penulis. 3. Ibu Made Susilawati. S.Si., M.Si. selaku Dosen Pembimbing II yang telah banyak memberikan bimbingan, dukungan, dan arahan, hingga terselesaikannya proposal tugas akhir ini. 4. Bapak I Wayan Sumarjaya, S.Si., M.Stats. sebagai penguji yang telah banyak memberikan saran dan masukan kepada penulis. 5. Ibu Ni Made Asih, S.Pd, M.Si dan Desak Putu Eka Nilakusmawati, S.Si., M.Si sebagai penguji yang telah banyak memberikan saran dan masukan kepada penulis. viii
6. Kedua orang tua, kakak dan adik yang telah memberikan motivasi, semangat, dan doa dalam menyelesaian Tugas Akhir ini. 7. Para Sahabat dan teman-teman di Jurusan Matematika, khususnya angkatan 2011, terima kasih atas bantuan, semangat, dan dukungannya. 8. Semua pihak yang turut membantu penyelesaian Tugas Akhir ini, yang tidak dapat penulis sebutkan satu persatu. Penulis menyadari bahwa Tugas Akhir ini masih terdapat banyak kesalahan dan kekurangan yang disebabkan karena keterbatasan kemampuan dan pengalaman penulis. Oleh karena itu, diharapkan masukan dan saran yang mendukung penyempurnaan Tugas Akhir ini. Semoga Tugas Akhir ini dapat bermanfaat bagi pembaca. Bukit Jimbaran, September 2015 Penulis ix
DAFTAR TABEL Tabel Halaman 4.1 Statisika Deskriptif Data Pasien Demam Berdarah Dengue (DBD)... 21 4.2 Analisis regresi linear berganda... 27 4.3 Korelasi antara lama kesembuhan pasien DBD, jenis kelamin, umur, suhu tubuh, nadi, kadar hematokrit, trombosit, lama demam...28 4.4 Nilai Y Observasi dengan Y Dugaan ( )...33 xii
DAFTAR GAMBAR Gambar Halaman 4.1 Scatter Plot Trombosit (PLT) dengan Lama Kesembuhan Pasien (Y)...22 4.2 Scatter Plot Antara Nadi (N) dengan Lama Kesembuhan Pasien (Y)...23 4.3 Scatter Plot Antara Lama Demam (LD) dengan Lama Kesembuhan Pasien (Y)... 23 4.4 Scatter Plot Antara Umur (U) dengan Lama Kesembuhan Pasien (Y)...24 4.5 Scatter Plot Antara Suhu (S) dengan Lama Kesembuhan Pasien (Y)...24 4.6 Scatter Plot Antara Kadar Hematokrit (HCT) dengan Lama Kesembuhan Pasien (Y)... 25 4.7 Plot Antara Bandwidth dengan GCV Untuk Kenaikan H=0.05...31 4.8 Plot Perbandingan Antara Y Observasi Dengan Hasil Dugaan ( )...38 xiii
DAFTAR LAMPIRAN Lampiran 1. Data Pasien Demam Berdarah Dengue (DBD) yang menjalani rawat inap di Rumah Sakit Puri Raharja. 2. Output Program Statistika Deskriptif Menggunakan Software SPSS. 3. Matriks Korelasi dan Hasil Analisis Regresi Berganda antara Lama Kesembuhan Pasien (Y), Suhu, Umur, Lama demam, Nadi, Trombosit, dan Hematokrit. 4. Program Untuk Menentukan Nilai Bandwidth Optimal dengan Kernel Uniform dengan bantuan Software R i386 2.15.0. 5. Output Nilai Bandwidth (h) dan GCV dengan Kernel Uniform pada selang kenaikan h=0.05 6. Output Nilai Bandwidth (h) dan GCV dengan Kernel Uniform pada selang kenaikan h=0.005 7. Output Nilai Bandwidth (h) dan GCV dengan Kernel Uniform pada selang kenaikan h=0.001 8. Program Untuk Menentukan Pendugaan dengan Kernel Uniform dengan bantuan Software R i386 2.15.0 9. Output Pendugaan dengan Kernel Uniform dengan Bandwidth (h)=0.05 xiv