PENDUGAAN MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN PENDUGA KERNEL [SKRIPSI] KOMPETENSI STATISTIKA oleh: NI PUTU PERDINA 0808405003 JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS UDAYANA 2012
LEMBAR PERSEMBAHAN Tempat Tinggal-Ku yang paling utama itu tidak diterangi oleh matahari, bulan, api maupun listrik, orang yang mencapai tempat tinggal itu tidak pernah kembali lagi ke dunia material ini (Bhagawad-Gita 15.6) Karya ini ku persembahkan untuk: My Sweet Lord Krsna atas segala Karunia-Nya kepada Penulis,, Bapak, Mama, Adik tersayang Kadek ayu dan Mang yoga untuk doa, nasehat, dan semangatnya; Kadoy, sahabat yang paling baik Risna, Dayu, n Melissa atas semangat, dukungan, doa, dan segalanya. Tidak lupa juga untuk para dosen pembimbing dan penguji yang sudah sangat baik membantu dalam penyelesaian tugas akhir ini. Temen-temen di Matematika khususnya angkatan 2008 yang juga telah banyak mendukung; Kak Chandra dan Temen-temen di Pasraman Sri-Sri Radha Rasesvara, atas doa dan semangatnya Terima Kasih buat semuanya.. ii
PENDUGAAN MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN PENDUGA KERNEL KOMPETENSI STATISTIKA [SKRIPSI] Sebagai syarat untuk memeroleh gelar Sarjana Sains bidang Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana Tulisan ini merupakan hasil penelitian yang belum pernah dipublikasikan NI PUTU PERDINA 0808405003 Pembimbing II Pembimbing I Dra. Ni Luh Putu Suciptawati, M.Si NIP. 19630122 199802 2 001 IGA Made Srinadi, S.Si, M.Si NIP. 19711213 199702 2 001 iii
LEMBAR PENGESAHAN TUGAS AKHIR Judul : Pendugaan Model Regresi Semiparametrik Menggunakan Penduga Kernel Kompetensi Nama : Statistika : Ni Putu Perdina Nim : 0808405003 Tanggal Ujian : 23 April 2012 Disetujui oleh: Pembimbing II Pembimbing I Dra. Ni Luh Putu Suciptawati, M.Si NIP. 19630122 199802 2 001 IGA Made Srinadi, S.Si, M.Si NIP. 19711213 199702 2 001 Penguji III Penguji II Penguji I Ni Made Asih, S.Pd, M.Si NIP. 19770314 200604 2 001 Made Susilawati, S.Si, M.Si NIP. 19710902 199802 2 001 Ir. I Komang Gde Sukarsa, M.Si NIP. 19650105 199103 1 004 Mengetahui Ketua Jurusan Matematika FMIPA UNUD Ir. Komang Dharmawan, M.Math, Ph.D NIP. 19620218 198803 1 001 iv
Judul : Pendugaan Model Regresi Semiparametrik Menggunakan Penduga Kernel Nama : Ni Putu Perdina (NIM: 0808405003) Pembimbing : 1. I Gusti Ayu Made Srinadi, S.Si, M.Si : 2. Dra. Ni Luh Putu Suciptawati, M.Si ABSTRAK Analisis Regresi Semiparametrik merupakan gabungan antara metode parametrik dan nonparametrik. Ada variabel bebas yang memenuhi asumsi parametrik dan ada yang tidak memenuhi asumsi parametrik. Variabel bebas yang memenuhi asumsi parametrik dapat diduga dengan metode analisis regresi linier, sedangkan yang tidak memenuhi asumsi parametrik diduga dengan metode nonparametrik. Teknik pemulusan (smoothing) kurva regresi pada komponen nonparametrik yang digunakan pada penelitian ini menggunakan fungsi kernel triangle. Kurva regresi pada komponen nonparametrik dipengaruhi oleh bandwidth (h). Agar memperoleh kurva regresi yang mulus, diperlukan bandwidth (h) yang optimal. Pemilihan bandwidth (h) optimal berdasarkan nilai GCV (Generalized Cross Validation) minimum. Tujuan penelitian ini adalah untuk mengetahui hasil pendugaan model semiparametrik dengan menggunakan penduga kernel. Respon dari data yang digunakan adalah data berat badan balita saat ditimbang.terdapat dua variabel bebas yaitu umur dan berat lahir. Umur merupakan komponen parametrik sedangkan berat lahir merupakan komponen nonparametrik. Bandwidth (h) optimal berdasarkan kriteria GCV minimum diperoleh sebesar 0.005. Bila dibandingkan dengan menggunakan analisis regresi linier berganda, hasil pendugaan menggunakan regresi semiparametrik jauh lebih baik. Dilihat dari MSE (Mean Squared Error) yang dihasilkan. Dengan menggunakan regresi linier berganda menghasilkan MSE sebesar 3.65, sedangkan dengan menggunakan regresi semiparametrik menghasilkan MSE sebesar 0.7744434. Kata kunci: Regresi Semiparametrik, Kernel, Bandwidth, GCV v
Title : Estimates of Semiparametric Regression Model Using Kernel Estimator Name : Ni Putu Perdina (NIM: 0808405003) Supervisors : 1. I Gusti Ayu Made Srinadi, S.Si, M.Si : 2. Dra. Ni Luh Putu Suciptawati, M.Si ABSTRACT Semiparametric regression analysis is combine between parametric method and nonparametric method. There s predictor variables that satisfy parametric assumption and not. If predictor variables satisfy the parametric assumption, it can estimate by using linear regression analysis method. But if not it can estimate with nonparametric method. Smoothing method for regression curve in nonparametric component in this research used kernel triangle function. The regression curve of nonparametric component be affected by bandwidth (h). To get smooth of the regression curve, optimal of bandwidth (h) must be obtained. Choos optimal of bandwidth (h) by choosing minimum value of GCV (Generalized Cross Validation). The purposed of this research to know the estimated semiparametric regression with estimator kernel. The Respon of data in this research is weight of toddlers when weighed. There are two predictors,age and birth weight. Age is parametric component and birth weight is nonparametric component. Bandwidth (h) obtained by minimum of GCV is 0.001. If compared with multiple linear regression analysis, estimated with semiparametric regression is better. It can be seen from MSE (Mean Squared Error). MSE in multiple linear regression analysis is 3.65, but semiparametricc regression is 0.7744434. Keywords: Semiparametric Regression, Kernel, Bandwidth, GCV vi
BIODATA ALUMNI Nama Lengkap : Ni Putu Perdina NIM : 0808405003 Kompetensi : Statistika Jenis Kelamin : Perempuan Tempat/Tanggal Lahir : Denpasar, 13 Pebruari 1990 Alamat Asal : Jl. Patih Nambi No.5 Ubung Kaja, Denpasar Utara, Bali Alamat Sekarang : Jl. Patih Nambi No.5 Ubung Kaja, Denpasar Utara, Bali Agama : Hindu Tanggal Lulus : 23 Juli 2012 Tanggal Wisuda : 11 Agustus 2012 IP Komulatif : 3.06 Predikat Kelulusan : Sangat Memuaskan Nilai TOEFL Lokal : 507 Alamat Email : math_dina@yahoo.com Telepon/HP : (081) 805431452 Nama Ayah : I Nyoman Yasa Nama Ibu : Nengah Srinatih Alamat Ayah/Ibu : Jl. Patih Nambi No.5 Ubung Kaja, Denpasar Utara, Bali Telepon/Hp : (081) 23852774 vii
KATA PENGANTAR Puji syukur penulis panjatkan kehadapan Tuhan Yang Maha Esa, karena atas berkat dan rahmat-nya, penulis dapat menyelesaikan Tugas Akhir yang berjudul Pendugaan Model Regresi Semiparametrik Menggunakan Penduga Kernel. Sehubungan dengan telah terselesaikannya Tugas Akhir ini, maka melalui kesempatan ini penulis menyampaikan penghargaan dan ucapan terima kasih kepada berbagai pihak yang telah membantu penyusunan Tugas Akhir ini, antara lain: 1. Bapak Ir. Komang Dharmawan, M.Math, Ph.D selaku Ketua Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Udayana. 2. Ibu I Gusti Ayu Made Srinadi, S.Si, M.Si sebagai pembimbing I yang telah dengan sabar memberikan bimbingan, saran, dan nasehat yang sangat membantu bagi penulis. 3. Ibu Dra. NLP Suciptawati, M.Si sebagai pembimbing II yang juga dengan sabar memberikan bimbingan, saran, dan nasehat yang membantu bagi penulis. 4. Bapak Ir. I Komang Gde Sukarsa, M.Si sebagai penguji yang telah banyak memberikan saran dan masukan kepada penulis. 5. Ibu Made Susilawati, S.Si, M.Si dan Ibu Ni Made Asih, S.Pd, M.Si sebagai penguji yang telah banyak memberikan saran dan masukan kepada penulis. viii
6. Kedua orang tua dan adik yang telah memberikan motivasi, semangat, dan doa dalam menyelesaian Tugas Akhir ini. 7. Para Sahabat dan teman-teman di Jurusan Matematika, khususnya angkatan 2008, terima kasih atas bantuan, semangat, dan dukungannya. 8. Semua pihak yang turut membantu penyelesaian Proposal Tugas Akhir ini, yang tidak dapat penulis sebutkan satu persatu. Penulis menyadari bahwa Tugas Akhir ini masih terdapat banyak kesalahan dan kekurangan yang disebabkan karena keterbatasan kemampuan dan pengalaman penulis. Oleh karena itu, diharapkan masukan dan saran yang mendukung penyempurnaan Tugas Akhir ini. Semoga Tugas Akhir ini dapat bermanfaat bagi pembaca. Denpasar, Juli 2012 Penulis ix
DAFTAR ISI Halaman LEMBAR JUDUL... LEMBAR PERSEMBAHAN... i ii LEMBAR PERNYATAAN... iii LEMBAR PENGESAHAN... ABSTRAK...... ABSTRACT...... iv v vi BIODATA ALUMNI...... vii KATA PENGANTAR... viii DAFTAR ISI... DAFTAR GAMBAR... x xi DAFTAR TABEL... xii DAFTAR LAMPIRAN... ix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 4 1.3 Batasan Masalah... 4 1.4 Tujuan Penelitian... 4 1.5 Manfaat Penelitian... 4 BAB II TINJAUAN PUSTAKA... 5 2.1 Regresi Parametrik... 5 2.2 Regresi Nonparametrik... 5 x
2.3 Regresi Semiparametrik... 6 2.4 Penduga Densitas Kernel... 7 2.5 Regresi Nonparametrik Kernel... 10 2.6 Pemilihan Bandwidth Optimal... 13 2.7 Pertumbuhan Balita... 15 BAB III METODE PENELITIAN... 17 3.1 Tempat dan Waktu Penelitian... 17 3.2 Sumber Data... 17 3.3 Identifikasi Variabel... 17 3.4 Metode Analisis Data... 18 BAB IV HASIL DAN PEMBAHASAN... 21 4.1 Deskripsi Data... 21 4.2 Menentukan Komponen Parametrik dan Komponen Nonparametrik... 22 4.3 Menentukan Bandwidth h Optimal... 24 4.4 Pendugaan y i pada Regresi Semiparametrik... 28 BAB V SIMPULAN DAN SARAN... 32 5.1 SIMPULAN... 32 5.2 SARAN... 32 DAFTAR PUSTAKA... 33 LAMPIRAN... 34 xi
DAFTAR GAMBAR Gambar Halaman 2.1 Bentuk Kurva dari Masing-Masing Fungsi Kernel pada selang [-1,1] 9 2.2 Kurva regresi dengan menggunakan bandwidth (h) yang terlalu kecil. 13 2.3 Kurva regresi dengan menggunakan bandwidth (h) yang terlalu besar. 14 2.4 Kurva regresi dengan menggunakan bandwidth (h) yang optimal 14 4.1 Scatterplot Umur (bulan) dengan Berat Timbang (kg) 23 4.2 Scatterplot antara Berat Lahir (kg) dengan Berat Timbang (kg) 23 4.4 Plot antara Bandwidth dengan GCV dengan kenaikan h=0.05.. 27 4.5 Plot antara Berat Lahir dengan Berat Timbang (Y) dan y.duga ( ) 30 xii
DAFTAR TABEL Tabel Halaman 4.1 Statistika Deskriptif Data Berat Badan Balita. 21 4.2 Korelasi antara Berat Lahir (V1) dengan Umur (V2) 22 4.3 Nilai Berat Timbang (Y) Observasi dengan Dugaan ( ) 29 4.4 Analisis Ragam 31 xiii
DAFTAR LAMPIRAN Lampiran 1 Data Berat Badan Balita yang Mengikuti Posyandu di Banjar Dinas Permata Anyar 2 Output Program Statistika Deskriptif Menggunakan Software S- Plus 2000 3 Matriks Korelasi dan Hasil Analisis Regresi Linier Berganda antara Berat Timbang(Y), Umur (X) dan Berat Lahir (t) dengan bantuan MINITAB 15 4 Program Untuk Menentukan Nilai Bandwidth Optimal dengan Kernel Triangle dengan bantuan Software R.12.0 5 Output Nilai Bandwidth (h) dan GCV dengan Kernel Triangle pada selang kenaikan h=0.05 6 Output Nilai Bandwidth (h) dan GCV dengan Kernel Triangle pada selang kenaikan h=0.005. 7 Output Nilai Bandwidth (h) dan GCV dengan Kernel Triangle pada selang kenaikan h=0.001. 8 Program Untuk Menentukan Pendugaan dengan Kernel Triangle dengan bantuan Software R.12.0 9 Output Pendugaan dengan Kernel Triangle dengan Bandwidth (h)=0.005 xiv
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis regresi digunakan untuk melihat pengaruh variabel bebas (prediktor) terhadap variabel terikat (respon) dengan terlebih dahulu melihat pola hubungan variabel tersebut. Pada umumnya, hal ini dapat dilakukan melalui dua pendekatan yaitu pendekatan parametrik dan pendekatan nonparametrik. Pendekatan yang paling umum digunakan adalah pendekatan parametrik. Pendekatan parametrik dapat digunakan apabila bentuk hubungan antara variabel prediktor dan responnya diketahui dari bentuk kurva regresinya. Asumsi-asumsi pada regresi parametrik juga harus semuanya terpenuhi, misalnya sebaran galat menyebar normal dan memiliki variansi yang konstan. Apabila asumsi pada regresi parametrik tidak terpenuhi dan tidak ada informasi apapun tentang bentuk dari fungsi regresi, maka pendekatan yang digunakan adalah pendekatan nonparametrik. Pendekatan nonparametrik merupakan metode pendugaan model yang dilakukan berdasarkan pendekatan yang tidak terikat asumsi bentuk kurva tertentu (Hardle, 1994). Pendekatan nonparametrik tidak tergantung pada asumsi bentuk kurva tertentu, sehingga memberikan fleksibilitas yang lebih besar. Misalkan X adalah variabel prediktor dan Y adalah variabel respon untuk n pengamatan berpasangan x n i, y i i 1, maka hubungan linear antara variabel prediktor dan variabel respon tersebut dapat dinyatakan sebagai berikut: 1
2 y i = f(t i ) + ε i, i = 1,2,, n (1.1) dengan i adalah sisaan yang diasumsikan independen dengan rataan nol dan keragaman 2, serta f(t i ) adalah fungsi regresi atau kurva regresi (Eubank, 1988). Pada kasus khusus, pendugaan model regresi tidak tepat diselesaikan dengan menggunakan pendekatan parametrik saja, maupun pendekatan nonparametrik saja. Hal ini dapat diatasi dengan menggunakan regresi semiparametrik. Regresi semiparametrik merupakan gabungan antara regresi parametrik dan regresi nonparametrik. Regresi semiparametrik digunakan untuk menduga parameterparameter pada komponen parametrik dan menduga kurva regresi pada komponen nonparametrik. Variabel yang memiliki sebaran data yang dapat diketahui atau terdapat informasi mengenai sebaran data variabel tersebut, dapat diduga dengan regresi parametrik. Sedangkan pada variabel yang tidak diketahui sebaran datanya atau tidak ingin terikat dengan bentuk sebaran data dari variabel tersebut, diduga dengan menggunakan regresi nonparametrik. Model semiparametrik pertamakali diperkenalkan oleh Wahba; Engle, Granger, Rise, dan Weiss; Green, Jennison, Seheult; dan Heckman dalam Purnomo (2011). Model semiparametrik dirumuskan sebagai berikut: y i = X T i β + f(t i ) + ε i, i = 1,2,3,, n (1.2) y i adalah variabel respon ke-i, X i adalah komponen parametrik, f(t i ) adalah fungsi regresi yang tidak diketahui, dan ε i adalah galat acak (random error), dimana ε i ~N(0, σ 2 ).