ESTIMASI MODEL REGRESI SEMIPARAMETRIK BIRESPON PADA DATA LONGITUDINAL BERDASARKAN ESTIMATOR LOKAL LINIER SKRIPSI DIAJUKAN UNTUK MEMENUHI SEBAGIAN PERSYARATAN DALAM MEMPEROLEH GELAR SARJANA STATISTIKA DEPARTEMEN MATEMATIKA PROGRAM STUDI STATISTIKA Diajukan Oleh: ZAHROTUL AZIZAH NIM : 081211832003 PROGRAM STUDI S-1 STATISTIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA SURABAYA 2016
ESTIMASI MODEL REGRESI SEMIPARAMETRIK BIRESPON PADA DATA LONGITUDINAL BERDASARKAN ESTIMATOR LOKAL LINIER SKRIPSI ZAHROTUL AZIZAH PROGRAM STUDI S1 STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA 2016 i
ADLN PERPUSTAKAAN UNIVERSITAS AIRLANGGA ii SKRIPSI ESTIMASI MODEL REGRESI ZAHROTUL AZIZAH
ADLN PERPUSTAKAAN UNIVERSITAS AIRLANGGA iii SKRIPSI ESTIMASI MODEL REGRESI ZAHROTUL AZIZAH
PEDOMAN PENGGUNAAN SKRIPSI Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seizing penyusun dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik Universitas Airlangga. iv SKIPSI ESTIMASI MODEL REGRESI... ZAHROTUL AZIZAH
ADLN PERPUSTAKAAN UNIVERSITAS AIRLANGGA v SKRIPSI ESTIMASI MODEL REGRESI ZAHROTUL AZIZAH
KATA PENGANTAR Alhamdulillahirabbil alamin puji syukur kehadirat Allah SWT, yang telah melimpahkan rahmat dan hidayah-nya sehingga penulis dapat menyelesaikan skripsi yang berjudul Estimasi Model Regresi Semiparametrik Birespon pada Data Longitudinal berdasarkan Estimator Lokal Linier. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada: 1. Kedua Orang tua: Ibu Mufarokhah dan bapak Masyhudi, adik penulis: Ulyatur Rosyidah dan Alifatul Mujahadah, dan seluruh keluarga penulis yang senantiasa mendoakan dan memberi dukungan kepada penulis. 2. Dr. Nur Chamidah, M.Si selaku dosen pembimbing I dan Drs. Eko Tjahjono, M.Si selaku dosen pembimbing II dan Ketua Program Studi S-1 Statistika yang senantiasa memberikan pengarahan dan bimbingan kepada penulis. 3. Drs. Suliyanto, M.Si selaku dosen wali yang telah memberikan arahan kepada penulis selama proses perkuliahan. 4. Seluruh dosen Statistika dan teman-teman Statistika angkatan 2012 yang telah membantu dan memberi dukungan. 5. Teman-teman seperjuangan skripsi yaitu Ria, Hana, dan Bayyinah atas kebersamaan, motivasi dan saran dalam penyusunan skripsi. 6. Bagus Aji selaku sahabat dan kakak yang senantiasa memberi motivasi kepada penulis pada segala kondisi dan sahabat tercinta yaitu Lussi, Hana, Della, Bayyinah, dan Aulia yang telah menjadi keluarga baru penulis dan setia vi
menemani dalam susah maupun senang, serta berjuang bersama-sama untuk meraih impian. 7. Serta pihak-pihak yang telah berjasa dalam membantu penulis untuk menyelesaikan skripsi ini. Penulis menyadari bahwa di dalam skripsi ini masih terdapat banyak kekurangan, oleh karena itu penulis sangat mengharapkan adanya kritik dan saran dari semua pihak. Penulis berharap semoga skripsi ini dapat bermanfaat bagi perkembangan ilmu pengetahuan di masa yang akan datang. Surabaya, 28 Januari 2016 Zahrotul Azizah vii
Zahrotul Azizah, 2016. Estimasi Model Regresi Semiparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Lokal Linier. Skripsi dibawah bimbingan Dr. Nur Chamidah, M.Si. dan Drs. Eko Tjahjono, M.Si., Program Studi S-1 Statistika, Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya. ABSTRAK Metode statistika yang digunakan untuk mengetahui pola hubungan antara dua variabel respon dan variabel prediktor dengan melibatkan variabel komponen parametrik dan nonparametrik adalah regresi semiparametrik birespon. Estimasi model pada suatu data yang menarik dibahas pada analisis regresi semiparametrik adalah data longitudinal karena data tersebut dapat digunakan dalam pembentukan fungsi perkembangan dari suatu individu. Estimator yang digunakan pada skripsi ini yaitu estimator lokal linier yang mempunyai kelebihan yaitu memenuhi prinsip parsimoni model sehingga mempermudah dalam hal interpretasi. Data yang digunakan pada skripsi ini adalah data pertumbuhan balita di Surabaya dengan berat badan dan tinggi badan balita sebagai variabel respon, usia sebagai variabel prediktor komponen nonparametrik, dan jenis kelamin sebagai variabel prediktor komponen parametrik. Berdasarkan hasil estimasi berat badan dan tinggi badan balita diperoleh laju pertumbuhan balita paling cepat terjadi pada usia 0-7,2 bulan dan mengalami perlambatan pada bulan-bulan setelahnya, sedangkan perbandingan hasil estimasi rata-rata berat badan dan tinggi badan balita pada balita laki-laki dan perempuan menunjukkan bahwa secara rata-rata berat badan dan tinggi badan balita laki-laki lebih dari perempuan masing-masing sebesar 0,617 kg dan 1,43 cm dengan nilai MSE sebesar 6.0958, dan nilai R-square sebesar 99,2135%. Hasil perbandingan persentil ke-50 pada kurva standar pertumbuhan yang dikeluarkan oleh WHO dengan estimasi berat badan dan tinggi badan balita di Surabaya diketahui bahwa secara rata-rata berat badan dan tinggi badan balita pada kurva standar pertumbuhan WHO 2005 lebih tinggi jika dibandingkan dengan estimasi rata-rata berat badan dan tinggi badan balita di Surabaya. Kata Kunci : Regresi Semiparametrik Birespon, Longitudinal, Lokal Linier, Pertumbuhan Balita viii
Zahrotul Azizah, 2016. Biresponse Semiparametric Regression Model Estimation on Longitudinal Data Based on Local Linier Estimator. This skripsi is under supervised by Dr. Nur Chamidah, M.Si. and Drs. Eko Tjahjono, M.Si., S- 1 Statistics Courses, Mathematics Department, Faculty of Science and Technology, Universitas Airlangga, Surabaya. ABSTRACT Statistical methods that is used to determine the pattern of relationship between two response variables and predictor variables involving the variable component of Parametric and nonparametric is known as biresponse semiparametric regression. The estimation models at an interesting data discussed in semiparametric regression analysis is the longitudinal data because such data can be used in the formation of the individual development function. Estimator used in this paper that the local linear estimator which has the advantage that satisfy the principle of parsimony models, making it easier in terms of interpretation. The data used in this paper is growth data of infants in Surabaya with weight and height toddlers as response variables, age as a predictor variable nonparametric component, and gender as a predictor variable parametric component. Based on estimates of weight and height obtained toddler toddlers fastest growth rate occurs at the age of 0 to 7.2 months and a slowdown in the months thereafter, whereas the comparison of the average estimated weight and height toddler between men and women showed that the average weight and height of toddler in men more than women respectively 0.617 kg and 1.43 cm with MSE value of 6.0958, and the R- square value of 99.2135%. The comparison between 50 th persentil of infant standard growth chart of WHO and the estimation of Surabaya s infant average weight and height is known that averagely, weight and height in infant standard growth chart of WHO are higher than the estimation of Surabaya s infant average weight and height. Keyword : Biresponse Semiparametric Regression, Longitudinal Data, Local Linear Estimator, Infant Growth ix
DAFTAR ISI HALAMAN JUDUL... i LEMBAR PERNYATAAN... ii LEMBAR PENGESAHAN... iii LEMBAR PEDOMAN PENGGUNAAN SKRIPSI... iv SURAT ORISINALITAS SKRIPSI... v KATA PENGANTAR... vi ABSTRAK... viii ABSTRACT... ix DAFTAR ISI... x DAFTAR TABEL... xiii DAFTAR GAMBAR... xiv DAFTAR LAMPIRAN... xv BAB 1 PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 5 1.3 Tujuan... 5 1.4 Manfaat... 6 1.5 Batasan Masalah... 6 BAB 2 TINJAUAN PUSTAKA... 7 2.1 Matriks... 7 2.2 Data Longitudinal... 11 x
2.3 Regresi Semiparametrik... 12 2.4 Regresi Birespon... 12 2.5 Fungsi Kernel... 13 2.6 Pemilihan Bandwitdh Optimal... 14 2.7 Estimator Lokal Linier untuk Satu Variabel Respon... 15 2.8 Model Semiparametrik untuk Data Longitudinal Berdasarkan Estimator Lokal Linier... 17 2.9 Heteroskedastisitas dan Homoskedastisitas... 18 2.10 Uji Korelasi Pearson... 20 2.11 Weighted Least Square... 20 2.12 Software R... 22 2.13 Pertumbuhan Balita... 25 BAB 3 METODOLOGI PENELITIAN... 27 3.1 Estimasi Model Regresi Nonparametrik Birespon Longitudinal Berdasarkan Estimator Lokal Linier... 27 3.2 Penerapan Program untuk Estimasi Model Regresi Semiparametrik Birespon pada Data Longitudinal Pertumbuhan Balita di Surabaya 2015 Berdasarkan Estimator Lokal Linier... 29 BAB 4 PEMBAHASAN... 32 4.1 Estimasi Model Regresi Semiparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Lokal Linier... 32 xi
4.2 Model Regresi Semiparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Lokal Linier pada Data Pertumbuhan Balita Surabaya... 40 BAB 5 KESIMPULAN DAN SARAN... 55 DAFTAR PUSTAKA... 58 LAMPIRAN xii
DAFTAR TABEL Nomor Judul Tabel Halaman 3.1 Variabel-variabel Penelitian 30 4.1 Penentuan Bandwidth Optimal berdasarkan 46 Kriteria GCV Minimum xiii
DAFTAR GAMBAR Nomor Judul Gambar Halaman 4.1 Plot Bandwidth terhadap GCV 46 4.2 Kurva Estimasi Rata-rata Pertumbuhan Berat Badan 47 Balita Laki-laki 4.3 Kurva Estimasi Rata-rata Pertumbuhan Berat Badan 47 Balita Perempuan 4.4 Kurva Perbandingan Estimasi Rata-rata Pertumbuhan 48 Berat Badan Balita Laki-laki dan Perempuan 4.5 Kurva Estimasi Rata-rata Pertumbuhan Tinggi Badan 49 Balita Laki-laki 4.6 Kurva Estimasi Rata-rata Pertumbuhan Tinggi Badan 49 Balita Perempuan 4.7 Kurva Perbandingan Estimasi Rata-rata Pertumbuhan 50 Tinggi Badan Balita Laki-laki dan Perempuan 4.8 Perbandingan Rata-rata Estimasi Berat Badan Balita Perempuan 52 di Surabaya dengan Standar WHO 2005 4.9 Perbandingan Rata-rata Estimasi Berat Badan Balita Laki-Laki 52 di Surabaya dengan Standar WHO 2005 4.10 Perbandingan Rata-rata Estimasi Tinggi Badan Balita Laki-laki 53 di Surabaya dengan Standar WHO 2005 4.11 Perbandingan Rata-rata Estimasi Tinggi Badan Balita Perempuan 53 di Surabaya dengan Standar WHO 2005 xiv
DAFTAR LAMPIRAN Lampiran 1. Data pertumbuhan berat badan dan tinggi badan balita berdasarkan jenis kelamin dan usia balita di Surabaya tahun 2015 yang telah memenuhi screening WHO Lampiran 2. Program Uji Korelasi Pearson dan Mencari Bandwidth Optimal Tanpa Pembobot V -1 Lampiran 3. Program Pengestimasian Error, Uji Heteroskedastisitas Box M, dan Menentukan Matriks Pembobot V -1 Lampiran 4. Program Mencari Bandwidth Optimal dan Estimasi Model Regresi Semiparametrik Birespon pada Data Longitudinal berdasarkan Pendekatan Estimator Lokal Linier dengan Menggunakan Pembobot V -1 Lampiran 5. Output Program Uji Korelasi Pearson dan Mencari Bandwidth Optimal Tanpa Pembobot V -1 berdasarkan Estimator Lokal Linier Lampiran 6. Output program Uji Heteroskedastisitas Box M dan Menentukan Matriks Pembobot V -1 Lampiran 7. Output Bandwidth Optimal dan Estimasi Model Regresi Semiparametrik Birespon pada Data Longitudinal berdasarkan Pendekatan Estimator Lokal Linier dengan Menggunakan Pembobot V -1 Lampiran 8. Estimasi Model Estimasi Berat Badan dan Tinggi Badan Balita di Surabaya berdasarkan Estimator Lokal Linier xv
Lampiran 9. Hasil Estimasi Tinggi Badan dan Berat Badan Balita di Surabaya pada Masing-masing Usia Lampiran 10. Form Screening Balita berdasarkan Kriteria Balita Sehat WHO xvi