GENERALIZED EXPLORATORY FACTOR ANALYSIS DAN ESTIMATOR KERNEL MULTIPREDIKTOR DALAM PEMODELAN KALIBRASI SENYAWA AKTIF KURKUMIN Diajukan Untuk Memenuhi Sebagian Persyaratan dalam Memperoleh Gelar Sarjana Sains Bidang Statistika Departemen Matematika Program Studi Statistika TIARA ANNISA TORADA PROGRAM STUDI S1-STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA SURABAYA 2016
GENERALIZED EXPLORATORY FACTOR ANALYSIS DAN ESTIMATOR KERNEL MULTIPREDIKTOR DALAM PEMODELAN KALIBRASI SENYAWA AKTIF KURKUMIN TIARA ANNISA TORADA PROGRAM STUDI S1-STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA SURABAYA 2016 i
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA GENERALIZED EXPLORATORY FACTOR... TIARA ANNISA
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA GENERALIZED EXPLORATORY FACTOR... TIARA ANNISA
PEDOMAN PENGGUNAAN Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seijin penulis dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik Universitas Airlangga. iv
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA SURAT PERNY ATAAN TENT ANG ORISINALITAS Yang bertanda tangan di bawah ini, saya: Nama NIM Program Studi Fakultas Jenjang Tiara Annisa Torada 081211833015 Statistika Sains dan Teknologi Sarjana (Sl) Menyatakan bahwa saya tidak melakukan kegiatan plagiat dalam penulisan skripsi saya yang berjudul: Generalized Exploratory Factor Analysis dan Estimator Kernel Multiprediktor dalam Pemodelan Kalibrasi Senyawa Aktif Kurkumin Apabila suatu saat nanti terbukti melakukan tidakan plagiat, maka saya akan menerima sanksi yang telah ditetapkan. Demikian surat pemyataan ini saya buat dengan sebenar-benamya. Surabaya, 29 Januari 2016 Tiara Annisa Torada NIM. 081211833015 V GENERALIZED EXPLORATORY FACTOR... TIARA ANNISA
KATA PENGANTAR Puji syukur ke hadirat Allah SWT, karena rahmat dan karunia-nya peneliti dapat menyelesaikan skripsi yang berjudul Generalized Exploratory Factor Analysis dan Estimator Kernel Multiprediktor dalam Pemodelan Kalibrasi Senyawa Aktif Kurkumin. Peneliti menyadari, dalam penyusunan skripsi ini tidak akan berjalan lancar tanpa adanya dukungan dari pihak lain. Oleh karena itu peneliti ingin menyampaikan ucapan terima kasih kepada: 1. Allah SWT yang telah memberikan kemudahan, rahmat dan hidayah-nya dan keridhaan-nya kepada peneliti. 2. Kedua orang tua peneliti, Eny Priyani, dan Mokh.Nuzuluddin Torada yang selalu memberikan doa, nasehat, serta dukungan yang tiada henti-hentinya baik secara materiil maupun moril kepada peneliti. 3. Adik-adik peneliti, Fadhliyah, Rafif, dan Fathiya yang selalu menghibur peneliti. 4. Dr. Nur Chamidah, M.Si selaku dosen wali pengganti sekaligus dosen pembimbing I yang selalu memberikan saran, semangat, pengetahuan, dan kesabaran yang tak ternilai harganya. 5. Ir. Elly Ana, M.Si selaku pembimbing II yang selalu meluangkan waktu memberikan bimbingan dan solusi yang bermanfaat bagi skripsi ini. 6. Toha Saifudin, S.Si, M.Si selaku dosen wali atas bimbingan dan saran untuk mengambil langkah di setiap semester. 7. Drs. H. Sediono, M.Si dan Drs. Eko Tjahjono, M.Si selaku dosen penguji I dan penguji II atas saran dan penilaian agar skripsi ini menjadi lebih baik. vi
8. Lauda Mutia selaku rekan dalam penulisan skripsi ini atas seluruh kesabaran, kebaikan, dan pengetahuan yang diberikan kepada peneliti. 9. Sahabat-sahabat peneliti, Aufa Akmal Raditya, Noviyanti Haswien P, Masitha Rahma A, Rosita Rahayu P, Maya Andika S, dan Maharani Irma S, terima kasih atas kesabaran dan semangat yang selalu diberikan. 10. Sahabat-sahabat Statistika 2012 dan Keluarga Besar Statistika Universitas Airlangga atas kebersamaan dan kekeluargaan selama ini. 11. Semua pihak yang tidak dapat disebutkan satu-persatu yang turut serta memberi doa, masukkan, dan semangat dalam penyusunan skripsi ini. Peneliti menyadari bahwa dalam penulisan skripsi ini masih banyak memiliki kekurangan, oleh karena itu peneliti sangat mengharapkan adanya kritik dan saran untuk perkembangan yang lebih baik. Peneliti berharap skripsi ini dapat memberikan kontribusi bagi pengembangan ilmu Statistika. Surabaya, 15 Januari 2016 Peneliti vii
Tiara Annisa Torada, 2016. Generalized Exploratory Factor Analysis dan Estimator Kernel Multiprediktor dalam Pemodelan Kalibrasi Senyawa Aktif Kurkumin. Skripsi ini dibawah bimbingan Dr. Nur Chamidah, M.Si dan Ir. Elly Ana, M.Si, Prodi S1-Statistika, Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya. ABSTRAK Tujuan dari skripsi ini adalah untuk mereduksi dimensi data dengan Generalized Exploratory Factor Analysis (GEFA) dan membuat model dengan regresi nonparametrik multiprediktor. GEFA merupakan pengembangan metode analisis faktor untuk mengatasi kekurangan dalam analisis faktor yang bermasalah dengan jumlah pengamatan relatif kecil dibandingkan jumlah variabel prediktor. Estimator yang digunakan adalah estimator kernel multiprediktor untuk mengestimasi hubungan antara variabel respon dengan lebih dari satu variabel prediktor. Kemudian diterapkan untuk mengestimai model kalibrasi senyawa aktif kurkumin. Proses penentuan Bandwidth optimal digunakan metode Generalized Cross Validation (GCV). Dari hasil penerapan GEFA dan model regresi nonparametrik dengan estimator kernel multiprediktor pada pemodelan kalibrasi senyawa aktif kurkumin diperoleh Mean Square Error (MSE) sebesar 0,0004920308 dan R-Square (R 2 ) vsebesar 0,9978864 atau 99,78%. Nilai MSE untuk validasi dengan menggunakan 4 data diluar titik pengamatan (outsample) sebesar 0,03933064 dan R 2 sebesar 0,8310522 atau 83,10 %.. Kata Kunci: Generalized Exploratory Factor Analysis, Regresi Nonparametrik, Estimator Kernel Multiprediktor, Pemodelan Kalibrasi ix
Tiara Annisa Torada, 2016. Generalized Exploratory Factor Analysis and Multipredictor Kernel Estimator in Calibration Modeling of Active Compound Curcumin. This Undergraduate Thesis is under guidance of Dr. Nur Chamidah, M.Si and Ir. Elly Ana, M.Si, S-1 Statistics Study Program, Matematics Departement, Faculty of Sciences and Teknology, Airlangga University, Surabaya. ABSTRACT The purposes of this research are to reduce the dimension of data with by using Generalized Exploratory Factor Analysis (GEFA) as the dimension reducer and nonparametric regression multipredictor to obtain the final model. GEFA is a development of factor analysis method to overcome the condition if the number of observations are relatively small compared to the number of predictor variables. This research uses multipredictor kernel estimator to estimate the relationship between the response variable with more than one predictor variable. These methods mentioned before will be applied to estimate the model calibration active compound curcumin. The process of determining the optimum bandwidth uses Generalized Cross Validation (GCV). The result of applying these two methods shows that the Mean Square Error (MSE) in the calibration modeling of active compound curcumin with multipredictor kernel estimator is 0,0004920308 and the R-Square (R 2 ) is 0,9978864, or 99,78 %. MSE from validation using four out sample data is 0,03933064 and the R 2 is 0,8310522 or 83,10 %. Keyword: Generalized Exploratory Factor Analysis, Nonparametric Regression, Multipredictor Kernel Estimator, Calibration Modeling viii
DAFTAR ISI HALAMAN JUDUL... i LEMBAR PERNYATAAN... ii LEMBAR PENGESAHAN... iii LEMBAR PEDOMAN PENGGUNAAN... iv LEMBAR ORISINALITAS... v KATA PENGANTAR... vi ABSTRACT... viii ABSTRAK... ix DAFTAR ISI... x DAFTAR TABEL... xiii DAFTAR GAMBAR... xiv DAFTAR LAMPIRAN... xv BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 3 1.3 Tujuan Penelitian... 4 1.4 Manfaat Penelitian... 4 1.5 Batasan Masalah... 5 BAB II TINJAUAN PUSTAKA... 6 2.1 Matriks... 6 2.2 Singular Value Decomposition (SVD)... 7 x
2.3 Generalized Exploratory Factor Analysis (GEFA)... 8 2.4 Regresi Nonparametrik... 10 2.5 Fungsi Kernel... 10 2.6 Fungsi Kepadatan Kernel Multiprediktor... 12 2.7 Pemilihan Bandwidth Optimal... 12 2.8 Kriteria Goodness-Of-Fit... 13 2.9 Model Kalibrasi Peubah Ganda... 14 2.10 Open Source Software-R... 15 BAB III METODOLOGI PENELITIAN... 19 3.1 Mereduksi Dimensi Menggunakan Generalized Exploratory Factor Analysis... 19 3.2 Mengestimasi Model Regresi Nonparametrik Berdasarkan Estimator Kernel Multiprediktor... 20 3.3 Algoritma dan Program Untuk GEFA Serta Estimator Kernel Multiprediktor... 21 3.4 Mengimplementasikan Program GEFA dan Estimator Kernel Multiprediktor Pada Data Persentransimitan Senyawa Aktif Kurkumin.. 23 BAB IV HASIL DAN PEMBAHASAN... 25 4.1 Mereduksi Dimensi Data dengan GEFA... 25 4.2 Estimasi Model Regresi Nonparametrik Berdasarkan Estimator Kernel Multiprediktor... 28 xi
4.2.1 Pemilihan Bandwidth Optimal Untuk Masing-masing Prediktor... 31 4.3 Membuat Algoritma dan Program untuk GEFA serta Estimator Kernel Multiprediktor dalam OSS-R... 32 4.3.1 Algortima dan Program untuk GEFA... 32 4.3.2 Algortima dan Program untuk untuk Menentukkan Bandwidth Optimal... 33 4.3.3 Algortima dan Program untuk Prosedur Kernel Multiprediktor... 34 4.4 Mengimplementasikan Program GEFA dan Estimator Kernel Multiprediktor Pada Data Persentransmitan Senyawa Aktif Kurkumin... 35 4.4.1 Penerapan GEFA untuk Mereduksi Dimensi Data Senyawa Aktif Kurkumin... 38 4.4.2 Penerapan Estimator Kernel Multiprediktor untuk Mengestimasi Model Kalibrasi Senyawa Aktif Kurkumin...39 4.4.3 Kriteria Goodness Of Fit.... 42 BAB V PENUTUP... 44 5.1 Kesimpulan... 44 5.2 Saran... 46 DAFTAR PUSTAKA... 47 LAMPIRAN xii
DAFTAR TABEL Tabel 4.1 Konsentrasi HPLC dalam 17 sentra tanaman obat... 37 Tabel 4.2 Iterasi nilai f lama dan f... 39 Tabel 4.3 Bandwidth Optimal... 40 xiii
DAFTAR GAMBAR Gambar 3.1 Flowchart GEFA... 22 Gambar 3.2 Flowchart Prosedur Kernel Multiprediktor... 23 Gambar 4.1 Plot spectra pengukuran kurkumin dengan FTIR pada 1866 panjang gelombang... 36 Gambar 4.2 Plot antara y dan y... 41 Gambar 4.3 Plot antara y dan y (outsample)... 43 xiv
DAFTAR LAMPIRAN Lampiran Judul Lampiran 1 Program Reduksi Dimensi Data dengan Metode GEFA Pada OSS-R 2 Program Menentukan Bandwidth Optimal Berdasarkan Estimator Kernel Pada OSS-R 3 Program Estimator Kernel Multiprediktor 4 Program Estimator Kernel Multiprediktor untuk outsample 5 Data Hasil Reduksi dengan Metode GEFA 6 Output Bandwidth Optimal di Masing-masing Prediktor 7 Nilai Estimasi Model Kalibrasi Senyawa Aktif Kurkumin 8 Nilai Estimasi Model Kalibrasi Senyawa Aktif Kurkumin (outsample) xv