REGRESI PROSES GAUSSIAN UNTUK PEMODELAN KALIBRASI MOCH. ABDUL MUKID SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASINYA Dengan ini saya menyatakan bahwa tesis dengan judul Regresi Proses Gaussian untuk Pemodelan Kalibrasi adalah karya saya sendiri dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam daftar pustaka dibagian akhir tesis ini. Bogor, Agustus 2009 Moch. Abdul Mukid NIM G151070011
ABSTRACT MOCH. ABDUL MUKID. Gaussian Process Regression for Calibration Modeling. Under the Supervision of AJI HAMIM WIGENA and ERFIANI. Multivariate calibration models have been developed usually by using principal component regression and partial least squares regression. This research proposes the application of Gaussian process regression as an alternative method to develop a calibration model. Gaussian process regression is one of the nonparametric regression methods that do not determine the mathematical relationship between exploratory and response variables. This method is applied to the measurement of curcumin concentration based on FTIR spectra. To handle the high dimensionality of spectra data, principal component analysis was initially performed, followed by applying the Gaussian process regression. Using three principal components, 99,03% of the original data s variability can be explained. Based on the leverage value, few spectra were detected as outliers and will not be used for the final calculation. This model was attempted for various covariance functions. The results indicate that the most relevant and suitable covariance function for curcumin concentration measurement was Square Exponential isotropic (SE iso). The hyperparameter values for SE iso were estimated by Maximum Marginal Likelihood Method. Based on R and RMSE criteria, the performance of Gaussian process regression is better than that of principal component regression. Keywords: Spectroscopic Calibration, Gaussian Process Regression, Covariance Function, Hyperparameter, Maximum Marginal Likelihood 2 YvsŶ
RINGKASAN MOCH. ABDUL MUKID. Regresi Proses Gaussian untuk Pemodelan Kalibrasi. Dibawah bimbingan AJI HAMIM WIGENA dan ERFIANI. Di Indonesia tanaman obat telah lama digunakan oleh masyarakat dan industri dalam pembuatan jamu. Penggunaan tanaman obat yang semakin meluas sudah selayaknya diikuti dengan usaha untuk menjamin kualitas tanaman obat tersebut. Hal ini untuk menjamin agar produksinya dapat bersaing dan diterima oleh masyarakat. Salah satu indikator kualitas tanaman obat adalah konsentrasi senyawa aktifnya. Proses penentuan konsentrasi senyawa aktif yang dikandung oleh suatu tanaman obat perlu dilakukan secara cepat dan akurat. Salah satu metodenya adalah dengan membuat model kalibrasi yang diperoleh dari contoh tanaman obat. Pada pemodelan kalibrasi spektroskopi kendala yang sering dihadapi adalah banyaknya peubah penjelas yang jauh lebih besar dari pada banyaknya pengamatan. Hal ini cenderung akan menyebabkan adanya multikolinearitas antar peubah penjelas yang pada akhirnya menyebabkan penduga parameter yang tidak stabil dan mengurangi ketepatan prediksi model. Untuk mengatasi hal tersebut, biasanya model-model kalibrasi peubah ganda dikembangkan dengan menggunakan regresi komponen utama maupun regresi kuadrat terkecil parsial (Erfiani, 2005). Dalam penelitian ini diusulkan penerapan regresi proses Gaussian sebagai sebuah metode alternatif untuk mengembangkan sebuah model kalibrasi. Metode ini diterapkan pada pengukuran konsentrasi kurkumin berdasarkan atas data spektra yang diukur dengan menggunakan FTIR. Untuk mengatasi besarnya dimensi dari data spectra, prapemrosesan dilakukan dengan menggunakan Analisis Komponen Utama (AKU). Dengan menggunakan tiga komponen utama yang pertama diketahui bahwa 99,03% keragaman data asal dapat dijelaskan. Berdasarkan nilai leverage, beberapa pengamatan terdeteksi sebagai pencilan dan dikeluarkan dalam perhitungan selanjutnya. Model ini telah dicobakan pada berbagai jenis fungsi peragam dan hasilnya mengindikasikan bahwa fungsi peragam yang cocok dan relevan untuk memodelkan pengukuran konsentrasi kurkumin adalah Kuadrat Eksponensial isotropik (KE-iso). Selanjutnya nilainilai hiperparamater dari fungsi peragam KE-iso diduga dengan menggunakan metode kemungkinan marginal maksimum. Berdasarkan atas kriteria nilai-nilai 2 R dan RMSE, kinerja regresi proses Gaussian jauh lebih baik jika YvsŶ dibandingkan dengan regresi komponen utama. Pada regresi proses Gaussian nilai 2 R mencapai 88,77% dan nilai RMSE sebesar 0,1753 sedangkan pada regresi YvsŶ 2 komponen utama nilai R hanya mencapai 40,18% dan nilai RMSE sebesar YvsYˆ 0,3901.
Hak Cipta milik IPB, tahun 2009 Hak Cipta dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan yang wajar IPB. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apa pun tanpa izin IPB.
REGRESI PROSES GAUSSIAN UNTUK PEMODELAN KALIBRASI MOCH. ABDUL MUKID Tesis Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. I Gusti Putu Purnaba, DEA
Judul Tesis Nama NIM : Regresi Proses Gaussian untuk Pemodelan Kalibrasi : Moch. Abdul Mukid : G151070011 Disetujui Komisi Pembimbing Dr. Ir. Aji Hamim Wigena, M.Sc. Ketua Dr. Ir Erfiani, M.Si. Anggota Diketahui Ketua Program Studi Statistika Dekan Sekolah Pascasarjana Dr. Ir. Aji Hamim Wigena, M.Sc. Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S. Tanggal Ujian : 5 Agustus 2009 Tanggal Lulus:
PRAKATA Alhamdulillah, puji syukur penulis panjatkan kepada Allah SWT atas berkat, rahmat dan karunia-nya sehingga penulis dapat menyelesaikan penelitian dan penulisan tesis ini. Tesis ini berjudul Regresi Proses Gaussian Untuk Pemodelan Kalibrasi disusun berdasarkan penelitian yang dilakukan di Departemen Statistika FMIPA- IPB. Penelitian yang dilakukan penulis merupakan bagian dari payung penelitian Hibah Pascasarjana Pengembangan Model Kalibrasi Multirespon dan Teknik Adulterasi Obat Bahan Alam 2008-2010 yang merupakan kerjasama antara Departemen Statistika dan Biofarmaka, Institut Pertanian Bogor yang didanai oleh Dirjen Pendidikan Tinggi, Departemen Pendidikan Nasional. Terima kasih yang sedalam-dalamnya penulis sampaikan kepada Bapak Dr. Ir. Aji Hamim Wigena, M.Sc selaku ketua Program Studi Statistika Sekolah Pascasarjana IPB yang sekaligus sebagai ketua komisi pembimbing dalam penyusunan tesis ini. Rasa terima kasih juga penulis sampaikan kepada Dr. Ir. Erfiani, M.Si selaku anggota dalam komisi pembimbing yang senantiasa memberikan masukan dan arahan dalam penelitian ini. Penulis juga mengucapkan terima kasih yang sebesar-besarnya kepada Prof. Dr. Khairil Anwar Notodiputro, M.S selaku ketua tim peneliti Hibah Pascasarjana tahun 2003-2005 dengan topik Pengembangan Model untuk Pendugaan Kandungan Senyawa Bioaktif atau Senyawa Penciri Beberapa Tanaman Obat, atas izin yang telah diberikan kepada penulis untuk menggunakan sebagian data hasil penelitiannya. Tidak lupa pula ungkapan terima kasih penulis sampaikan kepada seluruh teman-teman STK 2007 atas diskusi dan dukungan morilnya selama menyelesaikan penulisan tesis ini. Penulis menyadari bahwa masih banyak kekurangan dalam penyusunan tesis ini, oleh karena itu kritik, saran dan masukan sangat penulis harapkan demi penyempurnaan dan perbaikan tulisan ini. Semoga karya ilmiah ini bermanfaat untuk semua pembaca. Amin. Bogor, Agustus 2009 Penulis
RIWAYAT HIDUP Penulis dilahirkan di Grobogan, Jawa Tengah pada tanggal 17 Agustus 1978. Tahun 1996 penulis masuk program sarjana di Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Diponegoro melalui jalur UMPTN dan lulus pada tahun 2001. Pada tahun 2007 penulis mendapat kesempatan untuk mengikuti program magister pada program studi statistika, Sekolah Pascasarjana, Institut Pertanian Bogor. Beasiswa pendidikan pascasarjana penulis peroleh dari Direktorat Jenderal Pendidikan Tinggi Departemen Pendidikan Nasional.