PENERAPAN METODE TRANSFORMASI WAVELET KONTINU DAN PARTIAL LEAST SQUARES PADA DATA GINGEROL Margaretha Ohyver Jurusan Matematika dan Statistika, Fakultas Sains dan Teknologi, Universitas Bina Nusantara Jln. K. H. Syahdan No. 9, Palmerah, Jakarta Barat 11480 mohyver@binus.edu ABSTRACT The purpose of multivariate calibration model is estimation of more expensive measurements using cheaper and easier to acquire measurements. There are some problems in multivariate modelling, such as multicollinearity, (n < p), and noise. Continuous wavelet transform (CWT) and partial least squares (PLS) are combined to handle these problems. This study aims to implement CWT and PLS on gingerol data. Based on R 2 and RMSE for gingerol data, it is obtained that the CWT-PLS method is better than PLS method in developing calibration models. Keywords: multivariate calibration model, partial least squares, continuous wavelet transformation ABSTRAK Model kalibrasi peubah ganda bertujuan untuk menduga ukuran-ukuran yang mahal diperoleh dengan menggunakan ukuran-ukuran yang murah dan mudah. Ada beberapa masalah yang sering terjadi pada pemodelan kalibrasi, diantaranya multikolinier,, dan adanya noise. Untuk mengatasi permasalahan tersebut digunakan metode transformasi wavelet kontinu (TWK) yang digabungkan dengan partial least squares (PLS). Penelitian dilakukan dengan tujuan menerapkan metode TWK dan PLS pada data gingerol. Berdasarkan nilai dan untuk data gingerol, maka diperoleh bahwa metode TWK dan PLS adalah metode yang baik dalam pembentukan model kalibrasi. Kata kunci: kalibrasi peubah ganda, partial least square, transformasi wavelet kontinu Penerapan Metode... (Margaretha Ohyver) 27
PENDAHULUAN Penelitian dan ilmu pengetahuan bagaikan dua sisi mata uang. Keduanya tidak dapat dipisahkan satu sama lainnya. Penelitian digunakan untuk kebutuhan ilmu pengetahuan dan sebaliknya ilmu pengetahuan tidak akan berkembang apabila tidak dilakukan penelitian. Salah satu contohnya adalah penelitian mengenai kandungan (konsentrasi) senyawa aktif suatu tanaman. Khasiat dan kualitas tanaman obat tidak terlepas dari senyawa aktif yang dikandungnya. Alat ukur yang dapat digunakan untuk menentukan kadar senyawa aktif dari tanaman adalah high performance liquid chromatography (HPLC) dan fourier transform infrared (FTIR). Proses pengukuran dengan menggunakan FTIR merupakan proses yang sederhana dan biaya yang dibutuhkan lebih murah. Sedangkan proses pengukuran dengan menggunakan HPLC akan memerlukan tahapan yang panjang dan rumit, serta tenaga dan biaya yang besar. Karena proses pengukuran dengan HPLC tidak efisien dalam hal tenaga, waktu, dan biaya, maka digunakanlah model kalibrasi peubah ganda. Model ini bertujuan untuk menduga ukuran-ukuran yang mahal diperoleh dengan menggunakan ukuran-ukuran yang murah dan mudah diperoleh secara tepat dan akurat (Arnita, 2005). Data yang diperoleh dari FTIR merupakan data kontinu terhadap wavenumber (bilangan gelombang). Nilai pengukuran pada suatu gelombang dipengaruhi oleh nilai-nilai pada bilangan gelombang sebelumnya. Karena adanya hal ini, maka masalah multikolinier menjadi salah satu kendala dalam pemodelan kalibrasi. Selain itu, permasalahan dimana banyaknya pengamatan lebih kecil daripada banyaknya peubah juga merupakan kendala lain yang harus diatasi (Arnita, 2005). Untuk mengatasi permasalahan di atas, dapat digunakan metode partial least squares (PLS). Metode PLS sangat baik digunakan jika peubah bebasnya banyak dan saling berkorelasi. Untuk membentuk hubungan antara peubah respon dan peubah bebas, PLS membentuk peubah baru yang disebut faktor, peubah laten, atau komponen (Garthwaite, 1994). Pembentukan model kalibrasi dengan menggunakan metode PLS telah banyak dilakukan. Diantaranya aplikasi PLS dalam penentuan Chlorogenic Acid pada sampel tanaman (Shao dan Zhuang, 2004), dan aplikasi PLS yang didasarkan pada resolusi spektra near infrared (NIR) yang berbeda (Chung, Choi, Choo, dan Lee, 2004). Pada pembentukan model kalibrasi, perlu dilakukan langkah pra-pemrosesan data. Hal ini disebabkan seringnya data dipengaruhi oleh adanya noise. Menurut Shao dan Zhuang, adanya noise ini dapat mempengaruhi hasil akhir kalibrasi. Salah satu metode pra-pemrosesan data yang dapat digunakan adalah transformasi wavelet. Metode transformasi wavelet mempunyai peranan penting dalam kimia analitik. Hal ini terlihat pada keberhasilan transformasi wavelet kontinu (TWK) yang digabungkan dengan teknik chemometric dalam mengatasi noise dari data spektra. Selain dengan teknik chemometric, TWK juga dapat digabungkan dengan metode PLS dan principal component regression (PCR). Dimana hasil yang diperoleh lebih baik daripada penggabungan antara TWK dan teknik-teknik chemometric (Dinc, Baleanu, Kanbur, 2004). Transformasi wavelet telah banyak digunakan di berbagai penelitian. Diantaranya penggunaan TWK untuk menghasilkan spectograms yang menunjukkan frekuensi suara (Lang dan Forinash, 1998), analisis deret waktu chaotic dengan wavelet (Murguia dan Campos- Canton, 2005), dan penaksiran koefisien wavelet dalam regresi nonparametrik (Antoniadis, Bigos, dan Sapatinas, 2001). Jahe merupakan salah satu dari beberapa tanaman yang digunakan secara tradisional sebagai obat rematik, demam, radang, dan lain-lain. Menurut Young, rimpang jahe mengandung dua bagian utama yaitu volatil (minyak esensial) yang memberikan aroma dan gingerol yang merupakan pembawa rasa pedas. Kandungan gingerol yang cukup tinggi pada rimpang jahe, menyebabkan jahe memiliki peranan yang sangat penting. Peranan penting yang dimaksud adalah peranan dalam dunia 28 Jurnal Mat Stat, Vol. 11 No. 1 Januari 2011: 27-33
pengobatan baik pengobatan tradisional atau skala industri dengan memanfaatkan kemajuan teknologi. Data gingerol ini sebelumnya telah digunakan pada beberapa penelitian. Diantaranya digunakan untuk penerapan metode neural network dan principal component (Atok dan Notodiputro, 2004), untuk penerapan PCR (Arnita, 2005), untuk penerapan transformasi wavelet diskrit (TWD) dengan menggunakan mother wavelet Haar dan PCR (Sunaryo, 2005), untuk penerapan TWD dengan menggunakan mother wavelet Daubechies dan PLS (Sunaryo dan Retnaningsih, 2008), serta untuk penerapan metode PLS (Ohyver, 2010). Hasil dari tiga penelitian terakhir adalah sebagai berikut. Hasil penelitian dengan menggunakan TWD dan principal component regression (PCR) adalah 96,7% untuk kelompok kalibrasi (nilai root mean squared error (RMSE) tidak dituliskan) serta 93,9% dan 0,1072 untuk kelompok data validasi. Hasil penelitian dengan menggunakan TWD dan partial least squares (PLS) adalah 97,3% untuk kelompok data kalibrasi (nilai tidak dituliskan) serta 97,4% dan 0,111938 untuk kelompok data validasi. Hasil penelitian dengan menggunakan PLS adalah 83,8% dan 0,100891 untuk kelompok data kalibrasi serta 84,2% dan 0,199939 untuk kelompok data validasi. Berdasarkan hal tersebut maka makalah ini akan membahas penerapan metode transformasi wavelet kontinu (TWK) dan PLS pada data yang sama, yaitu data gingerol pada rimpang jahe. Mother wavelet yang akan digunakan adalah dengan Mexican Hat. Alasan pemilihan Mexican Hat adalah karena mother wavelet ini sangat baik dalam mengilustrasikan sifat-sifat TWK (Addison, 2002). Alasan penggunaan TWK dan PLS adalah karena keberhasilan kedua metode ini pada pendugaan model kalibrasi peubah ganda (Shao dan Zhuang, 2004; Dinc, dkk., 2004). Dengan hasil yang diperoleh ini, diharapkan dapat memberikan alternatif lain dalam mengembangkan model kalibrasi peubah ganda. METODE PENELITIAN Data yang digunakan adalah data sekunder. Data ini diperoleh dari peneliti sebelumnya (Sunaryo, 2005). Peubah yang akan digunakan adalah hasil pengukuran FTIR sebagai peubah bebas (X) dan hasil pengukuran HPLC sebagai peubah respon (Y). Hasil pengukuran dengan FTIR berupa data spektra % transmitan. Setiap bentuk spektrum % transmitan akan mencerminkan gugus fungsi yang terdapat pada senyawa (dalam hal ini gingerol) dari suatu sampel rimpang jahe. Adapun Pengolahan datanya dilakukan dengan menggunakan Microsoft Excel, Matlab, SAS, dan MINITAB. Gambar 1 Spektra % Transmitan 1866 Titik Penerapan Metode... (Margaretha Ohyver) 29
Dari penelitian sebelumnya, diketahui bahwa rimpang jahe mengalami masa simpan yang berbeda-beda pada tiap sampel (Sunaryo, 2005; Arnita, 2005). Oleh karena itu peubah dummy akan diikutkan sebagai peubah bebas. Sehingga ada sebanyak 1867 peubah bebas dan 1 peubah respon, dengan pengamatan sebanyak dua puluh. Penelitian ini dilakukan dengan langkah-langkah sebagai berikut. Pertama, membagi data menjadi dua bagian. Lima belas pengamatan digunakan untuk membentuk model kalibrasi peubah ganda dan lima pengamatn untuk membentuk model validasi. Kedua, mentransformasi wavelet peubah bebas, tanpa peubah dummy. Ketiga, membentuk model kalibrasi peubah ganda dengan menggunakan metode TWK dan PLS. Keempat, menentukan banyaknya komponen pada metode TWK dan PLS dengan menggunakan akar rataan prediction sum of squares (ARP). Kelima, menghitung dan untuk kelompok data kalibrasi dan kelompok data validasi. HASIL DAN PEMBAHASAN Dalam penelitian ini, mother wavelet yang akan digunakan adalah Mexican Hat dengan skala 1, 2, 3, 4, dan 5. Dengan demikian akan dihasilkan koefisien-koefisien wavelet pada masing-masing skala. Koefisien-koefisien ini masih saling berkorelasi. Hal ini dapat dilihat dari nilai-nilai VIF yang lebih dari 10. Karena adanya masalah korelasi ini maka akan dilanjutkan dengan menggunakan metode PLS. Hasil metode PLS untuk koefisien wavelet adalah sebagai berikut. Nilai ARP terkecil untuk skala 1 adalah 25,8546 untuk 1 komponen. Akan tetapi persentase keragaman untuk peubah X hanya sebesar 31,0572 % dan persentase keragaman untuk peubah Y hanya sebesar 32,1957 %. Sehingga untuk skala 1 ini dipilih model dengan 11 komponen. Nilai ARP untuk 11 komponen ini adalah 32,2649. Dengan 11 komponen, persentase keragaman untuk peubah X adalah 98,2260 % dan persentase keragaman untuk peubah Y adalah 99,9973 %. Nilai ARP terkecil untuk skala 2 adalah 57,943 untuk 1 komponen. Akan tetapi persentase keragaman untuk peubah X hanya sebesar 31,6909 % dan persentase keragaman untuk peubah Y hanya sebesar 30,5220 %. Sehingga untuk skala 2 dipilih model dengan 7 komponen. Nilai ARP untuk 7 komponen ini adalah 130,044. Persentase keragaman untuk peubah X adalah sebesar 91,3334 % dan persentase keragaman untuk peubah Y adalah sebesar 97,4976 %. Nilai ARP terkecil untuk skala 3 adalah 88,578 untuk 1 komponen. Akan tetapi persentase keragaman untuk peubah X hanya sebesar 46,8888 % dan persentase keragaman untuk peubah Y hanya sebesar 20,0029 %. Sehingga untuk skala 3 dipilih model dengan 7 komponen dengan nilai ARP sebesar 371,061. Persentase keragaman untuk peubah X adalah sebesar 92,6910 % dan persentase keragaman untuk peubah Y adalah sebesar 95,0790 %. Nilai ARP terkecil untuk skala 4 adalah 96,489 untuk 1 komponen. Akan tetapi persentase keragaman untuk peubah X hanya sebesar 16,9193 % dan persentase keragaman untuk peubah Y hanya sebesar 42,2347 %. Sehingga untuk skala 4 dipilih model dengan 8 komponen dengan nilai ARP sebesar 613,717. Persentase keragaman untuk peubah X adalah sebesar 90,0907 % dan persentase keragaman untuk peubah Y adalah sebesar 98,7674 %. Nilai ARP terkecil untuk skala 5 adalah 106,634 untuk 1 komponen. Akan tetapi persentase keragaman untuk peubah X hanya sebesar 19,6845 % dan persentase keragaman untuk peubah Y hanya sebesar 39,4055 %. Sehingga untuk skala 5 dipilih model dengan 8 komponen dengan nilai ARP sebesar 721,646. Persentase keragaman untuk peubah X adalah sebesar 91,3146 % dan persentase keragaman untuk peubah Y adalah sebesar 98,0245 %. 30 Jurnal Mat Stat, Vol. 11 No. 1 Januari 2011: 27-33
Tabel 1 Perbandingan Nilai untuk Skala 1, 2, 3, 4, 5 Hasil TWK dan PLS Skala Banyaknya komponen ARP 2 R x (%) 2 R y (%) 1 Sebelas 32,2649 98,2260 99,9973 2 Tujuh 130,044 91,3334 97,4976 3 Tujuh 371,061 92,6910 95,0790 4 Delapan 613,717 90,0907 98,7674 5 delapan 721,646 91,3146 98,0245 Nilai ARP terkecil untuk masing-masing skala dapat dilihat pada Tabel 1. Terlihat bahwa nilai ARP terkecil adalah pada skala 1 dengan ARP sebesar 32, 2649. Sehingga untuk membentuk model kalibrasi dipilih koefisien-koefisien wavelet pada skala 1 dengan 11 komponen. 1,3 1,1 1,0 ybenar 0,9 0,8 0,7 0,5 0,5 0,7 0,8 0,9 yduga 1,0 1,1 1,3 Gambar 2 Plot Y dengan Yˆ untuk Kelompok Data Kalibrasi dengan Metode TWK dan PLS 1,8 1,6 1,4 ybenar 1,0 0,8 0,4 0,2 0,0 0,0 0,2 0,4 0,8 1,0 yduga 1,4 1,6 1,8 Gambar 3 Plot Y dengan Yˆ untuk Kelompok Data Validasi dengan Metode TWK dan PLS Penerapan Metode... (Margaretha Ohyver) 31
Nilai-nilai dugaan peubah Y untuk kelompok data kalibrasi dan kelompok data validasi dapat dilihat pada Tabel 2. Dari nilai-nilai tersebut diperoleh 100% dan 0,0013065 untuk kelompok data kalibrasi. Sedangkan untuk kelompok data validasi diperoleh 18,6% dan 0,473388. Berdasarkan hal ini, maka dapat dikatakan bahwa metode TWK dan PLS mempunyai kelebihan dan kelemahan. Kelebihannya adalah metode ini sangat baik dalam pembentukan model kalibrasi. Sedangkan kelemahannya adalah ketika diberikan nilai-nilai peubah bebas yang baru, maka hasil dugaannya kurang baik. Tabel 2 Nilai Y dan Yˆ untuk Gingerol Rimpang Jahe dengan Metode TWK dan PLS Kelompok Data Kalibrasi Kadar Gingerol dari HPLC (%) Dugaan (%) Kelompok Data Validasi Kadar Gingerol dari HPLC (%) Dugaan (%) 3 3000 0,72 0,02171 0,53 0,53021 0,52 0,86531 0,78 0,77878 3 5533 0,58 0,58111 1,60 0,91688 0,53 0,52869 1,14 1,35527 0,54 0,54186 0,79 0,79002 0,78 0,78145 3 3095 0,78 0,77629 0,79 0,78943 6 6069 1,18 1,18005 4 4018 1,07 1,07029 Jika dibandingkan dengan tiga penelitian terakhir maka diperoleh perbandingan seperti pada Tabel 3. Pada tabel dapat dilihat bahwa metode terbaik untuk kelompok data kalibrasi adalah metode TWK dan PLS. Akan tetapi untuk kelompok data validasi, metode terbaik adalah TWD dan PLS. Tabel 3 Perbandingan metode TWD dan PCR, TWD dan PLS, PLS, dan TWK dan PLS TWD dan PCR TWD dan PLS PLS TWK dan PLS Kalibrasi 96,7% 97,3% 83,8% 100% * * 0,100891 0,0013065 Validasi 93,9% 97,3365% 84,2% 18,6% 0,1072 0,111938 0,199939 0,473388 PENUTUP Seleah melakukan penerapan metode TWK dan PLS pada data gingerol, maka diperoleh kesimpulan sebagai berikut. Metode TWK dan PLS sangat baik pada pembentukan model kalibrasi. Hal ini dapat dilihat pada nilai dan. 32 Jurnal Mat Stat, Vol. 11 No. 1 Januari 2011: 27-33
DAFTAR PUSTAKA Addison, P. (2002), The Illustrated Wavelet Transform Handbook, Institute of Physics Publishing, London. Antoniadis, A., Bigos, J., dan Sapatinas, T. (2001), Wavelet Estimators in Nonparametric Regression: A Comparative Simulation Study, Journal of Statistical Software, Vol. 6, hal. 1-83. Arnita. (2005). Koreksi Pencaran pada Data Kalibrasi Rimpang Jahe (Zingiber offcinale), Tesis tidak diterbitkan, Bogor: Program Pascasarjana, Institut Pertanian Bogor. Atok, R. M., dan Notodiputro, K. A. (2004). Metode NN (Neural Network) dengan Principle Component sebagai Pre-processing pada Data. Proceeding Seminar Nasional Statistika, Bogor: Institut Pertanian Bogor. Chung, H., Choi, S. Y., Choo, J., dan Lee, Y. (2004). Investigation of Partial Least Squares (PLS) Calibration Performance based on Different Resolutions of Near Infrared Spectra. Bull. Korean Chem. Soc, Vol. 25, No. 5, pp. 647-651. Dinc, E., Baleanu, D., dan Kanbur, M. (2004). Spectrophotometric Multicomponent Determination of Tetramethrin, Propoxur and Piperonyl Butoxide in Insecticide Formulation by Principal Component Regression and Partial Least Squares Techniques with Continuous Wavelet Transform. Canadian Journal of Analytical Sciences and Spectroscopy, pp. 218-225. Garthwaite, P. H. (1994). An Interpretation of Partial Least Squares. Journal of the American Statistical Association, Vol. 89, pp. 122-127. Lang, W. C., dan Forinash, K. (1998). Time-Frequency Analysis with the Continuous Wavelet Transform. Am. J. Phys, Vol. 66, pp. 794-797. Murguia, J. S., dan Campos-Canton, E. (2005). Wavelet Analysis of Chaotic Time Serie. Revista Mexicana De Fisica, Vol. 52(2), pp. 155-162. Ohyver, M. (2010). Penerapan Partial Least Squares pada Data Gingerol. Comtech, Vol. 1 No 1, pp. 39-47. Shao, X., & Zhuang, Y. (2004). Determination of Chlorogenic Acid in Plant Samples by Using Near- Infrared Spectrum with Wavelet Transform Preprocessing. Analytical Sciences, Vol. 20, pp. 451-454. Sunaryo, S. (2005), Model Kalibrasi dengan Transformasi Wavelet sebagai Metode Pra-Pemrosesan. Disertasi tidak diterbitkan. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Sunaryo, S., dan Retnaningsih, S. M. (2008). Pemodelan Kalibrasi dengan Metode Gabungan Transformasi Wavelet Diskrit dan Partial Least Squares. Jurnal Ilmu Dasar. Vol 9 Penerapan Metode... (Margaretha Ohyver) 33