BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Metode Permukaan Respon (Response Surface Methodology/RSM), pertama kali diperkenalkan oleh Box dan Wilson (1951), metode ini sering digunakan untuk mencari kondisi peubah bebas (variabel design) yang menghasilkan respon optimum (maksimum, minimum atau lebih luas lagi, mencari kondisi disekitar titik stasioner yang mengandung ridge). Secara umum ada tiga tahapan utama dalam RSM, yaitu: i. pengumpulan data, melalui pemilihan strategi rancangan percobaan yang tepat, ii. estimasi model/pemodelan data, melalui pemilihan metode pemodelan regresi yang tepat, iii. optimasi, melalui pemilihan metode optimasi yang akan digunakan untuk mengidentifikasi pengaturan dari peubah bebas yang mengoptimalkan peubah respon. Ketiga tahapan tersebut saling terkait, dimana setiap tahapan akan berpengaruh terhadap tahapan berikutnya. Oleh karena luasnya bidang kerja dari RSM, maka penelitian ini akan difokuskan pada estimasi model regresi untuk RSM, dengan asumsi bahwa rancangan percobaan sudah memuaskan dan data telah dikumpulkan. Untuk mendekati hubungan antara peubah respon dan peubah bebas pada daerah asal (daerah operasi) yang terbatas, dalam RSM, biasanya digunakan fungsi polinomial orde satu atau polinomial orde dua (model kuadratik). Fungsi polonomial orde dua (model kuadratik) ini selanjutnya disebut dengan model orde dua. Di dalam Myers at al. (2009), model permukaan respon orde dua (kuadratik) dengan variabel bebas x 1, x 2,..., x p dan variabel respon y dituliskan sebagai berikut: y = β o + p β j x j + j=1 p p β jj x 2 j + β jj x j x j + ε (1.1) j=1 j<j =2 1

2 Estimasi terhadap koefisien regresi linier dalam persamaan (1.1), di dalam model permukaan respon biasanya digunakan metode kuadrat terkecil (Ordinary Least Square-OLS). Namun demikian, metode OLS sangat peka terhadap adanya penyimpangan asumsi pada data. Salah satu asumsi penting dalam OLS adalah asumsi sebaran normal (normalitas). Asumsi normalitas seringkali dilanggar pada saat data mengandung outlier. Outlier sangat mungkin menghasilkan residual yang besar dan sering berpengaruh terhadap model regresi yang dihasilkan, sehingga estimasi model menjadi bias dan berakibat pada kesalahan dalam penentuan titik optimal yang sebenarnya. Sebuah contoh dari model yang terkait kesalahan penentuan titik optimal dengan metode (OLS), disajikan pada gambar 1.1. Gambar 1.1: Plot Data Mentah dan Plot OLS Kekuatan Tarik Kertas (sumber : Wen (2007))

3 Gambar 1.1 menunjukan plot antara kekuatan tarik (dalam psi) kertas sebagai variabel respon(y), dan persentase kayu dalam batch pulp kertas (x) yang diambil dari Wen (2007). Titik-titik ( ) melambangkan data mentah dan garis (- - -) melambangkan plot model yang diperoleh dengan estimasi OLS. Dari gambar terlihat bahwa plot data mentah mempunyai puncak yang lebih tinggi dibandingkan dengan plot hasil estimasi dengan OLS. Hal ini menunjukkan bahwa ada kemungkinan telah terjadi kesalahan dalam penentuan model. Salah satu kemungkinan penyebab kesalahan tersebut adalah adanya data yang menyimpang atau outlier. Hal ini bisa dilihat dari dua data terakhir atau data ke-14 dan ke-15, yang mempunyai nilai cenderung lebih rendah. Sebagai akibatnya jika model ini dipaksakan akan sangat mungkin terjadi kesalahan dalam penentuan titik optimal yang sebenarnya. Oleh karena data outlier dapat mempengaruhi penentuan titik optimal, sementara tujuan dari RSM adalah menentukan titik optimal maka dibutuhkan suatu model permukaan respon yang kuat/kekar terhadap outlier Ada beberapa cara yang digunakan oleh peneliti dalam memperlakukan data outlier, yaitu: menghapuskan data outlier. Cari ini dilakukan dengan pertimbangan bahwa data sudah diwakili oleh sebagian besar data yang ada, sehingga penghapusan data outlier tidak berpengaruh terhadap informasi yang dihasilkan. Selain itu ada kemungkinan bahwa data outlier tersebut disebabkan oleh kekeliruan dalam proses pengambilan data atau data yang dihasilkan bukan merupakan data yang sebenarnya. Penghapusan data outlier dari data diharapkan dapat menghilangkan penyebab pelanggaran asumsi normalitas, sehingga peneliti dapat menggunakan OLS. mempertahankan data outlier atau menggunakan seluruh data. Pada saat tertentu outlier ini tidak boleh begitu saja dihapuskan, karena kadang-kadang data outlier ini dapat memberikan informasi yang tidak dapat diberikan oleh titik pengamatan lain. Misalnya karena adanya kombinasi keadaan yang tidak biasa dan perlu diadakan penyelidikan lebih jauh. Suatu outlier dapat dihapuskan apabila setelah ditelusuri ternyata pengamatan tersebut merupakan akibat dari kesalahan pengukuran atau kesalahan dalam penyiapan pengukuran. Outlier dapat juga merupakan data berpengaruh. Outlier yang bukan pengamatan berpengaruh adalah outlier yang tidak memiliki pengaruh yang kuat pada model. Sebaliknya jika outlier merupakan data berpengaruh, maka akan memberikan

4 dampak pada model, sehingga untuk data berpengaruh, data outlier tetap digunakan dengan memberikan memberikan bobot yang kecil pada data outlier. Selanjutnya metode ini dikenal dengan nama metode regresi robust. Kata robust biasanya dikonotasikan sebagai ketakkonsistenan dari suatu estimator terhadap penyimpangan asumsi. Huber dan Ronchetti (2009) menyatakan bahwa metode robust lebih didekatkan pada parameter rata-rata dan variansikovariansi dari suatu estimator tertentu. Pendekatan tersebut dilakukan dengan melakukan standarisasi terhadap estimator parameter rata-rata dan variansi-kovariansi sedemikian hingga dapat dihasilkan estimator yang konsisten terhadap parameter-parameter tersebut. Standarisasi dilakukan dengan bentuk pembatasan nilai pada estimasi untuk parameter-parameternya. Dengan ke-robust-an tersebut, diharapkan hasil estimasi tidak akan menyimpang terlalu jauh. Regresi robust merupakan metode regresi yang digunakan ketika ada beberapa outlier pada model. Metode ini merupakan alat penting untuk menganalisa data yang dipengaruhi oleh outlier sehingga dihasilkan model yang robust atau kekar terhadap outlier. Suatu estimator yang kekar adalah estimator yang relatif tidak terpengaruh oleh perubahan besar pada bagian kecil data atau perubahan kecil pada sebagian besar data. Salah satu metode estimasi dalam regresi robust adalah estimasi-m (Maximum Likelihood type). Estimasi-M adalah metode yang paling sederhana dan paling banyak digunakan serta mempunyai nilai efisiensi yang tinggi. Sementara itu, di dalam kehidupan nyata sangat jarang data yang dikumpulkan hanya memuat satu variabel respon tetapi yang sering terjadi data yang dikumpulkan memuat beberapa variabel respon dan sekumpulan variabel independen. Memperlakukan setiap respon secara terpisah dan menerapkan prosedur respon tunggal dapat menyebabkan interprestasi yang salah dalam hasil. Sehingga dibutuhkan suatu pengembangan model untuk kasus multirespon. Pengembangan untuk kasus multirespon pada model permukaan respon telah dilakukan oleh Wen (2007) dengan menggunakan pendekatan Model Robust Regression 2 (MRR2), dengan menggabungkan metode OLS untuk pencocokan parametrik dan Local Linear Regression (LLR) untuk pencocokan nonparametrik. Sebagaimana telah diketahui bahwa OLS sensitif terhadap outliers sehingga MRR2 juga memiliki kelemahan terhadap keberadaan data outliers, sehingga dibutuhkan metode yang robust, salah satu alternatifnya adalah m-regression dengan mengembangkan pada kasus multirespon.

5 1.2 Perumusan Masalah Berdasarkan latar belakang di atas, terlihat bahwa adanya outlier dapat berpengaruh terhadap model permukaan respon yang dihasilkan dan dapat berakibat pada kesalahan dalam penentuan titik optimal yang sebenarnya. Sementara itu, tidak semua outlier bisa dihapuskan dari data, sehingga dibutuhkan suatu model permukaan respon yang robust terhadap outlier. Salah satu metode estimasi dalam regresi robust adalah estimasi-m. Pada sisi lain seringkali di dalam kehidupan nyata data yang dikumpulkan memuat beberapa variabel respon dan sekumpulan data independen. Sehingga dibutuhkan suatu pengembangan model untuk kasus multirespon. Oleh karena itu permasalahan yang muncul adalah bagaimanakah metode estimasi-m untuk model permukaan respon multivariat dengan data outliers 1.3 Tujuan Penelitian Dengan memperhatikan latar belakang perumusan masalah di atas maka penelitian ini bertujuan untuk mengembangkan metode estimasi parameter model permukaan respon multivariat dengan data outlier, dengan menggunakan metode estimasi- M. 1.4 Manfaat Penelitian Berdasarkan pada tujuan penelitian di atas, maka diperoleh manfaat penelitian sebagai berikut: 1. sebagaimana telah diketahui bahwa tujuan utama dari metodologi permukaan respon adalah menemukan pengaturan variabel input yang mencapai kompromi optimal dalam variabel respon. Dengan diperolehnya estimasi model permukaan respon multivariat yang memuat outlier diharapkan dapat mengurangi pengaruh outlier terhadap model sehingga dapat memperkecil peluang terjadinya kesalahan dalam penentuan titik optimal dalam variabel respon. 2. telaah ini bisa digunakan sebagai acuan dalam menyusun model permukaan respon multivariat dengan data memuat outliers

6 1.5 Tinjauan Pustaka Di dalam makalahnya Xu at al. (2006) menguraikan bahwa outliers dapat berpengaruh terhadap estimasi parameter model. Sehingga outliers dapat berpengaruh terhadap hasil analisis statistik. Selanjutnya Johnson dan Wichern (2007) mendefinisikan outliers sebagai suatu pengamatan yang tak konsisten terhadap kumpulan pengamatan lainnya. Selain itu outlier dapat didefinisikan sebagai suatu pengamatan yang menyimpang dari kumpulan pengamatan lainnya, sehingga tidak mengikuti sebagian besar pola. Akibatnya letak data outliers jauh dari pusat pengamatan. Beberapa peneliti yang berusaha untuk mengatasi kesalahan penentuan model dalam model permukaan respon diantaranya adalah Pickle (2006), dan Wen (2007). Kedua peneliti tersebut telah melakukan penelitian dengan menggunakan metode semi-parametrik. Metode semiparametrik yang digunakan adalah Model Robust Regression 2 (MRR2), dengan menggabungkan metode OLS untuk pencocokan parametrik dan Local Linear Regression (LLR) untuk pencocokan nonparametrik. Karena OLS sensitif terhadap outliers maka MRR2 juga memiliki kelemahan terhadap keberadaan data outliers. Memperhatikan kelemahan tersebut, pada bagian akhir penelitiannya Wen (2007), merekomendasikan untuk mengembangkan metode ini agar tahan terhadap data yang memuat outliers, dengan merujuk pada hasil penelitian Assaid (1997). Pada sisi lain Assaid (1997), telah mengusulkan suatu metode yang dinamakan dengan Outlier Resistant Model Robust Regression (ORMRR) untuk respon tunggal. ORMRR menggunakan MRR dengan cara menggabungkan metode parametrik estimasi M dan metode nonparametrik Robust Local Linear Regression (RLLR). Usulan ORMRR dilatarbelakangi oleh keinginan untuk mendapatkan sebuah rumusan taktis dalam menangani misspecification model dengan adanya data yang memuat outliers pada data univariat. 1.6 Metodologi Penelitian Materi pokok untuk dasar penelitian ini adalah karya-karya ilmiah, hasil penelitian para pakar yang telah dimuat dalam buku, artikel, dan jurnal. Metode penelitian yang digunakan adalah metode teoritis. Secara teoritis, penelitian dilakukan dengan cara mempelajari karya-karya ilmiah yang telah dihimpun, yang berkaitan dengan Estimasi Model Permukaan Respon dan outliers. Untuk mencapai tujuan penelitian,

7 diperlukan pengertian konsep tentang estimasi parameter, model permukaan respon, outliers, dan model robust regression. Secara umum untuk menjalankan penelitian ini dilakukan dengan langkahlangkah sebagi berikut : 1. Mengkaji konsep estimasi parameter 2. Mengkaji tentang outliers dalam regresi multivariat 3. Mencari Model Permukaan Respon Multivariat dengan data yang memuat outliers 4. Menemukan estimasi parameter model, 5. Menguraikan metodologi yang diusulkan bersama dengan contoh 6. Merangkum penelitian dan menjelaskan beberapa topik penelitian masa depan