PTNBR - BATAN Bandung, 04 Juli 013 MODEL REGRESI KANDUNGAN BATUBARA MENGGUNAKAN METODE LEAST MEDIAN OF SQUARES Kankan Parmikanti 1, Endang Rusyaman 1 dan Emah Suryamah 1 1 Jurusan Matematika FMIPA Universitas Padjajaran, Jalan Raya Bandung Sumedang km. 1, Jatinangor ABSTRAK MODEL REGRESI KANDUNGAN BATUBARA MENGGUNAKAN METODE LEAST MEDIAN OF SQUARES. Dalam makalah ini akan disajikan suatu metode untuk menentukan model regresi tentang kandungan batubara di lokasi dengan koordinat tertentu. Metode yang dimaksud adalah Least Median of Square (LMS) yaitu salah satu metoda estimasi dalam regresi robust yang bekerja dengan cara meminimumkan nilai median dari error kuadrat hasil dari taksiran parameter melalui Metode Kuadrat Terkecil (MKT). Akan diperlihatkan bagaimana metode ini memperlakukan pencilan yang terdapat dalam data, mengolahnya, dan kemudian mengieliminir pencilan tersebut sebagian demi sebagian melalui suatu proses iterasi.. Kata kunci: LMS, MKT, pencilan, robust, kuadrat error ABSTRACT REGRESSION MODEL FOR COAL CONTENT USING LEAST MEDIAN OF SQUARES METHOD. In this paper presented a method to determine regression model about the coal deposits in a locations with spesific cordinates. The method is the Least Median of Square (LMS) that is estimation methode in robust regression in which work to minimaze the median value of the squared error of estimated parameter results through Least Square Method. It will be shown how this method treats outliers that present in the data, process it, and then eliminate it piecemeal with itteracy process. Key words: LMS, Least Square Method, outlier, robust, error square 1. PENDAHULUAN Dalam ilmu statistika, banyak sekali metode yang dapat digunakan untuk menentukan suatu model regresi yang didasarkan pada sekumpulan data. Salah satu metode yang paling banyak dikenal dalam masalah ini adalah Ordinary Least Square (OLS) atau yang lebih dikenal dengan nama Metode Kuadrat Terkecil (MKT). Namun demikian, syarat bagi metode ini adalah bahwa sisaan atau eror harus berdistribusi normal, tidak terjadi autokorelasi, dan tidak ada pencilan data. Jika data mempunyai beberapa pencilan, maka dengan metode ini pencilan tersebut dibuang begitu saja. Hal ini sangat memungkinkan bahwa data tidak utuh dan sudah tidak mewakili populasi, sehingga model yang tebentuk menjadi kurang valid. Dalam banyak kasus, tidak jarang ditemui data yang diperoleh tidak sesuai dengan syaratsyarat di atas, sehingga metode kuadrat terkecil tidak cocok lagi digunakan. Sebagai alternatif metode yang dapat digunakan untuk data yang mengandung pencilan, dalam penelitian ini akan dikaji tentang sebuah metode yang disebut dengan Least Median of Square (LMS) salah satu metoda estimasi dalam regresi robust, di mana dengan metode ini data pencilan yang ada tidak dibuang begitu saja, tetapi diproses dan dieliminasi melalui sebuah iterasi. Untuk menerapkan algoritma dalam metode ini, akan disajikan sekelompok data yang mengandung pencilan, kemudian diolah dengan metode LMS untuk mendapatkan model 64
PTNBR - BATAN Bandung, 04 Juli 013 regresinya. Data tersebut adalah produksi batubara pada lokasi tertentu, di mana lokasi tersebut dinyatakan dalam bentuk koordinat.. PEMBAHASAN.1 Least Median of Squares Estimator (LMS) Prinsip dasar metode regresi robust penduga Least Median of Squares (LMS) adalah mencocokkan sebagian besar data setelah pencilan teridentifikasi sebagai titik yang tidak berhubungan dengan data (Rosseeuw dan Leroy, 1987). Jika pada MKT hal yang perlu dilakukan adalah meminimumkan kuadrat error ( ), maka pada LMS hal yang perlu dilakukan adalah meminimumkan median kuadrat error, yaitu dengan adalah kuadrat error hasil taksiran dengan MKT Untuk mendapatkan nilai M1, dicari himpunan bagian data dari matriks X sejumlah pengamatan, yaitu : di mana n adalah banyaknya data, dan p banyaknya parameter ditambah satu, dalam hal ini p=3. Dalam proses perhitungan, nilai h i harus selalu dalam bentuk bilangan bulat oleh karena itu, jika nilai h i bukan dalam bentuk bilangan bulat maka dilakukan pembulatan ke atas. Selanjutnya untuk mencari M, ditentukan himpunan bagian data dari matriks X sejumlah pengamatan, yaitu : dengan penduga lain pada regresi robust, prinsip dasar dari LMS adalah dengan memberikan bobot w ii pada data sehingga data pencilan tidak mempengaruhi model parameter taksiran. Bobot w ii ditentukan berdasarkan taksiran robust standard deviation yang didapat berdasarkan hasil perhitungan MJ dan. Berdasarkan Rousseeuw (1987), bobot dirumuskan dengan ketentuan sebagai berikut : dengan. () Setelah bobot dihitung, dapat dibentuk matriks W sebagai berikut : w w w w w w W w w w 11 1 1n 1 n n1 n nn dengan entri matriks w = 0, dimana i j. i j (3) Setelah terbentuk matriks W, maka penaksir parameter regresi LMS dapat dihitung dengan menggunakan rumus. Hasil Implementasi (4)..1. Model Regresi Kandungan Batubara dengan MKT Analisis data tentang kaitan antara produktifitas/kandungan batubara dengan menggunakan MKT dan dibantu program R, menghasilkan estimasi parameter sebagai berikut: di mana n = h 1 dan p = 3. Demikian seterusnya, sampai iterasi berahir pada iterasi ke-s yaitu saat h s = h s+1. Jadi akan diperoleh nilai Mj seperti pada persamaan (1). Selanjutnya karena LMS merupakan penduga pada regresi robust, maka sama hal nya yang berarti bahwa model regresinya adalah dengan scatter plot adalah (5) 65
PTNBR - BATAN Bandung, 04 Juli 013. Iterasi ke- dengan n = 106, melalui MKT diperoleh (lampiran-3), dengan model Dengan M = median { e i : i = 1,,..., 106} = 0,117566, dan h = = 55. Gambar 1. Data Batu Bara 08 lokasi... Model Regresi Kandungan Batubara dengan Metode LMS Artinya pada iterasi ke-3 akan diambil 55 pengamatan yang jarak nilai e i ke M nya minimum. Dengan kata lain akan dihilangkan sebanyak 51 pengamatan (dalam tabel diberi warna merah) yang jarak e i ke M nya maksimum. Scatter plotnya terlihat pada gambar di bawah ini Untuk menentukan nilai Mj yaitu median dari error kuadrat pada iterasi ke-j, terlebih dahulu dicari nilai error kuadrat dari MKT dengan jumlah pengamatan pada iterasi ke-j. Dengan demikian pada: 1. Iterasi ke-1 dengan n = 08 diperoleh (lampiran-) dengan model MKT seperti pada (4). Dengan demikian diperoleh M1 = median { e i : i = 1,,..., 08} = 4,64604, dan h 1 = = 106. Artinya pada iterasi ke- akan diambil 106 pengamatan yang jarak nilai e i ke M1 nya minimum. Dengan kata lain akan dihilangkan sebanyak 10 pengamatan (dalam tabel diberi warna merah) yang jarak e i ke M1 nya maksimum. Scatter plotnya terlihat pada gambar di bawah ini Gambar 3. Hasil Iterasi 3. Iterasi ke-3 dengan n = 55, melalui MKT diperoleh model regresi dengan sebaran e i sebagai berikut No. e i No. e i 1 0,013 14 0,079 0,007 15 0,091 3 0,0735 16 0,065 4 0,0971 17 0,0477 5 0,0934 18 0,165 6 0,053 19 0,0178 7 0,0495 0 0,0788 8 0,066 1 0,16 9 0,089 0,096 10 0,1876 3 0,0578 11 0,0588 4 0,105 1 0,0463 5 0,069 13 0,0001 6 0,0695 Gambar. Hasil Iterasi 1 66
PTNBR - BATAN Bandung, 04 Juli 013 No. e i No. e i 7 0,05 4 0,0569 8 0,078 43 0,011 9 0,148 44 0,031 30 0,0903 45 0,1478 31 0,1386 46 0,0573 3 0,1941 47 0,0494 33 0,113 48 0,14 34 0,0867 49 0,1334 35 0,0453 50 0,938 36 0,0666 51 0,0861 37 0,014 5 0,0079 38 0,079 53 0,66 39 0,1307 54 0,498 40 0,0694 55 0,16 41 0,0438 Dengan demikian M8 = median { e i : i = 1,,..., 6} = 0,006678, dan h 8 = = 5. Scatter plotnya terlihat pada gambar di bawah ini Dengan demikian M3 = median { e i : i = 1,,..., 55} = 0,07354, dan h 3 = = 30 (pembulatan ke atas). Artinya pada iterasi ke-3 akan diambil 30 pengamatan yang jarak nilai e i ke M3 nya minimum. Dengan kata lain akan dihilangkan sebanyak 5 pengamatan (dalam tabel diberi warna merah) yang jarak e i ke M3 nya maksimum. Demikian seterusnya sampai iterasi berahir pada iterasi ke-8, karena karena h 8 = h 9. Hasil dari iterasi ke-8 tersebut adalah 4. Iterasi ke-8 dengan n = 6, melalui MKT diperoleh model regresi Gambar 4. Hasil Iterasi 8 Dengan berakhirnya proses iterasi sebanyak delapan kali, maka diperoleh 8 buah nilai Mj yaitu: M1 4,64604 M 0,11757 M3 0,07354 M4 0,0663 M5 0,05594 M6 0,0506 M7 0,0113 M8 0,00668 Mj Min 0,00668 dengan sebaran e i sebagai berikut No. e i 1 0,0014 0,013393 3 0,006959 4 0,01537 5 0,006397 6 0,001465..3. Penentuan Parameter Regresi LMS Penentuan parameter regresi LMS didapat berdasarkan hasil perhitungan MJ dan yang kemudian dihitung bobot. Dengan mensubstitusikan nilai n = 08, p = 3, dan MJ = 0.00668 ke dalam persamaan () menghasilkan nilai. Selanjutnya dengan menggunakan rumus (3) diperoleh nilai penaksir parameter 67
PTNBR - BATAN Bandung, 04 Juli 013 Dengan demikian model regresi menurut metode LMS adalah 3. KESIMPULAN Apabila dibandingkan, model regresi hasil metode LMS ini lebih baik dari pada model hasil metode MKT. Dengan demikian metode LMS ini cukup layak untuk dijadikan alternatif dalam mencari model regresi untuk data yang mengandung pencilan. 4. DAFTAR PUSTAKA 1. EFRON, B. dan TIBSHIRANI, R.J, 1993,An Introduction to Bootstrap, Chapman and Hall, London. MIDI, H, 009, Dynamic Robust Bootstrap Method Based on LTS Estimators, European Journal of Scientific Research ISSN 1450-16X Vol.3 No.3 (009), pp.77-87 Euro Journals Publishing, Inc. 009, http://www.eurojournals.com/ejsr.htm, - 10-01. 3. REFNIWIDIALISTUTI, 010, perbandingan pengaruh pencilan terhadap Penduga Parameter Model Regresi dengan metode MKT dan MM-Robust, Universitas Andalas, Padang. 4. ROUSSEEUW, P.J, 1984, Least Median of Squares Regression, Jurnal of American Statistical Association, (online), http://web.ipac.caltech.edu/staff/finasci/hom e/statistics_refs/leastmedianofsquares.pdf, 1/09/011 5. ROUSSEEUW, P.J and LEROY, A.M, 1987, Robust Regression and Outlier Detection, John Wiley & Sons, Inc, Canada. 6. SOEMARTINI, 007, Pencilan (outlier), (online), http://resources.unpad.ac.id/unpad-content/... /OUTLIER(PENCILAN).pdf, 0/11/011 7. WEISSTEIN, ERIC, 007, Fractional Derivative,http://mathworld. wolfram.com /fractionalderivative.html, Download 10/05/007. 68