EFISIENSI ESTIMASI SCALE (S) TERHADAP ESTIMASI LEAST TRIMMED SQUARES (LTS) PADA PRODUKSI PADI DI PROVINSI JAWA TENGAH May Cristanti, Yuliana Susanti, dan Sugiyanto Program Studi Matematika FMIPA UNS ABSTRAK. Metode Kuadrat Terkecil (MKT) merupakan salah satu metode untuk mengestimasi parameter dalam model regresi. Penggunaan metode ini harus memenuhi asumsi-asumsi yang ada. Terdapatnya pencilan menyebabkan salah satu asumsi normalitas tidak terpenuhi sehingga diperlukan suatu metode lain dimana nilai estimasinya tidak banyak dipengaruhi oleh pencilan dalam data, metode tersebut adalah metode regresi robust. Estimasi parameter regresi dalam metode regresi robust antara lain estimasi Scale (S) dan estimasi Least Trimmed Square (LTS). Tujuan dari penelitian ini untuk menentukan efisiensi estimasi S terhadap estimasi LTS pada data produksi padi di Provinsi Jawa Tengah tahun 2015 sebagai indikator untuk menentukan model regresi yang lebih baik. Hasil dari penelitian menunjukkan bahwa estimasi S lebih efisien dibandingkan dengan estimasi LTS karena nilai efisiensi effβ, β = 1,85647 > 1. Kata kunci: regresi robust, estimasi S, estimasi LTS, efisiensi. 1. PENDAHULUAN Padi merupakan tanaman pangan yang dibutuhkan oleh penduduk Indonesia, karena hasil tanaman padi dapat diolah sebagai bahan makanan pokok penduduk di Indonesia. Salah satu provinsi penyangga padi nasional yakni Provinsi Jawa Tengah. Menurut Berita Resmi Statistik [1], produksi padi di Provinsi Jawa Tengah pada tahun 2014 mengalami penurunan sebesar 9,65 juta ton Gabah Kering Giling (GKG) yang disebabkan oleh berkurangnya luas lahan panen akibat banjir dan serangan hama tanaman yang mencapai 44,54 ribu hektar atau 2,41%. Penurunan produksi ini harus mendapatkan perhatian karena hasil produksi padi sangat dibutuhkan bagi penduduk untuk mencukupi kebutuhannya. Oleh karena itu, upaya untuk meningkatkan produksi padi di Jawa Tengah perlu ditingkatkan kembali secara bertahap. Menurut Balai Pengkajian Teknologi Pertanian Jawa Tengah [2] beberapa faktor yang berpengaruh dan perlu diperhatikan dalam upaya peningkatan produksi padi antara lain luas lahan panen, curah hujan, dan jumlah pupuk. Untuk mengetahui hubungan antara produksi padi dengan luas lahan panen, curah hujan, serta jumlah pupuk dapat digunakan regresi linear berganda. 1
Analisis regresi linear merupakan suatu analisis yang mempelajari hubungan antara variabel dependen dengan variabel independen. Metode yang digunakan untuk mengestimasi parameter model regresi dengan menggunakan Metode Kuadrat Terkecil (MKT). Pada suatu data dimungkinkan terdapatnya pencilan, yakni suatu data pengamatan yang tidak mengikuti pola sebagian besar data. Terdapatnya pencilan menyebabkan MKT tidak akurat untuk mengestimasi parameter. Oleh karena itu, diperlukan suatu metode regresi yang bersifat robust dimana nilai estimasinya tidak banyak dipengaruhi oleh pencilan dalam data. Regresi robust merupakan regresi yang digunakan ketika suatu data pengamatan terdapat pencilan. Data pencilan seringkali mempunyai pengaruh terhadap estimasi parameter sehingga data tersebut tidak dihilangkan begitu saja. Terdapat beberapa estimasi pada regresi robust antara lain estimasi Scale (S) dan estimasi Least Trimmed Square (LTS), kedua estimasi tersebut diaplikasikan pada data produksi padi di Provinsi Jawa Tengah untuk mengetahui efisiensi yang digunakan sebagai indikator untuk menentukan model mana yang lebih baik. 2. REGRESI ROBUST Model regresi robust diperkenalkan oleh Andrews pada tahun 1972. Menurut Drapper [4] regresi robust ditujukan untuk mengatasi masalah pencilan yang dapat menyebabkan data tidak normal sehingga nilai estimasi dari suatu parameter tidak tepat. Pada penelitian ini digunakan regresi robust estimasi S dan estimasi LTS. a. Estimasi Scale (S) Estimasi S diperkenalkan oleh Rousseeuw dan Yohai pada tahun 1984. Estimasi S didefinisikan β = min σ (e, e,, e ) dengan β adalah estimator koefisien regresi, σ adalah estimator skala robust, dan e, e,, e merupakan sisaan. Estimasi S dapat dilakukan dengan langkah-langkah berikut. 1. Menghitung estimasi parameter β dengan menggunakan MKT. 2. Menghitung nilai sisaan e = y y. 3. Menghitung nilai estimasi skala robust σ. 2
σ = median e median (e ), iterasi = 1 0,6745 4. Menghitung nilai u =. 1 0,199 n w e 5. Menghitung nilai fungsi pembobot w. w = u 1 u, iterasi > 1, u < c 0, u c ρ(u ) u, iterasi > 1, iterasi = 1 6. Menghitung nilai estimasi β dengan metode Iteratively Reweighted Least Square (IRLS) dengan pembobot w. 7. Mengulangi langkah 2 sampai dengan 6 sehingga diperoleh nilai β yang konvergen. 8. Menguji hipotesis untuk mengetahui apakah variabel independen mempunyai pengaruh signifikan terhadap model. b. Estimasi Least Trimmed Square (LTS) Estimasi Least Trimmed Square (LTS) adalah salah satu metode estimasi parameter regresi robust yang kekar terhadap pencilan. Metode LTS mengestimasi koefisien regresi dengan meminimumkan jumlah kuadrat sisaan dari himpunan bagian data berukuran h pengamatan dengan kuadrat sisaan terkecil. Estimasi LTS didefinisikan sebagai β = min e () 3 = min y () y () dengan h = [n/2] + [(p + 1)/2], n adalah banyaknya pengamatan, p adalah banyaknya parameter, e () adalah kuadrat sisaan yang diurutkan dari yang terkecil ke yang terbesar. Estimasi LTS dapat dilakukan dengan langkah-langkah sebagai berikut. 1. Mengestimasi koefisien regresi dengan Metode Kuadrat Terkecil (MKT).
2. Menghitung nilai sisaan e = y y. 3. Menghitung kuadrat sisaan e dan menghitung nilai h. 4. Menghitung nilai estimasi β. 5. Melakukan estimasi parameter b () dari h () pengamatan. 6. Menentukan kuadrat sisaan e dari h () pengamatan. 7. Menghitung nilai estimasi β (). 8. Melakukan tahap 5 sampai dengan 7 hingga diperoleh nilai β yang konvergen. 9. Menguji hipotesis untuk mengetahui apakah variabel independen mempunyai pengaruh signifikan terhadap model. 3. METODE PENELITIAN Penelitian ini merupakan penelitian terapan yaitu penerapan untuk menentukan efisiensi estimasi S terhadap estimasi LTS. Data yang digunakan pada penelitian ini adalah data produksi padi di Provinsi Jawa Tengah tahun 2015, merupakan data sekunder yang diambil dari Dinas Pertanian Tanaman Pangan dan Holtikultura. Data tersebut terdiri atas 4 variabel yakni jumlah produksi padi sebagai variabel dependen Y, luas lahan panen sebagai variabel independen X, curah hujan sebagai variabel independen X, dan jumlah pupuk sebagai variabel independen X. Tahapan dalam penelitian ini diawali dengan mengestimasi parameter regresi dengan menggunakan MKT, kemudian menguji asumsi klasik analisis regresi serta mengidentifikasi adanya pencilan dalam data. Jika asumsi kenormalan tidak terpenuhi dan terdapat pencilan, maka dapat digunakan regresi robust untuk mengestimasi parameter regresi yakni dengan estimasi S dan estimasi LTS dengan melakukan pemotongan terhadap himpunan bagian data berukuran h pengamatan dengan kuadrat sisaan terkecil. Kedua estimasi tersebut dilakukan hingga diperoleh nilai parameter regresi yang konvergen, selanjutnya dilakukan uji signifikansi dan menghitung nilai efisiensi untuk menentukan model regresi yang paling efisien dengan melihat nilai Mean Square Error (MSE) terkecil. 4
4. HASIL DAN PEMBAHASAN 4.1. Metode Kuadrat Terkecil. Model regresi linear berganda dengan menggunakan metode kuadrat terkecil pada data produksi padi di Provinsi Jawa Tengah tahun 2015 diperoleh hasil Y = 9154,09 + 6,4046 X + 0,05 X 39,273 X dengan Y adalah produksi padi, X adalah luas lahan panen, X adalah curah hujan, dan X adalah jumlah pupuk. 4.2. Uji Asumsi Klasik. Pada model regresi, diperlukan uji untuk mengetahui apakah model regresi memenuhi asumsi regresi atau tidak. Uji asumsi klasik yang digunakan dalam model regresi adalah uji normalitas, uji non autokorelasi, uji non heteroskedastisitas, dan uji non multikolinearitas. 1. Uji Asumsi Normalitas. Pengujian asumsi ini menggunakan uji Anderson Darling. Hipotesis H adalah sisaan berdistribusi normal dan H adalah sisaan tidak berdistribusi normal, dengan keputusan uji H ditolak apabila A > A., = 0,739642. Hasil pengujian diperoleh A sebesar 1.704292 maka dapat disimpulkan bahwa H ditolak yang berarti sisaan tidak berdistribusi normal. 2. Uji Asumsi Homoskedastisitas. Pengujian ini dilakukan menggunakan uji korelasi rank Spearman. Hipotesis H : variansi sisaan homogen dan H : variansi sisaan tidak homogen, dengan keputusan uji H ditolak apabila t > t = 2,048. Hasil pengujian diperoleh bahwa t luas lahan panen sebesar 1,038 dan hasil t curah hujan sebesar 1,756 serta hasil t jumlah pupuk diperoleh sebesar 1,204. Karena t < t = 2,048 maka dapat disimpulkan bahwa variansi sisaan homogen. 3. Uji Asumsi Bebas Autokorelasi. Pengujian asumsi ini menggunakan uji Durbin-Watson. Hipotesis H : tidak terdapat autokorelasi dan H : terdapat autokorelasi, dengan keputusan H tidak ditolak jika d < d < 4 d. Hasil pengujian diperoleh d sebesar 1,70097. Karena d = 1.6498 < d < 4 d = 2.3502 maka tidak menolak H, berarti bahwa tidak terdapat autokorelasi. 5
4. Uji Bebas Multikolinearitas. Pengujian ini menggunakan nilai Variance Inflation Factor (VIF). Hipotesis H : tidak terdapat multikolinearitas dan H : terdapat multikolinearitas, dengan keputusan uji H ditolak apabila nilai VIF<10. Hasil pengujian diperoleh nilai VIF luas lahan sebesar 2.554, VIF curah hujan sebesar 1.084, dan VIF jumlah pupuk sebesar 2.662. Karena nilai VIF<10, H ditolak sehingga dapat disimpulkan bahwa tidak terdapat multikolinearitas. 4.3. Identifikasi Pencilan. Identifikasi pencilan terhadap Y menggunakan Studentized Deleted Residuals (TRES). Hipotesis H : tidak terdapat pencilan dan H : terdapat pencilan, dengan keputusan uji H ditolak apabila nilai TRES > t (,;) = 2.056. Hasil pengujian diperoleh bahwa pada data ke-16, data ke-26, dan data ke-27 merupakan pencilan terhadap Y. Identifikasi pencilan terhadap X menggunakan nilai h dengan keputusan uji H ditolak apabila nilai h > = 0,267. Hasil perhitungan diperoleh hasil bahwa pada data ke-1, data ke-15, data ke- 17, dan data ke-19 merupakan data pencilan. 4.4. Model Regresi Robust Estimasi Scale (S). Model regresi dengan estimasi S adalah Y = 3110,30 + 6,6366 X 41,314 X 0,2874 X dengan interpretasi bahwa setiap kenaikan satu hektar luas lahan panen akan menaikkan produksi padi sebesar 6,6366 ton, setiap kenaikan satu milimeter kubik curah hujan akan menurunkan produksi padi sebesar 41,314 ton, dan setiap kenaikan satu ton jumlah pupuk akan menurunkan produksi padi sebesar 0,2874 ton. 4.5. Model Regresi Robust Estimasi Least Trimmed Square (LTS). Model regresi dengan estimasi LTS adalah Y = 12949 + 5,9978 X 31,69 X 0,4828 X dengan interpretasi bahwa setiap kenaikan satu hektar luas lahan panen akan menaikkan produksi padi sebesar 5,9978 ton, setiap kenaikan satu milimeter kubik curah hujan akan menurunkan produksi padi sebesar 31,69 ton, dan setiap kenaikan satu ton jumlah pupuk akan menurunkan produksi padi sebesar 0,4828 ton. 6
4.6. Uji simultan F dan uji parsial t. Uji hipotesis simultan digunakan untuk mengetahui apakah ada variabel independen mempunyai pengaruh signifikan terhadap model. Hipotesis H : β = β = β = 0 (semua variabel independen tidak berpengaruh secara signifikan terhadap model) dan H : β β β 0 (paling tidak ada satu variabel independen yang berpengaruh signifikan terhadap model). Keputusan uji H ditolak apabila F > F (.,,) = 2.975. Hasil pengujian diperoleh F untuk model estimasi S sebesar 1965.01 sedangkan untuk F model estimasi LTS sebesar 9681.07, karena nilai F > F (.,,) = 2.975 maka H ditolak yang berarti bahwa paling tidak ada satu variabel independen yang berpengaruh signifikan terhadap model. Selanjutnya akan diuji parsial untuk mengetahui variabel independen yang mempunyai pengaruh signifikan terhadap produksi padi. Hipotesis H : β = 0, i = 1,2,3 (variabel independen tidak berpengaruh secara signifikan terhadap model) dan H : β 0, i = 1,2,3 (variabel independen berpengaruh signifikan terhadap model). Kriteria pengambilan keputusan H ditolak apabila nilai t > t (.;) = 4.3027. Hasil pengujian ditunjukkan pada Tabel 1 Tabel 1 Hasil uji t pada parameter regresi robust estimasi S dan estimasi LTS Estimasi Variabel t Kesimpulan Luas lahan panen 49.84 Signifikan Estimasi S Curah hujan 0.77 Tidak Signifikan Jumlah pupuk 0.96 Tidak Signifikan Luas lahan panen 97.93 Signifikan Estimasi LTS Curah hujan 2.03 Tidak Signifikan Jumlah pupuk 1.36 Tidak Signifikan Berdasarkan Tabel 1 diperoleh kesimpulan bahwa variabel luas lahan panen (X ) berpengaruh secara signifikan terhadap model sedangkan variabel curah hujan (X ) dan jumlah pupuk (X ) tidak berpengaruh secara signifikan terhadap model baik pada estimasi S maupun pada estimasi LTS. 4.7. Efisiensi. Efisiensi suatu estimasi diperlukan untuk mengetahui bahwa estimasi tersebut merupakan yang terbaik yaitu estimasi dengan MSE(β) terkecil. Nilai MSEβ dari estimasi S yakni sebesar 42560473.5848, Nilai MSE(β ) dari 7
estimasi LTS yakni sebesar 78935654.7944, sehingga efisiensi dapat diperoleh sebesar effβ, β = 1,85647. Dengan demikian produksi padi di Provinsi Jawa Tengah tahun 2015, estimasi S lebih efisien dibanding estimasi LTS. Hal ini dapat dilihat dari nilai effβ, β = 1,85647 > 1. 5. KESIMPULAN Efisiensi estimasi S terhadap estimasi LTS pada produksi padi di Provinsi Jawa Tengah tahun 2015 adalah 1,85647. Hasil ini menjelaskan bahwa estimasi S lebih efisien dibandingkan estimasi LTS karena nilai effβ, β = 1,85647 > 1. Dengan demikian model yang tepat digunakan untuk produksi padi di Jawa Tengah tahun 2015 adalah model estimasi S, yaitu Y = 3110,30 + 6,6366 X 41,314 X 0,2874 X. DAFTAR PUSTAKA [1] Badan Pusat Statistik. https://www.jateng.bps.go.id/ (diakses tanggal 20 Juli 2016) [2] Balai Pengkajian Teknologi Pertanian Jawa Tengah http://jateng.litbang.pertanian.go.id/ind/images/artikel/kem.pangan4 (diakses tanggal 9 Oktober 2016) [3] Dinas Pertanian Tanaman Pangan dan Holtikultura. http://dinpertantph.jatengprov.go.id/data/ (diakses tanggal 8 Agustus 2016) [4] Drapper, N.R dan Smith, H., 1998, Applied Regression Analysis, John Wiley and Sons, Inc., New York. [5] Montgomery, D.C. and Peck, E.A, 2006, Introduction to Linier Regression Analysis, John Wiley and Sons, New York. [6] Musafirah, 2012, Perbandingan Metode Robust Least Trimmed Squares Dengan Metode Scale Dalam Mengestimasi Parameter Regresi Linear Untuk Data Yang Mengandung Pencilan, Universitas Hasanudin, Makassar. [7] Wijayanti, Lisa Unik, 2015, Analisis Perbandingan Regresi Robust Estimasi-M Huber dan Estimasi-S Dalam Mengatasi Outlier. Universitas Negeri Yogyakarta, Yogyakarta. [8] Wulandari, Sri., 2013, Perbandingan Metode Least Trimmed Squares Dan Penaksir M Dalam Mengatassi Permasalahan Data Pencilan, Vol.1, No.1, pp 73-85, Saintia Matematika. 8