Oleh : Fuji Rahayu W (1208 100 043) JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2012
Indonesia sebagai negara maritim Penduduk Indonesia banyak yang menggantungkan hidupnya pada sektor perikanan Metode regresi utk memodelkan jumlah produksi ikan laut di Jatim Meningkatkan jumlah produksi ikan laut melalui pemilihan variabel kendali yang tepat
Rumusan Masalah 1. Bagaimana bentuk persamaan model regresi untuk jumlah penangkapan ikan laut di Provinsi Jawa Timur. 2. Bagaimana model regresi yang terbentuk dari variabel bebas terhadap variabel respon.
Batasan massalah dalam Tugas Akhir ini adalah : 1. Variabel responnya adalah jumlah penangkapan ikan di perairan laut (Y) dan variabel bebasnya adalah jumlah nelayan (X1), jumlah motor boat penangkap ikan (X2), jumlah alat penangkapan ikan (X3) dan jumlah PDRB nelayan (X4). 2. Data stastistik yang diambil adalah data tahunan tentang perikanan di Provinsi Jawa Timur dari tahun 1980-2010 berdasarkan Badan Pusat Statistik Provinsi Jawa Timur. 4. Metode yang digunakan adalah Regresi Linier Bertatar Langkah Mundur. 3. Selang kepercayaan yang digunakan adalah 95 %.
Tujuan Penelitian 1. Menentukan model regresi untuk jumlah penangkapan ikan laut di Provinsi Jawa Timur. 2. Menentukan besarnya sumbangan variabel bebas secara keseluruhan terhadap variabel respon dari model regresi yang didapat.
Manfaat yang diharapkan pada tugas akhir ini adalah untuk memberikan informasi mengenai seberapa besar pengaruh variabel bebas terhadap jumlah penangkapan ikan laut di Provinsi Jawa Timur yang diharapkan mempunyai prospek hasil penangkapan ikan yang lebih bagus kedepannya.
2.1 Analisis Regresi Analisis regresi merupakan sebuah alat statistik yang memberikan penjelasan tentang pola hubungan (model) antara dua variabel atau lebih. Dalam analisis regresi, dikenal dua jenis variabel yaitu variabel respon yaitu variabel yang keberadaannya dipengaruhi oleh variabel lainnya dan dinotasikan dengan Y dan variabel bebas yaitu variabel yang bebas yang keberadaannya tidak dipengaruhi oleh variabel lainnya dan dinotasikan dengan X. 2.2 Analisis Regresi Linier Berganda Analisis regresi linier berganda (Multiple Linier Regression) ialah suatu alat analisis dalam ilmu statistik yang berguna untuk mengukur hubungan matematis antara lebih dari dua peubah. Regresi linear berganda juga merupakan regresi dimana variabel terikatnya (Y) dihubungkan atau dijelaskan lebih dari satu variabel, mungkin dua, tiga dan seterusnya variabel bebas. Bentuk umum dari persamaan regresi linier berganda dapat ditulis sebagai berikut: Y = 0 + 1 X 1i + 2 X 2i +.. + k X ki + i ; i = 1,2,, n dengan : Y β 0, β 1...β k X 1i, X 2i.. X ki εi k : variabel respon : parameter regresi : variabel bebas : error : banyaknya parameter
2.3 Regresi Bertatar Metode regresi bertatar umumnya dipakai sebagai pemilihan model terbaik apabila antar variabel bebasnya mengalami multikolinieritas karena dengan metode bertatar ini dapat menghilangkan variabel yang mempunyai multikolinieritas tinggi. Metode begresi bertatar langkah mundur (backward selection) mencoba memeriksa hanya regresi terbaik yang mengandung sejumlah tertentu peubah peramal. Metode ini bekerja dengan mengeluarkan satu per satu variabel bebas yang tidak signifikan dan dilakukan terus menerus sampai tidak ada variabel bebas yang tidak signifikan, langkah-langkah metode backward adalah sebagai berikut : 1. Menghitung persamaan regresi yang mengandung semua peubah peramal. 2. Menghitung nilai F-parsial untuk setiap peubah peramal. 3. Membandingkan nilai F-parsial terendah, misalnya F L, dengan nilai F bertaraf nyata tertentu dari tabel, misalnya F 0. a. Jika F L < F 0, buang peubah Z L yang menghasilkan F L dari persamaan regresi, kemudian hitung kembali persamaan regresi tanpa menyertakan peubah tersebut; kembali ke langkah (2). b. Jika F L > F 0, ambillah persamaan regresi tersebut.
2.4 Pengujian Parameter Regresi 1. Uji serentak Uji serentak bertujuan untuk menguji apakah antara variabel-variabel bebas X dan terikat Y benar-benar terdapat hubungan linier (linear relation). Hipotesa : H 0 : β i = 0, dimana i = 1,2,3,4,...k H 1 : ada i dimana β i 0, dimana i = 1,2,3,4,...k Statistik Uji : F F hitung hitung MSR SSReg/k MSR SSReg/k MSE SSRes/(n k 1) MSE SSRes/(n k 1) Kriteria Pengujian : Tolak Ho jika F hitung > F Tabel (α, p, n- p-1 ). 2. Uji Individu Dalam pengujian ini ingin diketahui apakah jika secara terpisah, suatu variabel X masih memberikan kontribusi secara signifikan terhadap variabel terikat Y. Hipotesa : H 0 : βi = 0 H 1 : βi 0 Statistik Uji : ˆ j bj thitung s. e( ˆ ) s( bj ) j jika t hitung > t tabel (n-p), maka tolak H 0
2.5 Uji Asumsi Residual Karena model regresi yang dibentuk didasarkan dengan meminimumkan jumlah kuadrat error, maka residual (sisaan) yang dalam hal ini dianggap sebagai suatu kesalahan dari pengukuran harus memenuhi beberapa asumsi, diantarannya : Identik : memiliki varian yang konstan Bebas (saling bebas) : tidak ada autokorelasi antar residual Berdistribusi Normal a 1. Uji Identik (Heteroscedasticitas) Hipotesa : Statustik uji : Kriteria pengujian: Apabila nilai F hitung < F Tabel, maka H 0 diterima atau residual tidak terdapat heterokedastisitas. i 0 1X1 2X 2... nx n
2. Uji Asumsi Independen Hipotesa : Statistik uji Durbin-Watson : d n e e t t n t 2 et t 1 2 1 2 Kriteria pengujian : Ho: tak ada otokorelasi positif Bila: d < dl : tolak Ho, d >du : terima Ho, dl d du : tak dapat disimpulkan Ho: tak ada otokorelasi positif dan negatif Bila: d < dl atau d > 4- dl : tolak Ho, du<d<4-du : terima Ho, dl d du atau4-du d 4-dL : tak dapat disimpulkan Ho: tak ada otokorelasi negatif Bila: d >4 - dl : tolak Ho, d<4-du : terima Ho, 4-dU d 4-dL : tak dapat disimpulkan
3. Uji Asumsi Distribusi Normal Uji asumsi distribusi normal adalah untuk melihat apakah nilai residual terdistribusi normal atau tidak. Model regresi yang baik adalah memiliki nilai residual yang terdistribusi normal. Jadi uji normalitas bukan dilakukan pada masing-masing variabel tetapi pada nilai residualnya. 4. Uji Multikolinieritas Multikolinearitas merupakan korelasi atau hubungan yang kuat diantara variabelvariabel bebas dalam persamaan regresi linear berganda. Multikolinearitas terjadi jika nilai Variance Inflation Factor (VIF) lebih besar dari 10.
Metodologi Penelitian Pengumpulan Data Metode penelitian Penarikan kesimpulan Penyusunan laporan Dalam Tugas Akhir ini, data di ambil dari Badan Pusat Statistik Provinsi Jawa Timur. Data stastistik yang diambil adalah data tahunan tentang perikanan di Provinsi Jawa Timur dari tahun 1980-2010. Langkah1: Memeriksa asumsi Langkah 2: Mengolah data dengan bantuan Minitab 15 Langkah 3: Menafsirkan output Langkah4:Mengembangkan persamaan model
Analisis dan Pembahasan 4.1 Analisis Regresi Dengan menggunakan program aplikasi MINITAB diperoleh hasil output komputer sebagai berikut: Tabel 4.1 Hasil Printout Analisis Regresi Y terhadap X 1, X 2, X 3, X 4 The regression equation is Y = 168109 + 0,554 X1-2,4 X2-4,68 X3 + 0,0137 X4 Predictor Coef SE Coef T P VIF Constant 168109 118997 1,41 0,170 X1 0,5539 0,5890 0,94 0,356 2,829 X2-2,42 10,58-0,23 0,821 18,364 X3-4,678 3,040-1,54 0,136 2,139 X4 0,01365 0,01092 1,25 0,222 21,074 S = 60074,9 R-Sq = 70,6% R-Sq(adj) = 66,1% Analysis of Variance Source DF SS MS F P Regression 4 2,25770E+11 56442424985 15,64 0,000 Residual Error 26 93833719809 3608989223 Total 30 3,19603E+11 Durbin-Watson statistic = 1,48237
Dari hasil pengolahan data minitab pada Tabel 4.1 diperoleh suatu model parameter regresi dengan metode kuadrat terkecil dan persamaan regresinya sebagai berikut: Y i = 168109 + 0,554X 1i - 2,4X 2i - 4,68X 3i + 0,0137X 4i + ε i Setelah dilakukan pengujian parameter untuk uji serentak, didapat bahwa = 15,6393 > F tabel (5%,4,26) = 2,74 atau nilai p-value = 0.000 < = 0.05. Yang berarti secara statistik signifikan, maka H 0 ditolak sehingga dapat disimpulkan bahwa secara bersama-sama terdapat pengaruh variabel X 1, X 2, X 3 dan X 4 terhadap variabel Y. Sedangkan untuk uji individu didapat berdasarkan hasil output diperoleh bahwa koefisien regresi dari masing-masing X 1, X 2, X 3, dan X 4 tidak signifikan karena nilai t hitung dari masingmasing koefisiennya lebih kecil daripada t tabel, sehingga H o diterima. Maka dapat disimpulkan bahwa koefisien regresi variabel X 1, X 2, X 3, dan X 4 yang bersesuaian dengan parameter regresi secara individual tidak memberikan pengaruh yang berarti terhadap model.
3.2 Uji Asumsi Residual a. Uji Identik (Heteroscedasticitas). Dari hasil pengolahan diperoleh F hitung = 3,25 > F tabel (5%,4,26) ditolak, maka dapat disimpulkan bahwa terjadi heteroskedastisitas. = 2,74, dengan demikian H o b. Independen (Autokorelasi) Secara umum, pengujian autokorelasi dapat menggunakan plot ACF seperti pada Gambar 1. Jika tidak ada lag yang keluar dari garis merah, maka dapat disimpulkan bahwa tidak terdapat korelasi antar variabelnya. c.uji Normalitas Hasil minitab pada Gambar 2 menggunakan test Kolmogorov Smirnov menunjukkan p- value < 0,150 maka H 0 ditolak, jadi residual tidak memenuhi asumsi normal. d. Multikolinearitas Dari hasil Analisis multikolinearitas menggunakan minitab pada Tabel 1 ditemukan nilai VIF yang lebih besar dari 10 yaitu variabel X 2 dan X 4 sehingga diduga ada multikolinearitas antar variabel bebas tersebut.
Gambar 1. Plot ACF residual 1 Gambar 2. Uji Normalits residual 1
3.3 Perbaikan Model Dari model yang didapat sebelumnya, masih terdapat heterokedastisitas dan multikolenieritas serta residualnya belum berdistribusi normal. Oleh karena itu, antar variabel bebasnya perlu diadakan tinjauan ulang terhadap model tersebut dengan melakukan transformasi terhadap semua variabelnya, yaitu variabel Y, X 1, X 2, X 3 dan X 4 dengan menggunakan transformasi Box-Cox.. Untuk selanjutnya, semua variabel yang sudah ditransformasi diberi lambang Y*, X 1 *, X 2 *, X 3 * dan X 4*. dengan : Y* mempunyai nilai X 1 * mempunyai nilai (X 1 ) 2 X 2 * mempunyai nilai In X 2 X 3 * mempunyai nilai In X 3 X 4 * mempunyai nilai (X 4 ) 0,18
Setelah dilakukan transformasi dengan menggunakan Box-Cox didapat persamaan regresinya, yaitu : Y* = 11,1-0,000000 X 1 * - 0,339 X 2 * - 0,199 X 3 * - 0,209 X 4 * Selajutnya dari hasil transformasi semua variabelnya dilakukan analisis regresi dengan metode bertatar seleksi langkah mundur untuk mengatasi kasus multikolinieritas dan uji asumsi normalnya. Secara umum, pengolahan metode analisis regresi seleksi bertatar langkah mundur dapat dilihat pada Tabel 2. Dari pengolahan tersebut didapat persamaan model regresinya adalah sebagai berikut : Y i * = 8,40-0,330 X 4i * + ε i
Tabel 2 Hasil Printout Analisis Regresi Metode Seleksi bertatar Langkah Mundur Backward elimination. Alpha-to-Remove: 0,05 Response is Y* on 4 predictors, with N = 31 Step 1 2 3 4 Constant 11,120 10,978 8,907 8,397 X1* -0,00000 T-Value -0,18 P-Value 0,859 X2* -0,34-0,35-0,28 T-Value -1,02-1,09-1,02 P-Value 0,316 0,286 0,318 X3* -0,20-0,19 T-Value -0,46-0,44 P-Value 0,650 0,661 X4* -0,209-0,211-0,220-0,330 T-Value -1,77-1,83-1,96-11,51 P-Value 0,089 0,078 0,060 0,000 S 0,680 0,668 0,658 0,658 R-Sq 82,84 82,82 82,69 82,05 R-Sq(adj) 80,20 80,91 81,46 81,43 Mallows Cp 5,0 3,0 1,2 0,2
Setelah dilakukan semua asumsi uji residual ternyata masih ada autokorlasi. Untuk mengatasi autokorelasi tersebut, maka dilakukan lag satu kali pada variabel Y*. Kemudian, variabel Y* yang sudah mengalami lag tersebut dimasukkan sebagai variabel bebasnya. Yang diregresikan dengan X 4 * dengan variabel responya adalah Y* seperti pada Tabel 3. Tabel 3. Hasil printout Analisis Regresi Yi* dengan variabel X 4* dan Y i-1 The regression equation is Y* = 5,55-0,228 X4* + 0,371 Y* (i-1) 30 cases used, 1 cases contain missing values Predictor Coef SE Coef T P VIF Constant 5,553 1,321 4,20 0,000 X4* -0,22760 0,05703-3,99 0,000 4,373 Y* (i-1) 0,3712 0,1581 2,35 0,026 4,373 S = 0,594065 R-Sq = 86,0% R-Sq(adj) = 85,0%
adalah : Karena semua asumsi residual terpenuhi, maka model yang digunakan Y i * = 5,55-0,228 X 4i * + 0,371 Y i-1 * dengan : Y i * adalah X 4i * adalah (X 4i ) 0,18
Untuk selanjutnya, akan dibahas kasus multikolinieritas. Pada pembahasan sebelumnya, ditemukan adanya kasus multikolinieritas antara variabel X 2 * dan X 4 * sebelum dilakukan proses seleksi bertatar. Multikolinearitas ditandai dengan tingginya nilai koefisien determinasi R 2 jika antar variabel tersebut di regresikan. Hasil pengolahan minitab antara variabel X 2 * dan X 4 * dapat dilihat pada Tabel 4.15. Dapat dilihat pada Tabel 4.15 tersebut bahwa R 2 yang didapat sangat besar yaitu 93,5 %. Sekarang akan dicoba memasukkan variabel X 2 * dalam model yang dapat dilihat pada Tabel 4.16. Dari pengolahan minitab didapat persamaan model regresinya adalah sebagai berikut : Y* = 5,88-0,502 X 2 * + 0,430 Y* (i-i) + ε i (5) dengan : Y i * adalah X 2 * mempunyai nilai In X 2
Selanjutnya dari persamaan (5) juga akan dilakukan uji asumsi residual untuk melihat apakah model tersebut benar-benar signifikan atau tidak. Jika model tersebut memenuhi semua asumsi residualnya, tidak menutup kemungkinan model tersebut juga bisa dipakai. Tabel 4.15 Hasil Analisis Regresi variabel X 4 * terhadap X 2 * The regression equation is X2* = 1,83 + 0,396 X4* Predictor Coef SE Coef T P VIF Constant 1,8331 0,2519 7,28 0,000 X4* 0,39632 0,01942 20,41 0,000 1,000 S = 0,445915 R-Sq = 93,5% R-Sq(adj) = 93,3% Analysis of Variance Source DF SS MS F P Regression 1 82,823 82,823 416,53 0,000 Residual Error 29 5,766 0,199 Total 30 88,590
Uji Asumsi Residual a. Uji Identik (Heteroscedasticitas). Dari hasil pengolahan diperoleh F hitung = 2,08 < F tabel (5%,2,28) = 3,34, dengan demikian H o diterima, maka dapat disimpulkan bahwa tidak terjadi heteroskedastisitas. b. Independen (Autokorelasi) Secara umum, pengujian autokorelasi dapat menggunakan plot ACF seperti pada Gambar 4.18. Jika tidak ada lag yang keluar dari garis merah, maka dapat disimpulkan bahwa tidak terdapat korelasi antar variabelnya. c.uji Normalitas Hasil minitab pada Gambar 4.19 menggunakan test Kolmogorov Smirnov menunjukkan p- value < 0, 05 maka H 0 diterima, jadi residual memenuhi asumsi normal. d. Multikolinearitas Dari hasil Analisis multikolinearitas menggunakan minitab pada Tabel 4.16 ditemukan nilai VIF yang kurang dari dari 10 sehingga disimpulkan bahwa tidak ada multikolinearitas antar variabel bebas.
IV. PENUTUP Dari hasil analisa model yang terbentuk, didapatkan kesimpulan sebagai berikut : Model terbaik penangkapan ikan laut di Provinsi Jawa Timur tahun 1980-2010 setelah dilakukan pemilihan model terbaik berdasarkan kriteria yang ada dengan metode regresi linier bertatar langkah mundur adalah sebagai berikut : dengan : Y* = 5,88-0,502 X 2 * + 0,430 Y* (i-i) + ε i Y i * adalah X 2 * mempunyai nilai In X 2 Besar sumbangan variabel bebasn terhadap variabel responnya adalah 85,2%.