Algoritme Least Angle Regression untuk Model Geographically Weighted Least Absolute Shrinkage and Selection Operator

dokumen-dokumen yang mirip
BAB III GEOGRAPHICALLY WEIGHTED REGRESSION (GWR)

BAB I PENDAHULUAN. Dalam bab ini akan dibahas mengenai hal-hal yang melatarbelakangi

MODEL REGRESI MENGGUNAKAN LEAST ABSOLUTE SHRINKAGE AND SELECTION OPERATOR (LASSO) PADA DATA BANYAKNYA GIZI BURUK KABUPATEN/KOTA DI JAWA TENGAH

ANALISIS GEOGRAPHICALLY WEIGHTED REGRESSION (GWR) DENGAN PEMBOBOT KERNEL GAUSSIAN UNTUK DATA KEMISKINAN. Rita Rahmawati 1, Anik Djuraidah 2.

BAB II TINJAUAN PUSTAKA

MODEL REGRESI TERBOBOTI GEOGRAFIS DENGAN FUNGSI PEMBOBOT KERNEL GAUSSIAN, BISQUARE, DAN TRICUBE PADA PERSENTASE KEMISKINAN DI PROVINSI JAWA TENGAH

BAB III MIXED GEOGRAPHICALLY WEIGHTED REGRESSION (MGWR)

BAB II TINJAUAN PUSTAKA

S - 17 MODEL GEOGRAPHICALLY WEIGHTED REGRESSION PENDERITA DIARE DI PROVINSI JAWA TENGAH DENGAN FUNGSI PEMBOBOT KERNEL BISQUARE

: Persentase Penduduk Dengan Sumber Air Minum Terlindungi PDAM : Pengeluaran Perkapita Penduduk Untuk Makan Sebulan

Informasi Fisher pada Algoritme Fisher Scoring untuk Estimasi Parameter Model Regresi Logistik Ordinal Terboboti Geografis (RLOTG)

PERBANDINGAN MODEL GWR DENGAN FIXED DAN ADAPTIVE BANDWIDTH UNTUK PERSENTASE PENDUDUK MISKIN DI JAWA TENGAH

BAB III MODEL GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION SEMIPARAMETRIC (GWLRS)

PEMODELAN PENDAPATAN ASLI DAERAH (PAD) DI KABUPATEN DAN KOTA DI JAWA TENGAH MENGGUNAKAN GEOGRAPHICALLY WEIGHTED RIDGE REGRESSION ABSTRACT

Perturbasi Nilai Eigen dalam Mengatasi Multikolinearitas

Kata Kunci : MGWMLM, GWMLM, DAS.

GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENT ANALYSIS (GWRPCA) PADA PEMODELAN PENDAPATAN ASLI DAERAH DI JAWA TENGAH

PEMODELAN PERTUMBUHAN EKONOMI JAWA TENGAH MENGGUNAKAN PENDEKATAN LEAST ABSOLUTE SHRINKAGE AND SELECTION OPERATOR (LASSO)

PEMODELAN PENDAPATAN ASLI DAERAH (PAD) DI KABUPATEN DAN KOTA DI JAWA TENGAH MENGGUNAKAN GEOGRAPHICALLY WEIGHTED RIDGE REGRESSION

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 3, Tahun 2014, Halaman Online di:

GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENT ANALYSIS (GWRPCA) PADA PEMODELAN PENDAPATAN ASLI DAERAH DI JAWA TENGAH ABSTRACT

PENERAPAN METODE REGRESI GULUD DAN REGRESI KOMPONEN UTAMA DALAM MENGATASI PENYIMPANGAN MULTIKOLINEARITAS PADA ANALISIS REGRESI LINEAR BERGANDA

BAB III REGRESI SPASIAL DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED POISSON REGRESSION (GWPR)

Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya September 2017, Samarinda, Indonesia ISBN:

Teknik Ensemble dengan Additive Noise pada Estimasi Parameter Model Autoregressive Spasial

PENERAPAN REGRESI GULUD DAN LEAST ABSOLUTE SHRINKAGE AND SELECTION OPERATOR (LASSO) DALAM PENYUSUTAN KOEFISIEN REGRESI ARUM PUSPORINI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Atiya Maulani, 2013

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

1. PENDAHULUAN PADA PRODUKSI JAGUNG DI JAWA TENGAH

PEMODELAN KEMISKINAN MENGGUNAKAN GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION DENGAN FUNGSI PEMBOBOT FIXED KERNEL

PEMODELAN PERSENTASE BALITA GIZI BURUK DI JAWA TENGAH DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENTS ANALYSIS (GWRPCA)

REGRESI LINIER BERGANDA

ISSN: Vol. 1 No. 1 Agustus 2012

PENDEKATAN MIXED GEOGRAPHICALLY WEIGHTED REGRESSION UNTUK PEMODELAN PERTUMBUHAN EKONOMI MENURUT KABUPATEN/KOTA DI JAWA TENGAH HALAMANAN JUDUL SKRIPSI

PEMODELAN DATA KEMISKINAN PROVINSI KALIMANTAN TIMUR DENGAN METODE GEOGRAPHICALLY WEIGHTED REGRESSION (GWR) DENGAN FUNGSI PEMBOBOT KERNEL BISQUARE

PEMODELAN PROPORSI PENDUDUK MISKIN KABUPATEN DAN KOTA DI PROVINSI JAWA TENGAH MENGGUNAKAN GEOGRAPHICALLY AND TEMPORALLY WEIGHTED REGRESSION ABSTRACT

BAB II TINJAUAN PUSTAKA. Dalam bab ini dibahas tentang matriks, metode pengganda Lagrange, regresi

PEMODELAN ANGKA KEMATIAN BAYI DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED POISSON REGRESSION DI PROVINSI BALI

EFISIENSI ESTIMASI SCALE (S) TERHADAP ESTIMASI LEAST TRIMMED SQUARES (LTS) PADA PRODUKSI PADI DI PROVINSI JAWA TENGAH

Bab 2 LANDASAN TEORI

KAJIAN METODE LEAST ABSOLUTE SELECTION AND SHRINKAGE OPERATOR (LASSO) PADA DATA YANG MENGANDUNG HETEROSKEDASTISITAS MEIRA MAWATI

Estimasi Parameter pada Regresi Spatial Error Model (SEM) yang Memuat Outlier menggunakan Iterative Z Algorithm

(R.5) Pemodelan Regresi Poisson Terboboti Geografis Pada Kasus Gizi. buruk di Jawa Timur.

Prosiding Seminar Nasional Hasil-Hasil PPM IPB 2016 Hal : 1 7 ISBN :

Pemodelan Angka Harapan Hidup di Papua dengan pendekatan Geographically Weighted Regression

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. banyak diterapkan pada berbagai bidang sebagai dasar bagi pengambilan

MODEL REGRESI MENGGUNAKAN LEAST ABSOLUTE SHRINKAGE AND SELECTION OPERATOR (LASSO) PADA DATA BANYAKNYA PENDERITA GIZI BURUK

Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas

PEMODELAN PROPORSI PENDUDUK MISKIN KABUPATEN DAN KOTA DI PROVINSI JAWA TENGAH MENGGUNAKAN GEOGRAPHICALLY AND TEMPORALLY WEIGHTED REGRESSION

PENERAPAN METODE GENERALIZED RIDGE REGRESSION DALAM MENGATASI MASALAH MULTIKOLINEARITAS

PEMODELAN PERSENTASE BALITA GIZI BURUK DI JAWA TENGAH DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENTS ANALYSIS (GWRPCA)

Kata kunci: Data Spatial, Heterogenitas Spatial, Geographically Weigthed Regression, Bandwidth, Fungsi Pembobot

Forum Statistika dan Komputasi, Oktober 2010 p : ISSN :

METODE REGRESI KOMPONEN UTAMA, REGRESI KUADRAT TERKECIL PARSIAL, DAN LASSO PADA DATA KEMISKINAN HASIL OLAHAN SUSENAS 2012 NURHAYATI

BAB IV HASIL DAN PEMBAHASAN

ESTIMASI EROR STANDAR PARAMETER REGRESI LOGISTIK MENGGUNAKAN METODE BOOTSTRAP

BAB I PENDAHULUAN. Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan

BAB I PENDAHULUAN. terus dihadapi di sejumlah daerah di Indonesia, tidak terkecuali Provinsi Sumatera

SIMULASI DAMPAK MULTIKOLINEARITAS PADA KONDISI PENYIMPANGAN ASUMSI NORMALITAS

BAB I PENDAHULUAN. dependen disebut dengan regresi linear sederhana, sedangkan model regresi linear

FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS)

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Kata kunci: Geographically Weighted Regression, Gauss Kernel, bandwidth, cross validation

PEMILIHAN MODEL REGRESI LINIER DENGAN BOOTSTRAP. Tarno. Jurusan Matematika FMIPA UNDIP Semarang. Subanar Jurusan Matematika FMIPA UGM Yogyakarta

BAB 2 TINJAUAN PUSTAKA

ESTIMASI PARAMETER SISTEM MODEL PERSAMAAN SIMULTAN PADA DATA PANEL DINAMIS DENGAN GMM ARELLANO DAN BOND

LEAST SQUARE AND RIDGE REGRESSION ESTIMATION ABSTRAK ( ) = ( + ) Kata kunci: regresi linear ganda, multikolinearitas, regresi gulud.

Jl. Ir. M. Putuhena, Kampus Unpatti, Poka-Ambon ABSTRAK

BAB II KAJIAN PUSTAKA. dicatat, atau diobservasi sepanjang waktu secara berurutan. Periode waktu dapat

III. METODE PENELITIAN. Ruang lingkup penelitian ini bertujuan untuk menganalisis pengaruh Upah

PEMODELAN BANYAKNYA PENDERITA DEMAM BERDARAH DENGUE (DBD) DI KOTA SURAKARTA DENGAN MIXED GEOGRAPHICALLY WEIGHTED REGRESSION (MGWR)

PEMODELAN DATA KEMISKINAN DI PROVINSI SUMATERA UTARA DENGAN METODE GEOGRAPHICALLY WEIGHTED REGRESSION

PERTURBASI NILAI EIGEN DALAM MENGATASI MULTIKOLINIERITAS

PEMODELAN UPAH MINIMUM KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHINYA MENGGUNAKAN REGRESI RIDGE

PEMODELAN JUMLAH ANAK PUTUS SEKOLAH DI PROVINSI BALI DENGAN PENDEKATAN SEMI-PARAMETRIC GEOGRAPHICALLY WEIGHTED POISSON REGRESSION

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

REGRESI BEDA DAN REGRESI RIDGE Ria Dhea Layla N.K 1, Febti Eka P. 2 1)

PENERAPAN METODE LASSO DALAM PENENTUAN PENGARUH UTAMA DAN INTERAKSI YANG SIGNIFIKAN PADA HASIL PERCOBAAN FAKTORIAL PECAHAN BENNY ROBBY KURNIAWAN

PERBANDINGAN ANALISIS LEAST ABSOLUTE SHRINKAGE AND SELECTION OPERATOR DAN PARTIAL LEAST SQUARES (Studi Kasus: Data Microarray)

Kematian wanita saat melahirkan dan saat 42 hari setelah melahirkan bukan dikarenakan kecelakaan

PEMODELAN REGRESI KOMPONEN UTAMA DAN LASSO TERBOBOTI GEOGRAFIS (GLOBAL DAN LOKAL)

PEMODELAN RISIKO PENYAKIT PNEUMONIA PADA BALITA DI PROVINSI JAWA TIMUR DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION

PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN

ANALISIS REGRESI KUANTIL

BAB II LANDASAN TEORI

= parameter regresi = variabel gangguan Model persamaan regresi linier pada persamaan (2.2) dapat dinyatakan dalam bentuk matriks berikut:

Estimasi Interval Kepercayaan Bootstrap pada Parameter Regresi Komponen Utama

ESTIMASI PARAMETER MODEL REGRESI LOGISTIK ORDINAL TERBOBOTI GEOGRAFIS (RLOTG) DENGAN METODE FISHER SCORING

MASALAH NILAI AWAL ITERASI NEWTON RAPHSON UNTUK ESTIMASI PARAMETER MODEL REGRESI LOGISTIK ORDINAL TERBOBOTI GEOGRAFIS (RLOTG)

BAB II LANDASAN TEORI. Data merupakan bentuk jamak dari datum. Data merupakan sekumpulan

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB III METODOLOGI PENELITIAN. Penelitian ini dilakukan di Bursa Efek Indonesia melalui situs

PEMODELAN FIXED EFFECT GEOGRAPHICALLY WEIGHTED PANEL REGRESSION UNTUK INDEKS PEMBANGUNAN MANUSIA DI JAWA TENGAH

BAB II LANDASAN TEORI. : Ukuran sampel telah memenuhi syarat. : Ukuran sampel belum memenuhi syarat

PROSIDING SEMINAR NASIONAL STATISTIKA UNIVERSITAS DIPONEGORO 2011 ISBN:

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI LAJU PERTUMBUHAN PENDUDUK KOTA SEMARANG TAHUN 2011 MENGGUNAKAN GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION

Transkripsi:

SEMINAR MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2017 Algoritme Least Angle Regression untuk Model Geographically Weighted Least Absolute Shrinkage and Selection Operator S-20 Yuliana 1, Dewi Retno Sari Saputro 2 Program Studi Matematika FMIPA Universitas Sebelas Maret 1,2 anayuli620@gmail.com Abstrak Data spasial merupakan data yang berorientasi geografis, permasalahan yang sering ditemukan pada data spasial adalah variansi yang tidak selalu homogen pada setiap lokasi pengamatan atau terjadi heterogenitas spasial. Terkait hal tersebut, model yang dapat digunakan untuk mengatasi terjadinya heterogenitas spasial adalah model geographically weighted regression (GWR). Permasalahan lain yang mungkin muncul adalah adanya hubungan antar variabel prediktor yang disebut sebagai multikolinieritas. Terdapat beberapa metode untuk mengatasi masalah multikolinieritas ini, terutama multikolinearitas lokal, salah satunya dengan metode least absolute shrinkage and selection operator (LASSO). Model yang dikonstruksi dengan GWR dan LASSO disebut sebagai model geografically weighted LASSO (GW- LASSO). Metode LASSO melakukan estimasi pada parameter model GWR dengan meminimumkan jumlah kuadrat eror terhadap kendala. Karena kendala tersebut adalah fungsi penalized log partial likelihood yang sulit ditentukan penyelesaiannya, digunakan algoritme least angle regression (LARS). LARS merupakan metode klasik yang berkaitan dengan metode pemilihan model yang dahulu dikenal dengan nama forward selection atau forward stepwise regression. Pada paper ini dilakukan kajian tentang algoritme LARS. hubukata kunci: GWR, GWL, heterogenitas spasial, LASSO, multikolinieritas I. PENDAHULUAN Model regresi linier merupakan model yang menjelaskan hubungan antara variabel respon dengan satu atau lebih variabel prediktor. Melihat hubungan antarvariabel pada data spasial dapat digunakan model regresi spasial yang merupakan hasil pengembangan dari model regresi linier. Data spasial merupakan data yang berkaitan dengan lokasi, berdasarkan geografi yang terdiri atas lintang-bujur dan wilayah. Pemodelan data spasial seringkali bergantung pada lokasi yang berdekatan (neighborhood) sehingga menimbulkan adanya pengaruh spasial antar wilayah. Hukum pertama tentang geografi yang dikemukakan W Tobler s menyatakan bahwa semakin dekat suatu lokasi maka pengaruhnya akan semakin besar. Hubungan tersebut dinamakan efek spasial yaitu terkait dengan perbedaan karakteristik lingkungan dan geografis antar lokasi pengamatan sehingga masing-masing pengamatan kemungkinan memilki variasi yang berbeda. Efek spasial ini disebut sebagai heterogenitas spasial. Model yang dapat mengatasi heterogenitas spasial yaitu Geographically Weighted Regression (GWR). Geographically weighted regression merupakan salah satu pengembangan model regresi linier yang digunakan untuk mengatasi masalah heterogenitas spasial yang disebabkan kondisi lokasi yang satu dengan lokasi yang lain tidak sama. Estimasi parameter pada GWR dilakukan dengan menggunakan metode kuadarat terkecil terboboti atau weighted least square (WLS), yaitu metode kuadrat terkecil dengan memberikan pembobot yang berbeda pada setiap lokasi pengamatan [1]. Matriks pembobot dapat ditentukan dengan menggunakan fungsi kernel. Salah satunya yaitu fungsi kernel bi-square yang memberikan pembobot sesuai bandwidth optimum yang nilainya diperoleh dari cross validation (CV). Selain heterogenitas spasial, masalah lain yang mungkin muncul pada variabel prediktor lebih dari satu adalah multikolinieritas. Multikolinieritas merupakan kondisi terdapatnya korelasi antara variabel prediktor. Hal ini mengakibatkan hasil estimasi parameter memiliki variansi yang besar [2]. Dalam kasus ini GWR tidak dapat mengatasi masalah multikolinieritas. Terdapat beberapa metode untuk mengatasi masalah multikolinieritas ini salah satunya adalah LASSO. Referensi [3] menyatakan bahwa LASSO melakukan estimasi dengan algoritme LARS yang menyusutkan estimasi parameter sampai ke nol. PS-139

ISBN. 978-602-73403-2-9 (Cetak) 978-602-73403-3-6 (On-line) Metode LASSO yang digabungkan dengan model GWR yang dikenal dengan istilah GW-LASSO merupakan metode yang digunakan untuk mengatasi kasus multikolinieritas lokal sehingga diharapkan dapat diperoleh estimasi parameter yang tidak bias dan efisien [4]. Masalah multikolinearitas pada model GWR dapat diselesaikan dengan beberapa metode, namun setiap metode tersebut memiliki kelebihan maupun kekurangan. Referensi [5] menyatakan bahwa untuk mengatasi multikolinearitas pada model GWR metode LASSO dinilai lebih konsisten meskipun antar variabel prediktor memiliki tingkat multikolinearitas yang tinggi dibandingkan dengan metode Ridge. Dalam penelitian ini dibahas algoritme LARS pada model GW-LASSO untuk mengatasi multikolinearitas pada data spasial sehingga diperoleh estimasi parameter model GWL. II. HASIL DAN PEMBAHASAN Diperlukan landasan teori sebagai landasan algoritme, teori berikut mengacu pada [6]. A. Model Regresi Linier Model regresi linier untuk variabel prediktor secara umum ditulis sebagai dengan merupakan nilai observasi variabel respon ke- ; merupakan nilai intercept model regresi; merupakan koefisien regresi variabel prediktor ke- ; merupakan variabel prediktor ke- pada pengamatan ke- ; : error pada pengamatan ke- dengan asumsi independen, identik, dan berdistribusi normal dengan mean ( ) bernilai nol dan variansi ( ) konstan. B. Geographically Weighted Regression (GWR) Model GWR pertama kali diperkenalkan oleh Fotheringham pada tahun 1967 yang merupakan pengembangan dari model regresi linier. GWR digunakan untuk mengatasi masalah heterogenitas spasial yang disebabkan kondisi lokasi yang satu dengan lokasi yang lain tidak sama. Nilai parameter dihitung pada setiap titik lokasi geografis sehingga nilai parameter dari masing-masing wilayah berbeda. Model dari GWR dapat dituliskan (1) dengan adalah variabel respon pada lokasi ke- ; merupakan nilai intersep model GWR; merupakan parameter regresi variabel dependen ke- pada lokasi pengamatan ke-, merupakan nilai pengamatan variabel prediktor ke- pada loksi pengamatan ke-, adalah koordinat titik lokasi pengamatan ke- (longitude, latitude) dan sisaan diasumsikan. Parameter regresi pada titik lokasi pengamatan ( ) diestimasi dengan menambahkan pembobot pada persamaan (1) dan meminimumkan jumlah kuadrat erornya seperti pada estimasi parameter regresi linier klasik dan ditulis sebagai. (2) Misalkan matriks pembobot pada titik lokasi pengamatan ke- adalah W( ), dinyatakan merupakan matriks diagonal dengan setiap elemen diagonalnya adalah pembobot untuk masing-masing titik lokasi pengamatan atau. Persamaan (2) dapat ditulis dalam bentuk matriks (3). Jumlah kuadrat error akan minimum dengan mendiferensialkan Persamaan (3) terhadap PS-140

SEMINAR MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2017 Diperoleh estimasi parameter untuk setiap lokasi adalah sebagai berikut merupakan estimasi parameter yang tak bias, efisien, dan konsisten bagi.. C. Fungsi Pembobot Spasial Metode kuadrat terkecil terboboti atau WLS memberikan pembobot yang berbeda pada setiap titik lokasi pengamatan. Referensi [7] menyatakan bahwa pembobot untuk setiap titik lokasi pengamatan adalah. Pembobot tersebut berupa matriks diagonal dengan elemen-elemen diagonalnya merupakan sebuah fungsi pembobot dari setiap titik lokasi pengamatan. Matriks pembobot dapat ditentukan menggunakan fungsi kernel. Fungsi pembobot dalam penelitian ini menggunakan fungsi kernel bi-square yaitu dengan adalah bandwidth dan adalah jarak euclidean antara titik lokasi pengamatan ke- dengan titik lokasi pengamatan ke-, dan. Metode yang digunakan untuk menentukan bandwidth optimum adalah metode validasi silang atau Cross Validation (CV). Rumus untuk menghitung CV dapat dituliskan sebagai dengan adalah nilai penaksir, dengan pengamatan di titik lokasi pengamatan ke- dihilangkan dari proses penaksiran. Nilai bandwidth optimum diperoleh ketika CV minimum. D. Multikolinieritas Multikolinieritas adalah terjadinya hubungan linier antara variabel prediktor dalam suatu model regresi linier berganda. Multikolinieritas disebabkan oleh adanya hubungan linier yang hampir sempurna (near dependence) pada kolom-kolom matriks dan apabila terjadi hubungan linier yang sempurna akan menyebabkan [8]. Adanya multikolinieritas mengakibatkan estimasi parameter regresi yang diperoleh dari Metode Kuadrat Terkecil (MKT) akan menghasilkan variansi yang besar (Pasha et al. [9]). Metode yang dapat digunakan untuk mendeteksi multikolinieritas dapat dilihat dari nilai Variance Inflation Factor (VIF) yang merupakan invers dari nilai toleransi. Nilai toleransi yang mengindikasikan adanya multikolinieritas bernilai kurang dari 0,10 dan atau nilai VIF >10[7]. Nilai VIF dinyatakan sebagai berikut. dengan adalah koefisien determinasi antara dengan variabel prediktor lainnya untuk setiap lokasi. E. LASSO Metode LASSO diperkenalkan pertama kali oleh Tibshirani pada tahun 1996. Estimasi parameter pada LASSO diperoleh dengan cara meminimumkan persamaan berikut dengan kendala PS-141

ISBN. 978-602-73403-2-9 (Cetak) 978-602-73403-3-6 (On-line) Nilai t merupakan parameter tuning yang ukuran numeriknya ditentukan oleh CV. Estimasi parameter LASSO tidak dapat diperoleh dalam bentuk tertutup seperti pada MKT, namun menggunakan pemrograman kuadratik [5]. LASSO didefinisikan sebagai Estimasi parameter LASSO diperoleh dengan menentukan batas yang dibakukan, yaitu dimana s merupakan parameter penyusutan (shrinkage) yang memiliki nilai dari 0 sampai 1 dengan. Jika adalah estimasi parameter kuadrat terkecil (OLS) dan, nilai menyebabkan sejumlah parameter menjadi nol. F. LARS Referensi [10], menyatakan bahwa LARS merupakan algoritme yang efisien digunakan karena LARS mempunyai modifikasi untuk mempermudah dalam perhitungan LASSO. LARS merupakan metode klasik yang berkaitan dengan metode pemilihan model yang dahulu dikenal dengan nama forward selection atau forward stepwise regression. Forward Selection merupakan salah satu metode untuk seleksi variabel dalam regresi linier, yaitu teknik untuk mendapatkan model regresi dengan cara menseleksi variabel yang memenuhi kriteria tertentu. Referensi [11], algoritme LARS diuraikan sebagai berikut. 1. Dimulai dengan semua koefisien parameter sama dengan nol, sehingga menjadikan. 2. Ditentukan variabel prediktor yang memiliki koefisien korelasi tertinggi dengan sisaan. 3. Koefisien parameter diduga untuk yang memiliki korelasi tertinggi dengan sisaan. 4. Sisaan dihitung dengan variabel prediktor yang masuk ke dalam model. 5. Dihitung korelasi parsial antara variabel prediktor yang tersisa dengan sisaan terbaru. 6. Langkah 3 sampai 5 diulangi hingga seluruh variable prediktor masuk kedalam model dan berhenti apabila korelasi antara y dan bernilai nol. Algoritme LARS merupakan metode seleksi model dimana algoritmenya dapat dimodifikasi untuk diimplementasikan ke dalam penyelesaian LASSO. Menurut Referensi [12], LARS melakukan estimasi Berikut langkah-langkah estimasi LASSO menggunakan algoritme LARS. 1. Mencari vektor yang sebanding dengan vektor korelasi antara variabel prediktor dan galat dari setiap variabel prediktor 2. Menentukan korelasi saat mutlak terbesar maka diperoleh untuk 3. Menenukan, Himpunan A merupakan himpunan indeks aktif dari variabel prediktor {1, 2, 3,..., m}. Himpunan indeks aktif A ditentukan berdasarkan nilai korelasi mutlak terbesar. Didefinisikan matriks: dengan tanda sj bernilai ± 1, maka dan 4. Menghitung nilai vektor equiangular, vektor equiangular adalah suatu vektor yang membagi sudut dari kolom-kolom menjadi sama besar dengan besar sudutnya kurang dari. nilai vektor equiangular dicari menggunakan rumus sebagai berikut: dengan 5. Menghitung vektor inner product: 6. Menghitung dengan menunjukkan bahwa yang dipilih adalah nilai minimum positif dari j yang bukan merupakan himpunan A. 7. Mencari nilai dimana adalah calon koefisien LASSO PS-142

SEMINAR MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2017 8. Melakukan pengecekan apakah. Jika dan memiliki tanda yang sama dengan maka dapat dilanjutkan seleksi variabel predictor selanjutnya. 9. Langkah diulangi untuk setiap seleksi variabelnya hingga semua variabel prediktor telah terseleksi. G. GW-LASSO GW-LASSO menggunakan algoritme LARS sehingga estimasi koefisien parameter pada model diduga dengan weighted least square dengan menambahkan fungsi pengganda Lagrange yang ditulis sebagai (4) Batasan kendala yang bersifat mutlak, maka solusi GWL juga menggunakan algoritme LARS dengan tambahan matriks pembobot pada matriks variabelnya. Estimasi parameter akhir LASSO dilakukan secara serentak sehingga solusi akhir tergantung pada bandwidth kernel yang telah diduga sebelumnya. Berikut adalah langkah yang dilakukan dalam estimasi parameter GWL 1) Bandwidth kernel yang optimum diestimasi dengan metode Cross Validation (CV), 2) Matriks pembobot berukuran dihitung, 3) Untuk setiap lokasi a) b) dan menggunakan akar kuadrat dari pembobot kernel disetiap lokasi ke-, c) Algoritme LARS ( dipanggil, kemudian solusi LASSO disimpan, kemudian menentukan solusi LASSO yang meminimumkan sisaan untuk. 4) Dugaan parameter akhir LASSO sesuai dengan CV berdasarkan fraksi dari nilai pengusutan. Pada langkah-langkah estimasi parameter pada model GWL, nilai parameter penyusutan (t) harus diduga terlebih dahulu sebelum solusi akhir LASSO. Dugaan parameter penyusutan (t) pada model GWL dilakukan dengan metode CV, sehingga terdapat parameter penyusutan yang berbeda untuk setiap lokasi dapat dituliskan seperti Persamaan (4). III. SIMPULAN Pemodelan dengan menggunakan LASSO koefisien regresi pada GW-LASSO akan disusutkan ke nol melalui koefisien shrinkage yang diberikan. Untuk menduga parameter GWL menggunakan nilai bandwidth dan koefisen penyusutan. Sehingga dapat dituliskan estimasi parameter model GW-LASSO dengan menggunakan algoritme LARS yaitu DAFTAR PUSTAKA [1] Y. Leung, C. L. Mei, and W. X. Zhang, Statistical Test for Spatial Nonstationarity Based on The Geographically Weighted Regression Model, Environment and Planning A, 32, 2000, pp. 9-32. [2] G. R. Pasha and A. A. Shah, Application of Ridge Regression to Multicollinier Data, Journal of Research 15(1), 2004, pp.97-106. [3] R. Tibshirani, Regression Shrinkage and Selection Via The LASSO, Journal of the Royal Statistical Society B 58(1), 1996, pp.267-288. [4] D. Wheeler and M. Tiefelsdorf, Multicollinierity and correlation among local regression coefficients in geographically weighted regression, Journal of Geographical System, 7, 2005, pp. 161 187. PS-143

ISBN. 978-602-73403-2-9 (Cetak) 978-602-73403-3-6 (On-line) [5] T. Yulita, Pemodelan Geographically Weighted Ridge Regression dan Geographically Weighted LASSO pada Data Spasial dengan Multikolinieritas, Bogor: Institut Pertanian Bogor, 2016. [6] D. C. Wheeler, Diagnostic Tools and a Remedial Method for Collinierity in Geographically Weighted Regression, Environment and Planning A, 2007. [7] A.S. Fotheringham, C. Brunsdon, and M. Charlton, Geographically Weighted Regression the Analysis of Spatially Varying Relationships, England (GB): John Wiley and Sons, 2002. [8] N. R. Draper and Smith H, Applied Regression Analysis, Ed ke-3. New York (US): John Wiley & Sons, 1998. [9] T. Hastie, R. Tibshirani, and J. Friendman, The Elements od Statistical Learning Data Mining, Inference, and Prediction, New York (US): Springer, 2009. [10] T. Hastie, R. Tibshirani, J. Friedman, The Elements of Statistical Learning Data Mining, Inference, and Prediction Second Edition, New York : Springer, 2008. [11] T. Hastie, R. Tibshirani, and J. Friendman, The Elements od Statistical Learning Data Mining, Inference, and Prediction, New York (US): Springer, 2009. [12] B. Efron, T. Hastie, I. Johnstone and R. Tibshirani, Least Angle Regression, The Annals of Statistic Vol. 32, No. 2, 2004, pp. 407-499. PS-144