BAB II TINJAUAN PUSTAKA 2.1 Analisis Regresi Dalam ilmu statistika, metode yang dapat digunakan untuk menganalisis pola hubungan antara satu variabel atau lebih dengan satu variabel atau lebih lainnya adalah analisis regresi. Analisis regresi merupakan sebuah alat statistika yang digunakan untuk mencari hubungan fungsional atau melihat pengaruh antara variabel prediktor terhadap variabel respons. Hubungan fungsional antarvariabel tersebut dijelaskan dalam sebuah kurva yang disebut dengan kurva regresi. Analisis regresi yang digunakan untuk melihat hubungan antarvariabel, apabila dilihat berdasarkan banyaknya variabel respons dan variabel prediktor yang digunakan dapat dibagi menjadi dua bagian yaitu, analisis regresi univariat dan analisis regresi multivariat. Banyak variabel respons dan variabel prediktor dalam analisis regresi univariat masing-masing adalah satu, sedangkan dalam analisis regresi multivariat terdapat lebih dari satu variabel respons dan lebih dari satu variabel prediktor. Pemodelan menggunakan analisis regresi akan menghasilkan suatu persamaan yang disebut dengan persamaan regresi. Misal diberikan data berpasangan dan pola hubungan antara dengan diasumsikan mengikuti model regresi sebagai berikut (Eubank, 1999, p. 1) 7
8 (2.1) dengan menyatakan respons ke-, adalah fungsi yang nilainya tidak diketahui pada pengamatan, dan merupakan galat yang diasumsikan saling bebas dengan rataan nol dan keragaman. Fungsi merupakan fungsi regresi atau kurva regresi. Dalam regresi parametrik, bentuk fungsi dalam persamaan (2.1) diasumsikan diketahui dan asumsi kenormalan distribusi galat harus terpenuhi. Model persamaan regresi parametrik linear dengan variabel prediktor secara umum dapat dituliskan pada persamaan berikut (2.2) atau (2.3) dengan menyatakan nilai dari variabel prediktor ke- untuk pengamatan ke- dengan, dan adalah parameterparameter regresi. Model persamaan regresi parametrik juga dapat dituliskan dalam notasi matriks berikut (2.4) dengan
9 [ ], [ ], [ ], dan [ ]. Pada model (2.4) menyatakan vektor kolom untuk variabel respons berukuran, adalah matriks konstanta berukuran, adalah vektor parameter berukuran, dan adalah vektor kolom berukuran yang diasumsikan saling bebas dengan rataan nol dan keragaman. 2.2 Analisis Regresi Nonparametrik Dalam kasus nonparametrik pemenuhan asumsi kenormalan galat tidak diperlukan, karena penggunaan regresi nonparametrik tidak terikat akan asumsiasumsi seperti yang mendasari statistika parametrik. Statistika nonparametrik sering disebut statistika bebas distribusi. Menurut Eubank (1999, p. 3), dalam model regresi nonparametrik bentuk kurva regresi tidak diketahui dan pada umumnya diasumsikan termuat dalam suatu ruang fungsi berdimensi takhingga, dan merupakan fungsi yang mulus (smooth). Regresi nonparametrik merupakan regresi yang memiliki fleksibilitas yang tinggi dalam menaksir kurva regresi dan sangat objektif dalam memodelkan pola data. Dalam regresi nonparametrik data dapat mencari sendiri bentuk taksirannya tanpa dipengaruhi oleh faktor subjektivitas peneliti (Budiantara, 2011). Terdapat beberapa model regresi nonparametrik yang sering digunakan antara lain: spline, MARS, kernel, wavelet, dan deret Fourier. Diberikan sekumpulan data
10 berpasangan yang mengikuti model regresi nonparametrik sebagai berikut (Eubank, 1999, p. 71). (2.5) dengan adalah sebuah vektor galat yang saling bebas dengan rataan nol dan keragaman dan menyatakan fungsi regresi yang bentuknya tidak diketahui. 2.3 Regresi Nonparametrik Spline Salah satu metode regresi nonparametrik adalah spline. Spline merupakan model polinom yang memiliki sifat tersegmen atau terpotong-potong yang terbentuk pada setiap titik knot dan dapat menghasilkan fungsi regresi yang sesuai dengan data (Eubank, 1999, p. 281). Metode spline sangat baik dalam memodelkan data yang memiliki pola berubah-ubah pada sub-interval tertentu. Secara umum fungsi spline berorde dengan titik knot dapat dinyatakan dengan persamaan berikut. (2.6) dengan { (2.7) merupakan fungsi potongan (truncated), menyatakan parameter model; menyatakan intersep; merupakan slope pada peubah truncated knot ke- pada spline berorde m; adalah variabel prediktor; adalah knot ke- ; adalah
11 banyaknya knot dalam variabel respons ke- ; adalah konstanta real dan adalah titik knot. Model regresi spline juga dapat dituliskan dalam notasi matriks berikut (2.8) dengan [ ] [ ] [ ] Regresi nonparametrik spline adalah suatu pendekatan dalam analisis regresi dengan pola hubungan (fungsi regresinya) yang diasumsuikan tidak diketahui dan didekati dengan fungsi spline. Model regresi nonparametrik spline orde ke-m adalah sebagai berikut. ;
12 ( ) (2.9) Estimasi parameter regresi nonparametrik spline dapat diperoleh dengan menggunakan metode Maximum Likelihood Estimation (MLE) berdasarkan asumsi yaitu dan pada persamaan (2.5) merupakan variabel acak yang saling bebas, dan. Oleh karena itu pada persamaan (2.5) juga berdistribusi normal dengan mean dan keragaman (Mubarak, 2012). Sehingga fungsi densitas peluang menjadi ( ) [ ( ) ] (2.10) Selanjutnya fungsi likelihood dapat dituliskan sebagai berikut. ( ). ( ) /. ( ) /. (2.11) Selanjutnya dengan memaksimumkan fungsi likelihood akan diperoleh estimasi titik untuk fungsi, yaitu sebagai berikut. * + {. ( )/ } (2.12)
13 Kemudian dilakukan tansformasi logaritma sehingga menghasilkan persamaan sebagai berikut. ( ( ) ). Misalkan, - dan [ ] maka: ( ) ( ) ( ) (2.13) dengan Selanjutnya persamaan (2.13) diturunkan secara parsial terhadap dan disamakan dengan nol di sisi kanannya, sehingga diperoleh hasil sebagai berikut. ( ( ) ( ))
14 ( ) ( ( ) ( )) ( ( ) ( )) (2.14) Hasil estimasi parameter adalah sebagai berikut. ( ) (2.15) dengan. 2.4 Regresi Nonparametrik Spline Multivariat Model regresi nonparametrik spline multivariat merupakan model regresi yang memiliki lebih dari satu variabel respons yang saling berkorelasi dan lebih dari satu variabel prediktor dengan fungsi regresinya diasumsuikan tidak diketahui dan didekati dengan fungsi spline. Model regresi nonparametrik spline multivariat dapat ditulis sebagai berikut. (2.16) Menurut Wang (1998) dalam Wulandari (2014), bentuk kurva regresi diasumsikan tidak diketahui dan dihampiri dengan fungsi spline berikut.
15 (2.17) Dalam regresi nonparametrik spline multivariat, estimasi parameter dapat dilakukan dengan pengoptimalan Weighted Least Square (WLS). Penentuan matriks pembobot W dilakukan dengan menghitung nilai varians kovarians dari variabel respons. Berikut tahapan dalam menyusun matriks W. 1. Menentukan variabel respons 2. Menghitung nilai varians variabel respons 3. Menghitung nilai kovarians antara variabel respons 4. Membentuk matriks varians kovarians dari data 5. Mendefinisikan matriks varians kovarians sebagai pembobot (W). Matriks (varians kovarians ) adalah sebagai berikut. [ ] Estimasi parameter dengan pengoptimalan Weighted Least Square (WLS) adalah sebagai berikut.
16 * + * +. (2.18) Selanjutnya dilakukan penurunan secara parsial untuk persamaan (2.18) dengan memisalkan fungsi, maka. (2.19) Selanjutnya persamaan (2.19) diturunkan terhadapat dan disamakan dengan nol, sehingga diperoleh hasil sebagai berikut. (2.20) Sehingga bentuk estimasi model spline dalam regresi nonparametrik multivariat menjadi sebagai berikut. (2.21) dengan adalah matriks yang digunakan untuk perhitungan pada rumus GCV dalam pemilihan titik knot optimal.
17 2.5 Pemilihan Model Regresi Terbaik Model regresi spline terbaik diperoleh dengan pemilihan titik knot yang optimal. Pemilihan titik knot yang optimal ini sangat penting untuk memperoleh estimator spline terbaik yang paling sesuai dengan data. Titik knot adalah titik perpaduan bersama yang menunjukan terjadinya perubahan pola perilaku data (Wulandari, 2014). Titik knot merupakan suatu titik fokus dalam fungsi spline, sehingga kurva yang dibentuk tersegmen pada titik-titik tersebut. Salah satu metode yang digunakan untuk memperoleh titik knot yang optimal adalah metode Generalized Cross Validation (GCV). Kelebihan dari GCV adalah sifatnya yang optimal asimtotik atau dengan sampel yang besar sifatnya tetap optimal. Model regresi terbaik yang berkaitan dengan titik knot optimal diperoleh dari nilai GCV paling minimum. Fungsi GCV didefinisikan sebagai berikut. [ ( )] (2.22) dengan menyatakan jumlah data, merupakan matriks identitas, ( ) ( ), dan ( ). 2.6 Korelasi antara Variabel-variabel Respons Korelasi menunjukan suatu hubungan timbal balik antara dua buah kejadian. Berdasarkan pengertian regresi multivariat yaitu regresi dengan lebih dari satu variabel respons di mana variabel-variabel respons tersebut harus saling
18 berhubungan atau berkorelasi, maka korelasi antara variabel respons tersebut terlebih dahulu harus diketahui. Dua variabel dikatakan berhubungan jika terjadi perubahan pada salah satu variabel dan perubahan tersebut juga akan disertai oleh variabel lainnya, baik dalam arah yang sama ataupun arah yang sebaliknya. Nilai korelasi dapat dicari menggunakan koefisien korelasi Pearson yang secara umum untuk peubah respons dan dinyatakan dalam persamaan berikut. { } (2.23) atau dapat dituliskan dengan rumus sebagai berikut. ( )( ) ( ) ( ). /. / ( ) ( ) (2.24) Koefisien korelasi menginformasikan seberapa besar atau kuat hubungan antara variabel yang digunakan. Berdasarkan perhitungan dengan menggunakan korelasi Pearson akan diperoleh nilai koefisien korelasi yaitu.
19 2.7 Kemiskinan Kemiskinan menurut BPS (2014a) didefinisikan sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar seperti pangan, sandang, pendidikan, kesehatan, dan perumahan. Pada umumnya definisi kemiskinan dapat dilihat dari dua sisi, yaitu: a) Kemiskinan absolut Kemiskinan yang dikaitkan dengan tingkat pendapatan dan kebutuhan, kebutuhan tersebut hanya terbatas pada kebutuhan pokok atau kebutuhan dasar minimum seseorang. b) Kemiskinan relatif Kemiskinan yang tidak memiliki batas kemiskinan yang jelas. Kemiskinan relatif bisa dilihat dari aspek ketimpangan sosial, karena ada orang yang sebenarnya memiliki pendapatan yang sudah cukup untuk memenuhi kebutuhan minimumnya tetapi pendapatannya masih jauh lebih rendah dibanding masyarakat sekitarnya. Sehingga, apabila semakin besar ketimpangan antara tingkat penghidupan golongan atas dan golongan bawah maka jumlah penduduk yang dapat dikategorikan miskin juga akan semakin besar. 2.7.1 Indikator Kemiskinan Kemiskinan oleh BPS (2014a) diukur melalui indikator seperti: 1. Persentase Penduduk Miskin Yaitu persentase penduduk yang berada di bawah garis kemiskinan (P 0 ). 2. Indeks Kedalaman Kemiskinan
20 Yaitu ukuran rata-rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P 1 ). Garis kemiskinan sendiri merupakan nilai atau jumlah rupiah minimum yang dibutuhkan seseorang untuk memenuhi kebutuhan dasar minimum makanan yang setara dengan 2100 kilokalori per kapita per hari (paket komoditas kebutuhan dasar makanan diwakili oleh 52 jenis komoditas) ditambah dengan jumlah rupiah kebutuhan dasar minimum bukan makanan (paket komoditas kebutuhan dasar nonmakanan diwakili oleh 51 jenis komoditas di perkotaan dan 47 komoditas di pedesaan). 2.7.2 Faktor-faktor yang Memengaruhi Kemiskinan Mengacu pada strategi nasional penanggulangan kemiskinan, kemiskinan dipengaruhi oleh beberapa faktor yaitu: tingkat pendapatan, kesehatan, pendidikan, akses barang dan jasa, lokasi geografis dan kondisi lingkungan (Sa yidah dan Arianti, 2012). Selain itu berdasarkan penelitian terdahulu (Yudha, 2013; Rumahorbo, 2014), dalam penelitian ini kemiskinan dipengaruhi oleh beberapa faktor seperti: pertumbuhan ekonomi, upah minimum, pendapatan berupa pendapatan per kapita atau PDRB per kapita, tingkat pengangguran berupa tingkat pengangguran terbuka, dan inflasi. 1. Pendidikan Pendidikan merupakan determinan penting dalam pembangunan modal manusia untuk menurunkan jumlah penduduk miskin (Sa yidah dan Arianti,
21 2012). Pendidikan yang dimiliki masyarakat akan memberikan kemampuan untuk berkembang lewat keterampilan dalam memperoleh penghasilan dan pekerjaan yang baik. Pendidikan dapat dilihat dengan indikator-indikator sebagai berikut (BPS, 2014b): a. Angka Melek Huruf b. Rata-rata Lama Sekolah c. Angka Partisipasi Sekolah 2. Pendapatan Pendapatan nasional merupakan salah satu tolak ukur yang digunakan untuk mengukur keberhasilan sebuah perekonomian, di mana semakin besar angka output pendapatan maka tingkat kemakmuran dianggap semakin tinggi pula (Rumahorbo, 2014). Pendapatan dalam penelitian ini dilihat berdasarkan Pendapatan Per Kapita atau PDRB per Kapita. PDRB menurut BPS (2015a) adalah jumlah balas jasa atau upah yang diterima oleh faktor-faktor produksi yang ikut serta dalam proses produksi di suatu negara dalam jangka waktu tertentu. Sementara PDRB Per Kapita adalah besarnya pendapatan rata-rata penduduk di suatu negara. Semakin tinggi PDRB per kapita semakin sejahtera penduduk di negara tersebut dan jumlah penduduk miskin juga semakin berkurang (Thamrin dalam Rumahorbo, 2014)
22 3. Tingkat Pengangguran Pengangguran dapat diukur dengan indikator seperti Tingkat Pengangguran Terbuka. Pengangguran terbuka menurut (BPS, 2014b) didefinisikan sebagai seseorang yang tergolong dalam angkatan kerja yang sedang mencari pekerjaan, mempersiapkan usaha, ataupun yang tidak mencari pekerjaan karena merasa tidak mungkin mendapatkan pekerjaan, termasuk juga yang sudah memperoleh pekerjaan namun belum memulai bekerja. 2.8 Penelitian Sebelumnya Penelitian menggunakan metode regresi spline telah banyak dilakukan. Salah satunya penelitian yang dilakukan oleh Oktaviana (2012) dalam memodelkan kadar gula darah penderita diabetes mellitus. Pada penelitian tersebut, diperoleh nilai GCV yang paling minimum adalah sebesar 0,000000002 dan model spline birespon terbaik yang menjelaskan kadar gula darah penderita DM tipe 2 adalah model spline linear dengan satu titik knot. Selain itu, Wulandari (2014) menganalisis faktor-faktor yang memengaruhi persentase penduduk miskin dan pengeluaran per kapita makanan di Jawa Timur menggunakan regresi nonparametrik birespon spline. Variabel prediktor yang digunakan ada empat variabel dari segi ketenagakerjaan dan ekonomi. Pada penelitian tersebut, diperoleh model regresi nonparametrik birespon spline terbaik adalah model spline linear dengan satu titik knot. Nilai GCV dan MSE yang dihasilkan adalah sebesar 0,048652 dan 0,040296. Penelitian-penelitian tersebut menjadi acuan dalam penelitian ini. Pemodelan dua
23 indikator kemiskinan di Indonesia yaitu persentase penduduk miskin dan indeks kedalam kemiskinan menggunakan metode regresi nonparametrik spline multivariat ini dilakukan karena kedua variabel memiliki keterkaitan yang erat, di mana kedua indikator ini digunakan untuk mengukur kemiskinan di suatu daerah. Berdasarkan penelitian sebelumnya penulis tertarik untuk melakukan penelitian lebih lanjut dengan objek penelitian yang lebih luas yaitu mencangkup 33 Provinsi di Indonesia.