BAB 3 MODEL ESTIMASI REGRESI NONPARAMETRIK

BAB 3 MODEL ESTIMASI REGRESI NONPARAMETRIK Dalam melakukan estimasi pada suatu kasus regresi nonparametrik, ada banyak metode yang dapat digunakan. Yasin (2009) dalam makalahnya melakukan estimasi regresi nonparametrik menggunakan metode Wavelet Shrinkage Neural Network pada model rancang tetap. Yasin menjelaskan bahwa fungsi W avelet merupakan fungsi matematika yang mempunyai sifat-sifat tertentu, diantaranya berosilasi di sekitar nol (seperti fungsi sinus dan cosinus) dan terlokalisasi dalam domain waktu, artinya pada saat nilai domain relatif besar maka fungsi W avelet bernilai nol. Selain W avelet, ada juga beberapa metode untuk melakukan estimasi fungsi regresi nonparametrik; seperti Nadaraya-Watson yang akan digunakan peneliti untuk menangani persoalan yang dimaksud. 3. Estimator Secara umum, parameter populasi akan diberi simbol m.jadi merupakan rata-rata µ, simpangan baku σ,proporsi π dan sebagainya. Jika m yang tidak diketahui harganya, ditaksir oleh harga ˆm, maka ˆm dinamakan penaksir. terdapat dua macam estimasi: 3.. Estimasi titik Sebuah estimasi titik (point estimate) dari sebuah parameter m adalah suatu angka tunggal yang dapat dianggap sebagai nilai yang masuk akal bagi m. Estimasi titik diperoleh dengan memilih statistik yang tepat dan menghitung nilainya dari data sampel. Statistik yang dipilih disebut estimator titik (point estimator) dan proses mengestimasi dengan suatu angka tunggal disebut sebagai estimasi titik (point estimation). 6

7 3..2 Estimasi interval Sebuah estimasi interval (interval estimate) dari sebuah parameter m adalah suatu sebaran nilai-nilai yang digunakan untuk mengestimasi m. Proses mengestimasi dengan suatu sebaran nilai-nilai ini disebut estimasi interval (interval estimation). 3.2 Nadaraya-Watson Estimator Bilamana terdapat data yang sangat banyak dimana X x i, maka cara mengatasinya adalah dengan mencari nilai rata-rata setiap y i pada data tersebut. Dan juga karena X berdistribusi kontinu, maka tidak perlu dilakukan pengamatan berulang pada data dengan nilai yang sama. Solusi dari persoalan tersebut adalah dengan memperhatikan ketetanggaan x i, untuk itu perlu dilakukan sejumlahpengamatan di ketetanggan tersebut. Trik yang sangat jelas jelas adalah dengan cara melakukan estimasi bias serta estimasi varians. Andai dilakukan pengamatan pada sejumlah besar data X. Misalkan x±h untuk sebarang bandwidth h > 0. Maka estimator Nadaraya-Watson (964) ˆm NW (x) yang ditunjukkan pada persamaan (3.) merupakan rata-rata nilai y i untuk pengamatan i sedemikian sehingga X i berada pada ketetanggaannya. ˆm NW (x) n K( x x i h)y i n K( x x i h) n y ik( x x i ) h n K( x x i ) (3.) h dengan K(u) merupakan Kernel. Pada dasarnya, fungsi regresi dapat dituliskan seperti pada persamaan berikut. m(x) yf(x, y)dy f(x) (3.2) dimana, f(x, y) n H h y K ( H (x x i ) ) ( ) y yi K dan h y merupakan bandwidth untuk pemulusan data y. h y

8 Dengan demikian, f(x) f(x, y)dy ( ) y K(H yi (x x i )) K dy n H h y h y K(H (x x i )) n H (3.3) dan yf(x, y)dy ( ) y K(H yi (x x i )) yk dy n H h y h y K(H (x x i ))y i (3.4) n H Kemudian lakukan substitusi persamaan (3.3) dan (3.4) ke persamaan (3.2), maka diperoleh: m(x) n n H K(H (x x i ))y i n n H K(H (x x i )) n y ik( x x i ) h n K( x x i ) h Pada persamaan tersebut, m(x) dinamakan estimator Nadaraya-Watson. Dalam menghadapi persoalan regresi, para peneliti sangat menyarankan untuk menggunakan hanya fungsi Kernel orde kedua. Hal ini untuk menghindari ketidakasimtotisan distribusi data pengamatannya. Dalam makalahnya. Isogai (987) mengambil nilai h n n r untuk 0.2 < r<. Kernel K merupakan fungsi kepadatan probabilitas yang berbatas pada bilangan riil dimana, lim u K(u) 0, uk(u)du 0 dan u u2 K(u)du < Nadaraya (964) mengindikasi bahwa jika Y adalah sebuah variabel random dan nh 2 n,maka(nh n) 2 (m(x) Em(x)) normal secara asimtotik dengan ratarata 0 dan varians E[Y 2 X x] K 2 (u)du/g(x).

9 3.2. Distribusi yang asimtotis Karena E(y i X x i )m(x i ), maka persamaan regresinya dapat dituliskan seperti pada persamaan (3.5). y i m(x i )+ε i, i,...,n (3.5) dimana ε,...,ε n merupakan nilai error yang merupakan variabel random dengan nilai ekspektasi E(ε i X I ) 0 dan nilai varians V (ε 2 i x i )σ 2 (x). Perhatikan bahwa, dan oleh sebab itu, nh y i m(x i )+ε i, m(x)+(m(x i ) m(x)) + ε i ( ) xi x k y i h nh ( ) xi x k m(x) (3.6) h

BAB 4 HASIL DAN PEMBAHASAN 4. Estimasi regresi nonparametrik Hubungan antara variabel X dan variabel Y pada tesis ini diambil data laju kendaraan Sepeda Motor dengan banyak sampel pengamatan sebanyak 40. Variabel prediktor yang digunakan adalah waktu dan variabel respon yang digunakan adalah percepatan. Contoh kasus penerapan estimasi regresi nonparametrik dapat dilihat pada Tabel 4. berikut ini. Tabel 4. Statistika deskriptif sepeda motor No Waktu (X) Percepatan (Y) No Waktu (X) Percepatan (Y) 2,4 0,5 2 39,87 0,52 2 2,5 0,55 22 4,45 0,7 3 2,67 0,45 23 4,67 0,95 4 4,5 0,7 24 4,78,35 5 4,96 0,45 25 42,65 2,47 6 7 -,54 26 43 2,98 7 5,7-2,45 27 43,34 6,47 8 8,6-4,34 28 43,87 0,24 9 9,9-5,78 29 44,54 0,99 0 2-5,43 30 44,89 9,34 4,6-6,79 3 45,32 9,75 2 8-7,64 32 45,33 8,75 3 2,24-5,43 33 45,78 8,89 4 29,56-4,34 34 49,56 9,75 5 3,34-4,0 35 49,65 7,78 6 33, -2,24 36 52,34 8,87 7 33,24 -,02 37 52,66 6,56 8 33,99-0,35 38 54,54 6,43 9 37,42 0,49 39 55,89 5,46 20 37 0,67 40 57,4 5 Dengan menggunakan aplikasi Microsoft excel dapat ditentukan nilai ratarata, nilai tengah, dan standar deviasi dari kedua variabel di atas. Hasil perhitungan dapat dilihat pada Tabel 4.2 berikut: 20

2 Tabel 4.2 Nilai rata-rata, nilai tengah dan standar deviasi Variabel Waktu (X) N 40 Min 2,4 Maks 57,4 Mean 32,3 Q 2 38,64 Standar deviasi 7,84 Percepatan (Y) 40-7,64 0,99,89 0,68 5,36 Data sampel pengamatan ada sebanyak 40 data, dengan waktu minimum sebesar 2, 4 detik dengan waktu maksimal sebesar 57, 4 detik dan percepatan minimum sebesar 7, 64 m/s 2, percepatan maksimal 0, 99 m/s 2, rata-rata waktu sebesar 32, 3 detik, dan percepatan sebesar, 89 m/s 2, dengan nilai tengah waktu sebesar 38, 64 detik dan percepatan 0, 68 m/s 2, serta standar deviasi waktu sebesar 7, 84 detik dan percepatan 5, 36 m/s 2. Bentuk hubungan antara variabel prediktor (waktu) dengan variabel respon (percepatan) dapat dilihat pada plot antara kedua variabel tersebut seperti pada gambar berikut ini: Gambar 4. Diagram pencar data sepeda motor

22 Selanjutnya dengan bantuan software SPSS, analisis estimasi regresi hubungan antara variabel prediktor (waktu) dengan variabel respon (percepatan) juga dapat dilihat dari plot antara kedua variabel seperti pada gambar berikut ini: Gambar 4.2 Diagram analisis estimasi regresi

23 Apabila data yang telah ada juga dibandingkan dengan menggunakan program R dari data deskriptif Sepeda Motor dapat dilihat seperti pada gambar berikut ini: Gambar 4.3 Diagram pencar data sepeda motor Fungsi s(x) adalah suatu fungsi yang digunakan untuk menentukan bentuk spsesifikasi model suatu formula, menunjukkan bahwa pemulusan yang dilakukan telah mendekati dengan baik. Pada program R pemilihan parameter pemulusan dilakukan secara otomatis. Berdasarkan dari Gambar 4.3 dapat dilihat bahwa nilai GCV minimum yaitu 2,3833. Artinya, pendugaan kurva dan kesesuaian fungsi pada data berada pada nilai GCV 2, 3833.

24 Berikut adalah hasil dari program R yang akan memperlihatkan bentuk model formula kernel: Gambar 4.4 Model formula nonparametrik Dengan demikian, dari data hubungan antara variabel prediktor (waktu) dengan variabel respon (percepatan) dapat dibentuk model estimasi regresi nonparametrik nya, yaitu: Y 4, 8753 + 0, 209x dengan nilai standar error sebesar 3,90. Penduga Kernel didefinisikan seperti pada persamaan berikut ini. f(x; h) 40 40 K h (x X i ) (4.) Berkaitan dengan model persamaan regresi yang telah didapat, suatu model dikatakan baik apabila nilai koefisien determinasi (R 2 ) mendekati, dari Gambar 4.3 memperlihatkan bahwa koefisien determinasi (R 2 ) sebesar 0,937. Hal ini berarti, model yang diperoleh dapat dikatakan baik dan memiliki hubungan antar variabel yang cukup erat.

25 Kemudian dalam hal kaitan dengan metode kernel, yang mana model estimasi regresi nonparametrik dilakukan dengan menggunakan metode kernel, maka ukuran sampel optimal untuk membentuk interval yang telah diperoleh dari gambar 4., gambar 4.2, dan gambar 4.3, dengan menggunakan metode kernel mengandalkan pada beberapa sifat asimptomatik dari Nadaraya-Watson. Maka estimator Nadaraya-Watson (964) ˆm NW (x) yang ditunjukkan pada persamaan (3.) merupakan rata-rata nilai y i, dimana dalam hal ini variabel y digunakan untuk menerangkan Percepatan, untuk pengamatan i sebanyak 40 pengamatan sedemikian sehingga X i, dimana dalam hal ini variabel x digunakan untuk menerangkan Waktu, diperolah persamaan sebagai berikut: ˆm NW (W aktu) dengan K(u) menerangkan Kernel. 40 K( x x i h)y i 40 K( x x i h) 40 y ik( x x i 40 K( x x i ) (4.2) h h )

BAB 5 KESIMPULAN DAN SARAN 5. Kesimpulan. Statistik nonparametrik merupakan kumpulan metode untuk analisis data yang menawarkan sebuah pendekatan dengan cara-cara pengambilan keputusan. Salah satu cara yang digunakan dalam model etimasi regresi nonparametrik ialah dengan metode Kernel. 2. Dengan menghadirkan fungsi regresi nonparametrik, dapat dimodelkan estimasi Nadaraya-Watson berdasarkan metode Kernel. 3. Berdasarkan hasil pembahasan hubungan non-linear antara dua variabel seperti pada contoh kasus untuk data Sepeda Motor dimana variabel Waktu (X) yang dibutuhan dengan variabel Percepatan (Y ) berpengaruh pada laju Sepeda Motor dengan model estimasi regresi nonparametrik yang diperoleh dapat dikatakan baik dan memiliki hubungan antar variabel yang cukup erat. Fungsi s(x) yang menyatakan suatu fungsi yang digunakan untuk menentukan bentuk spsesifikasi model suatu formula, menunjukkan bahwa pemulusan yang telah dilakukan mendekati baik, dengan nilai GCV minimum yaitu 2,3833. 4. Apabila dilihat dari grafik pada gambar 4., gambar 4.2, dan gambar 4.3 bahwa dari 0 detik sampai 20 detik kurva turun dan setelah waktu 20 detik kurva naik kembali sampai ke 50 detik. Hal ini sesuai dengan asumsi penggunaan regresi nonparamatrik, yakni contoh kasus yang diambil bersifat acak dan kontinu dan data yang tidak berdistribusi normal. 5.2 saran Sebagaimana yang diketahui, bahwa fungsi kernel ada beberapa jenis. Untuk itu perlu dilakukan penelitian lebih lanjut guna mengetahui apakah ada perbedaan yang signifikan apabila menggunakan fungsi Kernel yang berbeda. 26