BAB 3 MODEL ESTIMASI REGRESI NONPARAMETRIK

dokumen-dokumen yang mirip
Universitas Sumatera Utara

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

PERBANDINGAN TINGKAT AKURASI REGRESI NONPARAMETRIK SPLINE DAN REGRESI NONPARAMETRIK KERNEL PADA PERTUMBUHAN BALITA DI KOTA SURAKARTA

TINJAUAN PUSTAKA. Menurut Hardle (1994) analisis regresi adalah suatu metode analisis data yang

ESTIMASI. Arna Fariza PENDAHULUAN

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

(ESTIMASI/ PENAKSIRAN)

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI

KONSISTENSI ESTIMATOR

BAB II LANDASAN TEORI. Analisis regresi (regressison analysis) merupakan suatu teknik untuk membangun persamaan

BAB I PENDAHULUAN. bisnis, ekonomi, ilmu-ilmu pengetahuan sosial, kesehatan, dan biologi.

BAB III REGRESI SPLINE = + dimana merupakan fungsi pemulus yang tidak spesifik, dengan adalah

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

BAB II TINJAUAN PUSTAKA. (b) Variabel independen yang biasanya dinyatakan dengan simbol

DAFTAR ISI ABSTRACT. BAB I PENDAHULUAN 1.1 LatarBelakang Pembatasan Masalah TujuanPenulisan

BAB I PENDAHULUAN 1.1. Latar Belakang

REGRESI LINIER. b. Variabel tak bebas atau variabel respon -> variabel yang terjadi karena variabel bebas. Dapat dinyatakan dengan Y.

BAB 2 LANDASAN TEORI. Analisis regresi (regression analysis) merupakan suatu teknik untuk membangun

MODUL TEORI ESTIMASI ATAU MENAKSIR TEORI ESTIMASI ATAU MENAKSIR

BAB I PENDAHULUAN 1.1 Latar Belakang

APLIKASI REGRESI SPLINE UNTUK MEMPERKIRAKAN TINGKAT FERTILITAS WANITA BERDASARKAN UMUR

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. hubungan antara variabel respon dengan satu atau beberapa variabel prediktor.

PREDIKSI INFLASI DI PROVINSI JAWA TENGAH DENGAN MENGGUNAKAN REGRESI KERNEL

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 2 LANDASAN TEORI. 1. Analisis regresi linier sederhana 2. Analisis regresi linier berganda. Universitas Sumatera Utara

PENENTUAN MODEL REGRESI SPLINE TERBAIK. Agustini Tripena 1

ANALISIS REGRESI LINIER SEDERHANA DENGAN METODE THEIL

Interval Estimation. Tjipto Juwono, Ph.D. May TJ (SU) Interval Estimation May / 19

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

Distribusi Probabilitas : Gamma & Eksponensial

Interval Estimation. Tjipto Juwono, Ph.D. May 20, TJ (SU) Interval Estimation May / 24

BAB I PENDAHULUAN. menganalisis hubungan fungsional antara variabel prediktor ( ) dan variabel

Interval Estimation. Tjipto Juwono, Ph.D. May 13, TJ (SU) Interval Estimation May / 17

BAB I PENDAHULUAN Latar Belakang

Analisis Regresi Spline Kuadratik

STATISTIKA BISNIS PENDUGAAN STATISTIKA. Deden Tarmidi, SE., M.Ak., BKP. Modul ke: Fakultas Ekonomi dan Bisnis. Program Studi Akuntansi

BAB II LANDASAN TEORI

Penduga : x p s r b. Pertemuan Ke 9. BAB V PENDUGAAN PARAMETER

III. METODE PENELITIAN

BAB II TINJAUAN PUSTAKA. variabel prediktor terhadap variabel respons. Hubungan fungsional

III. HASIL DAN PEMBAHASAN

Estimasi Titik. (Point Estimation) Minggu ke 1-3. Prof. Dr. Sri Haryatmi, M. Sc. Universitas Gadjah Mada

BAB II LANDASAN TEORI. Data merupakan bentuk jamak dari datum. Data merupakan sekumpulan

BAB II LANDASAN TEORI. landasan pembahasan pada bab selanjutnya. Pengertian-pengertian dasar yang di

BAB 2 LANDASAN TEORI

GENERALIZED CROSS VALIDATION DALAM REGRESI SMOOTHING SPLINE

Korelasi Linier Berganda

PEMILIHAN PARAMETER PENGHALUS DALAM REGRESI SPLINE LINIER. Agustini Tripena Br.Sb.

BAB 2 TINJAUAN PUSTAKA

DISTRIBUSI NORMAL. Pertemuan 3. Distribusi Normal_M. Jainuri, M.Pd 1

BAB 2 LANDASAN TEORI. Analisis regresi merupakan bentuk analisis hubungan antara variabel prediktor

PENARIKAN SAMPEL & PENDUGAAN PARAMETER

Standar Kompetensi. Sesudah mengikuti mata kuliah ini, mahasiswa. menggunakan statistika secara tepat dalam kegiatan penelitian ilmiah.

BAB I PENDAHULUAN 1.1 Latar Belakang

PENS. Probability and Random Process. Topik 8. Estimasi Parameter. Prima Kristalina Juni 2015

MODEL REGRESI NONPARAMETRIK DENGAN PENDEKATAN DERET FOURIER PADA KASUS TINGKAT PENGANGGURAN TERBUKA DI JAWA TIMUR

BAB I PENDAHULUAN. Analisis regresi merupakan metode analisis data yang telah diterapkan

BAB 2 LANDASAN TEORI

BAB III PEMBAHASAN

KULIAH ANALISIS STATISTIK DATA SIMULASI Tipe-tipe simulasi berdasarkan analisis output:

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. pembahasan pada bab selanjutnya. Pembahasan teori meliputi pengertian data

BAB II TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI

KORELASI LINIER BERGANDA

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. belajar kimia SMA Negeri 1 Jogonalan Kabupaten Klaten.

ESTIMASI. Podojoyo, SKM, M.Kes. Podojoyo 1

PEMILIHAN BANDWIDTH PADA ESTIMATOR NADARAYA-WATSON DENGAN TIPE KERNEL GAUSSIAN PADA DATA TIME SERIES

ESTIMASI. Widya Setiafindari

BAB 2 LANDASAN TEORI

SESI 13 STATISTIK BISNIS

TINJAUAN PUSTAKA. Menurut Usman dan Warsono (2000) bentuk model linear umum adalah :

ESTIMASI MODEL REGRESI SEMIPARAMETRIK DISKRIT

BAB 2 LANDASAN TEORI. berkenaan dengan studi ketergantungan dari suatu varibel yaitu variabel tak bebas (dependent

Sampling, Estimasi dan Uji Hipotesis

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

BAB 2 LANDASAN TEORI. dangkal, sehingga air mudah di gali (Ruslan H Prawiro, 1983).

ESTIMASI. A. Dasar Teori

MODEL REGRESI NONPARAMETRIK BERDASARKAN ESTIMATOR POLINOMIAL LOKAL KERNEL PADA KASUS PERTUMBUHAN BALITA

MA3081 STATISTIKA MATEMATIKA We love Statistics

BAB 2 LANDASAN TEORI. berarti ramalan atau taksiran pertama kali diperkenalkan Sir Francis Galton pada

Haryoso Wicaksono, S.Si., M.M., M.Kom. 26

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

FORMAT LAPORAN MODUL IV DISTRIBUSI VARIABEL RANDOM KONTINU

ANALISA DATA. Mayang Adelia Puspita

KORELASI LINIER BERGANDA. Debrina Puspita Andriani /

PERBANDINGAN DISTRIBUSI BINOMIAL DAN DISTRIBUSI POISSON DENGAN PARAMETER YANG BERBEDA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III ANALISIS SPEKTRAL PADA RUNTUN WAKTU MODEL ARIMA. Analisis spektral adalah metode yang menggambarkan kecendrungan osilasi

ANALISIS MODEL REGRESI NONPARAMETRIK SIRKULAR-LINEAR BERGANDA

MODUL II DISTRIBUSI PELUANG DISKRIT DAN KONTINU

Transkripsi:

BAB 3 MODEL ESTIMASI REGRESI NONPARAMETRIK Dalam melakukan estimasi pada suatu kasus regresi nonparametrik, ada banyak metode yang dapat digunakan. Yasin (2009) dalam makalahnya melakukan estimasi regresi nonparametrik menggunakan metode Wavelet Shrinkage Neural Network pada model rancang tetap. Yasin menjelaskan bahwa fungsi W avelet merupakan fungsi matematika yang mempunyai sifat-sifat tertentu, diantaranya berosilasi di sekitar nol (seperti fungsi sinus dan cosinus) dan terlokalisasi dalam domain waktu, artinya pada saat nilai domain relatif besar maka fungsi W avelet bernilai nol. Selain W avelet, ada juga beberapa metode untuk melakukan estimasi fungsi regresi nonparametrik; seperti Nadaraya-Watson yang akan digunakan peneliti untuk menangani persoalan yang dimaksud. 3. Estimator Secara umum, parameter populasi akan diberi simbol m.jadi merupakan rata-rata µ, simpangan baku σ,proporsi π dan sebagainya. Jika m yang tidak diketahui harganya, ditaksir oleh harga ˆm, maka ˆm dinamakan penaksir. terdapat dua macam estimasi: 3.. Estimasi titik Sebuah estimasi titik (point estimate) dari sebuah parameter m adalah suatu angka tunggal yang dapat dianggap sebagai nilai yang masuk akal bagi m. Estimasi titik diperoleh dengan memilih statistik yang tepat dan menghitung nilainya dari data sampel. Statistik yang dipilih disebut estimator titik (point estimator) dan proses mengestimasi dengan suatu angka tunggal disebut sebagai estimasi titik (point estimation). 6

7 3..2 Estimasi interval Sebuah estimasi interval (interval estimate) dari sebuah parameter m adalah suatu sebaran nilai-nilai yang digunakan untuk mengestimasi m. Proses mengestimasi dengan suatu sebaran nilai-nilai ini disebut estimasi interval (interval estimation). 3.2 Nadaraya-Watson Estimator Bilamana terdapat data yang sangat banyak dimana X x i, maka cara mengatasinya adalah dengan mencari nilai rata-rata setiap y i pada data tersebut. Dan juga karena X berdistribusi kontinu, maka tidak perlu dilakukan pengamatan berulang pada data dengan nilai yang sama. Solusi dari persoalan tersebut adalah dengan memperhatikan ketetanggaan x i, untuk itu perlu dilakukan sejumlahpengamatan di ketetanggan tersebut. Trik yang sangat jelas jelas adalah dengan cara melakukan estimasi bias serta estimasi varians. Andai dilakukan pengamatan pada sejumlah besar data X. Misalkan x±h untuk sebarang bandwidth h > 0. Maka estimator Nadaraya-Watson (964) ˆm NW (x) yang ditunjukkan pada persamaan (3.) merupakan rata-rata nilai y i untuk pengamatan i sedemikian sehingga X i berada pada ketetanggaannya. ˆm NW (x) n K( x x i h)y i n K( x x i h) n y ik( x x i ) h n K( x x i ) (3.) h dengan K(u) merupakan Kernel. Pada dasarnya, fungsi regresi dapat dituliskan seperti pada persamaan berikut. m(x) yf(x, y)dy f(x) (3.2) dimana, f(x, y) n H h y K ( H (x x i ) ) ( ) y yi K dan h y merupakan bandwidth untuk pemulusan data y. h y

8 Dengan demikian, f(x) f(x, y)dy ( ) y K(H yi (x x i )) K dy n H h y h y K(H (x x i )) n H (3.3) dan yf(x, y)dy ( ) y K(H yi (x x i )) yk dy n H h y h y K(H (x x i ))y i (3.4) n H Kemudian lakukan substitusi persamaan (3.3) dan (3.4) ke persamaan (3.2), maka diperoleh: m(x) n n H K(H (x x i ))y i n n H K(H (x x i )) n y ik( x x i ) h n K( x x i ) h Pada persamaan tersebut, m(x) dinamakan estimator Nadaraya-Watson. Dalam menghadapi persoalan regresi, para peneliti sangat menyarankan untuk menggunakan hanya fungsi Kernel orde kedua. Hal ini untuk menghindari ketidakasimtotisan distribusi data pengamatannya. Dalam makalahnya. Isogai (987) mengambil nilai h n n r untuk 0.2 < r<. Kernel K merupakan fungsi kepadatan probabilitas yang berbatas pada bilangan riil dimana, lim u K(u) 0, uk(u)du 0 dan u u2 K(u)du < Nadaraya (964) mengindikasi bahwa jika Y adalah sebuah variabel random dan nh 2 n,maka(nh n) 2 (m(x) Em(x)) normal secara asimtotik dengan ratarata 0 dan varians E[Y 2 X x] K 2 (u)du/g(x).

9 3.2. Distribusi yang asimtotis Karena E(y i X x i )m(x i ), maka persamaan regresinya dapat dituliskan seperti pada persamaan (3.5). y i m(x i )+ε i, i,...,n (3.5) dimana ε,...,ε n merupakan nilai error yang merupakan variabel random dengan nilai ekspektasi E(ε i X I ) 0 dan nilai varians V (ε 2 i x i )σ 2 (x). Perhatikan bahwa, dan oleh sebab itu, nh y i m(x i )+ε i, m(x)+(m(x i ) m(x)) + ε i ( ) xi x k y i h nh ( ) xi x k m(x) (3.6) h

BAB 4 HASIL DAN PEMBAHASAN 4. Estimasi regresi nonparametrik Hubungan antara variabel X dan variabel Y pada tesis ini diambil data laju kendaraan Sepeda Motor dengan banyak sampel pengamatan sebanyak 40. Variabel prediktor yang digunakan adalah waktu dan variabel respon yang digunakan adalah percepatan. Contoh kasus penerapan estimasi regresi nonparametrik dapat dilihat pada Tabel 4. berikut ini. Tabel 4. Statistika deskriptif sepeda motor No Waktu (X) Percepatan (Y) No Waktu (X) Percepatan (Y) 2,4 0,5 2 39,87 0,52 2 2,5 0,55 22 4,45 0,7 3 2,67 0,45 23 4,67 0,95 4 4,5 0,7 24 4,78,35 5 4,96 0,45 25 42,65 2,47 6 7 -,54 26 43 2,98 7 5,7-2,45 27 43,34 6,47 8 8,6-4,34 28 43,87 0,24 9 9,9-5,78 29 44,54 0,99 0 2-5,43 30 44,89 9,34 4,6-6,79 3 45,32 9,75 2 8-7,64 32 45,33 8,75 3 2,24-5,43 33 45,78 8,89 4 29,56-4,34 34 49,56 9,75 5 3,34-4,0 35 49,65 7,78 6 33, -2,24 36 52,34 8,87 7 33,24 -,02 37 52,66 6,56 8 33,99-0,35 38 54,54 6,43 9 37,42 0,49 39 55,89 5,46 20 37 0,67 40 57,4 5 Dengan menggunakan aplikasi Microsoft excel dapat ditentukan nilai ratarata, nilai tengah, dan standar deviasi dari kedua variabel di atas. Hasil perhitungan dapat dilihat pada Tabel 4.2 berikut: 20

2 Tabel 4.2 Nilai rata-rata, nilai tengah dan standar deviasi Variabel Waktu (X) N 40 Min 2,4 Maks 57,4 Mean 32,3 Q 2 38,64 Standar deviasi 7,84 Percepatan (Y) 40-7,64 0,99,89 0,68 5,36 Data sampel pengamatan ada sebanyak 40 data, dengan waktu minimum sebesar 2, 4 detik dengan waktu maksimal sebesar 57, 4 detik dan percepatan minimum sebesar 7, 64 m/s 2, percepatan maksimal 0, 99 m/s 2, rata-rata waktu sebesar 32, 3 detik, dan percepatan sebesar, 89 m/s 2, dengan nilai tengah waktu sebesar 38, 64 detik dan percepatan 0, 68 m/s 2, serta standar deviasi waktu sebesar 7, 84 detik dan percepatan 5, 36 m/s 2. Bentuk hubungan antara variabel prediktor (waktu) dengan variabel respon (percepatan) dapat dilihat pada plot antara kedua variabel tersebut seperti pada gambar berikut ini: Gambar 4. Diagram pencar data sepeda motor

22 Selanjutnya dengan bantuan software SPSS, analisis estimasi regresi hubungan antara variabel prediktor (waktu) dengan variabel respon (percepatan) juga dapat dilihat dari plot antara kedua variabel seperti pada gambar berikut ini: Gambar 4.2 Diagram analisis estimasi regresi

23 Apabila data yang telah ada juga dibandingkan dengan menggunakan program R dari data deskriptif Sepeda Motor dapat dilihat seperti pada gambar berikut ini: Gambar 4.3 Diagram pencar data sepeda motor Fungsi s(x) adalah suatu fungsi yang digunakan untuk menentukan bentuk spsesifikasi model suatu formula, menunjukkan bahwa pemulusan yang dilakukan telah mendekati dengan baik. Pada program R pemilihan parameter pemulusan dilakukan secara otomatis. Berdasarkan dari Gambar 4.3 dapat dilihat bahwa nilai GCV minimum yaitu 2,3833. Artinya, pendugaan kurva dan kesesuaian fungsi pada data berada pada nilai GCV 2, 3833.

24 Berikut adalah hasil dari program R yang akan memperlihatkan bentuk model formula kernel: Gambar 4.4 Model formula nonparametrik Dengan demikian, dari data hubungan antara variabel prediktor (waktu) dengan variabel respon (percepatan) dapat dibentuk model estimasi regresi nonparametrik nya, yaitu: Y 4, 8753 + 0, 209x dengan nilai standar error sebesar 3,90. Penduga Kernel didefinisikan seperti pada persamaan berikut ini. f(x; h) 40 40 K h (x X i ) (4.) Berkaitan dengan model persamaan regresi yang telah didapat, suatu model dikatakan baik apabila nilai koefisien determinasi (R 2 ) mendekati, dari Gambar 4.3 memperlihatkan bahwa koefisien determinasi (R 2 ) sebesar 0,937. Hal ini berarti, model yang diperoleh dapat dikatakan baik dan memiliki hubungan antar variabel yang cukup erat.

25 Kemudian dalam hal kaitan dengan metode kernel, yang mana model estimasi regresi nonparametrik dilakukan dengan menggunakan metode kernel, maka ukuran sampel optimal untuk membentuk interval yang telah diperoleh dari gambar 4., gambar 4.2, dan gambar 4.3, dengan menggunakan metode kernel mengandalkan pada beberapa sifat asimptomatik dari Nadaraya-Watson. Maka estimator Nadaraya-Watson (964) ˆm NW (x) yang ditunjukkan pada persamaan (3.) merupakan rata-rata nilai y i, dimana dalam hal ini variabel y digunakan untuk menerangkan Percepatan, untuk pengamatan i sebanyak 40 pengamatan sedemikian sehingga X i, dimana dalam hal ini variabel x digunakan untuk menerangkan Waktu, diperolah persamaan sebagai berikut: ˆm NW (W aktu) dengan K(u) menerangkan Kernel. 40 K( x x i h)y i 40 K( x x i h) 40 y ik( x x i 40 K( x x i ) (4.2) h h )

BAB 5 KESIMPULAN DAN SARAN 5. Kesimpulan. Statistik nonparametrik merupakan kumpulan metode untuk analisis data yang menawarkan sebuah pendekatan dengan cara-cara pengambilan keputusan. Salah satu cara yang digunakan dalam model etimasi regresi nonparametrik ialah dengan metode Kernel. 2. Dengan menghadirkan fungsi regresi nonparametrik, dapat dimodelkan estimasi Nadaraya-Watson berdasarkan metode Kernel. 3. Berdasarkan hasil pembahasan hubungan non-linear antara dua variabel seperti pada contoh kasus untuk data Sepeda Motor dimana variabel Waktu (X) yang dibutuhan dengan variabel Percepatan (Y ) berpengaruh pada laju Sepeda Motor dengan model estimasi regresi nonparametrik yang diperoleh dapat dikatakan baik dan memiliki hubungan antar variabel yang cukup erat. Fungsi s(x) yang menyatakan suatu fungsi yang digunakan untuk menentukan bentuk spsesifikasi model suatu formula, menunjukkan bahwa pemulusan yang telah dilakukan mendekati baik, dengan nilai GCV minimum yaitu 2,3833. 4. Apabila dilihat dari grafik pada gambar 4., gambar 4.2, dan gambar 4.3 bahwa dari 0 detik sampai 20 detik kurva turun dan setelah waktu 20 detik kurva naik kembali sampai ke 50 detik. Hal ini sesuai dengan asumsi penggunaan regresi nonparamatrik, yakni contoh kasus yang diambil bersifat acak dan kontinu dan data yang tidak berdistribusi normal. 5.2 saran Sebagaimana yang diketahui, bahwa fungsi kernel ada beberapa jenis. Untuk itu perlu dilakukan penelitian lebih lanjut guna mengetahui apakah ada perbedaan yang signifikan apabila menggunakan fungsi Kernel yang berbeda. 26