PEMILIHAN PARAMETER PENGHALUS DALAM REGRESI SPLINE LINIER. Agustini Tripena Br.Sb.

dokumen-dokumen yang mirip
PENENTUAN MODEL REGRESI SPLINE TERBAIK. Agustini Tripena 1

Analisis Regresi Spline Kuadratik

REGRESI SEMIPARAMETRIK SPLINE TRUNCATED DENGAN SOFTWARE R. Abstract. Keywords: Spline Truncated, GCV, Software R.

MODEL REGRESI NONPARAMETRIK SPLINE TRUNCATED PADA PRODUK DOMESTIK REGIONAL BRUTO TERHADAP INVESTASI DI KABUPATEN TUBAN

BAB II LANDASAN TEORI

PEMODELAN KURS RUPIAH TERHADAP MATA UANG EURO DENGAN PENDEKATAN REGRESI SPLINE. Sulton Syafii Katijaya 1, Suparti 2, Sudarno 3.

BAB III REGRESI SPLINE = + dimana merupakan fungsi pemulus yang tidak spesifik, dengan adalah

BAB 2 LANDASAN TEORI

PERBANDINGAN TINGKAT AKURASI REGRESI NONPARAMETRIK SPLINE DAN REGRESI NONPARAMETRIK KERNEL PADA PERTUMBUHAN BALITA DI KOTA SURAKARTA

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

MODEL REGRESI NONPARAMETRIK SPLINE TRUNCATED PADA DATA INDEKS PEMBANGUNAN MANUSIA (IPM) DI INDONESIA. 1. Pendahuluan

Aplikasi Spline Kuadrat Terkecil dalam Pemodelan Pertumbuhan Anak Berdasarkan Indeks Antropometri

PENENTUAN GENERALIZED CROSS VALIDATION (GCV) SEBAGAI KRITERIA DALAM PEMILIHAN MODEL REGRESI B-SPLINE TERBAIK

REGRESI SPLINE BIRESPON UNTUK MEMODELKAN KADAR GULA DARAH PENDERITA DIABETES MELITUS

MODEL REGRESI NONPARAMETRIK BERDASARKAN ESTIMATOR POLINOMIAL LOKAL KERNEL PADA KASUS PERTUMBUHAN BALITA

MODEL REGRESI NONPARAMETRIK DENGAN PENDEKATAN DERET FOURIER PADA KASUS TINGKAT PENGANGGURAN TERBUKA DI JAWA TIMUR

PEMODELAN REGRESI SPLINE (Studi Kasus: Herpindo Jaya Cabang Ngaliyan)

GENERALIZED CROSS VALIDATION DALAM REGRESI SMOOTHING SPLINE

PREDIKSI INFLASI DI INDONESIA MENGGUNAKAN REGRESI NONPARAMETRIK B-SPLINE

APLIKASI REGRESI SPLINE UNTUK MEMPERKIRAKAN TINGKAT FERTILITAS WANITA BERDASARKAN UMUR

PEMODELAN DATA INDEKS HARGA SAHAM GABUNGAN. Disusun Oleh : NOVIA AGUSTINA. Skripsi. Jurusan Statistika Fakultas Sains dan Matematika Undip

Pemodelan Spline Truncated dalam Regresi Nonparametrik Birespon

BAB I PENDAHULUAN. bisnis, ekonomi, ilmu-ilmu pengetahuan sosial, kesehatan, dan biologi.

PEMODELAN DATA INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN REGRESI PENALIZED SPLINE

PEMODELAN HARGA CABAI DI KOTA SEMARANG TERHADAP HARGA INFLASI MENGGUNAKAN REGRESI SEMIPARAMETRIK POLINOMIAL LOKAL

ESTIMATOR SPLINE KUBIK

BAB I PENDAHULUAN. menganalisis hubungan fungsional antara variabel prediktor ( ) dan variabel

Seminar Tugas Akhir. Dosen Pembimbing : Prof. Dr. Drs. I Nyoman Budiantara, MS

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II TINJAUAN PUSTAKA. variabel prediktor terhadap variabel respons. Hubungan fungsional

ESTIMASI KURVA REGRESI PADA DATA LONGITUDINAL DENGAN WEIGHTED LEAST SQUARE

BAB I PENDAHULUAN. Analisis regresi merupakan metode analisis data yang telah diterapkan

PEMODELAN REGRESI SPLINE UNTUK RATA- RATA BANYAK ANAK YANG DILAHIRKAN HIDUP DI KOTA SURABAYA, KABUPATEN SITUBONDO DAN KABUPATEN BANGKALAN

BAB I PENDAHULUAN. dipergunakan untuk menaksir pola hubungan antara variabel prediktor atau

Pemodelan Faktor-Faktor yang Mempengaruhi Indeks Pembangunan Manusia Menggunakan Regresi Nonparametrik Spline di Jawa Tengah

Pemodelan Angka Putus Sekolah Usia SMA di Jawa Timur dengan Pendekatan Regresi Spline Multivariabel

TINJAUAN PUSTAKA. Menurut Hardle (1994) analisis regresi adalah suatu metode analisis data yang

ADLN Perpustakaan Universitas Airlangga

BAB I PENDAHULUAN. 1.1 Latar Belakang

PEMODELAN KASUS KEMISKINAN DI JAWA TENGAH MENGGUNAKAN REGRESI NONPARAMETRIK METODE B-SPLINE ABSTRACT

BAB I PENDAHULUAN 1.1. Latar Belakang

PREDIKSI INFLASI DI PROVINSI JAWA TENGAH DENGAN MENGGUNAKAN REGRESI KERNEL

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS REGRESI NONPARAMETRIK SPLINE MULTIVARIAT UNTUK PEMODELAN INDIKATOR KEMISKINAN DI INDONESIA

ABSTRAK. Kata Kunci: regresi nonparametrik spline, knot, GCV, angka kematian bayi.

APLIKASI SPLINE TRUNCATED DALAM REGRESI NONPARAMETRIK SKRIPSI FIKA KHAIRANI

Analisis Regresi Spline Multivariabel untuk Pemodelan Kematian Penderita Demam Berdarah Dengue (DBD) di Jawa Timur

REGRESI SPLINE SEBAGAI ALTERNATIF DALAM PEMODELAN KURS RUPIAH TERHADAP DOLAR AMERIKA SERIKAT SKRIPSI

2-RP RENCANA PEMBELAJARAN. Semester : VI Hal: 1 dari 5. No.Revisi : 00. tim. Regresi Nonparametrik. Deskripsi. Kemampuan. lokal).

MODEL REGRESI SPLINE KNOT OPTIMAL UNTUK MENGETAHUI FAKTOR FAKTOR YANG MEMPENGARUHI JUMLAH KEMATIAN BAYI DI JAWA TIMUR

oleh FAIFAR NUR CHAYANINGTYAS M SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

PEMODELAN KURS RUPIAH TERHADAP DOLLAR AMERIKA SERIKAT MENGGUNAKAN

BAB 1 PENDAHULUAN. hubungan antara variabel respon dengan satu atau beberapa variabel prediktor.

ESTIMASI KURVA REGRESI SEMIPARAMETRIK PADA DATA LONGITUDINAL BERDASARKAN ESTIMATOR POLINOMIAL LOKAL

PEMILIHAN BANDWIDTH PADA ESTIMATOR NADARAYA-WATSON DENGAN TIPE KERNEL GAUSSIAN PADA DATA TIME SERIES

APLIKASI MODEL REGRESI SEMIPARAMETRIK SPLINE TRUNCATED (Studi Kasus: Pasien Demam Berdarah Dengue (DBD) di Rumah Sakit Puri Raharja)

Pemodelan Regresi Nonparametrik Spline Truncated Dan Aplikasinya pada Angka Kelahiran Kasar di Surabaya

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

ANALISIS INFLASI KOTA SEMARANG MENGGUNAKAN METODE REGRESI NON PARAMETRIK B-SPLINE

BAB I PENDAHULUAN. Daerah daratan adalah daerah yang terletak di atas dan di bawah

PENDEKATAN REGRESI SEMIPARAMETRIK SPLINE LINIER UNTUK MEMODELKAN ANGKA KEMATIAN BAYI DI JAWA TIMUR

PEMODELAN KURS RUPIAH TERHADAP DOLLAR AMERIKA SERIKAT MENGGUNAKAN REGRESI PENALIZED SPLINE BERBASIS RADIAL

Pemodelan Angka Putus Sekolah Usia SMP Menggunakan Metode Regresi Nonparametrik Spline di Papua

Pemodelan Faktor-Faktor yang Mempengaruhi Unmet Need KB di Provinsi Jawa Timur dengan Pendekatan Regresi Nonparametrik Spline

PEMODELAN KASUS KEMISKINAN DI JAWA TENGAH MENGGUNAKAN REGRESI NONPARAMETRIK METODE B-SPLINE

Oleh : Edwin Erifiandi (NRP ) Pembimbing : Prof. Dr. Drs. I Nyoman Budiantara, MSi

APLIKASI SPLINE ESTIMATOR TERBOBOT

PEMODELAN REGRESI SPLINE TRUNCATED UNTUK DATA LONGITUDINAL

PEMODELAN TINGKAT PENGANGGURAN TERBUKA DI PROVINSI JAWA TENGAH MENGGUNAKAN REGRESI SPLINE

BAB II TINJAUAN PUSTAKA

MODEL REGRESI SEMI PARAMETRIK DENGAN ESTIMATOR SPLINE PARSIAL

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

DAFTAR ISI ABSTRACT. BAB I PENDAHULUAN 1.1 LatarBelakang Pembatasan Masalah TujuanPenulisan

SEMINAR TUGAS AKHIR 16 JANUARI Penyaji : I Dewa Ayu Made Istri Wulandari Pembimbing : Prof.Dr.Drs. I Nyoman Budiantara, M.

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 2, Tahun 2014, Halaman Online di:

ESTIMATOR KERNEL DALAM MODEL REGRESI NONPARAMETRIK

ISSN: JURNAL GAUSSIAN, Volume 5, Nomor 3, Tahun 2016, Halaman Online di:

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

PENDEKATAN REGRESI SEMIPARAMETRIK UNTUK PROSES PEMBENTUKAN LIMBAH PABRIK GULA ASEMBAGUS SITUBONDO

Kata Kunci : regresi semiparametrik, spline, knot, GCV

JMP : Volume 6 Nomor 1, Juni 2014, hal REGRESI LINEAR BIVARIAT SIMPEL DAN APLIKASINYA PADA DATA CUACA DI CILACAP

Faktor-faktor yang Mempengaruhi Indeks Pembangunan Manusia (IPM) di Jawa Timur dengan Pendekatan Regresi Semiparametrik Spline

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 2, Tahun 2017, Halaman Online di:

PERBANDINGAN TINGKAT AKURASI REGRESI NONPARAMETRIK SPLINE DAN REGRESI NONPARAMETRIK KERNEL PADA PERTUMBUHAN BALITA DI KOTA SURAKARTA

ADLN PERPUSTAKAAN UNIVERSITAS AIRLANGGA

Kata Kunci kematian maternal, regresi, spline, nonparametrik, GCV

MODEL SPLINE TERBOBOT UNTUK MERANCANG KARTU MENUJU SEHAT (KMS) PROPINSI JAWA TIMUR

PREDIKSI KURS RUPIAH TERHADAP EURO MENGGUNAKAN MODEL REGRESI SPLINE TERSEGMEN

BAB 1 PENDAHULUAN. variabel respon dengan variabel prediktor. Menurut Eubank (1988), f(x i ) merupakan

BAB IV PEMBAHASAN. 4.1 Deskripsi Data

PENDUGAAN MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN PENDUGA KERNEL [SKRIPSI] KOMPETENSI STATISTIKA

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA. pembahasan pada bab selanjutnya. Pembahasan teori meliputi pengertian data

II. TINJAUAN PUSTAKA 2.1 Metode Regresi 2.2 Model Aditif Terampat ( Generalized additive models , GAM)

MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) UNTUK KLASIFIKASI KEJADIAN KONSTIPASI TERHADAP PEMBERIAN AIR SUSU IBU DAN PEMBERIAN AIR SUSU FORMULA

EFISIENSI RELATIF ESTIMATOR FUNGSI KERNEL GAUSSIAN TERHADAP ESTIMATOR POLINOMIAL DALAM PERAMALAN USD TERHADAP JPY

BAB II LANDASAN TEORI

Transkripsi:

JMP : Volume 3 Nomor 1, Juni 2011 PEMILIHAN PARAMETER PENGHALUS DALAM REGRESI SPLINE LINIER Agustini Tripena Br.Sb. Fakultas Sains dan Teknik, Universitas Jenderal Soedirman Purwokerto, Indonesia ABSTRAK. Pada paper ini dibahas pemilihan parameter penghalus untuk estimasi regresi spline linier pada data beda potensial listrik dalam limbah cair. Metode yang digunakan adalah mean square error (MSE) dan generalized cross validation (GSV). Hasil penelitian menunjukkan bahwa dalam pemilihan metode mean square error (MSE) memberikan nilai parameter penghalus lebih kecil dari pada metode generalized cross validation (GCV). Ini berarti bahwa untuk kasus data beda potensial listrik dalam limbah cair metode mean square error (MSE) merupakan metode yang terbaik untuk mengestimasi parameter penghalus dari regresi spline linier. Kata Kunci: regresi spline linier, metode mean square errorr, metode generalized cross validation. ABSTRACT. This paper discusses aselection of smoothing parameters for the linier spline regression estimation on the data of electrical voltage differences in the wastewater. The selection methods are based on the mean square errorr (MSE) and generalized cross validation (GCV). The results show that in selection of smooting paranceus the mean square error (MSE) method gives smaller value, than that of the generalized cross validatio (GCV) method. It means that for our data case the errorr mean square (MSE) is the best selection method of smoothing parameter for the linear spline regression estimation. Keywords: linear spline regression, mean square errorr method, generalized cross validation method

A. Tripena 10 1. Pendahuluan Analisa regresi merupakan metode yang banyak digunakan untuk mengetahui hubungan antara sepasang variabel atau lebih. Misalkan y adalah variabel respon dan x adalah variabel prediktor, maka hubungan variabel x dan y dapat dinyatakan sebagai y = f(x i ) + ε i, i 1, 2,..., n. (1) (1) dengan i adalah error random yang diasumsikan independen dengan mean nol dan variansi 2 sedangkan f(x i ) merupakan fungsi kurva regresi. Untuk mengestimasi f(x i ) ada dua estimasi yang dapat digunakan yaitu estimasi regresi parametrik dan regresi nonparametrik (Hardle, 1990). Estimasi regresi parametrik digunakan bila bentuk fungsi f(x i ) diketahui dari informasi sebelumnya berdasarkan teori ataupun pengalaman masa lalu. Jadi dalam hal ini, estimasi untuk f(x i ) eqivalen dengan estimasi parameter. Sementara itu, pada estimasi regresi nonparametrik tidak diberikan asumsi terhadap bentuk kurva regresi sehingga estimasi regresi nonparametrik memiliki fleksibelitas yang tinggi untuk mengestimasi kurva regresi f(x i ). Dalam hal ini fungsi regresi f(x i ) hanya diasumsikan termuat dalam suatu ruang fungsi tertertentu, dan pemilihan ruang fungsi tersebut biasanya dimotivasi oleh sifat kemulusan (smoothness) yang dimiliki oleh fungsi f(x i ). Beberapa penulis seperti Hardle (1990), Wahba (1990), Budiantara dan Subanar (1997) menyarankan penggunaan regresi nonparametrik sebagai estimasi untuk model data, agar mempunyai fleksibelitas yang baik. Beberapa model pendekatan dalam regresi nonparametrik, yang cukup populer untuk mengestimasi fungsi f(x i ) antara lain adalah regresi spline (Craven dan Wahba, 1979), kernel (Rosenblatt, 1971), dan deret Fourier dan lain-lain.. Bentuk estimator spline sangat dipengaruhi oleh nilai parameter penghalus ( ) (Budihantara, 2000). Oleh karena itu, pemilihan nilai parameter penghalus ( ) optimal mutlak diperlukan untuk memperoleh estimator spline yang sesuai dengan data.

Pemilihan Parameter Penghalus dalam Regresi Spline 11 Bentuk estimator spline juga dipengaruhi oleh lokasi dan banyaknya titiktitik knot. Nilai parameter penghalus yang sangat besar akan menghasilkan bentuk kurva regresi yang sangat halus; sebaliknya nilai parameter penghalus yang kecil memberikan bentuk kurva regresi yang sangat kasar (Wahba, 1990; Eubank, 1988; Budiantara, 1998). Pada paper ini, dibahas mengenai pemilihan parameter penghalus ( ) untuk estimasi spline linier pada data pengaruh penambahan potensial listrik dalam limbah cair. 2. Regresi Spline Menurut Eubank (1988), estimasi terhadap f(x) adalah f λ (x) yakni estimator yang mulus. Bentuk umum regresi spline orde ke-m sebagai berikut: y = β 0 + m j=1 β j x j + N β j+k (x K k ) m k=1 + + ε (2) Dengan menggunakan data amatan sebanyak n, maka bentuk matriks dari persamaan (2) adalah dengan y = y 1 y 2 [ y n ] ; ε = y = X 1 δ 1 + (X K)δ 2 + ε (3) ε 1 ε 2 [ ε n ] (X K) = ; δ 1 = β 0 β 1 β 2 [ β m ] ;X 1 = 1 x 1 x 1 2 x 1 m 1 x 2 x 2 2 x 2 m 2 [ 1 x n x n m n ] ; δ 1 = (x 1 k 1 ) m (x 1 k 2 ) m (x 1 k N ) m (x 2 k 1 ) m (x 2 k 2 ) m (x 2 k N ) m [(x n k 1 ) m (x n k 2 ) m (x n k N ) m ] Untuk alasan kesederhanaan, maka matriks (3) dapat ditulis kembali menjadi β m+1 β m+2 β m+3 [ β m+n ] y = Xβ + ε (4) δ 1 dengan X = [X 1 (X K)] dan β = [ ] δ 2

A. Tripena 12 Dalam hubungannya dengan estimasi kurva mulus f(x), yang mempunyai nilai parameter penghalus (λ ) optimal, maka untuk memilih estimator f(x) yang terbaik diantara kelas estimator C(Λ) = {f λ : λ Λ, Λ = himpunan indeks}. Himpunan indeks merupakan himpunan yang berisi indeks-indeks. Dengan menggunakan model regresi spline sebagai estimasi kurva mulus f λ, dilakukan penyesuaian persamaan menjadi b λ = β λ = (X λx λ ) 1 X λ y (5) Dengan X λ adalah matriks disain dari model yang membentuk model estimasi f λ dengan λ yang optimal. Dalam hal ini, f λ = X λ b λ = X λ (X λ X λ ) 1 X λ y = H λ y, λ Λ (6) dengan H λ = X λ (X λ X λ ) 1 X λ. Perlu dicatat H λ bersifat simetris, definit positif, dan idempoten. Untuk mendapatkan kurva mulus yang mempunyai λ optimal menggunakan data amatan sebanyak n, diperlukan ukuran kinerja atas estimator yang dapat diterima secara universal. Eubank (1988) menyebutkan, ukuran kinerja atas estimator tersebut adalah: a. Mean Squared Error (MSE) Ukuran kinerja atas estimator yang sederhana adalah kuadrat dari sisaan yang dirata-rata. Rata-rata kuadrat sisaan diberikan oleh atau MSE(λ) = n 1 (y f λ ) (y f λ ) MSE( ) = n 1 n i=1 (y i f (x i )) 2 (7) b. Generalized Cross-Validation (GCV) Menurut Budihantara (2005), GCV merupakan modifikasi dari Cross- Validation (CV). Cross-Validation (CV) merupakan suatu metode untuk memilih

model berdasarkan pada kemampuan prediksi dari model tersebut. CV adalah metode untuk memilih λ yang meminimumkan CV(λ) = n 1 n ( y i f λ (x i ) ) 2 i=1 (8) 1 h ii λ dengan h ii λ adalah elemen diagonal ke-i dari matriks H λ. GCV diperoleh dengan mengganti h ii λ pada persamaan (8) dengan n 1 n i=1 h ii λ = n 1 Tr(H λ ). Fungsi GCV didefinisikan sebagai: Pemilihan Parameter Penghalus dalam Regresi Spline 13 GCV(λ) = n 1 n (y i f λ (x i )) 2 i=1 MSE(λ) (1 n 1 Tr(H λ )) 2 = (9) {n 1 Tr(I H λ )} 2 dengan Tr(H λ ) < n. Kedua kriteria tersebut, baik MSE(λ) ataupun GCV(λ) diharapkan memiliki nilai yang minimum sehingga model regresi spline dapat dikatakan memiliki nilai λ yang optimal. 3. Pemilihan Model Regresi Spine dengan λ yang optimal. 3.1. Pembentukan Model Regresi Spline Plot data pengaruh penambahan beda potensial listrik dalam limbah cair disajikan pada Gambar 1. 600 plot cair vs waktu 550 potensial listrik(mv) 500 450 400 0 10 20 30 waktu(jam) 40 50 Gambar 1. Plot data pengaruh penambahan beda potensial listrik dalam limbah cair. Gambar 1 plot menunjukkan bahwa ada indikasi perubahan pola perilaku dari variabel bebas pada sub-sub interval tertentu. Selanjutnya, pola data akan didekati dengan pendekatan regresi nonparametrik spline linier. Terdapat 24 titik

A. Tripena 14 knot yang dapat digunakan untuk membentuk model spline. Banyaknya kombinasi titik knot yang bisa digunakan untuk membentuk model spline dengan empat titik knot adalah sebanyak 10.630 kombinasi. Persamaan regresi spline yang digunakan pada data ini adalah model spline dengan intersep (β 0 ) karena pada awal pengukuran sudah diperoleh besarnya beda potensial listrik. 3.2. Estimasi Regresi Spline Linier Model umum dari regresi spline linier adalah N y i = β 0 + β 1 x i + β 1+k (x i K k ) + + ε i ; dengan konstanta k=1 N y i = β 1 x i + β 1+k (x i K k ) + + ε i ; tanpa konstanta k=1 Fungsi spline linier merupakan fungsi spline dengan satu orde. Bentuk fungsi spline linier dengan satu titik knot f 1 (x) 1 = β 0 + β 1 x + β 2 (x K) + (10) Persamaan (10) dapat disajikan menjadi (Tripena, 2005) f 1 (x) = { β 0 + β 1 x, x < K β 0 + β 1 x + β 2 (x K), x K (11) Estimasi regresi spline linier dengan menggunakan tiga titik knot (K) dari data yang digunakan mempunyai model sebagai berikut: y i = β 0 + β 1 x i + β 2 (x i K 1 ) + + β 3 (x i K 2 ) + + β 4 (x i K 3 ) + + ε i (12) Pemilihan titik knot yang optimal terletak pada nilai MSE dan GCV yang minimum. Model regresi spline linier dengan empat titik knot adalah

Pemilihan Parameter Penghalus dalam Regresi Spline 15 y i = β 0 + β 1 x i + β 2 (x i K 1 ) + + β 3 (x i K 2 ) + + β 4 (x i K 3 ) + + β 5 (x i K 4 ) + ε i (13) Pemilihan titik knot dengan metode MSE dan GCV minimum untuk model regresi spline linier dengan empat titik knot dapat dilihat pada Tabel 1. Tabel 1. Nilai MSE dan GCV model regresi spline linier dengan empat titik knot No Titik knot Nilai MSE Nilai GCV 1 8,12,18,26 263,8931 439,3273 2 10,12,20,24 173,423 254,5532 Titik knot yang optimal berada pada titik K1= 10, K2= 12, K3= 20, dan K4= 24 dengan nilai MSE minimum sebesar 173,423 dan nilai GCV minimum sebesar 254,5532. Estimasi model regresi spline linier empat titik knot diberikan pada Tabel 2 berikut. Tabel 2. Estimasi model regresi spline linier dengan empat titik knot Parameter Estimasi β 0 536,031775 β 1-1,317260 β 2-65,101832 β 3 65,275544 β 4 27,716613 β 5 30,384043

A. Tripena 16 Estimasi model regresi spline linier dengan empat titik knot K1=10, K2=12, K3=20, dan K4= 4 adalah y i = 536,031775 1,317260 x i 65,101832(x i 10) + + 65,275544(x i 12) + + 27,716613(x i 20) + 30,384043(x i 24) + 3.3. Pemilihan Model Regresi Spline Terbaik Titik knot (K) yang paling optimal dengan nilai MSE dan GCV minimum adalah penggunaan empat titik knot pada regresi spline linier. Nilai MSE dan GCV model regresi spline dengan empat titik knot ditunjukkan pada Tabel 3 Tabel 3. Nilai MSE dan GCV beberapa model regresi spline dengan beberapa titik knot Orde Model Jumlah Knot (K) Letak Titik Knot (K) Nilai MSE (λ) optimal 1 2 3 4 Nilai GCV (λ) optimal 1 Linier 4 10 12 20 24 173,423 254,5532 Berdasarkan Tabel 3 dapat disimpulkan bahwa model terbaik untuk data pengaruh penambahan beda potensial listrik dalam limbah cair adalah model regresi spline linier dengan empat titik knot K1 = 10, K2 = 12, K3 = 20, dan K4 = 24 yakni y i = 536,031775 1,317260 x i 65,101832(x i 10) + + 65,275544(x i 12) + + 27,716613(x i 20) + 30,384043(x i 24) + Estimasi model regresi spline linier dengan empat titik knot dapat disajikan pula dalam bentuk fungsi terpotong (truncated) diberikan oleh

Pemilihan Parameter Penghalus dalam Regresi Spline 17 536,031775 1,317260 x i, x i < 10 1147,063257 66,418892 x i, 10 x i < 12 y i = 412,447691 1,317060 x i,12 x i < 20 171,527551 + 26,409553 x i, 20 x i < 24 { 578,156877 1,75814672 x i, x i 24 Semantara plot estimasi model regresi spline linier dengan empat titik knot yang merupakan model regresi spline terbaik berdasarkan kriteria nilai MSE dan GCV minimum diberikan pada Gambar 2. Beda Potensial 400 450 500 550 K 1 = 4 K 4 = 24 K 2 = 12 K 3 = 20 0 10 20 30 40 50 Waktu Gambar 2. Kurva estimasi regresi spline linier dengan empat titik knot yang merupakan kurva regresi spline terbaik Nilai koefisien determinasi (R 2 ) sebesar 0,9344868 berarti bahwa variabel pemberian beda potensial tambahan mampu menerangkan sebesar 93,44868% terhadap potensial listrik yang dihasilkan dalam limbah cair 3.4. Pengujian Model Regresi Spline Terbaik Uji hipotesis untuk pemeriksanaan model, dilakukan dengan hipotesis H0: Model tidak sesuai dengan data atau β 0 = β 1 = = β k = 0, i = 0,1,.., k

A. Tripena 18 H1: Model sesuai dengan data atau minimal terdapat satu β i 0, i = 0,1,, k untuk tingkat signifikansi 5%, diperoleh analisis variansi pada Tabel 4 berikut ini Tabel 4. Analisis variansi untuk model regresi spline terbaik Source of Variance Degree of freedom (df) Sum Square (SS) Mean Square (MS) F Regression 5 SS R = 72.732,06 MS R = 4.546,412 24,96604 Error 20 SS E = 3.642,077 MS E = 182,10385 Total 25 SS T = 77.374,137 Dengan menggunakan F tabel, diperoleh F α/2,p,(n (p+1)) = F 0.025,5,20 = 3,28906, sehingga diperoleh F Hitung = 24,96604 F 0.025,5,20 = 3,28906. Hal ini mengidentifikasi bahwa H 0 ditolak, artinya model berpengaruh terhadap data. Jadi dapat disimpulkan bahwa model regresi spline linier dengan titik-titik knot 10, titik 12, titik 20,dan titik 24 cukup memadai sebagai model estimasi untuk data pengaruh penambahan beda potensial listrik dalam limbah cair pada waktu tertentu. 4. Kesimpulan a) Titik knot yang optimal diperoleh menggunkan empat titik knot yaitu K1 = 10, K2 = 12, K3 = 20, dan K4 = 24. b) Pemilihan model regresi spline terbaik dengan menggunakan metode mean square error memberikan parameter penghalus = 173,423, dengan menggunakan metode generalized cross validation memberikan parameter penghalus = 254,5532, karena nilai mean square error paling minimum maka metode yang terbaik adalah metode mean square error

Pemilihan Parameter Penghalus dalam Regresi Spline 19 c) Nilai koefisien determinasi (R 2 ) sebesar 0,9344868, berarti bahwa pemberian beda potensial tambahan pada waktu tertentu mengakibatkan perubahan sebesar 93,44868% pada beda potensial listrik yang dihasilkan dalam limbah cair. 5. DAFTAR PUSTAKA Budiantara, I. N, 2005. Penentuan Titik-Titik Knots dalam Regresi Spline, Jurnal Jurusan Statistika FMIPA-ITS, Surabaya. Budiantara, I. N, Subanar. 1997. Pemilihan Parameter Penghalus dalam Regresi Spline Terbobot. Jurnal Jurusan Statistika FMIPA-ITS, Surabaya. Eubank, R. 1988. Spline Smoothing and Nonparametric Regression. Marcel Dekker, New York. Hardle, W. 1990. Applied Nonparametric Regression. Cambridge University Press, New York. Tripena, A. 2005. Pendekatan Model Regresi Spline Linier. Jurusan MIPA, Fakultas Sains dan Teknik, UNSOED. Wahba, G. 1990. Spline Models For Observasion Data. SIAM Pensylvania.

A. Tripena 20