BAB I PENDAHULUAN 1.1 Latar Belakang Jika kita mempunyai data yang terdiri dari dua atau lebih variabel maka sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat berhubungan, hubungan yang didapat pada umumnya dinyatakan dalam bentuk matematika yang menyatakan hubungan fungsional antara variabel-variabel. Studi yang menyangkut masalah ini dikenal dengan analisis regresi. Dalam analisis regresi ada beberapa syarat yang harus dipenuhi agar hasil estimasi yang diperoleh adalah benar dan efektif. Analisis regresi merupakan alat bantu statistika untuk melihat hubungan antara satu atau lebih variabel bebas atau variabel prediktor dan satu variabel tak bebas, untuk keperluan analisis, variabel bebas akan dinyatakan dengan X 1,X 2,,X k (k>1) sedangkan variabel tak bebas akan dinyatakan dengan Y, pada umumnya variabel yang dikumpulkan dari survey atau observasi. Hasil yang diperoleh dari analisis regresi yang berfungsi untuk melihat hubungan antara 2 variabel yang atau lebih harus diartikan secara hati-hati. Meskipun perhitungan statistika yg digunakan ntuk menghitung estimasi kuat dan sifat hubungan antara variabel telah benar, estimasi statistikanya dapat bias. Jika parameter populasi tidak diketahui maka dilakukan estimasi tapi jika parameter diketahui maka dilakukan pengujian hipotesis untuk menguji kebenaran dari asumsi tentang parameter. Dalam mengestimasi parameter, maka perlu memilih metode yang tepat sesuai dengan keadaan dari populasi yang diteliti.
Dalam statistika inferensi, biasanya diasumsikan bahwa distribusi populasi diketahui. Teknik yang digunakan untuk menaksir nilai parameter bila distribusi populasi diketahui adalah metode maximum likelihood. Metode ini hanya mendasarkan inferensinya pada sampel. Tetapi jika distribusi populasi tidak diketahui maka metode maksimum likelihood tidak dapat digunakan. 1.2 Perumusan masalah Pada penelitian ini rumusan masalah yang dibahas adalah bagaimana mengestimasi Regresi Nonparametrik dengan estimator Spline pada Generalized Maximum Likelihood yang berdistribusi normal multivariate 1.3 Tinjauan Pustaka Dalam teknik-teknik dalam regresi nonparametrik memenuhi kebutuhan ini karena tetap valid walaupun tidak diperlukan pemenuhan asumsi kenormalan galat dan hanya berlandaskan asumsi-asumsi yang sangat umum. Conover (1980) menjelaskan bahwa penggunaan regresi nonparametrik dilandasi pada asumsi: a. contoh yang diambil bersifat acak dan kontinu ; b. regresi (Y/X) bersifat linier; c. semua nilai X i saling bebas. Regresi nonparametrik merupakan pendekatan regresi yang sesuai untuk pola data yang tidak diketahui bentuknya atau tidak terdapat informasi masa lalu tentang pola data.
MAKSIMUM LIKELIHOOD ESTIMATORS Misalkan variabel acak dengan fungsi probabilitas, dimana merupakan himpunan parameter yang tidak diketahui dan saling independent maka pengkonstruksian fungsi likelihood dapat dinyatakan f (X 1,X 2,, X n :β) = f(x 1,β), f(x 2,β),,f( X n,β) = n i= 1 f ( Xi, β ) = L(β ǀ X 1,X 2,, X n ) Setelah fungsi likelihood dikonstruksi, langkah selanjutnya adalah mencari nilai estimator yang memaksimumkan fungsi likelihood tersebut. Dalam hal ini, memaksimumkan fungsi likelihood dilakukan dengan menurunkan fungsi likelihood terhadap parameter. Kemudian persamaan hasil turunan tersebut disamakan dengan nol sehingga dapat diperoleh nilai estimator parameter yang memaksimumkan fungsi likelihood tersebut. DISTRIBUSI SAMPLING MULTIVARIATE Misalkan x sebagai sampel random sampling dari distribusi normal univariat dengan mean μ dan variansi σ 2 dinyatakan sebagai N(μ,σ 2 ) dengan fungsi densitas probabilitasnya: 1 1 x µ f( x) = exp ; < x<. 2 πσ. 2 σ 2 Kuantitas ( x µ ) 2 σ 2 = ( x µ ) σ 2 2 2 = ( x µσ ) ( x µ ) untuk membawa ke bentuk multivariate.
Misalkan X = x1, x2,..., x p T sebagai sampel random dari distribusi normal multivariat p-dimensi dengan vektor mean µ dan kovarian matrik pxp dinyatakan sebagai N p ( µ, ). Dengan fungsi densitas probabilitasnya dinyatakan dalam bentuk: ( ) 1 ex 1 p( ) T 1 f x = x µ ( x µ ) ; < x< ; p 1 2 2. 2 2 ( π ) dengan kuantitas T 1 ( x µ ) ( x µ ) merupakan elipsoid. Model Regresi Linier Multivariat merupakan perluasan dari model Regresi Linier Berganda pada statistik univariat. Model Regresi Linier Multivariat ini dalam bentuk matriks dapat dituliskan sebagai Y = XB +E, dimana Y, X, B dan E berbentuk matriks. Model Regresi Linier Multivariat ini mempunyai parameter yang harus diestimasi yaitu B Selain B, parameter lain yang harus diestimasi adalah matriks kovarian Σ, dimana matriks kovarian ini menunjukkan variasi pada pengamatan respon Y. Selanjutnya akan ditentukan distribusi beserta sifat sifat dari kedua parameter tersebut. Dalam mencari estimator parameter B dan estimator matriks kovarian digunakan metode Maximum Likelihood Estimation (MLE) sehingga diperoleh Βˆ dan Σˆ. Untuk kajian distribusi dari estimator parameter model Regresi Liner Multivariat diperoleh dengan menunjukkan bahwa estimator tersebut merupakan kombinasi linier dari elemen error model.
1.4 Tujuan Penelitian Penelitian ini bertujuan untuk melakukan pengestimasian Regresi Nonparametrik spline dengan Generalized Maximum Likelihood serta menyelidiki penerapan Metode Maksimum Likelihood dalam distribusi normal multivariat. 1.5 Manfaat Penelitian 1. Sebagai bahan acuan untuk mempelajari permasalahan estimasi guna memudahkan dalam mengambil keputusan 2. Mengembangkan pengestimasian model regresi nonparametrik dengan menggunakan metode maksimum likelihood 3. Mengetahui penerapan metode maksimum likelihood dalam pengidentifikasian outlier distribusi normal multivariate 1.6 Metode Penelitian Penelitian ini merupakan kajian literatur yang kemudian dikembangkan. Hal ini dilakukan pembahasan tentang mengestimasi titik kurva regresi nonparametrik dengan menggunakan maximum likelihood. Adapun metode penelitiannya: 1. Menjelaskan tentang bentuk umum dari regresi nonparametrik 2. Menjelaskan tentang metode maksimum likelihood 3. Menjelaskan mengenai model regresi nonparametrik spline 4. Menjelaskan bagaimana likelihood dapat mengestimasi kurva regresi f yang termuat dalam suatu ruang tertentu 5. Mengkaji Estimasi Spline dalam Regresi Nonparametrik
1.7 Sistematika Penulisan Sistematika penulisan diuraikan untuk memberikan kerangka atau gambaran dari Skripsi ini yaitu sebagai berikut ; BAB 1 : PENDAHULUAN Pada bab ini berisi tentang latar belakang pengambilan judul, perumusan masalah, tinjauan pustaka, tujuan penelitian, manfaat penelitian, metode penelitianserta sistematika penulisan. BAB 2 : LANDASAN TEORI Pada Bab ini berisi tentang bentuk fungsi regresi nonparametrik, regresi nonparametrik spline dalam ruang tertentu, distribusi normal multivariat, distribusi normal univariat serta perbedaan keduanya. BAB 3 : PEMBAHASAN Pada Bab ini menjelaskan pembahasan Hubungan antara variabel yaitu estimasi kurva f regresi nonparametrik spline dalam suatu ruang tertentu dengan metode maksimum likelihood serta distribusi normal multivariat. BAB 4 : KESIMPULAN DAN SARAN Pada Bab ini berisikan tentang kesimpulan dan saran dari hasil analisa yang dilakukan.