PENDEKAAN MEODE PEMULUSAN KERNEL PADA PENDUGAAN AREA KECIL (SMALL AREA ESIMAION) Indawat, Ksman Sadk, Rat Nrmasar Dosen Departemen Statstka FMIPA IPB Maasswa S Departemen Statstka FMIPA IPB ABSRAK Pendgaan area kecl merpakan pendgaan parameter sat area yang leb kecl dengan memanfaatkan nformas dar lar area, dar dalam area t sendr, dan dar lar srve. Berdasarkan peba penjelas yang dgnakan, terdapat da model area kecl, yat basc area level model dan basc nt level model, dmana keda model tersebt mengasmskan bawa pendga langsng memlk bngan yang lner dengan peba penjelas. Ada kalanya asms tersebt tdak dapat dpen dan sala sat solsnya adala dengan menggnakan pendekatan nonparametrk, sepert pemlsan. Smlas yang tela dlakkan mennjkkan bawa pemlsan dapat meredks bas pendgaan pada pola bngan yang tdak lner dengan berbaga jmla area. Nla Mean Sqare Error (MSE) pendgaan area kecl dengan menggnakan pemlsan pada pola bngan yang tdak lner relatf leb kecl dbandngkan metode parametrk yang menggnakan model Fay-Herrot. MSE pada pemlsan memlk kecenderngan semakn kecl jka jmla area semakn banyak. Kata Knc : nonparametrk, pendgaan area kecl, pemlsan PENDAHULUAN Latar Belakang Metode pendgaan area kecl dapat dlakkan dengan cara memodelkan pendga langsng dengan peba penjelas. Berdasarkan peba penjelas yang terseda, terdapat da model area kecl, yat basc area level model dan basc nt level model. Keda model tersebt mengasmskan bawa pendga langsng memlk bngan yang lner dengan peba penjelas (Mkopadyay & Mat 004). Sala sat sols ntk mengatas masala asms tersebt adala dengan menggnakan pendekatan nonparametrk. Beberapa penelt tela mencoba mengkaj pendekatan nonparametrk pada pendgaan area kecl, dantaranya Pspal K. Mkopadyay dan apabrata Mat yang tela mengkaj metode pada tan 004 serta local polynomal Semnas Matematka dan Penddkan Matematka 008-6
regresson pada tan 006, Opsomer et al jga tela melakkan pengkajan mengena metode penalzed splne pada pendgaan area kecl pada tan 004. Metode nonparametrk yang dgnakan pada peneltan n adala metode pemlsan. Mkopadyay dan Mat (004) tela mengkaj metode n ntk area sebanyak 00, sedangkan peneltan n jga akan mengkaj penerapan metode pada jmla area yang berbeda-beda. jan. Mengkaj penerapan sala sat metode nonparametrk, yat pemlsan, pada pendgaan area kecl.. Mengeta keefektfan pendgaan area kecl dengan metode pemlsan pada pola bngan yang lner dan tak lner antara pendga langsng dengan peba penjelas. 3. Mengeta keefektfan pendgaan area kecl dengan metode pemlsan pada jmla area yang berbeda-beda. Pendgaan Area Kecl INJAUAN PUSAKA Area kecl ata small area dartkan sebaga bagan dar poplas, bak berdasarkan area geograf mapn sosal-demograf. Sat daera dsebt area kecl jka d dalam daera tersebt, conto yang terambl krang banyak ntk mendapatkan nla pendga langsng dengan press yang memada. Pendgaan area kecl merpakan pendgaan parameter sat area yang leb kecl dengan memanfaatkan nformas dar lar area, dar dalam area t sendr, dan dar lar srve (Rao 003). Da jens model eksplst pada pendgaan area kecl adala basc area level model dan basc nt level model (Rao 003).. Basc area level model mengasmskan bawa peba penjelas yang terseda anya ada ntk level area tertent. Msalkan terseda vektor peba penjelas x = (x, x,..., x p ), dan parameter θ yang akan ddga dasmskan memlk bngan dengan x. Peba penjelas tersebt dmodelkan: Semnas Matematka dan Penddkan Matematka 008-63
x θ = β +...() dengan =,,..., m dan ~ N(0, σ ), dmana m merpakan banyaknya area kecl, β merpakan vektor koefsen regres, dan merpakan pengar acak pada area ke-. Parameter θ dapat dketa dengan mengasmskan bawa pendga langsng pada area ke- (y ) tela terseda, yat: y = θ + ε...() dmana =,,..., m, ε merpakan samplng error dan dasmskan ε ~N(0,D ). Model gabngan dar persamaan () dan () adala: x y = β + + dmana =,,..., m. ε...(3). Basc nt level model merpakan model yang data-data pendkngnya bersesaan secara ndvd dengan data respon, msal x j = (x j, x j,..., x jp ), sengga dapat dbat sat model regres tersarang: y j x j = β + + ε...(4) dmana =,,..., m, j =,..., n, dengan n merpakan banyaknya conto yang tersrve pada area ke-, ~N(0, σ ), dan ε ~ N (0,D ). Pemlsan Secara sederana, model regres nonparametrk adala: y = m(x) + ε...(5) dmana y merpakan peba respon yang damat, merpakan fngs regres yang ngn ddga dan tdak dapat ddekat dengan model parametrk, serta merpakan eror pengamatan yang tdak dapat djelaskan ole fngs regres. m(x) m(x) Beberapa metode pemlsan yang basa dgnakan ntk mendga ε pada persamaan (5) adala local polynomal smooters, regresson splnes, smootng splnes, penalzed splnes, dan smooters. Sala sat de ntk mendga fngs m(x) adala dengan menggnakan local averagng procedre ata rata-rata lokal terbobot sebaga fngs pemls, yat: m m ( x ) = W ( x) y...(6) m = m(x) Semnas Matematka dan Penddkan Matematka 008-64
dmana ( m x ) merpakan dgaan dar fngs regres pada ttk pengamatan ke-, m merpakan banyaknya pengamatan, y merpakan peba respon pada pengamatan ke-, dan W (x) merpakan fngs pembobot pada daera d sektar x dengan lebar jendela (Hardle 994). Lebar jendela () merpakan parameter pemlsan yang menentkan kemlsan krva yang daslkan. Beberapa cara yang dapat dgnakan ntk menentkan antara lan least sqare cross valdaton, lkelood cross valdaton, dan generalzed cross valdaton. Nla jga bsa dtentkan secara sbjektf ata berdasarkan peneltan yang tela dlakkan sebelmnya (Slverman 986). Menrt Hardle (994), lebar jendela optmm yang mengaslkan asymptotc / 5 mean sqare error (AMSE) mnmm adala m. Fngs W (x) yang dgnakan pada pemlsan ( smooters): K ( x x ) W ( x) = f ( x) dmana f.... (7) n ( x) = K ( x x ) dan K(.) merpakan fngs yang dapat n = dnyatakan sebaga K ( ) = K( ). Fngs K(.) memlk sfat smetrs, kontn dan terngga, serta K( x) dx = Box, Parzen, rangle, dan Gassan (Normal).. Beberapa fngs yang mm dgnakan adala Pemlsan pada Pendgaan Area Kecl Jka bngan antara pendga langsng dengan varabel penjelas tdak lner, maka persamaan () dapat ddekat dengan seba fngs yang leb mm, yat: θ = m ( x ) + dmana:........(8) =,,..., m, sedangkan m merpakan banyaknya area, m(x ) = fngs pemlsan yang menggambarkan bngan yang sesnggnya θ antara x dan y pada area ke-, = parameter pada area ke-, = pengar acak dar area ke- dan ~N(0, σ ). Semnas Matematka dan Penddkan Matematka 008-65
Fngs m(x ) ddga dengan persamaan Nadaraya-Watson, yat: m ( x) n = = n K ( x x ) y = K ( x x )...(9) Dgaan parameter pada area kecl ke-, θ, adala: θ = E θ y ) = γ y + ( γ ) m ( x )...(0) ( dmana σ, dan dapat ddga dengan metode momen, yat: γ σ = σ + D m dan D σ = max(0, W ( x){ y m( x)} D) dasmskan konstan ntk sema area. m = Pendgaan Area Kecl dengan Model Fay-Herrot Model yang dgnakan ole Fay dan Herrot (979) adala sebaga berkt: y x + ε...() = θ + ε = β + dengan =,,..., m dan ~ N(0, σ ), dmana m merpakan banyaknya area kecl, y merpakan pendga langsng pada area ke-, θ merpakan parameter area kecl yang menjad peratan dan akan ddga, β merpakan vektor koefsen regres, merpakan pengar acak pada area ke-, ε merpakan samplng error dan dasmskan ε ~ N(0,D ). Nla β dapat ddga dengan menggnakan wegted least sqare, sedangkan σ ddga dengan maxmm lkelood ata restrcted maxmm lkelood. θ dperole dengan cara mengtng rata-rata terbobot antara pendga langsng, y, dan pendga sntetk, β, yat: ( γ x...() θ = γ y + ) β dmana γ σ = σ + D. x DAA DAN MEODE Data Peba penjelas dasmskan anya terseda ntk level area tertent sengga dgnakan basc area level model. Data yang dgnakan adala data smlas ntk beberapa area kecl dengan sat peba penjelas. Jmla area kecl (m) Semnas Matematka dan Penddkan Matematka 008-66
yang dbangktkan adala m=00, m=50, dan m=5. Pola data yang dbangktkan jga berbeda-beda, yat lner dan tdak lner (kbk dan logartma natral). Metode. Membangktkan data ntk setap pola bngan dan banyaknya area (m) tertent dengan langka-langka sebaga berkt: a. membangktkan peba penjelas (x ) sebanyak m, dmana x ~ nform(0,) b. memetakan x melal fngs matemats tertent ntk memperole m(x ) c. membangktkan pengar acak area ( ) sebanyak m, dmana ~N(0,4) d. mengtng parameter area kecl θ, dmana θ = m(x )+ e. membangktkan eror ( ε ) sebanyak m, dmana sepertga area pertama ε ~N(0,), sepertga area keda ε ~N(0,4), dan sepertga area terakr ε ~N(0,9) f. mengtng pendga langsng (y ), dmana y = θ + ε. Langka a-b dlakkan sebanyak sat kal karena x dasmskan tetap (fxed). Langka c-f dlang sebanyak R kal, dmana R yang dgnakan adala 00.. Mendga parameter area kecl dengan menggnakan da pendekatan, yat pendekatan nonparametrk dengan menggnakan pemlsan dan pendekatan parametrk yang menggnakan model Fay-Herrot. 3. Mengkr performa smlas pendgaan yang dlakkan dengan mengtng: Absolte Relatve Bas (ARB): ARB( θ ) = R R j= ( θ θ ) j θ j j...(3) Mean Sqare Error (MSE): MSE R ( θ ) = ( θ j θ j )...(4) R j= HASIL DAN PEMBAHASAN Pembangktan Data dan Pendgaan Parameter Area Kecl Fngs m(x ) yang dgnakan ntk memetakan x adala sebaga berkt:. Lner: m( x ) = 5 +. 5x 3. Kbk: m ( x ) = 0. + 0.x + 0.3x + 0.4x Semnas Matematka dan Penddkan Matematka 008-67
y y y 3. Logartma natral: m x ) = 05ln( x ) ( Fngs pemls yang dgnakan adala fngs Gassan karena fngs tersebt memanfaatkan sema ttk pengamatan dengan bobot yang berbeda-beda ntk memperole pendga m(x ). Bobot yang dberkan fngs Gassan semakn kecl jka ttk pengamatan semakn ja dar ttk yang akan ddga. Persamaan matemats fngs Gassan adala sebaga berkt: K ( x) = exp( x ), < x < π...(5) Lebar jendela yang dgnakan pada peneltan n mengkt formla dar Hardle (994), yat sebesar m -/5. Untk jmla area sebanyak 00, 50, dan 5, lebar jendela yang dgnakan masng-masng adala 0.40, 0.46, dan 0.53. 7.0.0 0.5 6.5.5 6.0.0 5.5 0.5 5.0-0.5-0.5 4.5 0. 0.3 0.5 0.7 0.9 x 0. 0.3 0.5 0.7 0.9 x -.0 0. 0.3 0.5 0.7 0.9 x Lner Kbk Logartma Natral Propors keragaman area kecl teradap keragaman total ( γ ) adala sebesar 0.8 ntk sepertga area pertama, 0.5 ntk sepertga area keda, dan 0.308 ntk sepertga area terakr. Nla γ mennjkkan besarnya kontrbs yang dberkan ole pendga langsng teradap dgaan parameter area kecl, sedangkan -γ mennjkkan besarnya kontrbs pendga sntetk. Pendga sntetk dar pemlsan berpa dgaan dar pemlsan ( ) dar persamaan Nadaraya-Watson. Sedangkan pada model Fay-Herrot, pendga sntetk dperole dar x β ( x ) dmana β ddga dengan wegted least sqare. m Perbandngan Metode dengan Metode Parametrk pada Pola Lner Perbandngan MSE Pola Hbngan Lner Perbandngan ARB Pola Hbngan Lner 0,06000 0,06000 0,05000 0,04805 0,04597 0,05000 0,04000 0,04000 MSE 0,03000 0,0000 0,0000 0,0086 0,089 0,0738 0,096 ARB 0,03000 0,0000 0,0000 0,097 0,0804 0,0693 0,0006 0,00447 5 50 00 0,000 5 50 00 Semnas Matematka dan Penddkan Matematka 008-68
Pemlsan mengaslkan MSE dan ARB yang leb besar darpada model Fay-Herrot. Sels MSE pada m=00 sangat kecl, mengndkaskan bawa pemlsan pada pola bngan yang lner dengan jmla area yang besar akan mengaslkan pendgaan yang ampr sama baknya dengan model Fay- Herrot. Pada jmla area yang semakn sedkt, model Fay-Herrot mengaslkan pendgaan yang ja leb bak dbandngkan pemlsan. Pendgaan dengan metode pemlsan mengaslkan MSE yang semakn kecl jka jmla area semakn banyak. Perbandngan Metode dengan Metode Parametrk pada Pola Kbk Perbandngan MSE Pola Hbngan Kbk Perbandngan ARB Pola Hbngan Kbk 0,06000 0,0534,00000 MSE 0,05000 0,04000 0,03000 0,0000 0,0000 0,04076 0,03875 0,0375 0,03499 0,09 ARB,80000,60000,40000,0000,00000 0,80000 0,60000 0,40000 0,0000 0,70500 0,55800,0900 0,88300 0,64900 0,47470 5 50 00 5 50 00 MSE dan ARB pemlsan leb kecl darpada model Fay-Herrot. Pada jmla area sebesar 5 dan 50 sels MSE tdak terlal ja, namn pada saat jmla area sebesar 00 sels MSE kedanya menjad sangat besar. Hal n mngkn dsebabkan karena pola bngan kbk ampr menyerpa pola bngan lner pada saat jmla area relatf sedkt. Secara vsal, pola bngan kbk pada saat m=50 dan m=5 dapat dlat pada Lampran. Nla MSE dar pemlsan semakn kecl jka jmla area semakn besar. Perbandngan Metode dengan Metode Parametrk pada Pola Logartma Natral Perbandngan MSE Pola Hbngan Logartma Natral Perbandngan ARB Pola Hbngan Logartma Natral 0,06000,00000,93400 0,05000,80000,60000,56600 MSE 0,04000 0,03000 0,0000 0,0000 0,060 0,0309 0,038 0,05 0,0967 0,0935 ARB,40000,0000,00000 0,80000 0,60000 0,40000 0,0000,8700,0000 0,9700,33400 5 50 00 5 50 00 Pemlsan mengaslkan MSE dan ARB yang leb kecl dbandngkan model Fay-Herrot. MSE dar metode semakn kecl jka jmla area semakn besar. Sels MSE dar keda metode ampr sama dan relatf ckp Semnas Matematka dan Penddkan Matematka 008-69
kecl pada sema jmla area. Sels ARB antara pemlsan dan model Fay-Herrot ckp besar pada berbaga jmla area. KESIMPULAN Pemlsan sebaga sala sat pendekatan nonparametrk dapat dterapkan pada pendgaan area kecl. Pendgaan area kecl dengan menggnakan pemlsan leb bak dbandngkan metode parametrk pada pola bngan yang tdak lner, sedangkan pada pola bngan yang lner, metode parametrk tetap leb bak dbandngkan metode. MSE dar metode pemlsan cenderng semakn kecl jka jmla area semakn banyak. SARAN Beberapa al yang dapat dkaj leb lanjt antara lan:. Peba penjelas yang dgnakan leb dar sat.. Lebar jendela pada pemlsan dpl dengan menggnakan metodemetode tertent. 3. Menggnakan propors keragaman area kecl yang leb beragam. 4. Ragam pengar acak area kecl ( σ ) dan ragam samplng error (D) ddga dar data. DAFAR PUSAKA Fay RE, Herrot RA. 979. Estmaton of Income for Small Places: An Applcaton of James-Sten Procedres to Censs Data. Jornal of te Amercan Statstcal Assocatons: 69-77. Hardle W. 994. Appled Nonparametrc Regresson. ttp://www.qantlet.com. [5 Aprl 008]. Mkopadyay P, Mat. 004. wo Stage Non-Parametrc Approac for Small Areas Estmaton. Proceedngs of ASA Secton on Srvey Researc Metods: 4058-4065. Mkopadyay P, Mat. 006. Local Polynomal Regresson for Small Area Estmaton. Proceedngs of ASA Secton on Srvey Researc Metods: 3447-345. Semnas Matematka dan Penddkan Matematka 008-70
Opsomer et al. 004. Nonparametrc Small Area Estmaton Usng Penalzed Splne Regresson. Proceedngs of ASA Secton on Srvey Researc Metods: - 8. Rao JNK. 003. Small Area Estmaton. New Jersey: Jon Wlley &Sons, Inc. Slverman BW. 986. Densty Estmaton For Statstcs and Data Analyss. London: Capman and Hall. W H, Zang J. 006. Nonparametrc Regresson Metods for Longtdnal Data Analyss. New Jersey: Jon Wley & Sons, Inc. Semnas Matematka dan Penddkan Matematka 008-7
y y y y y y LAMPIRAN Lampran Krva asl pemlsan. Lner Kbk Logartma Natral.5 7.0 0.5 m=50 6.5 6.0.0 0.5 5.5-0.5 5.0 -.0-0.5 0. 0.3 0.5 0.7 0.9 0. 0.3 0.5 0.7 0.9 0. 0.3 0.5 0.7 0.9 x x x 7.0.0 0.5 m=5 6.5 6.0 0.8 0.6 0.4 5.5 0. -0.5 5.0 -.0 0. 0.3 0.5 0.7 0.9 0,000 0,3000 0,5000 0,7000 0,9000 0. 0.3 0.5 0.7 0.9 x x x Lampran abel perbandngan MSE. Statstk Lner Kbk Logartma Natral 5 50 00 Rata-rata 0,04805 0,0738 0,03875 0,04076 0,0309 0,060 St. devas 0,0349 0,037 0,00869 0,03353 0,00489 0,0065 Rata-rata 0,04597 0,089 0,03499 0,0375 0,0967 0,038 St. devas 0,04805 0,0 0,039 0,0300 0,00933 0,043 Rata-rata 0,0086 0,096 0,09 0,0534 0,0935 0,05 St. devas 0,0056 0,00867 0,060 0,0684 0,0098 0,00990 Lampran 3 abel perbandngan ARB. Statstk Lner Kbk Logartma Natral 5 50 00 Rata-rata 0,097 0,0804 0,55800 0,70500,8700,93400 St. devas 0,068 0,0854 0,76900 0,80600,45400 3,8300 Rata-rata 0,0006 0,0693 0,88300,0900 0,9700,0000 St. devas 0,0656 0,005,0800 4,9600,3600,03000 Rata-rata 0,00447 0,000 0,47470 0,64900,33400,56600 St. devas 0,0045 0,007 0,700,3600 3,80900,9500 Semnas Matematka dan Penddkan Matematka 008-7