METODE REGRESI RIDGE UNTUK MENGATASI KASUS MULTIKOLINEAR Margaretha Ohyver Jurusan Matematka, Fakultas Sans dan Teknolog, Bnus Unversty Jl. Kh.Syahdan No.9, Palmerah, Jakarta 480 ethaohyver@bnus.ac.d, mohyver@bnus.edu ABSTRACT Multcolnear s a case that occurs n mult-lnear regresson analyss. Usng multcolnear, t wll be dffcult to separate the nfluence of each ndependent varable towards the response varables. It also occurs n a farm producton lke cabbage. To solve ths problem, Rdge regresson method s used. Ths research ams to obtan a Rdge regresson model to solve the multcolnear case. By usng ths method, the alleged regresson coeffcent s obtaned by varance nflaton factor less than ten for sx free varables. Keywords: multcolnear, Rdge regresson. ABSTRAK Multkolnear merupakan salah satu kasus yang terjad dalam analss regres lnear ganda. Dengan adanya multkolnear, akan sult memsahkan pengaruh masng-masng varabel bebas terhadap varabel respon. Kasus n pun terjad pada hasl produks usaha tan kol bulat. Untuk mengatas kasus n, dgunakan metode regres Rdge. Tujuan peneltan n adalah memperoleh model regres Rdge yang dapat mengatas kasus multkolnear. Berdasarkan metode n dperoleh koefsen regres dugaan dengan varance nflaton factor yang kurang dar sepuluh untuk keenam varabel bebas. Kata kunc: multkolnear, regres Rdge. Metode Regres Rdge (Margaretha Ohyver) 45
PENDAHULUAN Hubungan antara dua varabel (varabel bebas X dan varabel tak bebas Y) dalam suatu sstem yang kompleks tdak cukup dnyatakan dalam suatu persamaan regres sederhana. Dalam stuas yang demkan, suatu varabel tak bebas atau varabel respon dapat dpengaruh oleh lebh dar satu varabel bebas. Apabla persamaan regres memuat lebh dar satu varabel bebas, model regresnya dsebut model regres ganda. Sepert halnya metode statstka lannya, model regres ganda mempunya beberapa asums, d antaranya galat ε salng bebas dan berdstrbus normal N (0, σ ) serta tdak terjad multkolnear (Supranto, 986). Asums yang terakhr terkadang dlanggar dalam data yang dambl dar keadaan tak terkontrol. Varabel-varabel bebas dalam stuas tersebut cenderung berkorelas, bahkan berkorelas tngg. Korelas antar varabel bebas nlah yang dsebut dengan multkolnear (multcollnearty). Adanya kasus n dapat menyebabkan sultnya memsahkan pengaruh masng-masng varabel bebas terhadap varabel responnya (Retveld & Sunaryanto, 994). Multkolnear juga dapat menyebabkan kesalahan tanda (postf atau negatf) dar dugaan koefsen regres kuadrat terkecl (Ryan, 997). Akbat adanya pengaruh yang dtmbulkan oleh multkolnear tersebut dperlukan suatu metode untuk mengatasnya. Dan salah satu metode yang dapat dgunakan adalah metode regres Rdge. Peneltan n dlakukan dengan tujuan untuk memperoleh persamaan regres Rdge yang dapat mengatas kasus multkolnear. Dengan adanya peneltan n dharapkan dapat memberkan pengetahuan mengena cara mengatas adanya multkolnear serta penerapan regres Rdge pada data, yang dalam hal n adalah data Hasl Produks Usaha Tan Kol Bulat. METODE Metode regres Rdge (Rdge regresson) dapat dgunakan untuk mengatas korelas yang tngg antara beberapa varabel bebas (Hoerl dan Kennard, 970). Regres Rdge merupakan metode pendugaan koefsen regres yang dperoleh melalu penambahan konstanta bas c pada dagonal X' X. Meskpun metode n menghaslkan penduga koefsen regres yang berbas, penduga n bsa mendekat nla parameter yang sebenarnya. Hal n dapat dketahu dar perbandngan mean square error (MSE) antara penduga Rdge dengan penduga kuadrat terkecl (least square), dmana MSE penduga Rdge lebh kecl darpada MSE penduga kuadrat terkecl. Jka βˆ * adalah penduga dar vektor β, jumlah kuadrat resdual dapat dtuls sebaga berkut (Hoerl & Kennard, 970): φ = ( Y Xβ* ˆ )'( Y Xβˆ *) = (Y Xβ ˆ + Xβˆ Xβ*) ˆ ( Y Xβˆ + Xβˆ Xβˆ * ) = [ Y Xβˆ + X(ˆ β β* ˆ )'] [ Y Xβˆ + X(ˆ β βˆ *)] = (Y Xβ)'(Y ˆ Xβ) ˆ + (βˆ β*) ˆ ' X X(βˆ β*) ˆ () dmana βˆ adalah penduga kuadrat terkecl dar β. Untuk φ tetap, maka dplh nla βˆ * dan dbuat memnmumkan β ˆ * βˆ * dengan kendala ( β ˆ β*) ˆ X X(βˆ βˆ *) = φ 0, sehngga fungs lagrangenya (Hoerl & Kennard, 970) adalah: F = β* ˆ β* ˆ + [( β* ˆ β)xx(β* ˆ ˆ β ˆ) φ0 ] () c 45 ComTech Vol. No. Jun 0: 45-457
dmana c adalah pengganda lagrange. Kemudan ddfferensalkan terhadap βˆ *. F ˆ = β* + [(XX)β* ˆ (XX)β ˆ] β* ˆ c = β* ˆ + (XX)β* ˆ (XX)β ˆ] c c = β* ˆ + (XX)β* ˆ (XX)β ˆ] c c F = 0 β* ˆ ˆ β* [ + ( XX )] = ( XX ) β ˆ c c β* ˆ [ c I+ ( XX )] = ( XX ) β ˆ ˆ ( XX )] ( XX ) β ˆ] ˆ ( XX )] XY. (3) Jad penduga Rdge adalah ˆ ( XX )] XY. Selan tu, penduga Rdge dapat juga dtuls dalam bentuk: ˆ ( XX )] XY = [ ci+ ( XX )] X'X( X'X) XY = [ ci+ ( XX )] X'Xβ = Zˆ β (4) Nla harapan dar penduga Rdge adalah: ˆ E( β* ) = E([ ci+ ( XX )] X'Xβ ˆ) Karena ˆ = E([ ci+ ( XX )] [( X'X) + ci ci] β ) ˆ ˆ = E([ ci+ ( XX )] X'Xβ + c[ ci+ ( X'X)] β k[ ki+ ( X'X)] β ˆ) ˆ ˆ = E([ ci+ ( XX )] [ X'Xβ + ciβ] c[ ci+ ( X'X)] β ˆ) ˆ = E([ ci+ ( XX )] [ X'X+ ci] β c[ ci+ ( X'X)] β ˆ) ˆ = E( β c( XX + ci) β ˆ) = β c( XX + ci) β (5) E( ˆ ) c( c ) ˆ β* = β XX+ I β, penduga Rdge merupakan penduga yang bas dengan besarnya bas adalah c( XX + ci) β. Untuk memperoleh ragam dar penduga Rdge adalah sebaga berkut. Msalkan * * * * λ λ, adalah nla-nla egen dar ( X X) dan ˆ β, ˆ β, ˆ β,, ˆ β adalah penduga,, λ k + koefsen regres Rdge. Dketahu bahwa β ˆ ˆ* var [ β ] = var [ Zβ ˆ] * = Zβ ˆ sehngga ( c),0 ( c), ( c), ( c), k Metode Regres Rdge (Margaretha Ohyver) 453
= Z var[ βˆ ] Z = Z σ ( X X) Z = σ Z ( X X) Z. Karena yang akan dcar adalah var [ ˆ* β ] maka ˆ* var [ β ] = σ tr [ ZXX ( ) Z ] = σ tr[( X X) Z Z] λ = σ. (6) ( λ c) + Sehngga ragam untuk penduga Rdge adalah λ σ. k+ = ( λ + c) MSE dperoleh dengan menjumlahkan ragam dan besarnya bas dar penduga regres Rdge. * * * MSE( β ) = var( β ) + bas( β ) λ = σ + β XX+ I β. (7) k + c ( c ) = ( λ + c) Adapun transformas yang dgunakan adalah transformas korelas, yatu: y y y = n SY xj x j x = j ( j =,, k) n S X j (8) dengan y adalah rata-rata nla y, x j adalah rata-rata nla x j, S Y adalah smpangan baku dugaan varabel Y, S X j adalah smpangan baku dugaan varabel. Data Data yang akan dgunakan dalam peneltan n adalah data sekunder mengena hasl produks usaha tan kol bulat yang dgunakan dalam skrps S- Haerunssa (004) dar Fakultas Matematka dan Ilmu Pengetahuan Alam Unverstas Haluoleo. Ada 6 (enam) varabel bebas yang dgunakan, yatu: X adalah benh (ml); X adalah pupuk urea (kg); X 3 adalah pupuk TSP (kg); X 4 adalah pupuk KCL (ml); X 5 adalah pestsda (ml); X 6 adalah curahan har kerja (HKP); Y adalah hasl produks (kg). Peneltan n dlakukan dengan langkah-langkah sebaga berkut: () menganalss data dengan metode regres ganda, serta menentukan nlvif yang lebh dar sepuluh mengndkaskan adanya multkolnear; () menganalss data dengan metode regres Rdge. HASIL DAN PEMBAHASAN Data yang ada danalss dengan analss regres ganda. Nla penduga kuadrat terkecl dan hasl ANOVA dapat dlhat pada Tabel dan Tabel. Pada tabel terlhat bahwa ada nla VIF yang 454 ComTech Vol. No. Jun 0: 45-457
lebh dar sepuluh. Hal n berart terjad kasus multkolnear. Karena adanya kasus n, maka dperlukan metode untuk mengatasnya. Untuk peneltan kal n akan dgunakan metode regres Rdge. Tabel Penduga Parameter dan VIF Tabel ANOVA untuk Regres Lnear Ganda Peubah Penduga VIF Konstan -86,7 X 0,53 7, 87 X,9 3, 3 X 3 3,65 4, X 4-3,35, 7 X 5 0,36, 6 X 6 3,94 9, 79 Sumber Keragaman Jumlah Kuadrat Derajat Bebas Kuadrat Tengah F htung Regres,37x0 7 6 7979,497 Error 47957 3 8606,8 Total,4x0 7 9 48633, Berdasarkan hasl tersebut, dperoleh persamaan regres sebaga berkut: 86.7 0.53.9 3.65 Langkah yang dlakukan untuk mengatas kasus multkolnear n adalah menganalsnya dengan menggunakan metode regres Rdge. Dan haslnya dapat dlhat pada Tabel 3. Koefsenkoefsen regres untuk berbaga nla c dapat dlhat secara lengkap pada Tabel 3 d atas. Untuk memlh koefsen regres yang mana yang akan dgunakan dlakukan dengan melhat nla VIF serta jejak Rdge (Tabel 4). Tabel 3 Nla koefsen regres dugaan untuk berbaga c c X X X 3 X 4 X 5 X 6 0,000000 0,339 0,0583 0,0737-0,040 0,0640 0,5099 0,00000 0,33 0,0580 0,0738-0,036 0,0676 0,5056 0,00000 0,33 0,0578 0,0739-0,03 0,070 0,505 0,003000 0,333 0,0575 0,074-0,07 0,0744 0,4976 0,004000 0,33 0,0573 0,074-0,03 0,0776 0,4939 0,005000 0,33 0,057 0,0744-0,09 0,0808 0,4903 0,006000 0,339 0,0569 0,0746-0,05 0,0838 0,4868 0,007000 0,337 0,0567 0,0747-0,0 0,0868 0,4835 0,008000 0,334 0,0565 0,0749-0,007 0,0896 0,4803 0,009000 0,33 0,0564 0,075-0,003 0,094 0,4773 0,00000 0,3308 0,056 0,0753-0,0099 0,095 0,4743 0,00000 0,364 0,0553 0,077-0,0063 0,8 0,4493 0,030000 0,34 0,0549 0,0788-0,008 0,358 0,430 0,040000 0,365 0,0550 0,0804 0,0004 0,495 0,450 0,050000 0,39 0,055 0,089 0,0034 0,605 0,403 0,060000 0,3076 0,0557 0,083 0,0063 0,693 0,396 0,070000 0,3036 0,056 0,0844 0,0090 0,765 0,383 Metode Regres Rdge (Margaretha Ohyver) 455
Tabel 4 Nla VIF untuk Berbaga Nla C 0,080000 0,999 0,0568 0,0855 0,06 0,85 0,374 0,090000 0,964 0,0575 0,0866 0,04 0,874 0,3668 0,00000 0,93 0,058 0,0876 0,065 0,96 0,360 0,00000 0,690 0,0656 0,0950 0,0354 0,097 0,36 0,300000 0,56 0,079 0,0998 0,0484 0,5 0,900 0,400000 0,40 0,0769 0,030 0,0577 0,088 0,7 0,500000 0,98 0,0807 0,05 0,0646 0,047 0,566 0,600000 0, 0,0835 0,066 0,0697 0,000 0,445 0,700000 0,36 0,0857 0,075 0,0736 0,954 0,343 0,800000 0,068 0,0873 0,079 0,0765 0,908 0,54 0,900000 0,008 0,0884 0,08 0,0787 0,864 0,75,000000 0,953 0,089 0,079 0,0804 0,8 0,05 c VIF (X ) VIF (X ) VIF (X 3 ) VIF (X 4 ) VIF (X 5 ) VIF (X 6 ) 0,000000 7,8630 3,60 4,96,7077,6 9,7908 0,00000 5,744 3,846 4,04,6887 0,8057 8,4463 0,00000 3,8645 3,454 3,9685,670 0,4670 7,468 0,003000,890 3,08 3,9008,658 0,448 6,74 0,004000 0,6887 3,079 3,8373,6338 9,838 5,09 0,005000 9,3400 3,039 3,7777,66 9,5457 4,373 0,006000 8,8 3,0066 3,73,5988 9,668 3,535 0,007000 7,005,9755 3,6679,586 9,0005,8085 0,008000 6,089,9454 3,67,5647 8,746,469 0,009000 5,059,964 3,5686,548 8,507,5403 0,00000 4,74,8883 3,53,537 8,699 0,987 0,00000 8,7707,6453 3,47,3778 6,407 7,06 0,030000 5,9889,4474,853,396 5,8 5,930 0,040000 4,380,783,67,4 4,03 3,9736 0,050000 3,36,30,467,9997 3,5 3,703 0,060000,6753,9985,47,8947 3,000,6087 0,070000,887,8805,0895,798,597,983 0,080000,8306,7739,9534,709,678,8879 0,090000,5590,677,834,668,0043,6466 0,00000,3477,5888,75,5505,7874,4545 0,00000 0,5083,0058,07,087 0,788 0,6330 0,300000 0,96 0,7048 0,696 0,755 0,4656 0,3907 0,400000 0,000 0,564 0,5035 0,5459 0,308 0,787 0,500000 0,5 0,409 0,3854 0,476 0,403 0,48 0,600000 0, 0,334 0,3063 0,345 0,899 0,736 0,700000 0,00 0,740 0,506 0,855 0,558 0,450 0,800000 0,0867 0,3 0,097 0,408 0,34 0,40 0,900000 0,0759 0,983 0,787 0,063 0,3 0,080,000000 0,0676 0,73 0,546 0,79 0,0990 0,0954 Pada Tabel 4 terlhat bahwa mula dar 0,00000 sampa,00000 nla VIF akan semakn kecl. Nla VIF yang akan dambl adalah nla VIF yang relatf mendekat satu. Sehngga koefsen regres yang akan dgunakan adalah koefsen pada nla 0,0000. Pada nla c n juga koefsen regres mula stabl. Pada Gambar dsajkan jejak Rdge untuk berbaga nla c. Sehngga persamaan regres untuk data kol bulat adalah: 0,93 0,058 0,0876 0,065 0,96 0,360. 456 ComTech Vol. No. Jun 0: 45-457
Jka dlhat dar hasl tersebut, dketahu bahwa benh, pupuk urea,pupuk TSP, pupuk KCL, pestsda, dan HKP, memberkan pengaruh postf terhadap hasl produks kol bulat. Gambar. Jejak Rdge. PENUTUPP Berdasarkan peneltan yang dlakukan dapat dsmpulkan bahwa persamaan regres untuk data hasl produks usaha tan kol bulat adalah:. Koefsen-koefsen regres untuk persamaan n dperoleh pada nla bas nla VIF yang kurang dar sepuluh. dengan DAFTAR PUSTAKA Haerunssa. (004), Penggunaann Metode Regres Komponen Utama pada Kasus Kasus Kolnear Ganda. Skrps S. Kendar: Jurusan Matematka, Haluoleo. Data yang Memlk FMIPA Unverstas Hoerl, A. E., and Kennard, R. W. (970). Rdge Regresson: Based Estmaton for Nonorthogonal Problems. A Journal of Statstcs for the Physcal Chemcal and Engneerng Scences, (), 55-67. Retveld, P., dan Sunaryanto, L. T. (994). 87 Kasus Pokok dalam Regres pertama). Yogyakarta: And Offset. Ryan, T. P. (997). Modern Regresson Method. New York: Wley. Berganda (eds Supranto, J. (986). Pengantar Probablta dan Statstk Induktf (eds pertama). Jakarta: Erlangga. Metodee Regres Rdge (Margaretha Ohyver) 457