Jural Matematika UNAND Vol. 2 No. 2 Hal. 115 122 ISSN : 2303 2910 c Jurusa Matematika FMIPA UNAND TRANSFORMASI BOX-COX PADA ANALISIS REGRESI LINIER SEDERHANA ELVI YATI, DODI DEVIANTO, YUDIANTRI ASDI Program Studi Matematika, Fakultas Matematika da Ilmu Pegetahua Alam, Uiversitas Adalas, Kampus UNAND Limau Mais Padag, Idoesia, lviyati@ymail.com Abstrak. Asumsi dasar regresi merupaka asumsi yag harus dipeuhi dalam memodelka hubuga atara variabel tak bebas (Y ) dega variabel bebas (X) dalam aalisis regresi liier sederhaa. Jika asumsi tersebut tidak dipeuhi, maka dapat dilakuka trasformasi Box-Cox terhadap variabel tak bebas, dimaa Y dipagkatka dega λ, sehigga mejadi Y λ. Pedugaa parameter λ dilakuka dega Metode Kemugkia Maksimum dimaa dipilih λ yag memiliki jumlah kuadrat sisaa palig kecil. Parameter λ tersebut diguaka dalam trasformasi sehigga diperoleh data yag memeuhi asumsi ormalitas, homogeitas, da liieritas. Kata Kuci: Metode kemugkia maksimum, trasformasi Box-Cox. 1. Pedahulua Aalisis regresi adalah tekik statistika yag diguaka utuk membetuk model hubuga atara variabel bebas dega variabel tak bebas. Hubuga atara satu variabel bebas (X) dega satu variabel tak bebas (Y ) utuk aalisis regresi liier sederhaa diyataka dalam model berikut Y i = β 0 + β 1 X i + ε i. (1.1) Dalam aalisis regresi liier sederhaa perlu diperhatika beberapa asumsi yag dikeal dega asumsi dasar regresi yaitu asumsi keormala data (ormalitas), kehomogea ragam (homogeitas), da keliiera data (liieritas). Apabila keormala data, kehomogea ragam da keliiera tidak dipeuhi, maka dapat dilakuka trasformasi terhadap variabel tak bebas. Salah satu trasformasi yag dapat dilakuka adalah Trasformasi Box-Cox yag diberlakuka terhadap variabel tak bebas Y yag berilai positif. Trasformasi Box-Cox ii berupa trasformasi pagkat berparameter tuggal, katakalah λ, terhadap Y mejadi Y λ. Pedugaa parameter λ dapat dilakuka dega megguaka Metode Kemugkia Maksimum (Maximum Likelihood Methods). λ yag diambil adalah λ yag meghasilka jumlah kuadrat sisaa terkecil [3]. 115
116 Elvi Yati dkk. 2. Aalisis Regresi 2.1. Uji Asumsi Dasar Regresi Dalam aalisis regresi liier sederhaa terdapat beberapa asumsi yag harus dipeuhi, di maa asumsi ii disebut asumsi dasar regresi. Pegujia asumsi dasar dalam aalisis regresi liier sederhaa diuraika sebagai berikut. (a) Asumsi Normalitas (Keormala Data) Pegujia asumsi ormalitas dega uji Kolmogorov-Smirov dapat diyataka sebagai berikut H 0 : Data megikuti sebara tertetu H 1 : Data tidak megikuti sebara tertetu Berdasarka [6], statistik uji yag diguaka adalah D = max F 0 (x) S N (x), (2.1) di maa F 0 (x) adalah fugsi kumulatif sebara, S N (x) adalah peluag kumulatif sampel, da N adalah bayak pegamata. Kriteria utuk pegujia ii adalah tolak H 0 jika ilai D hitug lebih besar dari ilai D tabel. (b) Asumsi Homogeitas (Kehomogea Ragam) Pegujia asumsi homogeitas dega uji Levee dapat diyataka sebagai berikut H 0 : σ1 2 = σ2 2 = = σk 2 H 1 : σi 2 σ2 j palig tidak utuk satu pasag (i, j) Misalka variabel tak bebas Y dega ukura sampel N yag dibagi atas k subgrup, dimaa N i meyataka ukura sampel dari subgrup ke-i, maka statistik uji Levee [4] diyataka sebagai berikut W = (N k) k N i( Z i. Z.. ) 2 (k 1) k Ni j=1 (Z ij Z i. ), (2.2) 2 di maa Z ij = Y ij Ȳi., Ȳi. adalah ilai tegah dari subgrup ke-i. Zi. meyataka ilai tegah grup(kelompok) dari Z ij da Z.. meyataka ilai tegah secara keseluruha dari Z ij. Kriteria utuk pegujia ii adalah tolak H 0 jika ilai W > F α,k 1,N k. (c) Asumsi Liieritas (Keliiera Data) Pegujia keliiera dega uji F diyataka sebagai berikut. H 0 : terdapat hubuga yag liier atara variabel X da Y H 1 : tidak terdapat hubuga yag liier atara variabel X da Y Dari [1], statistik uji yag diguaka adalah F hit = χ2 1/(k 2) χ 2 (2.3) 2 /( k),
Trasformasi Box-Cox pada Aalisis Regresi Liier Sederhaa 117 dega: χ 2 1 = yi 2 ( yij ) 2 b 2 ( 1)s 2 i x, χ 2 2 = y 2 ij y 2 i i, s 2 x = x2 i ( x i) 2. ( 1) Didefiisika y ij sebagai ilai ke-j bagi peubah acak Y i, semetara y i. adalah jumlah ilai-ilai Y i dalam cotoh. Kriteria pegujia ii adalah tolak H 0 jika F hit > F tabel. 2.2. Metode Kemugkia Maksimum Metode kemugkia maksimum (Maximum Likelihood Methods) adalah metode yag diguaka utuk meduga parameter-parameter dega memaksimumka fugsi kemugkia yag dibetuk dari fugsi kepekata peluag bersama beberapa peubah acak. Fugsi kemugkia maksimum adalah fugsi dari θ dilambagka dega L(θ). Jika X 1, X 2,, X merupaka peubah acak dari f(x i ; θ), maka L(θ) = f(x 1 ; θ)f(x 2 ; θ) f(x ; θ) = f(x i ; θ) [1] (2.4) i Padag model regresi dalam otasi matriks Y = Xβ + ε ; ε N(0, σ 2 ) (2.5) Utuk aalisis regresi liier sederhaa, persamaa (2.5) dapat ditulis dalam betuk Y i = β 0 + β 1 X i + ε i ; ε i N(0, σ 2 ) (2.6) Dalam regresi liier sederhaa, fugsi kemugkiaya dapat dituliska L = L(β 0, β 1, σ 2 ) = (2πσ 2 ) 2 exp [ 1 2σ 2 ] (Y i β 0 β 1 X i ) 2 (2.7) Utuk meetuka peduga kemugkia maksimum dari parameter-parameter β 0, β 1, da σ 2 yag diotasika dega b 0, b 1, da ˆσ 2, maka persamaa (2.7) ekivale dega ( ) ( ) ( ) 1 l L(β, σ 2 ) = l 2π l σ 2 2 2 2σ 2 (Y i β 0 β 1 X i ) 2 (2.8) Dega meuruka fugsi kemugkia terhadap setiap parameter β 0, β 1, σ 2,
118 Elvi Yati dkk. diperoleh l L β 0 = 0 1ˆσ 2 l L β 1 = 0 1ˆσ 2 l L σ 2 (Y i b 0 b 1 X i ) = 0, (2.9) (Y i b 0 b 1 X i )X i = 0, (2.10) = 0 2ˆσ 2 + 1 2ˆσ 4 Peyelesaia persamaa (2.9) (2.11) adalah sebagai berikut. (Y i b 0 b 1 X i ) 2 = 0. (2.11) b 0 = Ȳ b X, 1 (2.12) b 1 = Y i(x i X) (X, (2.13) i X) 2 ˆσ 2 = (Y i b 0 b 1 ) 2. (2.14) Sehigga diperoleh peduga model regresi liier sederhaa adalah Ŷ = b 0 + b 1 X. Pada model Y = Xβ + ε, persamaa (2.8) dapat ditulis dalam betuk ( ) ( ) ( ) 1 l L(β, σ 2 ) = l 2π l σ 2 2 2 2σ 2 (Y Xβ) t (Y Xβ) (2.15) di maa l L β i = 0 b = (X t X) 1 (X t Y ). 3. Trasformasi Box-Cox Trasformasi Box-Cox adalah trasformasi pagkat pada variabel tak bebas di maa variabel tak bebasya berilai positif. Box da Cox mempertimbagka kelas trasformasi berparameter tuggal, yaitu λ yag dipagkatka pada variabel tak bebas Y, sehigga trasformasiya mejadi Y λ, dimaa λ adalah parameter yag perlu diduga. Prosedur trasformasi Box-Cox pada aalisis regresi liier sederhaa utuk model Y = Xβ + ε dapat dilakuka dalam dua betuk trasformasi. Meurut [2], trasformasi pertama adalah: { ( ) Y λ i 1 W i (λ) = λ, λ 0, i = 1, 2,, (3.1) l(y i ), λ = 0 Dari [5], diperoleh trasformasi kedua berdasarka W i (λ), dega { ( ) Y λ i 1, λ 0 V i (λ) = λŷ λ 1 Ŷ l(y i ), λ = 0 di maa Ŷ = Y 1 Y 2 Y = ( merupaka rata-rata geometrik dari Y 1, Y 2,, Y. Y i ) 1. (3.2)
Trasformasi Box-Cox pada Aalisis Regresi Liier Sederhaa 119 Trasformasi Y mejadi W megakibatka model persamaa liier dalam otasi matriks mejadi W = Xβ + ε. Trasformasi Y mejadi V megakibatka model persamaa liierya dalam otasi matriks mejadi V = Xβ + ε. Dega demikia, prosedur utama trasformasi Box-Cox adalah meduga parameter trasformasiya yaitu λ. Salah satu metode yag dapat diguaka dalam pedugaa parameter λ pada Trasformasi Box-Cox adalah Metode Kemugkia Maksimum. Dalam model regresi liier V = Xβ + ε diperoleh fugsi kemugkia sebagai berikut. L(β, λ, σ 2 ) = (2πσ 2 ) 2 exp [ Persamaa (3.3) ekivale dega dega demikia Sehigga Selajutya, di maa l L = 2 l(2πσ2 ) 1 2σ 2 ] (V i β 0 β 1 X i ) 2 (3.3) ( ) 1 2σ 2 (V (λ) Xβ) t (V (λ) Xβ), (3.4) l L β = [ 2 l(2πσ2 ) ( 1 2σ )(V (λ) Xβ) t (V (λ) Xβ)] 2 = 0. (3.5) β (X t X)β = X t V (λ) b = (X t X) 1 X t V (λ). l L σ 2 = 2σ 2 + (V (λ) ˆV (λ)) t (V (λ) ˆV (λ)) 2(σ 2 ) 2 (3.6) ˆV (λ) = Xb = X(X t X) 1 X t V (λ), ˆσ 2 = (V (λ) ˆV (λ)) t (V (λ) ˆV (λ)) = RSS(V (λ)), di maa RSS(V (λ)) = (V (λ) ˆV (λ)) t (V (λ) ˆV (λ)) merupaka jumlah kuadrat sisaa dari V (λ). Peduga kemugkia maksimum ˆλ dari λ merupaka ilai yag memaksimumka fugsi kemugkia maksimum. Maka, ˆλ memaksimumka l L = 2 l(2π) 2 l RSS(V (λ)) [ ] 2 l RSS(V (λ)) ˆλ memiimumka 2 memiimumka [ ] 2RSS(V (λ)) [V (λ) ˆV (λ)] t [V (λ) ˆV (λ)], RSS(V (λ)) l[ ] ˆλ diperoleh dega meetuka ilai λ yag RSS(V (λ)) = [V (λ) ˆV (λ)] t [V (λ) ˆV (λ)]. Peaksira parameter λ yag biasa dilakuka yaitu meetuka ilai λ pada kisara ilai tertetu. Biasaya λ yag dipakai yaitu dari kisara (-2,2) atau (-1,1). (3.7)
120 Elvi Yati dkk. 4. Pembahasa Data yag diguaka dalam peelitia ii adalah data sekuder yag diperoleh dari website http://archive.ics.uci.edu. Data terdiri dari 90 pegamata, dega satu variabel bebas da satu variabel tak bebas. Variabel bebas (X) adalah umur pederita hepatitis yag berusia 30 50 tahu da variabel tak bebas (Y ) adalah level bilirubi seorag pederita hepatitis. 4.1. Aalisis Data Awal Dega megguaka software SPSS 17 diperoleh model persamaa regresi sebagai berikut Y = 0, 454 + 0, 024X, dega X adalah umur da Y adalah level bilirubi. Pegujia asumsi ormalitas meghasilka ilai sigifikasi 0, 000 lebih kecil dari 0, 1, maka disimpulka data tidak meyebar ormal. Pegujia asumsi homogeitas meghasilka ilai sigifikasi 0, 000 lebih kecil dari 0, 1, maka disimpulka ragam data tidak homoge. Pegujia asumsi liieritas meghasilka ilai sigifikasi 0, 213 lebih besar dari 0,1, maka disimpulka bahwa atara variabel bebas (X) da variabel tak bebas (Y ) tidak terdapat hubuga yag liier. Berdasarka model regresidi atas, diperoleh selag level bilirubi yaitu 1, 174 1, 654. Nilai ii tetu tidak sesuai dega ilai rujuka level bilirubi dewasa. Oleh karea itu, perlu dilakuka trasformasi Box-Cox utuk memperoleh model regresi yag sesuai megeai hubuga atara umur da bilirubi pada seseorag. 4.2. Trasformasi Terhadap Variabel Tak Bebas (Y ) Pada peelitia ii dilakuka trasformasi Y λ terhadap variabel tak bebas (Y ) dega lagkah-lagkah sebagai berikut : (1) Meetuka rage λ Rage λ yag diambil adalah ( 2, 2) dega ilai No. 1 2 3 4 5 6 7 8 9 λ 2 1,5 1 0,5 0-0,5-1 -1,5-2 (2) Meghitug Ŷ = (Y 1Y 2...Y ) 1 (3) Meghitug Ŷ λ 1 utuk tiap harga λ Nilai Ŷ λ 1 utuk tiap harga λ ditampilka dalam tabel berikut λ 2 1,5 1 0,5 0-0,5-1 -1,5-2 Ŷ λ 1 1,1265 1,0614 1,0000 0,9422 0,8877 0,8364 0,7880 0,7425 0,6995 (4) Meghitug V i (λ) Diperoleh ilai V i utuk tiap harga λ dega i = 1, 2,, 90.
Trasformasi Box-Cox pada Aalisis Regresi Liier Sederhaa 121 (5) Regresika atara V da X, sehigga diperoleh JKS Diperoleh ilai JKS sebagai berikut λ 2 1,5 1 0,5 0-0,5-1 -1,5-2 Ŷ λ 1 1603,05 437,862 147,536 65,0742 38,6102 30,1490 29,5105 34,5212 46,5506 (6) Tetuka λ yag mempuyai JKS terkecil Nilai JKS terkecil adalah 29, 5105 pada λ = 1. (7) Melakuka trasformasi data megguaka λ dega JKS terkecil Dega λ = 1 dilakuka trasformasi Y 1, artiya data awal Y dipagkatka dega 1 yag diberi simbol dega Y. 4.3. Aalisis Data Hasil Trasformasi Pada tahap ii dilakuka regresi terhadap variabel tak bebas hasil trasformasi (Y ) dega variabel bebas (X), sehigga diperoleh model persamaa regresi yag baru sebagai berikut Y = 1, 589 0, 015X, dega X adalah umur da Y adalah level bilirubi. Pegujia asumsi ormalitas meghasika ilai sigifikasi 0, 969 lebih besar dari 0, 1, maka disimpulka data meyebar ormal. Pegujia asumsi homogeitas meghasika ilai sigifikasi 0, 785 lebih besar dari 0, 1, maka disimpulka ragam data homoge. Pegujia asumsi liieritas meghasilka ilai sigifikasi 0, 067 lebih kecil dari 0, 1, maka disimpulka terdapat hubuga yag liier atara variabel bebas (X) da variabel tak bebas (Y ). Dari hasil uji asumsi dasar terhadap data hasil trasformasi, diperoleh bahwa data hasil trasformasi tersebut telah memeuhi ketiga asumsi. Sehigga, model yag cocok utuk hubuga atara umur da level bilirubi adalah Y = 1, 589 0, 015X. Model regresi ii memberika ilai Adjusted R Square sebesar 0, 026. Nilai ii meyataka bahwa pegaruh variabel bebas (X) terhadap variabel tak bebas (Y ) sagat kecil. Utuk model regresi ii diperoleh selag level bilirubi yaitu 0, 839 1, 139. Nilai ii sesuai dega ilai rujuka level bilirubi dewasa karea terletak pada selag 0, 1 ± 1, 2 mg/dl. 5. Kesimpula Data statistika dega model regresi yag baik pada aalisis regresi liier sederhaa adalah data yag memeuhi asumsi-asumsi dasar regresi. Apabila asumsiasumsi tersebut tidak dipeuhi, maka dapat dilakuka trasformasi terhadap data, salah satuya trasformasi Box-Cox. Trasformasi Box-Cox merupaka trasformasi pagkat terhadap variabel tak bebas, yaitu λ yag dipagkatka terhadap Y dega betuk trasformasi Y λ. Pedugaa parameter λ dapat dilakuka dega Metode Kemugkia Maksimum, dega tujua medapatka jumlah kuadrat sisaaa yag miimum.
122 Elvi Yati dkk. Daftar Pustaka [1] Bai, L.J da M. Egelhardt. 1997. Itroductio to Probability ad Mathematical Statistics. Secod Editio. PWS-KENT, Bosto [2] Drapper, N.R da H. Smith. 1992. Aalisis Regresi Terapa. PT. Gramedia, Jakarta [3] Ispriyati, D. 2004. Pemodela Statistika dega Trasformasi Box-Cox. Jural Matematika da Komputer. Vol.7 No.3 [4] Natrella, M. 2012. NIST/SEMATECH e-hadbook os Statistical Method. U.S Commerce Departmet s Techology Admiistratio, USA [5] Rawlig, J.O, S.G Patula da D.A Dickey. 1998. Applied Regressio Aalysis : A Research Tool. Secod Editio. Spriger-Verlag, New York [6] Siegel, S.1992. Statistik Noparametrik. PT. Gramedia, Jakarta