JURNAL MATEMATIKA AN KOMPUTER Vol. 5. No. 3, 161-167, esember 00, ISSN : 1410-8518 PENGARUH SUATU ATA OBSERVASI ALAM MENGESTIMASI PARAMETER MOEL REGRESI Hern Utam, Rur I, dan Abdurakhman Jurusan Matematka FMIPA UGM Abstrak Observas yang mempengaruh model regres sedemkan hngga elpsod konfdens untuk estmas parameter regresnya menjad kecl apabla observas tersebut dhlangkan adalah observas pentng. Sehngga observas pentng tersebut bsa merupakan observas berpengaruh sesungguhnya atau bsa juga sebaga outler. Salah satu cara menentukan observas ke- pentng atau tdak, melhat elpsod konfdens parameter model regres lnear dengan menghlangkan observas tersebut. Kata kunc : elpsod konfdens 1. PENAHULUAN Berbcara mengena regres secara umum, berart membcarakan proses bagamana kta menghubungkan antara varabel eksplanator (ndependen dengan varabel respon (dependen dar suatu hmpunan data (data set dengan harapan dperoleh suatu model yang sesua untuk bentuk hubungan varabel-varabel tad. Setelah dperoleh model yang sesua, muncul suatu pertanyaan mengena apakah suatu observas pentng yang mempengaruh model tersebut? Pengertan observas pentng d sn adalah observas yang mempengaruh model regres sedemkan hngga elpsod konfdens untuk estmas parameter regresnya menjad kecl apabla observas tersebut dhlangkan. Sehngga observas pentng tersebut bsa merupakan observas berpengaruh sesungguhnya atau bsa juga sebaga outler. Sebelum melakukan analsa regres ganda, uj yang basa dlakukan adalah melhat ada atau tdaknya kejanggalan (outler atau gap pada dstrbus unvarat setap varatnya dengan menggunakan plot dagram scatter, meskpun dengan cara n tdak dapat mendeteks observas multvarat yang tdak sesua. 161
Pengaruh Suatu ata (Hern Utam, Rur I, dan Abdurakhman Setelah terbentuk model regresnya, maka kebanyakan prosedur deteks yang dgunakan terfokus pada resdual, nla predks (ftted value, ŷ, dan varabel eksplanator. Studentzed resdual, t, banyak drekomendaskan sebaga alat deteks adanya outler. Behnken dan raper (197 menggambarkan estmas varans ŷ (ekuvalen dengan estmas varans resdual, V ˆ( dengan plot resdual atau studentzed resdual memberkan nformas lebh. Lebh spesfk mereka mengatakan Suatu varas yang luas d dalam varans resdual mencermnkan suatu keanehan dar matrks, yatu suatu jarak yang tak homogen dar observas-observas dan akan menunjukkan data yang defsens. Huber (1975 juga menyatakan bahwa varans-varans tersebut memlk nformas lebh. Setelah observas-observas pentng terdeteks menggunakan ukuran-ukuran d atas, dengan menguj efek penghapusan (deletng observas tertentu merupakan satu langkah lebh lanjut. Tujuan dar penulsan makalah n, adalah untuk menunjukkan salah satu metode untuk mendeteks observas berpengaruh dalam model regres lnear.. MOEL REGRESI LINEAR Jka varabel bebas dnotaskan dengan dan varabel tdak bebas dnotaskan dengan Y, maka model regres lnear dnyatakan dalam bentuk: dmana: Y = β + ε. (1 Y : vektor observas dengan order Nx1 β : vektor parameter dengan order px1 : matrks yang elemen-elemennya dketahu, dengan order Nxp ε : vektor kesalahan dengan order Nx1, yang setap elemennya dasumskan berdstrbus normal ndependen dengan mean nol dan varansnya σ. alam makalah n, dasumskan model datas adalah model lnear rank penuh, sehngga rank dar adalah p. R 16
JURNAL MATEMATIKA AN KOMPUTER Vol. 5. No. 3, 161-167, esember 00, ISSN : 1410-8518 Karena β belum dketahu, sehngga destmas dar data. Salah satu cara untuk mencar estmas vektor β dengan menggunakan metode kuadrat terkecl (least square yang dperoleh dengan jalan memnmumkan jumlah kuadrat kesalahannya. ar persamaan (1 dapat dtuls kembal menjad ε = Y β sehngga jumlah kuadrat kesalahannya adalah ε ε = ( Y β ( Y β = Y ββ Y + β β d( ε ε Untuk = 0, maka Y + βˆ = 0 dβ ar persamaan ( dperoleh estmas β, yatu: βˆ = ( βˆ = Y... ( Y (3 Berdasarkan persamaan (3 yang merupakan penyelesaan dar persamaan normal (, maka: 1. vektor resdu model (1: ˆ ˆ R = Y Y = Y β = ( I ( Y... (4. covarans dar Ŷ : V ( Yˆ = V ( βˆ = V ( ( 3. covarans dar R : Y = ( σ.. (5 V ( R = V (( I ( Y = ( I ( σ...(6 4. ellpsod konfdens ( 1 α100% untuk β, jka dketahu hmpunan semua vektor β ( estmas β yang lan adalah 163
Pengaruh Suatu ata (Hern Utam, Rur I, dan Abdurakhman ( β βˆ β ( ps βˆ F( p, n p,1 α dengan s = R R /( n p dan F ( p, n p,1 α adalah persentl 1 α dstrbus F dengan derajat bebas p dan n-p. 3. MENITEKSI PENGARUH SEBUAH ATA OBSERVASI ALAM MENGESTIMASI PARAMETER MOEL Untuk menentukan derajat pengaruh data ke- dalam memperoleh βˆ, langkah pertama adalah menghtung estmas β dengan menghapus ttk tersebut, sehngga dperoleh β ˆ (, yatu estmas kuadrat terkecl β dengan menghapus data ke-. Selanjutnya dhtung: ( βˆ = ˆ ( β β ( β ps ( ˆ ˆ... (7 engan menentukan tngkat sgnfkan α, akan dperoleh batas konfdens (1-α 100% untuk β berdasarkan βˆ. dmana ( matrks Untuk menghtung, secara mudah akan dtunjukkan d bawah n: ( ˆ ˆ β β ( ( ˆ ( = ( ( x Y xβ......(8 : matrks yang dperoleh dengan menghlangkan bars ke- dar Y : observas ke- x : bars ke- dar matrks. Selanjutnya jka v = x ( x, dan dasumskan v < 1 maka dperoleh ( ( ( = ( + ( x x ( /(1 v ( ( x = ( x + ( x x ( x /(1 v ( ( x = (( x (1 v + ( x x ( x /(1 v ( ( ( x = ( x /(1 v......(9 ( ( engan mensubsttuskan persamaan (9 ke persamaan (8, akan dperoleh: 164
JURNAL MATEMATIKA AN KOMPUTER Vol. 5. No. 3, 161-167, esember 00, ISSN : 1410-8518 (βˆ βˆ ( x = 1 v 1 ( ( Y sehngga persamaan (7 bsa dtuls: Y βˆ x = s 1 v xβˆ ar persamaan (10 tampak bahwa parameter (p, t Y = s 1 ( V ( Yˆ = ( = v σ x v.....(10 p(1 v bergantung pada 3 hal, yatu: jumlah x β ˆ, dan raso antara covarans nla predks ke- 1 v x dan covarans resdu ke- ( V ( (1 σ R = σ v. engan demkan persamaan (10 dapat dtuls dalam bentuk yang sederhana menjad: t ˆ V ( Y =....(11 p V ( R Jelas, t merupakan ukuran untuk mengetahu bahwa observas ke- dapat dkatakan sebaga outler dar model yang dasumskan. Sedangkan V Yˆ / V ( R ( merupakan ukuran senstf relatf estmas, yatu βˆ, terhadap data yang potensal terpencl dar hmpunan data. Untuk nla raso yang besar memberkan ndkas bahwa data yang bersangkutan memberkan bobot yang besar dalam menentukan βˆ. Kombnas t dan V Yˆ / V ( R dalam persamaan (11 menghaslkan suatu ( ukuran pengaruh menyeluruh dar sembarang data dalam menentukan estmas parameter dengan metode least square error. alam suatu analss, untuk nformas tambahan bsa dlakukan uj t dan V ( Yˆ / V ( R secara terpsah. 4. CONTOH KASUS Longley(1967 memberkan hmpunan data yang menghubungkan antara 6 varabel ekonom dengan total tenaga kerja yang dbutuhkan dar tahun 1947 sampa 196. Tabel 1 memuat t, V ( Yˆ / V ( R,, dan tahun. ar tabel tampak 165
Pengaruh Suatu ata (Hern Utam, Rur I, dan Abdurakhman bahwa terbesar dperoleh untuk tahun 1951. Penghlangan data tahun n ternyata akan merubah estmas kuadrat terkecl, yatu βˆ ke batas daerah konfdens 35% untuk βˆ. Sedang terkecl kedua tahun 196 dan n penghlangan data tahun n akan merubah estmas βˆ ke batas daerah konfdens 15%. Jelas, tahun 1951 dan 196 mempunya pengaruh yang besar dalam menentukan βˆ. Tahun t Y ˆ / V ( R V ( 1947 1.15 0.74 0.14 1948 0.48 1.30 0.04 1949 0.19 0.57 * 1950 1.70 0.59 0.4 1951 1.64 1.60 0.61 195 1.03 0.59 0.09 1953 0.75 0.97 0.08 1954 0.06 1.0 * 1955 0.07 0.84 * 1956 1.83 0.49 0.3 1957 0.07 0.56 * 1958 0.18 0.93 * 1959 0.64 0.60 0.04 1960 0.3 0.30 * 1961 1.4 0.59 0.17 196 1.1.1 0.47 * : lebh kecl dar 5.10-3 5. KESIMPULAN ar data hasl observas, dapat ddteks bagamana pengaruh observas ke- dalam memperoleh estmas parameter model regres lnear. engan melhat elpsod konfdens parameter model regres lnear, dapat dtentukan apakah jka observas ke- dhlangkan akan dperoleh elpsod konfdens yang lebh kecl, yang berart observas ke- merupakan observas pentng. 166
JURNAL MATEMATIKA AN KOMPUTER Vol. 5. No. 3, 161-167, esember 00, ISSN : 1410-8518 AFTAR PUSTAKA 1. enns C. R, etecton of Influental Observaton n Lnear Regresson, Technometrcs, 000, 4 : 65-68.. avd A. B, Edwn, K, and Roy, E.W, Regresson agnostcs : Identfyng Influental ata and Sources of Collnearty, Wley, New York, 1980. 3. Peter, J. H, Robust Statstcs, Wley, New York, 1981. 167