Modul 3: Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis A. Pendahuluan Regresi Linier dan Metode Kuadrat Terkecil Istilah atau pengertian regresi (yang berarti: prediksi atau taksiran) pertama kali diperkenalkan oleh Sir Francis Galton (1877) dalam suatu karya ilmiah atau penelitiannya tentang korelasi antara tinggi anak dan tinggi orang tuanya. Pada penelitiannya tersebut, Galton mendapatkan bahwa tinggi anak dari orang tua yang tinggi cenderung meningkat atau menurun sebagai fungsi atau model hubungan dari berat rata-rata populasi. Garis yang menunjukkan hubungan seperti di atas, disebut juga garis regresi. Regresi linear adalah metode, perangkat atau kelengkapan ilmu statistik yang digunakan untuk mengetahui korelasi atau pengaruh parametrik antara satu atau beberapa variabel terhadap satu buah variabel yang membentuk suatu korelasi dalam sebuah persamaan aljabar. Di sisi lain, analisis regresi mempelajari korelasi atau hubungan yang diperoleh yang dinyatakan dalam suatu persamaan matematika (umumnya, sebagai suatu persamaan aljabar) yang menyatakan hubungan fungsional antara variabelvariabel. Variabel-variabel (peubah-peubah) yang memiliki pengaruh terhadap lainnya disebut juga variabel bebas (variabel independen atau variabel penjelas). Di sisi lain, suatu variabel yang dipengaruhi sering disebut sebagai variabel terikat (variabel dependen). Regresi linear hanya dapat digunakan pada skala interval dan atau yang berbentuk nisbah (perbandingan atau rasio). Dengan melakukan pendekatan-pendekatan secara kaidah statistik, analisis regresi linier yang dipelajari dalam Mata Kuliah Komputasi Numerik ini dilakukan dengan bantuan analisis Metode Kuadrat Terkecil (Least-Squares Method). Metode Kuadrat Terkecil tersebut dapat dianggap sebagai suatu metode pendekatan yang paling praktis dalam dunia keteknikan untuk: (a). Regresi ataupun pembentukan persamaan dari titik-titik data diskretnya (dalam suatu aktivitas pemodelan), dan atau untuk (b). Analisis galat (sesatan) dari suatu pengukuran atau penelitian teoretis (untuk validasi model). Metode kuadrat terkecil ini juga memainkan peranan penting dalam metode aplikasi secara statistik, karena metode ini seringkali digunakan dalam penyelesaian problem-problem yang melibatkan kumpulan data yang tersusun secara acak, seperti dalam sesatan-sesatan percobaan. Namun demikian, hal-hal yang berhubungan dengan teori statistik tidak akan dibahas secara khusus dalam modul ini. Analisis regersi dapat digunakan untuk memeperoleh korelasi matematis (hubungan fungsional) antara dua buah variabel atau lebih. Selain itu juga, analisis regersi ini dapat digunakan pula untuk mendapatkan pengaruh antar Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (1/11)
variabel-variabel prediktor terhadap variabel kriteriumnya atau memprediksi pengaruh variabel prediktor terhadap variabel kriteriumnya (Usman dan Akbar, 006). Secara empirik, korelasi antara satu atau beberapa variabel bebas (sebagai prediktor) dengan satu variabel terikatnya (sebagai variabel respon atau kriterium) dapat dibedakan atas: 1. Analisis regresi linier sederhana (tunggal) atau Simple Analysis Regression: yaitu bila hanya terbentuk korelasi atau hubungan fungsional antara sebuah variabel bebas (tunggal) dengan sebuah variabel terikat; dan. Analisis regresi linear berganda atau Multiple Analysis Regression: yaitu bila beberapa variabel bebas dan satu buah variabel terikat membentuk suatu hubungan fungsional berbentuk persamaan aljabar atau korelasi matematis. Analisis regresi linier merupakan metode statistik yang paling umum dan banyak digunakan dalam studi parametrik dari penelitian-penelitian sosial, terutama penelitian ekonomi. Dalam studi ekonomi tersebut, piranti lunak atau program komputer yang paling banyak digunakan adalah SPSS (Statistical Package For Service Solutions). B. Analisis Regresi Linier Sederhana Secara teoretis, regresi linier sederhana merupakan suatu aktivitas analisis statistika yang dapat digunakan untuk memprediksi korelasi atau hubungan matematis dalam bentuk suatu persamaan (model) antara variabel terikat (tak bebas) tunggal sebagai fungsi dari variabel bebas (independen) tunggal. Analisis regresi linier sederhana hanya memiliki satu variabel (peubah) yang dihubungkan dengan satu variabel tidak bebas. Bentuk umum dari persamaan regresi linier untuk populasi adalah sebagai berikut: y f x Ax B dengan x : berperan sebagai variabel bebas y f x : berperan sebagai variabel terikat A : parameter kelandaian (slope) garis lurus B : parameter perpotongan (intercept) dengan variabel terikat Seperti telah dijelaskan di atas, penentuan dari koefisien-koefisien persamaan A dan B dapat dilakukan dengan menggunakan metode kuadrat terkecil (least-square), yaitu metode pendekatan yang dipakai untuk menentukan koefisien persamaan dan dari jumlah pangkat dua (kuadrat) antara titik-titik dengan garis regresi yang dicari pada nilai (harga) yang terkecil, dalam suatu rangkaian pasangan data (set x y ) yang berjumlah N. Sebagai contoh, di bawah ini diberikan 1 set data ( x y ) sebanyak 7 buah ( N 7 ) yang ditabelkan sebagai berikut: Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (/11)
Tabel 1. Set data regresi linier. n x y 1-3 0, - 0,67 3-1 1,55 4 0 1,99 5 1,55 6 3,5 7 3 4,11 Hasil pengaluran kurva (plotting) titik-titik tersebut di atas dapat dilihat seperti pada Gambar 1 di bawah ini. Gambar 1. Kurva regresi linier, dengan N 7. Persamaan sebaran ( S = deviasi standar atau kadang disebut sebagai distribusi) yang menyatakan galat (sesatan) terdistribusi dari persamaan linier tersebut, yang dapat juga dinyatakan sebagai: S yaxb Persyaratan yang harus dipenuhi untuk dapat menentukan A dan B adalah minimisasi turunan persamaan S di atas terhadap tetapan A dan B (dalam hal ini, koefisien-koefisien A dan B dianggap sebagai variabel-variabel semu), sehingga membentuk persamaan-persamaan berikut: Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (3/11)
ds (a). agar dapat menentukan koefisien A, maka 0 da dan ds (b). agar dapat menentukan koefisien B, maka 0 db Rician untuk memperjelas penurunan dari kedua persamaan di atas adalah sebagai berikut: d da yaxb 0 y Ax B x 0, atau A x B x x, sehingga didapat persamaan berikut: y (1) d db, sehingga didapatkan: y AxB 1 0, atau yaxb 0 Ax NB y () Kedua persamaan (1) dan () seperti di atas adalah suatu Sistem Persamaan Aljabar Linier (SPAL), bila disusun ulang sebagai berikut: x x x N A xy B y yang identik dengan persamaan matriks [ A ] [ ˆx ] = [b ]. Solusi SPAL tersebut sebenarnya relatif cukup mudah bila dilakukan dengan menggunakan metode analitis. Dengan menggunakan aturan Cramer, maka solusi parameter- parameter A dan B adalah: A dan x y x xy x det y N y N x x x x det x N x N B det x y x y x x x x det x N x N x xy x xy Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (4/11)
Karena hanya membentuk persamaan matriks berorder, maka determinandeterminan matriks di atas dapat langsung dihitung, dengan rincian sebagai berikut: x x x N det x N x x xy x y N det xy N x y x x xy y det x y x xy Sehingga, diperoleh harga parameter A dan parameter B sebagai berikut: A B xyn xy x N xx x y x xy x N x x 0,684143; dan 1,985000 C. Analisis Regresi Linier Persamaan Parabola Persamaan Parabola atau Persamaan Kuadrat merupakan pengembangan model korelasi fungsi polinomial antara variabel bebas ( x ) dengan variabel terikatnya ( ), yang mempunyai bentuk umum sebagai berikut: y y f x px qx r Regresi yang dimaksudkan disini adalah: pencarian harga-harga tetapan p, q dan r berdasarkan set data yang diberikan (ingat: jumlah atau pasangan data x y sebanyak N buah!). Persamaan sebaran atau deviasi standar ( ) yang menyatakan galat atau sesatan terdistribusi dari persamaan linier tersebut di atas, dapat dinyatakan sebagai: S S y px qx r Persyaratan yang harus dipenuhi untuk dapat menghitung p, dan r adalah minimisasi turunan persamaan di atas terhadap tetapan p q dan r (dalam hal ini, p, q dan r dianggap sebagai variabel-variabel semu), sehingga membentuk persamaan-persamaan minimisasi berikut: 0 ds dp q Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (5/11)
ds 0 dq ; dan ds 0 dr Tahapan penurunan ketiga persamaan-persamaan di atas terhadap p, dan r adalah sebagai berikut: d dp y px qx r 0 q d dq y px qx r 0 d dr y px qx r 0 ; dan yang ketiganya dapat membentuk SPAL (Sistem Persamaan Aljabar Linier) seperti berikut ini: (3) 4 3 p x q x r x x y (4) 3 p x q x r x xy (5) p x q x Nr y Seperti halnya pada regresi persamaan linier sebelumnya, ketiga persamaan (3), (4), dan (5) di atas juga membentuk suatu Sistem Persamaan Aljabar Linier (SPAL) dengan order 3, yang bila disusun ulang akan terbentuk sebagai berikut: x x N r y 4 3 x x x p x y 3 x x x q xy Solusi SPAL di atas dapat dilakukan melalui cara, yaitu: (a). analitis (aljabar) dan (b). numeris. Berbagai solusi SPAL (dengan menggunakan metode numeris) dapat dipelajari pada Bab 4 di buku ajar (Metode Numerik). Sebagai catatan, determinan dari matriks bujur-sangkar dengan rank 3 dapat dihitung sebagai berikut: (6) Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (6/11)
Dengan menggunakan metode analitis, sebenarnya SPAL di atas masih relatif cukup mudah diselesaikan, yaitu dengan menggunakan aturan Cramer untuk mencari solusi konstanta atau parameter-parameter p, q dan. r Berdasarkan catatan tentang determinan matriks berorder 3 seperti di atas, maka determinan-determinan matriks di atas berturut-turut adalah sebagai berikut: Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (7/11)
dan D. Analisis Regresi Linier Berganda (Regresi Multi Linier) Beberapa persamaan aljabar dapat membentuk suatu relasi linier atau yang sejenisnya, antara beberapa variabel bebas (independent variables) dengan sebuah variabel terikat (dependent variable). Relasi tersebut seringkali dijumpai dalam dunia keteknikan, termasuk hasil logaritmik dari persamaan-persamaan analisis adimensional ataupun relasi analogi bilangan-bilangan tak berdimensi. Bentuk umum dari persamaan multilinier seperti di atas dapat disederhanakan dalam relasi fungsi matematis berikut: Bila persamaan multilinier tersebut memiliki jumlah variabel bebas yang lebih besar lagi, maka secara sistematis dapat dituliskan sebagai berikut: Persamaan sebaran ( S ) yang menyatakan galat terdistribusi dari persamaan multilinier tersebut di atas dapat dinyatakan sebagai: Menarik untuk dicatat, bahwa jumlah konstanta atau parameter (c 1 sampai dengan c n ) yang dimiliki suatu persamaan multilinier sekurang-kurangnya sama dengan jumlah variabel bebasnya. Seperti biasanya, persyaratan yang harus dipenuhi untuk dapat menghitung konstanta-konstanta c 1 sampai dengan c n, adalah minimisasi turunan persamaan di atas terhadap masing-masing konstanta (dalam hal ini, semua konstanta dianggap sebagai variabel-variabel semu), sehingga membentuk persamaan-persamaan berikut: Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (8/11)
Tahapan diferensiasi persamaan-persamaan di atas terhadap masingmasing parameternya (dari c 1 sampai dengan c n ) dapat disajikan sebagai berikut: membentuk bersamaan berikut: (7) membentuk bersamaan berikut: sampai, akhirnya (8) akan membentuk bersamaan ke-n dalam bentuk berikut: Sistem Persamaan Aljabar Linier (SPAL) yang terbentuk dari persamaanpersamaan (7), (P), (8), dan (9) adalah sebagai berikut: (9) Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (9/11)
Sebagai catatan, metode penyelesaian dari SPAL yang terakhir seperti di atas akan lebih baik jika dipilih secara numerik (komputasi numerik), misalnya adalah Metode Eliminasi Gauss atau dengan menggunakan spreadsheet (worksheet) MS-EXCEL. Penyelesaian secara analitis tampaknya akan sangat kompleks sekaligus tidak praktis. E. Contoh: Regresi Linier suatu Garis Lurus dari Pasangan Data x-y Diketahui bahwa pasangan data (variabel bebas y ) berikut ini: x dengan variabel terikat memiliki korelasi kurva garis lurus, dengan model persamaannya sebagai berikut: A B y Dengan menggunakan analisis regresi linier yang telah saudara pelajari, tentukanlah harga-harga koefisien A dan B dari korelasi model di atas! x Jawab: Untuk memudahkan penyelesaiannya, dapat digunakan worksheet MS- EXCEL yang penyusunan kolom-kolomnya disesuaikan dengan bentuk SPAL dari regresi linier tersebut. Bentuk tampilan tabel dalam worksheet MS-EXCEL yang dimaksudkan, Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (10/11)
adalah sebagai berikut: Dari uraian pada halaman 4 seperti di atas, diketahui bahwa untuk koefisienkoefisien A dan B dapat dihitung sebagai vektor jawab dari SPAL berikut: x x A x y x N B y Jika menggunakan acuan pada worksheet MS-EXCEL seperti di atas, maka bentuk SPAL yang dimaksud dapat disusun sebagai worksheet berikut: diperoleh F11 C11 A E11 C11 B10 B D11 60 1 A 10 1 8 B 4 Maka, jika kita gunakan Aturan Cramer atau pun Metode Eliiminasi Gauss, akan diperoh: A = -3 B= 5 Sehingga, Persamaan Model yang dimaksud adalah: y - 3x 5 Intellectual Property Right of Prof. Dr. Ir. Setijo Bismo, DEA. @015, DTK-FTUI Modul #3 - Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis (11/11)