MAKALAH REGRESI LOGISTIK DAN REGRESI DENGAN VARIABLE DUMMY KELOMPOK : Karlina Siti Faresha 135020200111071 Rezky Ridhowati 135020200111074 Pahriyatul Ummah 135020201111002 JURUSAN MANAJEMEN FAKULTAS EKONOMI DAN BISNIS UNIVERSITAS BRAWIJAYA MALANG 2014
KATA PENGANTAR Puji dan syukur kami panjatkan kepada Allah SWT, karena dengan rahmat dan hidayah-nya kami dapat menyelesaikan makalah mata kuliah Aplikasi Komputer Statistika tentang Regresi Logistik dan Regresi dengan Variable Dummy ini dengan tepat waktu. Harapan kami makalah ini dapat meningkatkan pemahaman dalam mempelajari regresi logistic dan dummy dalam Aplikasi Komputer Statistik. Apabila terdapat kesalahan dan kekurangan baik yang disengaja maupun yang tidak disengaja mohon dimaklumi dan dimaafkan karena kami masih dalam tahap pembelajaran. Kami menyadari bahwa makalah ini tidaklah sempurna, oleh karena itu kami menerima kritikan dan saran yang membangun dari pembaca. Semoga makalah ini dapat memberikan manfaat bagi kita semua. Atas perhatian dan kesempatan serta bimbingan yang telah diberikan Dosen matakuliah Aplikasi Komputer Statistika oleh Bapak Bayu, kami ucapkan terima kasih. Malang, 30 Mei 2014 Penyusun
DAFTAR ISI KATA PENGANTAR...i DAFTAR ISI.ii BAB I PENDAHULUAN.1 1.1 Latar Belakang....1 1.2 Rumusan Masalah......1 1.2. Tujuan Penulisan.1 BAB II ISI 2.1 Regresi Logistik.2 2.1.1 Contoh Aplikasai dan Analisis Regresi Logistik...2 2.1.2 Fungsi Regresi Logistik.6 2.2 Regresi dengan Variable Dummy.....6 2.2.1 Fungsi Regresi denngan Variable Dummy....6 2.2.2 Contoh Aplikasi Regresi dengan Variable Dummy.6 2.2.3 Analisis Regresi dengan Variable Dummy.7 2.2.4 Hasil Data Regresi dengan Variable Dummy 9 BAB III KESIMPULAN Kesimpulan.12 DAFTAR PUSTAKA iii
BAB 1 PENDAHULUAN 1.1 Latar Belakang Penggunaan statistika dalam segala bidang akan mempengaruhi tingkat analisis dari hasil penelitian yang sedang dilakukan. Untuk mengukur besarnya pengaruh variabel bebas terhadap variabel tergantung dan memprediksi variabel tergantung dengan menggunakan variabel bebas. Variabel pertama disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan dikenakan kepada variabel tergantung. Salah satu bagian dari regresi linear berganda adalah regresi berganda dengan variabel dummy atau variabel yang digunakan untuk mengkuantitatifkan variabel yang bersifat kualitatif (misal: jenis kelamin, ras, agama, perubahan kebijakan pemerintah, perbedaan situasi dan lain- Regresi dengan. Variabel dummy merupakan variabel yang bersifat kategorikal yang diduga mempunyai pengaruh terhadap variabel yang bersifat kontinue Model regresi logistik biner merupakan salah satu model regresi logistic yang digunakan untuk menganalisa hubungan antara satu variabel respon dan beberapa variabel prediktor, dengan variabel responnya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah karakteristik.model regresi logistik biner dengan satu variabel respon dapat dikembangkan menjadi model regresi logistik biner dengan menggunakan dua variabel respon, dimana model ini disebut model regresi logistik biner bivariat. 1.2 Rumusan Masalah A. Apa definisi regresi logistic? B. Apa fungsi regresi logistic? C. Bagaimana aplikasi dan analisi regresi logistic? D. Apa definisi regresi dengan variable dummy? E. Apa fungsi regresi dengan variable dummy? F. Bagaimana aplikasi dan analisi regresi dengan variable dummy? 1.3 Tujuan Penulisan
Tujuan penulisan makalah ini adalah agar para pembaca makalah dapat lebih mengetahui secara luas mengenai regresi logistic dan regresi dengan variable dummy serta tujuan penulisan makalah ini juga untuk memenuhi nilai dari mata kuliah Aplikasi Komputer Statistika. 2.1 Regresi Logistik BAB II ISI Pengertian Regresi logistik adalah bagian dari analisis regresi yang digunakan ketika variable dependen (respon) merupakan variabel dikotomi. Variabel dikotomi biasanya hanya terdiri atas dua nilai,yang mewakili kemunculan atau tidak adanya suatu kejadian yang biasanya diberi 0 atau angka. 2. 1.1 Contoh Aplikasi dan Analisis Regresi Logistik Jika kita ingin mengetahui pembelian tas merk tertentu oleh beberapa orang wanita dengan beberapa variabel penjelas antara lain adalah umur, tingkat pendapatan (low, medium, high), dan status (M menikah; S untuk single). Pada data tersebut, pembelian merupakan variabel prediktor yang dijelaskan dengan angka 1 sebagai membeli dan 0 sebagai tidak membeli. 1. Dengan SPSS 17.0 data yang diinput dapat berupa: 2. Setelah data diinput, pilih Analyze Regression Binary logistic seperti berikut:
3. Setelah muncul kotak dialog logistic regression, masukkan variabel dependen purchase ke kolom dependent, dan ketiga variabel independen ke dalam kolom covariates, lalu pilih button categorical untuk memasukkan variabel kategorik yaitu pendapatan dan status klik continue: 4. Setelah itu pilih option, checklist classification plot dan Hosmer-lemeshow goodness of fit, kemudian continue:
5. Kemudian pada method pilih enter, kemudian klik OK: 6. Output yang didapatkan adalah sebagai berikut: Output Case Processing Summary menghilangkan variabel yang tidak diperhitungkan dalam model.
Output classification table diatas menjelaskan bahwa persentase variabel yang diprediksi sebesar 88,9 persen adalah baik, dan dari perbandingan antara kedua nilai mengindikasikan tidak terdapatnya masalah homoskedastisitas (asumsi model logit). Pada output variables in equation signifikansi adalah 0,05 artinya model tidak signifikan dan dengan demikian terima H0. Pada output omnibus test menyatakan bahwa hasil uji chi-square goodness of fit lebih kecil dari 0,05, ini mengindikasikan bahwa model adalah signifikan. Hasil output pada Cox-Snell R2 dan Nagelkerke R memiliki analogi sama dengan nilai R- square pada regresi linier, menyakatan bahwa sebanyak 50,2 persen keragaman dapat dijelaskan oleh model, sedangkan sisanya diluar model.
Hasil pada output Hosmer and Lemeshow Goodness-of-Fit Test mengindikasikan bahwa kita dapat menerima H0 karena lebih dari 0,05 (1 > 0,05). output variables in the equation menunjukkan nilai signifikansi berdasarkan Wald Statistic, jika model signifikan, maka nilai sig. adalah kurang dari 0,05. Kolom Exp(B) menunjukkan nilai odds ratio yang dihasilkan. Nilai odds ratio yang hanya mendekati 1,0 mengindikasikan bahwa variabel independen tidak mempengaruhi variabel dependen. Output classplot diatas menunjukkan prediksi pada regresi logistik. Sumbu X menujukkan probabilitas yang diprediksi, sedangkan sumbu Y menunjukkan jumlah kasus yang diamati.
2.1.2 Fungsi Regresi Logistik membentuk persamaan atau fungsi dengan pendekatan maximum likelihood, yang memaksimalkan peluang pengklasifikasian objek yang diamati menjadi kategori yang sesuai kemudian mengubahnya menjadi koefisien regresi yang sederhana. 2. 2 Regresi Dengan Variable Dummy Pengertian Regresi Dengan Variable Dummy Variabel dummy adalah variabel yang digunakan untuk mengkuantitatifkan variabel yang bersifat kualitatif (misal: jenis kelamin, ras, agama, perubahan kebijakan pemerintah, perbedaan situasi dan lain-lain). 2.2.1 Fungsi Regresi Dengan Variable Dummy digunakan sebagai upaya untuk melihat bagaimana klasifikasiklasifikasi dalam sampel berpengaruh terhadap parameter pendugaan 2.2.2 Contoh Aplikasi Seorang Manager sebuah perusahaan industri mobil ingin mengetahui gaji karyawan berdasarkan masa kerja, jenis kelamin dan tingkat pendidikan karyawannya Diketahui data sampel gaji 30 karyawan adalah sebagai berikut 6.50 Y D X1 X2 10 1.00 2.00 6.50 10 1.00 2.00 6.25 10.00 2.00 6.25 10.00 2.00 5.50 7 1.00 2.00 5.50 7 1.00 2.00 6.00 10.00 2.00 5.25 8 1.00 2.00 4.50 5 1.00 2.00 5.00 10 1.00 1.00 5.25 7.00 2.00 4.25 5.00 2.00 5.50 7 1.00 2.00 4.00 8 1.00 1.00 4.00 8 1.00 1.00 3.75 8.00 1.00 6.00 12 1.00 1.00 5.00 10 1.00 1.00 3.75 8.00 1.00 3.75 7.00 1.00 4.75 10.00 1.00 4.00 9 1.00 1.00 4.00 8 1.00 1.00 5.00 10 1.00 1.00 6.00 12 1.00 1.00 5.75 12.00 1.00 4.00 8 1.00 1.00 4.75 9.00 1.00 6.00 8 1.00 2.00 4.75 11.00 1.00
2.2.3 Analisi Regresi Variable Dummy 1. Buatlah variable dan masusakan data SPSS 2. Lakukanlah analisi dengan cara klik Analyze > Regression > Linear>, Selanjutnya akan muncul dialog Linear Regression 3. Pindahkan variable Y ke dalam kolom Dependent dan pindahkan X1, X2, dan D ke kolom Independent
4. Klik Statistic, aktifkan Estimets, Model fit, Descriptives, Collinearity diagnostics, dan Durbin Watson. Klik Countinue 5. Klik Plots pindahkan variable *Zresid* ke dalam kolom Y dan pindahkan *Zresid* ke dalam kolom X. aktifkan Histogram dan Normal Probability Plots klik Countinue 6. Klik save pada Predictide values aktifkan unstandardized. Pada residual aktifkan unstandardized klik Countinue dan klik ok
2.2.4 Hasil data a) Tabel 1 b) Table 2 Dari table diatas diketahui bahwa variable yang dimasukkan adalah tingkat pendidikan, jenis kelamin, dan masa bekerja. menunjukkan bahwa kofisien atau R simultannya adalah 0,939. Kisaran nilai R adalah 0 hingga 1. Semakin nilai R mendekati angka 1, maka semakin kuat variabel-variabel bebas memprediksikan variabel terikat. Karena 0,939 mendekati angka 1, maka variabel-variabel bebas berupa tingkat pendidikan, jenis kelamin dan masa kerja dapat gaji pekerja dengan cukup kuat.
Sedangkan R Square adalah 0,881 yaitu hasil kuadrat dari koefisien korelasi (0,939 x 0,939 = 0,881). Koefisien determinasi R-Square = 0.881 (88,1%). Ini menunjukkan bahwa sebesar 88,1% variasi variabel dependent (Y) dapat dijelaskan oleh 3 variabel independent (X1, X2,dan D), artinya pengaruh variabel independen terhadap perubahan variabel dependen adalah 88,1%, sedangkan sisanya sebesar 11,9% dipengaruhi oleh variabel lain selain variabel independen X1,X2 dan D. Seperti halnya R Simultan, kisaran nilai adjusted R Square adalah 0 hingga 1. Dari tabel diatas diketahui bahwa nilai adjusted R Square adalah 0,867 tidak mendekati 1, sehingga ketetapan mencari jawaban berdasarkan sampel yang ada sangat tinggi. c) Table 3 Dari tabel diatas, diketahui bahwa df (degree of freedom) adalah derajat kebebasan dimana df regression (perlakuan) sebagai df pembilang dan df residual (sisa) sebagai df penyebut. Nilai df pembilang adalah 3 (jumlah variabel bebas), sedangkan df penyebut adalah 26. Disamping itu diketahui bahwa Fhitung adalah 64,167 diperoleh dari mean square untuk regression dibagi mean square untuk residual (6,953 : 0,108). Kemudian nilai Ftabel kita peroleh dengan melihat pada tabel untuk nilai dari F(0,05;6;23) adalah 2,53. Karena Fhitung > Ftabel, maka dapat disimpulkan bahwa variabel bebas (tingkat pendidikan, jenis kelamin dan masa kerja ) secara serentak mempengaruhi gaji pekerja atau dengan kata lain model regresi dapat digunakan untuk memprediksi gaji Pekerja. Selain itu, kita juga dapat menarik kesimpulan dengan membandingkan nilai Sig.hitung pada tabel diatas yaitu 0,001 dengan α = 0,05 dimana Sig.hitung < α, sehingga juga dapat ditarik kesimpulan yang sama bahwa variabel bebas (tingkat pendidikan, jenis kelamin dan masa kerja) secara serentak mempengaruhi gaji pekerja atau dengan kata lain model regresi dapat digunakan untuk memprediksi gaji Pekerja.
d) Table 4 disamping itu, kolom Sig. diatas juga menunjukkan nilai signifikansi hubungan antara setiap variabel bebas dngan variable terikat dimana jika Sig.hitung < α (α = 0,05), maka variabel bebas tersebut berpengaruh signifikan terhadap variabel terikat. Artinya: Masa Kerja Sig.hitung = 0.00 <α = 0,05, jadi Masa Kerja berpengaruh secara signifikan terhadap gaji karyawan. jenis Kelamin Regresi dengan Variabel Bebas Dummy Sig.hitung = 0,.460> α = 0.05, jadi Jenis kelamin tidak berpengaruh secara signifikan terhadap gaji karyawan. Tingkat Pendidikan Sig.hitung = 0,00 < α = 0,05, jadi Tingkat Pendidikan berpengaruh secara signifikan terhadap gaji karyawan. Karena tidak semua variable bebas pada regresi tersebut yang signifikan terhadap variabel terikat, maka model persamaan regresi tersebut menjadi: Ŷ = -1,014 + 0,093X1 + 1,603X2 + 0,428D
BAB III KESIMPULAN Dari hasil pembahasan diatas maka dapat ditarik beberapa kesimpulan, yaitu: a) Variabel dummy adalah variabel yang digunakan untuk mengkuantitatifkan variabel yang bersifat kualitatif (misal: jenis kelamin, ras, agama, perubahan kebijakan pemerintah, perbedaan situasi dan lain-lain) b) Variabel dummy hanya mempunyai 2 (dua) nilai yaitu 1 dan nilai 0, serta diberi simbol D. Dummy memiliki nilai 1 (D=1) untuk salah satu kategori dan nol (D=0) untuk kategori yang lain. c)
DAFTAR PUSTAKA http://www.slideshare.net/agecastaneda/model-regresi-dengan-variabel-bebas-dummy http://id.wikipedia.org/wiki/regresi_logistik