(R.2) KAJIAN PREDIKSI KLASIFIKASI OBYEK PADA VARIABEL RESPON BINER Drs. Soekardi Hadi P. Prodi Matematika Fakultas Sains dan Teknologi Universitas Islam As-Syafi iyah Email : s.hadip@yahoo.co.id Abstrak Dalam makalah ini dibahas prediksi klasifikasi obyek respon biner berdasarkan variabel bebas (prediktor) numerik. Namun dengan asumsi Normalitas Distribusi populasi data numerik tidak dipenuhi, dalam pembentukan model digunakan fungsi logistik P EXP( Z)/[1 EXP( Z)] dengan bentuk kurva signoid, dalam hal ini Z = 0 + 1x 1 + 2x 2 + 3x 3 +. Hasil penerapan pada prediksi status pekerjaan anggota BKMT didapat bentuk taksiran P fungsi logistik ln = 1 P 3,145 + 0,188pkprt - 0,625 pspnk - 0,295 pha kwnt atau p = exp (3,145 + 0,188 pkprt - 0,625 pspnk - 0,295 pha kwnt) Kata Kunci : klasifikasi obyek, prediksi, biner, numerik, normalitas, logistik. 1. PENDAHULUAN Dalam mempelajari masalah klasifikasi obyek atau keanggotaan kelompok dari individu anggota BKMT sebagai variabel respon (X) yang mencerminkan pilihan dua alternatif, status pekerjaan, menjadi wanita karir dengan probabilitas P dan diasumsikan berharga 1, lainnya bukan wanita karir (ibu rumah tangga) dengan probabilitas = 1 P dan diasumsikan berharga 0. Berdasarkan variabel bebas (X) campuran antara kategori dan numerik atau semua numerik namun asumsi kenormalan distribusi populasi tidak dapat dipenuhi, melalui pendeteksian menggunakan uji Kolmogorov Smirnov. Hubungan antara Z sebagai kumpulan fungsi linier variabel predikfor atau bebas berbentuk : Z = 0 + 1X 1 + 2X 2 + 3X 3 + (1 ) Dalam hal ini : X 1 = Perilaku terhadap pekerjaan rumah tangga X 2 = Perilaku terhadap status pernikahan X 3 = Pandangan terhadap hak wanita (gender) i = Parameter populasi, i = 1, 2, 3 = Faktor galat dalam model regresi linier ganda. 104
Dengan Y tidak linier dan seringkali dijumpai fungsi respon berbentuk signoid, salah satu pendekatan untuk memprediksi model ini adalah fungsi logistik biner (logit) berganda. exp Z P ( 2 ) 1 exp( Z ) Dimana Z variabel prediktor dan penulisan exp Z (experimen Z) merupakan cara penulisan e Z, dan e bilangan pokok logaritma natural (dasar) disingkat ln, yang nilainya 2,71827. Oleh karena itu fungsi logistik (1) di atas dapat ditulis dengan alternatif sebagai berikut : Z e exp Z ( 3 ) Z 1 e 1 exp Z Sedangkan P merupakan probabilitas ibu-ibu anggota BKMT memilih status pekerjaan wanita karir, besarannya antara 0 dan 1. Untuk probabilitas ibu-ibu BKMT yang memilih status pekerjaan bukan wanita karir (rumah tangga) dinyatakan dengan fungsi : expz 1 1 ( 4 ) 1exp( Z) 2. METODE PENAKSIRAN FUNGSI LOGISTIK Fungsi logistik ditaksir dengan metode kemungkinan maksimum (Maximum Likelihood Estimator = MLE). Setelah fungsi logistik dilinierkan dengan menggunakan transformasi perbandingan antara dan (1 - ) atau odd diperoleh : dan 1 = e Z ( 5 ) Selanjutnya, bila kedua ruas kiri dan kanan di lon kan (ln), didapat persamaan : L = ln = Z ( 6 ) 1 dimana berbentuk fungsi Z seperti tertulis pada persamaan (1), maka diperoleh bentuk linier. L = 0 + 1X 1 + 2X 2 + 3X 3 + ( 7 ) Untuk menentukan taksiran i, i = 0, 1, 2, 3. 105
Karena Y berharga 0 atau 1, maka Y berdistribusi Bernaulli dan fungsi densitas dari Y dapat ditulis sebagai berikut : y 1 y (1 ) ( 8 ) f ( y) [ ] Dengan demikian bentuk fungsi Likelihoodnya : L y 1y ( ) (1 ) ( 9 ) Prinsip maksimum Likelihood pada intinya mencari kumpulan parameter i, i = 1,2,3,4 yang dapat memaksimumkan fungsi Likelihood, maka secara matematis ditulis ln L () = y i ln + (1 y) ln (1 ). Selanjutnya dengan persyaratan optimasi 0, 1, 2, 3, yang optimal akan diperoleh bila persyaratan FONC (First Order Necessary Condition) berikut dipenuhi : n L FONC = 0, i = 1, 2, 3, 4 (10) i Bila persamaan (10) diselesaikan maka diperoleh taksiran i sama dengan dan biasa ditulis b i, i = 0, 1,, 4. dan taksiran ditulis P, maka diperoleh taksiran model logistik yang dilinierkan dalam ln : ln 1 p p = b 0 + b 1X 1 + b 2X 2 + b 3X 3 (11) atau p exp Z (12) 1 exp( Z ) untuk : Z = b 0 + b 1X 1 + b 2X 2 + b 3X 3 (13) Sebagai taksiran model regresi linier ganda dalam bentuk ln odd rasio P dengan (1 P) dan fungsi logistik pada persamaan (2). 3. PENGUJIAN HIPOTESIS Untuk memberlakukan model regresi logistik biner yang diperoleh atas dasar data sampel terhadap keseluruhan tatanan populasi obyek, perlu dilakukan pengujian hipotesis tentang pengaruh variabel bebas (X) terhadap proporsi fenomena variabel respons, dengan mengguntakan statistik uji Wald. 106
W = b i E(b i ) 2 Statistik ini berdistribusi khi kuadrat (chi-square) dengan Ho ditolak bila W 2 1 P dan diterima bila G 2 ( 1 P). Dengan derajat kebebasan secara simbolik ditulis : W 2 2 (1) dan kriteria pengujian Ho ditolak bila W i 2 tabel serta diterima bila W < 2 tabel. Untuk uji keabsahan model logistik digunakan statistik uji : Likelihood G = -2 ln Likelihood model A model B (14) Dalam hal ini model : G 2 (P) A = hanya terdiri konstanta saja B = terdiri atas seluruh variabel Ho ditolak bila G 2 tabel serta diterima bila G < 2 tabel. 4. APLIKASI DAN PEMBAHASAN Penerapan Pembentukan klasifikasi status pekerjaan wanita dengan menggunakan pendekatan Fungsi Logistik Biner, dilakukan terhadap 3 Responden ibu ibu anggota Badan Kontak Majelis Ta lim (BKMT) di Kota Bekasi. Berdasarkan hasil olahan data dengan SPSS versi 15.00 didapat informasi prediksi klasifikasi pilihan status pekerjaan Wanita Karir dan bukan yang disajikan dalam Tabel 1 berikut ini : Tabel.1 Klasifikasi data Observasi dan prediksi Status Pekerjaan Prediksi Langkah Observasi Status Pekerjaan Peeswntase keseluruhan Prediksi Bukan Wanita Wanita Karir Karir Persentase Wanita Karir 90 60 60.0 Bukan Wanit Karir 80 70 46.7 53.3 Dari Tabel 1, terlihat bahwa taksiran (Prediksi) ibu ibu BKMT yang masuk katagori wanita karir 150, sedangkan hasil observasi hanya 90, dengan demikian ketepatan klasifikasi 60,0 % dan prediksi yang bukan wanita karir 70, sedangkan hasil 107
observasi 130, jadi ketepatan klasifikasi 70,0 %, secara keseluruhan kecepatan klasifikasi sebesar 752,2 %. Untuk menyelidiki ketepatan model, dapat diperhatikan Tabel 2 berikut ini : Tabel.2 Hasil Uji Kecocokan (FIT) Model Data STATISTK UJI FIT MODEL Yang Dihipotesiskan (-2log L) Data Empirik (Hosmer & Lemeshow^s Khi Kuadrat (Chi Square) Hitung Tabel Kriteria uji Ho 41,325 124,342 Diterima 8,512 9,4877 Diterima Berdasarkan tabel 2 di atas didapat nilai -2 log L = 41,325 lebih kecil dari nilai χ sehingga H ditolak, hal ini menunjukan bahwa yang dihipotesiskan cocok atau sesuai dengann data. Sementara nilai uji Hosmer dan Lemeshouis juga lebih kecil dari χ, maka H diterima dan dinyatakan bahwa data empires hasil penelitian sesuai dengan model. Taksiran Fungsi Regresi Logistik dapat dilihat dalam tabel 3 berikut ini : Tabel.3 Koefisien Persamaan untuk tiap Variabel Bebas dan Konstanta Step 1 pkprt(1) pspnk(1) phakwnt(1 Konstanta B S.E. Wald df Sig. Exp(B).188.042 2305.314 1.00.024 -.625.057 1439.452 1.00.141 -;295.049 1759.045 1.00,211 3.145.042 5928.704 1.00 6.290 Dari Tabel 3 tersebut tersebut didapat bentuk taksiran Fungsi Logistik Statyistik Pekerjaan sebagai berikut : L ( ) = 3,145 + 0,188 pkprt - 0,625 pspnk atau - 0,295 phakwnt. p = exp [ ] Dan terlihat juga nilai wald untuk semua koefpers Fungsi Logistik lebih besar dari χ = 3,841, hal ini berarti masing - masing variabel bebas berpengaruh nyata dalam pembetukan Fungsi Logistik. Selanjutnya dengan nilaia eksprimen (β) untukl variabelpandangan tugas ibu - ibu rumah tangga sbesar 0,024. Hal ini menunjukkan bahwa kelompok ibu - BKMT yang 108
berpandangan positif 0,024kali lebih rendah dari yang ne4gatif untuk menjadi wanita karir. 5. SIMPULAN Berdasarkan hasil pembahasan dan kategori teoritis dapat disimpulkan, bahwa Model Regresi Logistik Biner dapat digunakan lebih fleksibel dibandig teknik yang lain yang dapat merancang prediksi model klasisifikasi obyek, karna tidak memiliki Normalitas atau variabel bebas digunakan dalam pembentukan model. Kemudian interprestasi model tidak dapat langsung dari melihat nilai koefisien persamaan yang diperoleh dalam hasil keluaran (output) SPSS, melain kan di transformasi dulu kedalam bentuk exponent, dengan demikian bentuk persamaan yang diperoleh dinyatakan dalam bentuk p = exp [ ] 6. DAFTAR PUSTAKA Freund, JE. (2000). Mathematical Statistics, Mexico, Prentice-Hall International. Hosmer, DW & Stanley, W. (1999). Applied Logistic Regression, New York, John Wiley & Sons. Prabowo, Hadi, S. (2008). Alternatif Penerapan Model Diskriminan dan Logistik, Prosiding. Seminar Nasional Matematika, UNPAD, Jatinangor, 205-212. Rusdin, (2004). Statistik Penelitian Sebab Akibat, Bandung, Pustaka Bani Quraisy. Sartono, B. & Anang, K. (2007). Penerapan Generalized Additive Model dalam Penyusunan Model Skoring, Prosiding. Seminar Nasional Statistika, UNISBA, Bandung, Mei, 97-102. 109