Others Institution Credit Job Code

dokumen-dokumen yang mirip
KAJIAN PERBANDINGAN MODEL CREDIT SCORING TERHADAP DATA NUMERIK DAN DATA KATEGORIK MENGGUNAKAN REGRESI LOGISTIK PERA TINFIKA MUTIARA

HASIL DAN PEMBAHASAN. (a) (b) (c)

HASIL. yang berlebihan. kotak garis (box-plot) yaitu, Bersubsidi. untuk KPR Bersubsidi. 2. Membangun. analisis. keseluruhan

BAB II TINJAUAN PUSTAKA. penulisan skripsi. Teori penunjang tersebut adalah: Regresi logistik, analisis survival,

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

DISKRETISASI PEUBAH CREDIT SCORING MODEL MENGGUNAKAN METODE ENTROPI DAN KHI KUADRAT BAYU ALFIANSYAH

Jurnal Gradien Vol 8 No 2 Juli 2012: Yuli Andriani, Uxti Mezulianti, dan Herlina Hanum

PEMBAHASAN. 5.1 Karakteristik Responden Berdasarkan Tingkat Pengembalian Kredit. Karakteristik responden baik yang lancar maupun yang menunggak dalam

PENERAPAN ANALISIS REGRESI LOGISTIK PADA PEMAKAIAN ALAT KONTRASEPSI WANITA

HASIL DAN PEMBAHASAN. penelitian ini adalah MS.Excell 2003, Answertree 2.01 dan SPSS for Windows versi Tabel 1. Karakteristik debitur

III. METODE PENELITIAN

VI. FAKTOR-FAKTOR YANG MEMPENGARUHI PERSEPSI DAN SIKAP RESPONDEN TERHADAP PRODUK OREO SETELAH ADANYA ISU MELAMIN

BAB II TINJAUAN PUSTAKA

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

BAB III METODE PENELITIAN. Penelitian ini menggunakan pendekatan kuantitatif untuk menjawab

BAB IV HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN. perekonomiannya dan untuk meningkatkan taraf kehidupannya. Salah satu lembaga

BAB III METODE PENELITIAN

PERBANDINGAN METODE DISKRETISASI DALAM MODEL REGRESI LOGISTIK (Studi Kasus: Pembentukan Model Penskoran Kredit Bank X) DIAN ILMIATI ARDITA

BAB III METODE PENELITIAN. menyebabkan, kebutuhan pangan tidak hanya sebatas produk pelengkap dengan

BAB 4 ANALISIS DAN PEMBAHASAN

ANALISIS REGRESI LOGISTIK ORDINAL PADA FAKTOR-FAKTOR BERPENGARUH TERHADAP PENYAKIT MATA KATARAK BAGI PASIEN PENDERITA DI KLINIK MATA UTAMA GRESIK

FAKTOR-FAKTOR YANG MEMPENGARUHI PENGAMBILAN KEPUTUSAN PETANI TERHADAP PENGGUNAAN BENIH PADI DI KECAMATAN NISAM KABUPATEN ACEH UTARA

METODE PENELITIAN IV.

di masa yang akan datang dilihat dari aspek demografi dan kepuasannya. PENDAHULUAN

BAHAN DAN METODE HASIL DAN PEMBAHASAN

VI. FAKTOR-FAKTOR YANG MEMPENGARUHI PENGEMBALIAN KREDIT USAHA RAKYAT MIKRO

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

METODE PENELITIAN. Penelitian ini dilakukan di Bank Jabar Banten KCP Dramaga dan juga

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

II. METODE PENELITIAN

BAB IV ANALISIS DATA DAN PEMBAHASAN. mahasiswa. Setiap responden mempunyai karakteristik yang berbeda. Oleh

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

BAB III METODOLOGI PENELITIAN. kriteria yang sudah ditetapkan atau bisa disebut representatif.

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB III METODE PENELITIAN

BAB II TINJAUAN PUSTAKA

Oleh : Mochammad Taufan ( ) DOSEN PEMBIMBING: Prof. Drs. Nur Iriawan, M.Ikom,Ph.D

BAB 3 METODE PENELITIAN

IV. METODOLOGI PENELITIAN. wisata tirta. Lokasi penelitian ini dapat dilihat pada Lampiran 1.

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

III. METODOLOGI PENELITIAN. penelitian ini, penulis menggunakan dua sumber data, yaitu :

BAB III METODOLOGI PENELITIAN

HASIL DAN PEMBAHASAN

MAKALAH REGRESI LOGISTIK DAN REGRESI DENGAN VARIABLE DUMMY

BAB III METODE PENELITIAN. perusahaan yang terdaftar di Bursa Efek Indonesia (BEI) Periode 2010-

III. METODE PENELITIAN. Penelitian ini merupakan kajian mengenai Faktor-Faktor Yang Mempengaruhi

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III PEMBAHASAN. extended untuk mengatasi nonproportional hazard dan penerapannya pada kasus

BAB III DESAIN DAN METODE PENELITIAN. Penelitian ini merupakan penelitian kausalitas, yaitu penelitian yang

METODE PENELITIAN Definisi dan Pengukuran Variabel Definisi dan pengukuran variabel penelitian ini disajikan pada Tabel 3.1.

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

ANALISIS STATUS KREDIT MIKRO DENGAN REGRESI LOGISTIK TJIPTO AJI SUDARSO

Model Regresi Binary Logit (Aplikasi Model dengan Program SPSS)

IV METODE PENELITIAN. 4.1 Lokasi dan Waktu Penelitian

BAB IV HASIL DAN PEMBAHASAN. sehingga analisis deskriptif dipisahkan dari variabel lain. Tabel 4.1. Statistik Deskriptif

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

V. FAKTOR PENENTU KETAHANAN PANGAN RUMAH TANGGA DI PROVINSI NUSA TENGGARA TIMUR

BAB III METODOLOGI PENELITIAN DAN DATA

IV. METODE PENELITIAN

RMSE = dimana : y = nilai observasi ke-i V PEMBAHASAN. = Jenis kelamin responden (GENDER) X. = Pendidikan responden (EDU) X

IV. METODE PENELITIAN. Penelitian ini dilakukan di Desa Purwasari, Kecamatan Dramaga

Pengaruh brand image IM3terhadap keputusan pembelian simcard Gambar 7. Kerangka pemikiran

IV. METODE PENELITIAN. Kawasan ini dipilih secara sengaja (purposive) dengan pertimbangan bahwa

HASIL DAN PEMBAHASAN Deskripsi Karakteristik Responden Berdasarkan Peubah Penjelas

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB III METODE PENELITIAN. diperlukan dalam penelitian ini, maka penulis mengadakan penelitian

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL ANALISIS DAN PEMBAHASAN. penelitian ini, yang dapat dilihat pada tabel berikut ini: Tabel 4.1. Statistik Deskriptif GC

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB IV. HASIL dan PEMBAHASAN

BAB III METODE PENELITIAN

ANALISIS REGRESI LOGISTIK UNTUK MENGETAHUI FAKTOR FAKTOR YANG MEMPENGARUHI FREKUENSI KEDATANGAN PELANGGAN DI PUSAT PERBELANJAAN X

BAB III METODE PENELITIAN

HASIL DAN PEMBAHASAN. Analisis data menggunakan software SPSS 11.5 for windows, Microsoft Excel, dan SAS 9.1. Profil Responden

BAB III OBYEK DAN METODE PENELITIAN. Sesuai dengan judul penelitian ini yaitu Pengaruh Likuiditas dan Cost

perembesan zat pencemar dari limbah yang berasal dari aktivitas domestik.

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam penelitian ini adalah penelitian

BAB IV HASIL DAN PEMBAHASAN

BAB III. berubahnya suatu variabel lain (variabel dependen). Variabel independen. dalam penelitian ini yaitu: Struktur Kepemilikan Manajerial (X 1 ),

STK511 Analisis Statistika. Pertemuan 10 Analisis Korelasi & Regresi (1)

BAB III METODOLOGI PENELITIAN

BAB IV ANALISIA HASIL DAN PEMBAHASAN

KLASIFIKASI DAN KAJIAN PERFORMA NASABAH USAHA EKONOMI DESA SIMPAN PINJAM (UED-SP) DESA PISANG BEREBUS ABRAR SETIAWAN

BAB 3 METODOLOGI PENELITIAN

BAB IV HASIL PENGUJIAN. Pada penelitian ini, peneliti menggunakan sampel perusahaan manufaktur

BAB III METODOLOGI PENELITIAN. memilih sampel seluruh perusahaan di BEI periode adalah karena

ABSTRAK METODE REGRESI LOGISTIK UNTUK MENGANALISIS FAKTOR RISIKO PENYAKIT JANTUNG KORONER

IV. METODE PENELITIAN. Provinsi Jawa Barat. Lokasi ini dipilih secara sengaja (purposive) dengan

BAB 2 LANDASAN TEORI

BAB II KAJIAN TEORI. Analisis survival atau analisis ketahanan hidup adalah metode yang

BAB IV HASIL PENELITIAN DAN PEMBAHASAN Data dan Sampel Data yang digunakan dalam penelitian ini merupakan data sekunder yang

BAB III OBJEK DAN DESAIN PENELITIAN. Objek dari penelitian dalam skripsi ini adalah seluruh perusahaan go public yang

BAB IV HASIL DAN PEMBAHASAN

METODOLOGI PENELITIAN

Transkripsi:

4. Residence status (status kepemilikan rumah) yang dinotasikan dengan RS. Peubah ini dibagi menjadi enam kelompok. 5. Job code (kode pekerjaan) yang dinotasikan dengan JC. Peubah ini dibagi menjadi lima kelompok. Pada setiap peubah penjelas dibagi mejadi beberapa kategori dan pada masingmasing kategori dihitung nilai -nya. Nilai yang dihasilkan dan tercantum pada Tabel 1 merupakan perbandingan proporsi kategori tertentu pada masing-masing peubah penjelas untuk status baik atau buruknya calon penerima kredit. Semakin besar nilai pada suatu kategori berarti kategori tersebut cenderung untuk baik, atau dengan kata lain para calon penerima kredit pada kategori tersebut cenderung memiliki peluang lebih besar untuk mendapatkan pinjaman. Tabel 1. sasi data berdasarkan Debt Salary Ratio (%) 0.00-16.27-0.1740 16.27-17.00 0.8944 17.00-17.99-1.0365 17.99-19.69-0.0456 19.69-20.41 1.9240 20.41-38.01 0.3204 38.01-38.91-0.8640 38.91 - inf -0.0362 Gross Annual Income (juta rupiah) 0.0 53.4-0.0682 53.4 57.6-1.1005 57.6 63.0 1.0429 63.0 72.3-0.1496 72.3 98.9 2.0323 98.9 139.7 0.0270 139.7 inf 6.4396 Number Of Dependants (jiwa) 1-0.1874 2-0.0419 4 0.0569 0,3 0.1355 5 0.4107 Residence Status Rented -0.3583 Parents -0.1376 Own 0.1444 Others 0.2658 Institution 0.4481 Credit 0.5087 Job Code Notaris, peg yayasan -1.3393 Pegawai swasta -0.1135 Guru/Dosen, peg.bumn/bumd 0.4602 Pegawai Negri Sipil 0.9379 Others 2.0969 Metode Langkah langkah metode penelitian sebagaimana tertera pada Gambar 2 adalah sebagai berikut : 1. Memanfaatkan data asli dan data hasil diskretisasi Alfiansyah (2007). 2. Menduga model menggunakan metode regresi logistik dengan peubah penjelasnya adalah nilai asli yang kemudian disebut sebagai Model-1. 3. Menduga model dengan menggunakan metode regresi logistik dengan nilai peubah penjelasnya adalah nilai hasil diskretisasi (nilai ) yang kemudian disebut sebagai Model-2. 4. Membandingkan performa dari kedua model yang dihasilkan pada tahap (2) dan (3) dengan melihat signifikansi koefisien regresi, correct classification table, dan kurva ROC. Software yang digunakan adalah SAS 9.1, SPSS 11.5, dan Microsoft Office Excel 2007. Data asli Menduga Model -I Membandingkan performa model - Koefisien regresi - Correct Classification Table - Kurva ROC Gambar 2 Flowchart Metode HASIL DAN PEMBAHASAN Deskripsi Nasabah Data terdiskretisasi Menduga Model -2

Jumlah nasabah yang menjadi contoh dalam penelitian ini sebanyak 1000 orang. Untuk melihat apakah orang tersebut bisa mendapatkan pinjaman dari bank atau tidak, maka harus dilihat apakah orang tersebut berpeluag untuk mengalami kredit macet atau tidak. Dilihat dari kategori pertama yakni DSR (Rasio Utang dan Pendapatan) semakin besar DSR menunjukkan bahwa nasabah tersebut semakin berpeluang untuk macet dalam pembayaran kredit karena alokasi pendapatan berkurang untuk membayar kredit dengan asumsi pengeluaran sama. Setelah dilakukan analisis terhadap 1000 orang nasabah tersebut dapat diketahui dari Tabel 2 bahwa sebagian besar nasabah berada pada selang rasio (17.00-17.99)% dan (20.41-38.01)%. Nasabah dengan rasio terkecil berada pada selang (0.00-16.27)% sebanyak 43 orang. Sedangkan nasabah dengan rasio tertinggi memiliki rasio lebih dari 38.91% sebanyak 37 orang. Tabel 2 Jumlah Nasabah pada kategori Debt Salary Ratio (DSR) DSR (%) Jumlah % 0.00-16.27 43 4.3 16.27-17.00 41 4.1 17.00-17.99 272 27.2 17.99-19.69 100 10 19.69-20.41 83 8.3 20.41-38.01 396 39.6 38.01-38.91 28 2.8 38.91 - inf 37 3.7 Untuk kategori pendapatan tahunan kotor atau GAI, sebagian besar nasabah memiliki pendapatan yang berkisar pada selang 57.6 sampai 63 juta rupiah dengan persentase 81.8%. Nasabah dengan pendapatan tahunan kotor paling rendah memiliki pendapatan sebesar 0.0 sampai 53.4 juta rupiah dengan persentase 27% dan nasabah dengan pendapatan paling tinggi memiliki pendapatan lebih dari 139.7 juta rupiah dengan persentase 32%, bahkan ada nasabah yang mencapai pendapatan tahunan kotor paling tinggi yakni sebesar 1.2 Milyar. Tabel 3 Jumlah Nasabah pada kategori Pendapatan Tahunan Kotor GAI (juta rupiah) Jumlah % 0.0 53.4 27 2.7 53.4 57.6 27 2.7 57.6 63.0 818 81.8 63.0 72.3 25 2.5 72.3 98.9 31 3.1 98.9 139.7 40 4 139.7 inf 32 3.2 Pada Tabel 4 dapat diketahui nahwa nasabah yang tidak memiliki tanggungan sebanyak 311 orang atau 31.1%, selanjutnya nasabah dengan tanggungan 1, 2, 3, 4 dan 5 berturut-turut sebesar 25.1%, 27.2%, 12.3%, 3.2%, dan 0.7%. Sedangkan nasabah yang memiliki tanggungan lebih dari 5 orang sebesar 0.4%. Tabel 4 Jumlah Nasabah pada kategori Jumlah Tanggungan NOD (jiwa) Jumlah % 0 311 31.1 1 251 25.1 2 272 27.2 3 123 12.3 4 32 3.2 5 11 1.1 Untuk kategori status rumah atau RS pada Tabel 5 dapat diketahui bahwa sebagian besar nasabah tinggal di rumah milik sendiri sebesar 43.7% dan sebesar 47.1% tinggal di rumah milik orang tua. Selainnya tinggal di rumah yang berstatus sewa sebesar 3.2%, di rumah yang bestatus kredit sebesar 1.9%, di rumah milik institusi sebesar 1.8% dan dengan status rumah lainnya sebesar 2.3%. Tabel 5 Jumlah Nasabah pada Status Rumah Hunian RS Jumlah % Rented 32 3.2 Parents 471 47.1 Own 437 43.7 Others 23 2.3 Institution 18 1.8 Credit 19 1.9 terakhir pada Tabel 6 adalah kode pekerjaan atau JC. Mayoritas nasabah

memiliki pekerjaan sebagai pegawai swasta sebesar 79% dan sebagian yang lain adalah pegawai BUMN/BUMD, Pegawai Negeri Sipil, Guru/Dosen, Pejabat Negara dll. Tabel 6 Jumlah Nasabah pada kategori Kode Pekerjaan JC Jumlah % Notaris 2 0.2 Pegawai Yayasan 5 0.5 Pegawai Swasta 790 79 Guru/Dosen 8 0.8 Pegawai BUMN/BUMD 137 13.7 Pegawai Negeri Sipil 29 2.9 Pejabat Negara 7 0.7 Profesional 2 0.2 Wiraswasta 7 0.7 Akuntan 2 0.2 Dokter 6 0.6 Employee 3 0.3 Paramedis 2 0.2 Peubah Y (kolektibilitas nasabah) sebagai peubah respon merupakan peubah biner karena memiliki dua nilai yakni baik yang dinotasikan oleh angka 1 dan buruk yang dinotasikan oleh angka 0. Pada Gambar 3 dapat dilihat nasabah yang memiliki kategori baik sebanyak 833 orang atau 83.3%, nasabah dengan kategori buruk sebanyak 163 orang atau 16.3%, dan data nasabah yang hilang sebanyak 4 orang atau 0.4%. Jumlah Kolektibilitas Nasabah 163 4 833 Baik Buruk Nilai Hilang Gambar 3 Grafik Jumlah Kolektibilitas Nasabah Analisis Regresi Logistik Analisis regresi logistik menggunakan peubah penjelasnya, yang dapat berupa peubah kategorik ataupun peubah numerik, untuk menduga besarnya peluang kejadian tertentu dari kategori peubah respon. Dalam hal ini, analisis regresi logistik menggunakan peubah penjelas (DSR, GAI, NOD, RS dan JC) untuk menduga besarnya peluang kejadian nasabah yang mengalami kredit macet atau masuk dalam kategori buruk. Pemodelan peluang kejadian peubah penjelas dari kategori peubah respon dilakukan melalui transformasi logit. Hubungan yang dibangun antara logit dengan parameternya adalah hubungan linier. Berdasarkan Lampiran 1 hubungan antara peubah penjelas dengan logitnya banyak yang tidak linier. Misalnya, hubungan DSR dengan logit membentuk pola kuadratik. Hubungan antara GAI dengan logit membentuk gerombol dan terdapat data ekstrem. Hubungan antara NOD dengan logit membentuk pola kubik. Untuk RS dan JC tidak bisa dihitung nilai logitnya karena RS dan JC merupakan peubah kategorik sementara model regresi mensyaratkan peubah penjelasnya dalam bentuk numerik. Berdasarkan Tabel 7 pendugaan parameter pada Model-1 menghasilkan nilai Statistik-G sebesar 30.012 dengan nilai p = 0.000. Model penuh dapat diterima secara statistik karena nilai p lebih kecil dari taraf nyata α = 0.05. Berarti model yang dibangun layak atau minimal ada satu βi yang tidak sama dengan nol. Sedangkan pendugaan parameter pada Model-2 menghasilkan nilai Statistik-G sebesar 74.461 dengan nilai p = 0.000. Model penuh dapat diterima secara statistik karena nilai p lebih kecil dari taraf nyata α = 0.05. Berarti model yang dibangun layak atau minimal ada satu βi yang tidak sama dengan nol. Dari tabel 7 juga bisa dilihat bahwa nilai statistik-g pada Model-2 lebih besar daripada Model-1, hal ini menunjukkan bahwa kuasa uji dari Model-2 lebih besar atau dengan kata lain pengaruh dari peubah penjelas (DSR, GAI, NOD, RS dan JC) lebih terdeteksi pada Model-2 daripada Model-1. Statistik uji-g digunakan untuk mengetahui peran seluruh peubah penjelas dalam model secara bersama-sama. Sehingga terujinya signifikansi kedua model menandakan bahwa seluruh peubah penjelas berpengaruh terhadap kelancaran kredit nasabah yang akan menentukan status nasabah pada dua kategori baik atau buruk. Akan tetapi keberpengaruhan peubah penjelas pada Model-2 lebih besar jika dilihat berdasarkan statistik uji-g. Tabel 7 Nilai statistik-g, nilai-p dan nilai loglikelihood pada Model-1 dan

Model-2 Model-1 Model-2 Statistik-G 30.012 74.461 Nilai-p 0.000 0.000 Log-Likelihood - 426.902-406.668 Selain statistik uji-g, uji Wald digunakan untuk menguji parameter secara parsial. Dari model logistik yang terlihat pada Tabel 8, pada Model-1 peubah DSR, NOD, dan RS menghasilkan nilai-p yang lebih besar dari α = 0.05. Hal ini menunjukkan bahwa peubah-peubah tersebut tidak berpengaruh nyata secara statistik, sedangkan peubahpeubah yang signifikan berpengaruh nyata pada taraf α = 0.05 adalah peubah GAI dan JC. Sedangkan untuk Model-2 peubah NOD dan RS menghasilkan nilai-p yang lebih besar dari α = 0.05. Hal ini menunjukkan bahwa peubahpeubah tersebut tidak berpengaruh nyata secara statistik, sedangkan peubah-peubah yang signifikan berpengaruh nyata pada taraf α = 0.05 adalah peubah DSR, GAI, dan JC. Tabel 8 P-Value dari uji Wald pada Model-1 dan Model-2 Peubah Model-1 Model-2 DSR 0.167 0.000 GAI 0.011 0.001 NOD 0.058 0.176 RS 0.265 0.121 JC 0.015 0.003 Untuk mengukur sejauh mana validitas pengujian parameter maka dapat dilakukan pengujian korelasi antar peubah, hal ini berguna dan menjadi salah satu indikator apakah antar peubah saling bebas atau tidak atau dengan kata lain telah terjadi multikolinearitas dalam model atau tidak. GAI -0.160 NOD 0.015 (0.637) RS 0.052 (0.100) 0.241 0.136 0.388 JC 0.000 (0.988) 0.242 0.257 0.162 Keterangan : Nilai di dalam tanda kurung menunjukkan nilai-p Dari Tabel 9 dapat dilihat bahwa antar peubah NOD dengan RS ada korelasi. Akan tetapi hal ini tidak dapat dijadikan pegangan bahwa telah terjadi masalah dalam model sehingga pada Tabel 8 peubah NOD dan RS dari Model-2 tidak nyata. Kemudian dilakukan simulasi lagi dengan membuang peubah RS, akan tetapi hasilnya peubah NOD tetap saja tidak menjadi nyata. Hal ini diduga cukup untuk menyatakan bahwa tidak ada masalah dalam model sehingga hasil pengujian parameter dinyatakan valid. Besarnya nilai-nilai koefisien regresi (B), SE dan Rasio Odds dari Model-1 dan Model-2 disajikan berturut-turut pada Lampiran 2 dan Lampiran 3. Pembandingan Model Penilaian kebaikan model dalam mengepas data yang digunakan diperlukan untuk memastikan bahwa prediksi yang diperoleh dari model memiliki tingkat ketepatan yang tinggi. Menurut (Hosmer & Lemeshow 1989), model dengan peubah yang signifikan berdasarkan hasil pengujian belum tentu akan memberikan tingkat ketepatan yang tinggi. Sehingga digunakan teknik sederhana untuk menentukan tingkat kebaikan pendugaan dari model, salah satunya adalah tabel klasifikasi. Tabel 9 Korelasi Antar Peubah Penjelas DSR GAI NOD RS Tabel 10 Klasifikasi metode regresi logistik antara Model-1 dan Model-2 Amatan Dugaan Total (%) Tepat Ya Tidak Model-1 Ya 115 47 162 71.0 Tidak 462 370 832 44.5 Total 577 417 994 48.8 Model-2 Ya 114 48 163 70.4 Tidak 348 484 833 58.2 Total 462 532 994 60.2 Tabel ini merupakan tabel frekuensi dua kategori prediksinya. Model yang diinginkan arah antara nilai kategori aktual data dengan dari pengujian ini adalah model yang

memiliki rata-rata prediksi benar yang sangat tinggi. Karena dalam penelitian ini ada dua model, dimana Model-1 disusun dari data asli dan Model-2 dari data hasil diskretisasi maka model dengan rata-rata prediksi benar yang lebih tinggi adalah model yang lebih baik. Tabel 10 menunjukkan bahwa dengan menggunakan nilai cutoff sebesar 0.84 maka berdasarkan metode regresi logistik pada Model-1 diperoleh nilai sensitivity sebesar 71.0% dan nilai specificity sebesar 44.5% dengan nilai kesalahan positif dan kesalahan negatif masing-masing sebesar 80.1% dan 11.3%. Sedangkan nilai total correct classification adalah sebesar 48.8%. Untuk metode regresi logistik pada Model-2, nilai sensitivity dan specificity masing-masing sebesar 70.6% dan 58.1% dengan nilai total correct classification sebesar 60.1%, sedangkan nilai kesalahan positif sebesar 75.2% dan nilai kesalahan negatifnya sebesar 9.0%. Nilai total misclassification rate untuk Model-1 sebesar 51.2% sedangkan untuk Model-2 sebesar 39.9%. Selain Tabel Klasifikasi, teknik lain yang digunakan adalah kurva ROC. Kurva ROC merupakan teknik pengembangan dari tabel klasifikasi. Kurva ROC untuk pengkelasan yang sempurna akan memiliki satu titik di sudut kiri atas (0,1). Oleh karena itu, wilayah di bawah kurva ROC (c statistic) sering digunakan untuk mengevaluasi penampilan dari model prediksi untuk keseluruhan cutoff. Penggunaan c statistic yang diturunkan dari ROC curve sangat membantu kesulitan yang terjadi dalam penggunaan tabel klasifikasi dan memperjelas pengambilan kesimpulan terhadap kebaikan model. Gambar 4. Kurva ROC Model 1 Gambar 5. Kurva ROC Model 2 Sebagaimana terlihat pada Gambar 4 dan 5, Model-2 lebih baik dari Model-1 karena kurva ROC pada Model-2 memiliki luas daerah di bawah kurva yang lebih besar dari Model-1 dilihat dari estimated area (c) pada Model-2 sebesar 0.703 sedangkan Model-1 sebesar 0.617. Setelah dianalisis melalui beberapa teknik yang ada maka dapat disimpulkan bahwa Model-2 lebih baik dari Model-1. Hal ini terjadi karena bentuk hubungan yang tidak linear antara peubah penjelas dengan logit. Sebagai contoh adalah plot antara NOD dengan logit pada Lampiran 1. Hubungan ini terkesan dipaksakan linier padahal hubungan yang sebenarnya tidak linier. Akibatnya performa Model-1 menjadi lebih buruk dari pada Model-2. Adapun Model-2 nampak lebih baik (hubungannya linier) karena data yang digunakan pada model ini adalah data hasil diskretisasi. KESIMPULAN Perbandingan dua model yang dibentuk dari data yang berbeda, dimana Model-1 dibentuk dari data asli dan Model-2 dari data hasil diskretisasi, menghasilkan keluaran yang berbeda. Model dengan data asli menjadi buruk karena tidak dapat menghindari kehadiran data-data ekstrem, seperti data pencilan dan lain sebagainya. Kemudian model ini juga tidak dapat menghindari pelanggaran asumsi seperti kelinearan yang harus dipenuhi dalam hubungan antara logit dengan parameternya. Setelah melalui serangkaian pengujian dan pengepasan data menunjukkan bahwa keberadaan nilai ekstrem ataupun ketidaklinieran pada hubungan antara logit dengan parameternya menyebabkan buruknya model, sehingga upaya untuk melakukan diskretisasi data cukup memperbaiki kondisi model.