KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI PROVINSI JAWA TIMUR DENGAN PENDEKATAN BOOTSTRAP AGGREGATTING CLASSIFICATION AND REGRESSION TREES Hary Mega Gancar Prakosa 1307 100 077 Dosen Pembimbing Dr. Suhartono, S.Si, M.Sc Co Pembimbing Dr. Bambang Wijanarko Otok, S.Si, M.Si
Kemiskinan Kemiskinan adalah sasaran strategis dalam usaha peningkatan kesejahteraan (Sutaat, 2006 Jumlah penduduk miskin di Indonesia pada bulan Maret 2010 mencapai 31.023.390 jiwa (13,33 persen. Sementara itu daerah dengan jumlah penduduk miskin terbanyak adalah Jawa Timur, yaitu sebesar 5.529.300 jiwa (BPS Kesejahteraan
Faturokhman dan Molo_1995 ( Meneliti karakteristik rumah tangga miskin di Jogjakarta Rahmawati_1999 (Meneliti kesempatan kerja penduduk miskin di DKI Jakarta BPS dan World Bank Institute_2002 (Menyusun dasar-dasar analisis kemiskinan Cahyat dkk_2007 (mengkaji kemiskinan dan kesejahteraan rumah tangga
Banyak faktor yang mempengaruhi kesejahteraan rumah tangga dilihat dari sudut pandang kemiskinan Klasifikasi Kesejahteraan Rumah Tangga Bagging CART
1 Bagaimana model kesejahteraan rumah tangga di Propinsi Jawa Timur dengan pendekatan CART? 2 Bagaimana model kesejahteraan rumah tangga di Propinsi Jawa Timur dengan pendekatan bagging CART? 3 Bagaimana model kesejahteraan rumah tangga di Propinsi Jawa Timur dengan pendekatan regresi logistik? 4 Bagaimana perbandingan model kesejahteraan rumah tangga di Propinsi Jawa Timur dengan pendekatan CART, bagging CART, dan regresi logistik?
BPS Kemampuan untuk memenuhi kebutuhan komoditas secara umum KESEJAHTERAAN RUU SKSN kondisi sosial ekonomi yang memungkinkan bagi setiap warga negara untuk dapat memenuhi kebutuhan yang bersifat jasmani, rohani dan sosial sesuai dengan harkat dan martabat manusia
KEMISKINAN BPS ketidakmampuan untuk memenuhi standar dari kebutuhan dasar, baik makanan maupun bukan makanan Bappenas kondisi di mana seseorang atau sekelompok orang, lakilaki dan perempuan, tidak mampu memenuhi hak dasarnya untuk mempertahankan dan mengembangkan kehidupan yang bermartabat
Tingkat Konsumsi Memiliki kaidah-kaidah Statistik yang harus dijalankan sehingga lebih bisa dipertanggungjawabkan (Cahyat, 2004 Model Pengukuran Kemiskinan Kesejahteraan Keluarga Pembangunan Manusia
Kemiskinan Pengeluaran Perkapita
CART metode nonparametrik yang dikembangkan untuk topik analisis klasifikasi, baik untuk variabel respon kategorik maupun kontinu Breiman et al (1993 Lewis dan Roger (2000 Keunggulan CART 1 2 3 4 Tidak ada asumsi yang harus dipenuhi Dapat mengeksplorasi data berstruktur kompleks dan multivariabel Hasil lebih mudah untuk dinterpretasi kan Memudahkan eksplorasi dan pengambilan keputusan
LANGKAH-LANGKAH PENERAPAN CART Pembentukan Pohon Klasifikasi Pemilihan Pemilah Penentuan Simpul Terminal Penandaan Label Kelas Pemangkasan Pohon Klasifikasi Test Sample Estimate Cross Validation V-fold Estimate Pohon Klasifikasi Optimal
Regresi Logistik Biner 1. Model regresi logistik dengan k variabel prediktor exp( 0 1x1... kx k π(x 1 exp( x... x 2. Bentuk logit g(x 0 1 0 1x1 kxk... 1 k 3. Penaksiran Parameter Menggunakan metode MLE (Maximum Likelihood Estimation, dengan memaksimumkan fungsi Likelihood (Agresti, 1990. k
LANGKAH-LANGKAH PENERAPAN REGRESI LOGISTIK Penaksiran Parameter Pengujian Signifikansi Paramter Uji Individu Uji Serentak Uji Kesesuaian Model Menghitung Ketepatan Klasifikasi
Data Survei Sosial Ekonomi Nasional (SUSENAS tahun 2009 Provinsi Jawa Timur. Jumlah sampel sebesar 29.952 rumah tangga.
Y 1 2 3 4 5 6 7 8 Kemiskinan Rumah Tangga Jenis Kelamin KRT Usia KRT Status Perkawinan KRT Ijazah Tertinggi KRT Jumlah ART Kegiatan Utama KRT Lapangan Usaha Utama KRT Status Pekerjaan Utama KRT 1 : Tidak Miskin 2 : Miskin 1 : Laki-laki 2 : Perempuan 1 : Kawin 2 : Lainnya 1 : Belum Sekolah 2 : Tidak Tamat SD 3 : Tamat SD/Sederajat 4 : Tamat SLTP/Sederajat 5 : Tamat SLTA/Sederajat 6 : Tamat di atas SLTA 1 : Bekerja 2 : Tidak Bekerja 1 : Pertanian 2 : NonPertanian 3 : Tidak Bekerja 1 : Buruh/karyawan 2 : Pengusaha 3 : Lainnya 4 : Tidak Bekerja
DESKRIPTIF Jumlah dan Persentase Rumah Tangga di Jawa Timur tahun 2009 Berdasarkan Status Kemiskinan Kesejahteraan Rumah Tangga n p (% Miskin 4.422 15 Tidak Miskin 25.530 85 Total 29.952 100
ASPEK SOSIAL DEMOGRAFI Tabel 1. Deskripsi Karakteristik Sosial Demografi Rumah Tangga di Provinsi Jawa Timur tahun 2009 Variabel Sosial Demografi Miskin Tidak Miskin mean stdev mean stdev Jumlah anggota rumah tangga 4,32 1,60 3,44 1,491 Usia kepala rumah tangga 50,42 14,39 49,40 13,96 Keterangan : signifikan berbeda pada α = 5% Tabel 2. Deskripsi Karakteristik Sosial Demografi Kepala Rumah Tangga di Provinsi Jawa Timur tahun 2009 Variabel Sosial Demografi Proporsi (% Miskin Tidak miskin Jenis kelamin kepala rumah tangga Laki-laki 86,27 82,77 Wanita 13,73 17,23 Status perkawinan kepala rumah tangga Kawin 84,53 79,66 Lainnya 15,47 20,34 Keterangan : signifikan berbeda pada α = 5%
ASPEK PENDIDIKAN Tabel 3. Deskripsi Karakteristik Pendidikan Kepala Rumah Tangga di Provinsi Jawa Timur tahun 2009 Kategori Miskin Tidak Miskin Pendidikan n p (% n p (% Total 1 975 26,75 2.670 73,25 3.645 2 1.400 20,32 5.490 79,68 6.890 3 1.461 16,40 7.448 83,60 8.909 4 483 7,23 6.193 92,76 6.676 5 92 4,25 2.073 95,75 2.165 6 11 0,66 1.656 99,34 1.667 Total 4.422 100 25.530 100 29.952 Persentase 100 90 80 70 60 50 40 30 20 10 0 1 2 3 4 5 6 Ijazah Tertinggi Kepala Rumah Tangga Miskin Tidak Miskin
ASPEK KETENAGAKERJAAN Tabel 4. Deskripsi Karakteristik Ketenagakerjaan Kepala Rumah Tangga di Provinsi Jawa Timur tahun 2009 Karakteristik Miskin Tidak Miskin n p (% n p (% Total Kegiatan Utama - Bekerja 3.854 87,15 21.515 84,27 25.369 - Tidak Bekerja 568 12,84 4.015 15,73 4.583 Total 4.422 100,00 25.530 100,00 29.952 Lapangan Usaha Utama - Pertanian 2.625 59,36 8.521 33,38 11.146 - Non Pertanian 1.229 27,79 12.994 50,90 14.223 - Tidak Bekerja 568 12,84 4.015 15,72 4.583 Total 4.422 100,00 25.530 100,00 29.952 Status Pekerjaan Utama - Buruh/karyawan 596 13,48 6.458 25,30 7.054 - Pengusaha 2.409 54,48 11.943 46,78 14.352 - Lainnya 849 19,20 3.114 12,20 3.963 - Tidak Bekerja 568 12,84 4.015 15,72 4.583 Total 4.422 100,00 25.530 100,00 29.952
Tabel 5. Deskripsi Karakteristik Pengeluaran Perkapita Perbulan Rumah Tangga di provinsi Jawa Timur tahun 2009 Komponen Miskin Tidak Miskin Pengeluaran Mean Koef Var Mean Koef Var Makanan 112.025 18,88 227.010 50,41 Nonmakanan 55.440 32,07 208.222 119,59
CART Tabel 6. Perbandingan Ketepatan Klasifikasi Antar Kombinasi Data No Ketepatan Kombinasi Data (% Klasifikasi (% L T L T Jumlah Node Terminal 1 95 5 69,5 68,7 61 2 90 10 71,7 69,6 110 3 85 15 71,1 69,9 66 4 80 20 70,2 69,2 76 5 75 25 69,0 68,6 16 6 70 30 74,5 72,5 882 7 65 35 71,7 67,9 185
Ilustrasi Proses Pemilahan Pada Pohon Klasifikasi Optimal SIMPUL TERMINAL SIMPUL UTAMA
Plot antara relative cost dan jumlah node Pohon Klasifikasi Optimal
Tabel 7. Ketepatan Klasifikasi Data Learning Pada Pohon Optimal Kelas Aktual Prediksi Kelas Tidak Miskin Miskin Ketepatan Klasifikasi (% Miskin 850 2497 68,05 Tidak Miskin 13009 6.108 74,60 Ketepatan Klasifikasi Total 69,00
Tabel 8. Ketepatan Klasifikasi Data Testing Pada Pohon Optimal Kelas Aktual Prediksi Kelas Tidak Miskin Miskin Ketepatan Klasifikasi (% Miskin 301 773 71,97 Tidak Miskin 4362 2052 68,01 Ketepatan Klasifikasi Total 68,6
NO Bagging CART Tabel 9. Perbandingan Ketepatan Klasifikasi dari Berbagai Variasi Jumlah Sampel Bootstrap Banyaknya Replikasi Sampel Bootstrap Ketepatan Klasifikasi (% 1 25 70,5 2 50 72,4 3 75 71,4 4 100 73,8 5 125 73,8 6 150 74,3 7 175 74,3 8 200 74,3
Tabel 10. Perbandingan Ketepatan Klasifikasi dari Metode CART dan bagging CART Metode Ketepatan Klasifikasi (% CART (tanpa bagging 69,00 Bagging CART (replikasi 150 kali 74,30 Perbedaan 5,3
REGRESI LOGISTIK Tanpa Interaksi Hasil Uji Regresi Logistik Individu Variabel Respon vs Variabel Prediktor Variabel Prediktor β p-value 1 : Jenis Kelamin KRT Laki-laki 0,294 0,000 Konstanta -1,992 0,000 2 : Usia KRT 0,006 0,000 Konstanta -2,032 0,000 3 : Status Perkawinan KRT Lainnya -0,345 0,000 Konstanta -1,682 0,000 4 : Ijazah Tertinggi KRT Tidak Punya Ijazah -0,391 0,000 Tamat SD/Sederajat -0,672 0,000 Tamat SLTP/Sederajat -1,574 0,000 Tamat SLTA/Sederajat -2,163 0,000 Tamat di atas SLTA -4,546 0,000 Konstanta -0,965 0,000 5 : Jumlah ART 0,357 0,000 Konstanta -3,124 0,000 6 : Kegiatan Utama KRT Bekerja 0,213 0,000 Konstanta -1,926 0,000 7 : Lapangan Usaha Utama KRT Non Pertanian -1,200 0,000 Tidak Bekerja -0,766 0,000 Konstanta -1,159 0,000 8 : Status Pekerjaan Utama KRT Pengusaha 0,783 0,000 Lainnya 1,060 0,000 Tidak Bekerja 0,445 0,000 Konstanta -2,371 0,000
Hasil Uji Regresi Logistik Serentak Variabel Respon vs Variabel Prediktor Variabel Prediktor β p-value 2 : Usia KRT -0,016 0,000 3 : Status Perkawinan KRT 0,058 Lainnya -0,118 0,058 4 : Ijazah Tertinggi KRT 0,000 Tidak Punya Ijazah -0,727 0,000 Tamat SD/Sederajat -1,135 0,000 Tamat SLTP/Sederajat -1,860 0,000 Tamat SLTA/Sederajat -2,437 0,000 Tamat di atas SLTA -4,728 0,000 5 : Jumlah ART 0,416 0,000 6 : Kegiatan Utama KRT 0,000 Bekerja 0,279 0,002 7 : Lapangan Usaha Utama KRT 0,000 Non Pertanian -0,789 0,000 8 : Status Pekerjaan Utama KRT 0,000 Pengusaha 0,043 0,500 Lainnya 0,310 0,000 Konstanta -1,451 0,000 G=3491,864 2 (8;0.05 = 15.50731
model logistik g ( x 1.451 0,016( 2 0,118( 3,2 0,727( 4,2 1,135( 4,3 1,860( 4,4 2,437( 4,5 4,728( 4,6 0,416( 5 0,279( 6,1 0,789( 7,2 0,310( 8,3 Uji Kesesuaian Model C = 52,213 > 2 (8;0.05 = 15.50731
Odds Ratio Model Regresi Logistik Tanpa Interaksi Variabel β OR 2 : Usia KRT -0,016 0,984 3 : Status Perkawinan KRT Lainnya -0,118 0,889 4 : Ijazah Tertinggi KRT Tidak Punya Ijazah -0,727 0,484 Tamat SD/Sederajat -1,135 0,321 Tamat SLTP/Sederajat -1,860 0,156 Tamat SLTA/Sederajat -2,437 0,087 Tamat di atas SLTA -4,728 0,009 5 : Jumlah ART 0,416 1,516 6 : Kegiatan Utama KRT Bekerja 0,279 1,321 7 : Lapangan Usaha Utama KRT Non Pertanian -0,789 0,454 8 : Status Pekerjaan Utama KRT Pengusaha 0,043 1,044 Lainnya 0,310 1,364 Konstanta -1,451 0,234
Tabel Klasifikasi Model Regresi Logistik Observasi Prediksi Tidak Miskin Miskin Ketepatan Klasifikasi (% Tidak Miskin 18.843 274 98,6 Miskin 3.026 321 9,6 Ketepatan Klasifikasi Total (% 85,3
REGRESI LOGISTIK Dengan Interaksi Uji Independensi Terdapat hubungan antarsemua variabel prediktor Uji Individu Semua interaksi antar variabel prediktor signifikan berpengaruh kecuali interaksi antara variabel usia KRT dan kegiatan utama KRT
Hasil Uji Regresi Logistik Serentak Interaksi antar Variabel Prediktor Variabel Prediktor p-value (4 (1 0,023 (4,1 (1,1 0,756 4 vs 1 (4,2 (1,1 0,108 (4,3 (1,1 0,010 (4,4 (1,1 0,343 (4,5 (1,1 0,029 (1 (7 0,000 1 vs 7 (1,1 (7,1 0,023 (1,1 (7,2 0,000 (5 (3 0,000 5 vs 3 (5,1 (3,1 0,000 (5,2 (3,1 0,184 (5,3 (3,1 0,133 Variabel Prediktor p-value (2 (4 0,000 (2,2 (4,1 0,699 2 vs 4 (2,2 (4,2 0,002 (2,2 (4,3 0,000 (2,2 (4,4 0,604 (2,2 (4,5 0,997 (2 (5 0,000 2 vs 5 (2,2 (5,1 0,000 (2,2 (5,2 0,916 (2,2 (5,3 0,674 (7 (2 0,000 7 vs 2 (7,1 (2,2 0,000 (7,2 (2,2 0,257 (4 (7 0,000 (4,1 (7,1 0,726 (4,1 (7,2 0,000 4 vs 7 (4,2 (7,1 0,015 (4,2 (7,2 0,000 (4,3 (7,1 0,001 (4,3 (7,2 0,000 (4,4 (7,1 0,108
4 vs 7 6 vs 4 4 vs 8 (4,4 (7,2 0,000 (4,5 (7,1 0,122 (4,5 (7,2 0,995 (6 (4 0,000 (6,1 (4,1 0,002 (6,1 (4,2 0,000 (6,1 (4,3 0,000 (6,1 (4,4 0,001 (6,1 (4,5 0,997 (4 (8 0,000 (4,1 (8,1 0,862 (4,1 (8,2 0,713 (4,2 (8,1 0,000 (4,2 (8,2 0,411 (4,3 (8,1 0,075 (4,3 (8,2 0,000 (4,4 (8,1 0,025 (4,4 (8,2 0,018 (4,5 (8,1 0,513 (4,5 (8,2 0,999 5 vs 6 5 vs 7 (5 (6 0,000 (5,1 (6,1 0,000 (5,2 (6,1 0,000 (5,3 (6,1 0,009 (5 (7 0,000 (5,1 (7,1 0,786 (5,1 (7,2 0,000 (5,2 (7,1 0,809 (5,2 (7,2 0,000 (5,3 (7,1 0,521 (5,3 (7,2 0,051 Konstanta 0,000 Keterangan : signifikan pada α = 10 persen Sumber : Data sekunder Susenas 2009, diolah peneliti Nilai C = 0,129 dimana nilai ini kurang dari 2 (8;0.10 = 13.36157
Perbandingan Ketepatan Klasifikasi dari Penerapan Metode Regresi Logistik Biner, CART dan bagging CART Metode Misklasifikasi (% Regresi Logistik Biner 14,70 CART (tanpa bagging 31,00 Bagging CART (replikasi 150 kali 25,70
KESIMPULAN DAN SARAN 1. Analisis menggunakan metode CART menunjukkan bahwa variabel prediktor yang berpengaruh terhadap kesejahteraan rumah tangga : ijazah kepala rumah tangga, lapangan usaha utama kepala rumah tangga, usia kepala rumah tangga, dan jumlah anggota rumah tangga. Variabel ijazah tertinggi kepala rumah tangga merupakan variabel yang paling dominan berpengaruh. Tiga kelompok terbesar rumah tangga miskin adalah sebagai berikut. - Simpul terminal 13 terdiri dari 1226 rumah tangga dengan karakteristik ijazah tertinggi kepala rumah tangga adalah tidak tamat SD, lapangan usaha utama kepala rumah tangga adalah tidak bekerja atau bekerja di sektor nonpertanian, dan usia kepala rumah tangga 49,5 tahun. - Simpul terminal 12 terdiri dari 1182 rumah tangga dengan karakteristik ijazah tertinggi kepala rumah tangga adalah di atas SMA dan jumlah anggota rumah tangga > 1,5 orang. - Simpul terminal 3 terdiri dari 525 rumah tangga dengan karakteristik ijazah tertinggi kepala rumah tangga adalah SD/Sederajat, SLTP/Sederajat, atau SMA/Sederajat, lapangan usaha utama kepala rumah tangga adalah pertanian, jumlah anggota rumah tangga > 3,5 orang, dan usia kepala rumah tangga 55,5 tahun.
2. Penerapan metode bagging pada CART mampu meningkatkan ketepatan klasifikasi hingga 5,3 persen menjadi 74,3 persen dibandingkan dengan metode CART biasa. 3. Analisis regresi logistik biner tanpa interaksi menunjukkan bahwa variabel prediktor yang berpengaruh signifikan terhadap klasifikasi kesejahteraan rumah tangga adalah usia kepala rumah tangga, status perkawinan kepala rumah tangga, ijazah tertinggi kepala rumah tangga, jumlah anggota rumah tangga, kegiatan utama kepala rumah tangga, lapangan usaha kepala rumah tangga, dan status pekerjaan utama kepala rumah tangga. Ketepatan klasifikasi sebesar 85,30 persen. Akan tetapi model tidak sesuai digunakan untuk menjelaskan seberapa besar peluang sebuah rumah tangga di Provinsi Jawa Timur tahun 2009 termasuk rumah tangga miskin. g ( x 1.451 0,016( 2 0,118( 3,2 0,727( 4,2 1,135( 4,3 1,860( 4,4 2,437( 4,5 4,728( 4,6 0,416( 5 0,279( 6,1 0,789( 7,2 0,310( 8,3
1,1 4,3 0,264( 1,1 4,2 0,041( 1,1 4,1 0,554( 0,377 ( x g 7,2 5,3 0,097( 7,1 5,3 1,176( 7,2 5,2 0.035( 7,1 5,2 1,417( 7,2 5,1 0.050( 7,1 5,1 0,461( 6,1 5,3 1,170( 6,1 5,2 1,780( 6,1 5,1 15,952( 8,2 4,5 0.921( 8,1 4,5 1.079( 8,2 4,4 0.710( 8,1 4,4 1.034( 8,2 4,3 0.264( 8,1 4,3 0.094( 8,2 4,2 0,368( 8,1 4,2 0,051( 8,2 4,1 0,021( 8,1 4,1 35,373( 4,5 6,1 2,702( 4,4 6,1 3,313( 4,3 6,1 1,011( 4,2 6,1 0,513( 4,1 6,1 0,214( 7,2 4,5 2,198( 7,1 4,5 3,839( 7,2 4,4 0,525( 7,1 4,4 4,425( 7,2 4,3 0,631( 7,1 4,3 2,194( 7,2 4,2 0,386( 7,1 4,2 0,859( 7,2 4,1 0,055( 7,1 4,1 17,007( 2,2 7,2 0,589( 2,2 7,1 14,427( 5,3 2,2 0,014( 5,2 2,2 0,620( 5,1 2,2 0,524( 4,5 2,2 0,399( 4,4 2,2 1,837( 4,3 2,2 0,519( 4,2 2,2 0,050( 4,1 2,2 0,063( 3,1 5,3 0,142( 3,1 5,2 0,547( 3,1 5,1 0,164( 7,2 1,1 0,346( 7,1 1,1 2,535( 1,1 4,5 0,604( 1,1 4,4 0,663(
Diketahui faktor-faktor yang berpengaruh terhadap status kemiskinan rumah tangga di provinsi Jawa Timur tahun 2009 adalah interaksi antara variabel ijazah tertinggi kepala rumah tangga dengan jenis kelamin kepala rumah tangga, jenis kelamin kepala rumah tangga dengan lapangan usaha utama kepala rumah tangga, jumlah anggota rumah tangga dengan status perkawinan kepala rumah tangga, usia kepala rumah tangga dengan ijazah tertinggi kepala rumah tangga, lapangan usaha utama kepala rumah tangga dengan usia kepala rumah tangga, ijazah tertinggi kepala rumah tangga dengan lapangan usaha utama kepala rumah tangga, ijazah tertinggi kepala rumah tangga dengan kegiatna utama kepala rumah tangga, ijazah tertinggi kepala rumah tangga dengan status pekerjaan utama kepala rumah tangga, jumlah anggota rumah tangga dengan kegiatan utama kepala rumah tangga, dan jumlah anggota rumah tangga dengan lapangan usaha utama kepala rumah tangga. Model sudah sesuai digunakan untuk menjelaskan seberapa besar peluang sebuah rumah tangga di Provinsi Jawa Timur tahun 2009 termasuk rumah tangga miskin dengan ketepatan klasifikasi sebesar 85,30 persen. 4. Dilihat dari besarnya misklasifikasi maka model regresi logistik lebih baik dibandingkan dengan metode CART dan bagging CART karena menghasilkan nilai misklasifikasi paling kecil, yaitu 14,7 persen.
Untuk kepentingan penelitian selanjutnya bisa ditambahkan variabel prediktor lain atau modifikasi variabel prediktor yang telah digunakan dalam penelitian ini demi mendapatkan hasil klasifikasi yang lebih baik. Selain itu bisa dicoba menggunakan fungsi keheterogenan simpul yang lain (selain indeks gini
DAFTAR PUSTAKA Agresti, A., 1990. Categorical Data Analysis. John Wiley and Sons. New York. Anonim, 2010. Kesejahteraan. http://wikipe-dia.org Badan Pusat Statistika, 2010. Berita Resmi Statistik : Profil Kemiskinan di Indonesia Maret 2010. Jakarta. Breiman, L., Friedman, J., Olshen, R. and Stone, C., 1984. Classification and Regression Trees. Chapman Hall, New York London. Breiman L, Friedman J.H, Olshen R.A, dan Stone C.J., 1993. Classification And Regression Trees. Chapman And Hall. New York. Breiman, L., 1996. Bagging Predictors, Machine Learning, Vol. 24. 123-140 Cahyat, A., 2004. Bagaimana Kemiskinan Diukur? Beberapa Model Penghitungan Kemiskinan di Indonesia. Bogor : CIFOR. Hosmer, D. W. and Lemeshow, S., 1989. Applied Logistic Regression. John Wiley and Sons, Inc. USA. Hosmer, W. dan Lemeshow, S., 2000. Applied Logistic Regression. Canada: John Wiley&Sons Johnson, R. A. and Wichern, D. W., 1992. Applied Multivariate Statistical Analysis. Prentice Hall. New Jersey. Le, C. T., 1998. Applied Categorical Data Analysis. John Wiley and Sons, Inc. USA. Lewis dan Roger J. 2000. An Introduction to Classification And Regression Trees (CART Analysis. Presented at the 2000. Steinberg, D., dan Colla, P., 1995. CART: Tree-structured nonparametric data analysis. San Diego, Calif., U.S.A.: Salford Systems. Steinberg D. dan Phillip C. 2005. CART Classification and Regression Trees. CA: Salford System, San Diego. Sutaat, 2006. Hasil-hasil Penelitian Tahun 2006 Puslitbang Kesejahteraan Sosial. Jakarta : Pusat Penelitian dan Pengembangan Kesejahteraan Sosial, Badan Pendidikan dan Kesejahteraan Sosial, Departemen Sosial, Republik Indonesia. Sutton, C.D., 2005. Classification and regression trees, Bagging, and Boosting, Handbook of statistics, Vol. 24. hal 303-329.
TERIMA KASIH
1. Pemilihan Pemilah (Classifier Fungsi Keheterogenan Himpunan bagian yang dihasilkan dari pemilahan harus lebih homogen debandingkan dengan pemilahan sebelumnya Indeks Gini i j t i p t j p t i ( ( ( Breiman et al (1993 Ø (s, t = ( ( (, ( R R L L t i p t i p t i t s i
2. Penentuan Simpul Terminal 1 Pada simpul t tidak terdapat penurunan keheterogenan yang berarti 2 Hanya terdapat satu pengamatan (n=1 pada tiap simpul anak atau adanya batasan minimum n 3 Adanya batasan jumlah level atau tingkat kedalaman pohon maksimal
3. Penandaan Label Kelas Aturan Jumlah Terbanyak p(j 0 t = max p j t = max j N j (t N (t p j t N j (t N (t = proporsi kelas j pada simpul t = jumlah pengamatan kelas j pada simpul t = jumlah pengamatan pada simpul t
Pemangkasan Pohon Klasifikasi Ukuran pemangkasan yang digunakan = complexity minimum (Breiman et al, 1984 R ~ ( T R( T T = kompleksitas parameter (cost bagi penambahan satu simpul akhir pada pohon T R (T = penduga pengganti (resubstitution estimate T ~ = banyaknya simpul terminal pada pohon T
Uji Signifikansi Parameter a. Model Univariat H 0 : j = 0, j = 1,2,...,k H 1 : j 0 Statistik Uji (Le, 1998 : Daerah kritis : W Z / 2 Wald (W ˆ j SÊ( ˆ j b. Model Multivariat H 0 : β 0 H 1 : β 0 Statistik Uji (Hosmer and Lemeshow, 1989 : 2 n G i i i i 1 1 0 0 i1 Daerah kritis : y lnˆπ x 1 y ln1 ˆπ x n lnn n lnn nlnn G 2 ( db,
Goodness-of-fit H 0 : Model sesuai H 1 : Model tidak sesuai Statistik Uji (Hosmer and Lemeshow, 1989: Ĉ Hosmer Lemeshow 2 Cˆ Daerah kritis : ( g 2 g k1 o n k k n ' k Interpretasi Model Regresi Logistik Odds rasio : ψ exp 1 Rata-rata besar kecenderungan variabel respon bernilai tertentu jika x = 1 dibandingkan x = 0 (Hosmer and Lemeshow, 1989. k ' π k 1 π 2 k
Prosedur Klasifikasi Evaluasi yang melihat peluang kesalahan klasifikasi yang dilakukan oleh suatu fungsi klasifikasi (Johnson and Wichern, 1992. Tabel klasifikasi Hasil Observasi Taksiran y 1 y 2 y 1 n 11 n 12 y 2 n 21 n 22 APER (apparent error rate = n 11 n n 12 12 n n 21 21 n 22