KLASIFIKASI ANAK PUTUS SEKOLAH DENGAN MELIBATKAN PEUBAH JARINGAN SOSIAL MENGGUNAKAN CART DI SULAWESI DINA SRIKANDI

dokumen-dokumen yang mirip
Seminar Tugas Akhir. Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING. Surabaya, Juli 2011

IDENTIFIKASI KARAKTERISTIK ANAK PUTUS SEKOLAH DI JAWA BARAT DENGAN REGRESI LOGISTIK

Klasifikasi Kegiatan Partisipasi Ekonomi Perempuan Di Jawa Timur Dengan Pendekatan CART (Classification And Regression Trees)

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

Analisis CART (Classification And Regression Trees) pada Faktor-Faktor yang Mempengaruhi Kepala Rumah Tangga di Jawa Timur Melakukan Urbanisasi

ANALISIS KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA FEM DAN FAPERTA MENGGUNAKAN METODE CHART

BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI

PENERAPAN METODE CART

Hary Mega Gancar Prakosa Dosen Pembimbing Dr. Suhartono, S.Si, M.Sc Co Pembimbing Dr. Bambang Wijanarko Otok, S.Si, M.

ANALISIS KETAHANAN DAN APLIKASINYA UNTUK PEMODELAN INTERVAL KELAHIRAN ANAK PERTAMA HARNANTO

ANALISIS POLA KELAHIRAN MENURUT UMUR STUDI KASUS DI INDONESIA TAHUN 1987 DAN TAHUN 1997 SUMIHAR MEINARTI

JURNAL SAINS DAN SENI POMITS Vol. 3, No.1, (2014) ( X Print) D-54

STRATEGI PENGEMBANGAN DAYA SAING PRODUK UNGGULAN DAERAH INDUSTRI KECIL MENENGAH KABUPATEN BANYUMAS MUHAMMAD UNGGUL ABDUL FATTAH

MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR

ANALISIS POLA KELAHIRAN MENURUT UMUR STUDI KASUS DI INDONESIA TAHUN 1987 DAN TAHUN 1997 SUMIHAR MEINARTI

Survei Sosial Ekonomi Nasional (SUSENAS) Kor, 2017

Memodelkan regresi logistik biner data set hasil sampel bootstrap B.

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

ANALISIS MODEL PELUANG BERTAHAN HIDUP DAN APLIKASINYA SUNARTI FAJARIYAH

PENENTUAN FAKTOR-FAKTOR MEMILIH MEREK DENGAN METODE CART DAMAS ESMU HAJI

PENDEKATAN CART UNTUK MENDAPATKAN FAKTOR YANG MEMPENGARUHI TERJANGKITNYA PENYAKIT DEMAM TIFOID DI ACEH UTARA

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENYALURAN KREDIT DI BANK UMUM MILIK NEGARA PERIODE TAHUN RENALDO PRIMA SUTIKNO

PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI

PREFERENSI KARAKTERISTIK KOPI 3 IN 1 MENGGUNAKAN METODE POHON REGRESI DAN KLASIFIKASI FITRIYANTO

ANALISIS BIPLOT UNTUK MEMETAKAN MUTU SEKOLAH YANG SESUAI DENGAN NILAI UJIAN NASIONAL SUJITA

ANALISIS REGRESI TERPOTONG BEBERAPA NILAI AMATAN NURHAFNI

Klasifikasi Nilai Peminat SBMPTN (Seleksi Bersama Masuk Perguruan Tinggi Negeri) ITS dengan Pendekatan Classification and Regression Trees (CART)

PENGARUH SERTIFIKASI GURU TERHADAP KESEJAHTERAAN DAN KINERJA GURU DI KABUPATEN SUMEDANG RIZKY RAHADIKHA

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES)

PERBANDINGAN METODE INTERPOLASI ABRIDGED LIFE TABLE

PENGARUH PEMENUHAN TUGAS PERKEMBANGAN KELUARGA DENGAN ANAK USIA REMAJA TERHADAP PENCAPAIAN TUGAS PERKEMBANGAN REMAJA. Lia Nurjanah

PREDIKSI NASABAH POTENSIAL MENGGUNAKAN METODE KLASIFIKASI POHON BINER

PENGARUH PERAN DOSEN PEMBIMBING TERHADAP KUALITAS TUGAS AKHIR (Studi Kasus : Mahasiswa Fmipa Unsyiah)

Survei Sosial Ekonomi Nasional (SUSENAS) Kor, 2014

ANALISIS POLA KONSUMSI DAERAH PERKOTAAN DAN PEDESAAN SERTA KETERKAITANNYA DENGAN KARAKTERISTIK SOSIAL EKONOMI DI PROPINSI BANTEN MUHARDI KAHAR

METODE POHON GABUNGAN PADA CART UNTUK ANALISA KESEJAHTERAAN RUMAH TANGGA DI BANJARMASIN

Survei Sosial Ekonomi Nasional (SUSENAS) Kor, 2013

KLASIFIKASI PENYAKIT DIABETES MELITUS DENGAN METODE CHAID (CHI SQUARE AUTOMATIC INTERACTION DETECTION) DAN CART (CLASSIFICATION AND REGRESSION TREE)

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER

POHON KLASIFIKASI DAN POHON REGRESI KEBERHASILAN MAHASISWA PASCASARJANA PROGRAM STUDI STATISTIKA IPB

ANALISIS FAKTOR RISIKO PENYAKIT JANTUNG KORONER DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK DAN CHAID: KASUS DI RSUP DR. WAHIDIN SUDIROHUSODO MAKASSAR

Model Machine Learning CART Diabetes Melitus

BAGGING CART PADA KLASIFIKASI ANAK PUTUS SEKOLAH

EKSPLORASI KINERJA DOSEN TERSERTIFIKASI DALAM MELAKSANAKAN TRIDHARMA PERGURUAN TINGGI DI INDONESIA RIZKY NURKHAERANI

MODIFIKASI METODE RELE UNTUK MODEL PENDUDUK QUASI-STABIL CECEP A.H.F. SANTOSA

HUBUNGAN EFEKTIVITAS SISTEM PENILAIAN KINERJA DENGAN KINERJA KARYAWAN PADA KANTOR PUSAT PT PP (PERSERO), TBK JULIANA MAISYARA

PENERAPAN METODE REGRESI BERSTRUKTUR POHON PADA PENDUGAAN LAMA PENYUSUNAN SKRIPSI MAHASISWA ARTIKEL ILMIAH

ANALISIS EKOLOGI-EKONOMI UNTUK PERENCANAAN PEMBANGUNAN PERIKANAN BUDIDAYA BERKELANJUTAN DI WILAYAH PESISIR PROVINSI BANTEN YOGA CANDRA DITYA

Survei Sosial Ekonomi Nasional (SUSENAS) Kor, 2016

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

PENENTUAN KONDISI OPTIMUM PADA PEMBENTUKAN POHON TERBAIK DENGAN METODE POHON KLASIFIKASI (CLASSIFICATION TREE)

DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN

EVALUASI KINERJA KEUANGAN SATUAN USAHA KOMERSIAL PERGURUAN TINGGI NEGERI BADAN HUKUM DARSONO SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014


PPDAFTAR GAMBAR Gambar Halaman Yuni Melawati, 2013

MODEL PERTUMBUHAN EKONOMI DUA DAERAH BERDASARKAN MODAL DAN KNOWLEDGE MUHAMMAD TAUFIK NUSA TAJAU

PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI

PENGARUH STRUKTUR MODAL TERHADAP KINERJA PERUSAHAAN SEKTOR KEUANGAN YANG TERDAFTAR DI BURSA EFEK INDONESIA TEDY SAPUTRA

Pengaruh Formula dengan Penambahan Bumbu untuk Makanan Rumah Sakit pada Status Gizi dan Kesehatan Pasien LIBER

MODEL DISTRIBUSI PERTUMBUHAN EKONOMI ANTARKELOMPOK PADA DUA DAERAH ADE LINA HERLIANI

PERBANDINGAN ANTARA UNWEIGHTED LEAST SQUARES (ULS) DAN PARTIAL LEAST SQUARES (PLS) DALAM PEMODELAN PERSAMAAN STRUKTURAL MUHAMMAD AMIN PARIS

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

ABDUL HOYYI. T e s i s Sebagai salah satu syarat memperoleh gelar Magister Sains pada P r o g r a m S t u d i S t a t i s t i k a

KINERJA PENGAWAS KAPAL PERIKANAN (STUDI KASUS DI PELABUHAN PERIKANAN SAMUDERA NIZAM ZACHMAN JAKARTA) AHMAD MANSUR

SEBARAN ASIMTOTIK PENDUGA KOMPONEN PERIODIK FUNGSI INTENSITAS PROSES POISSON PERIODIK DENGAN TREN FUNGSI PANGKAT RO FAH NUR RACHMAWATI

ANALISIS KETERKAITAN KREDIT DAN KONSUMSI RUMAH TANGGA DALAM PEMBANGUNAN EKONOMI REGIONAL PROVINSI JAWA BARAT DHONA YULIANTI

GAMBARAN ASUPAN NUTRISI SISWA SEKOLAH SEPAKBOLA SEJATI PRATAMA MEDAN SAAT PERTANDINGAN TAHUN 2014 OLEH: M. IBNU KHALDUN

BIPLOT DENGAN DEKOMPOSISI NILAI SINGULAR BIASA DAN KEKAR UNTUK PEMETAAN PROVINSI BERDASARKAN PRESTASI MAHASISWA IPB WARSITO

PERBANDINGAN KEKONVERGENAN BEBERAPA MODEL BINOMIAL UNTUK PENENTUAN HARGA OPSI EROPA PONCO BUDI SUSILO

Indonesia - Survei Sosial Ekonomi Nasional 2016 Maret (KOR)

HUBUNGAN KARAKTERISTIK KELUARGA DAN PEER GROUP DENGAN KARAKTER DAN PERILAKU BULLYING REMAJA KARINA

PENGGUNAAN REGRESI SPLINE ADAPTIF BERGANDA UNTUK DATA RESPON BINER AZWIRDA AZIZ SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2005

PENDEKATAN CART UNTUK MENDAPATKAN FAKTOR YANG MEMPENGARUHI TERJANGKITNYA PENYAKIT DEMAM TIFOID DI ACEH UTARA

ABDUL HOYYI. T e s i s Sebagai salah satu syarat memperoleh gelar Magister Sains pada P r o g r a m S t u d i S t a t i s t i k a

KETEPATAN KLASIFIKASI KEIKUTSERTAAN KELUARGA BERENCANA MENGGUNAKAN REGRESI LOGISTIK BINER DAN REGRESI PROBIT BINER

SKRIPSI. Disusun oleh: DHINDA AMALIA TIMUR

Indonesia - Survei Sosial Ekonomi Nasional 2015 Maret (KOR)

METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN ALGORITMA QUEST DAN ALGORITMA CART (Aplikasi pada Data Pasien Penyakit Jantung) SKRIPSI

MODEL DISTRIBUSI PERTUMBUHAN EKONOMI ANTARKELOMPOK PADA DUA DAERAH ADE LINA HERLIANI

Survei Perlindungan Sosial (Suplemen Susenas 2013 Triwulan I), 2013

MODEL PEMBERIAN KOMPENSASI BAGI PENGANGGUR UNTUK MENCAPAI KESEJAHTERAAN EKONOMI HADI KUSWANTO

PERBANDINGAN KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES) Abstract

PEMODELAN SISTEM PENDULUM TERBALIK GANDA DAN KARAKTERISASI PARAMETER PADA MASALAH REGULASI OPTIMAL HASBY ASSIDIQI

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

Pendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker pada Pasien Kanker Tiroid

KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI PROVINSI JAWA TIMUR DENGAN PENDEKATAN CART ARCING

PEMODELAN USIA MENARCHE DENGAN REGRESI LOGISTIK ORDINAL DAN METODE CHAID Studi Kasus pada Siswi SMP di Kota Depok SILVANA SYAH

METODE EKSPLORATIF UNTUK MENGUJI KESAMAAN SPEKTRUM FTIR TEMULAWAK

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES)

PENETAPAN HARGA JAMINAN POLIS ASURANSI JIWA DENGAN PREMI TAHUNAN DAN OPSI SURRENDER WELLI SYAHRIZA

PENGARUH VARIABEL EKONOMI DAN SOSIAL DEMOGRAFI TERHADAP STATUS EKONOMI PEREMPUAN DI KABUPATEN JEMBRANA

PENERAPAN POHON KLASIFIKASI DAN BOOTSTRAP AGGREGATING DALAM KLASIFIKASI USIA MENARCHE (Studi Kasus: SMPN Ragunan dan SMPN 1 Dramaga) IIS ISTIQOMAH

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG

III. METODE PENELITIAN

ANALISIS KEPUASAN DAN LOYALITAS KONSUMEN DALAM PENGGUNAAN METODE PEMBAYARAN NON-TUNAI

Indonesia - Survei Sosial Ekonomi Nasional 2013 Modul (Gabungan)

KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H

Transkripsi:

KLASIFIKASI ANAK PUTUS SEKOLAH DENGAN MELIBATKAN PEUBAH JARINGAN SOSIAL MENGGUNAKAN CART DI SULAWESI DINA SRIKANDI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2015

PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa tesis berjudul Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juni 2015 Dina Srikandi G152130494

RINGKASAN DINA SRIKANDI. Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi. Dibimbing oleh ERFIANI dan BAGUS SARTONO. Pendidikan merupakan salah satu hak anak sebagai generasi muda penerus bangsa yang harus dipenuhi oleh pemerintah. Menurut Undang-Undang No.23 Tahun 2002 pasal 4 tentang perlindungan anak, anak didefenisikan sebagai seseorang yang belum berusia 18 tahun. Salah satu hak anak yang harus dipenuhi oleh pemerintah adalah hak mendapatkan pendidikan. Keberhasilan pemerintah dalam memenuhi kewajibannya dapat dilihat dari seberapa besar angka putus sekolah di suatu daerah. Pada tahun 2012, seluruh provinsi di Pulau Sulawesi memiliki angka putus sekolah yang lebih tinggi dibandingkan angka rata-rata nasional, namun hal ini tidak terjadi untuk pulau besar lainnya di Indonesia. Masalah putus sekolah di Sulawesi perlu diatasi dengan mengidentifikasi dan mencari faktor penyebab siswa putus sekolah, baik faktor sosial ekonomi dan demografi anak maupun faktor lingkungan khususnya pengaruh jaringan sosial dalam kehidupan anak, sehingga kebijakan yang diambil oleh pemerintah dapat tepat sasaran. Salah satu cara yang dapat dilakukan untuk mengetahui karakteristik anak putus sekolah adalah dengan melakukan klasifikasi anak putus sekolah umur 7-17 tahun dengan menggunakan metode pohon klasifikasi kemudian menerapkan teknik Bagging pada pohon klasifikasi yang dibangun. Penelitian ini bertujuan mengetahui karakteristik anak putus sekolah di Sulawesi dengan melakukan klasifikasi terhadap anak putus sekolah usia 7-17 tahun. Klasifikasi disusun berdasarkan faktor sosial ekonomi dan demografi yang dimiliki anak kemudian menambahkan faktor jaringan sosial. Selanjutnya, akan dilihat pengaruh penambahan faktor tersebut kedalam pohon klasifikasi dengan melihat ketepatan klasifikasi yang dihasilkan. Penelitian ini menunjukkan bahwa penambahan peubah jaringan sosial kedalam pohon klasifikasi meningkatkan ketepatan klasifikasi sebesar 23.6% dan penerapan teknik Bagging pada pohon CART tunggal dapat memperbaiki ketepatan klasifikasi sebesar 5.3%. Berdasarkan penelusuran klasifikasi yang terbentuk diperoleh beberapa karakteristik utama anak putus sekolah usia 7-17 tahun di Sulawesi yaitu mereka adalah anak-anak yang tinggal di lingkungan yang memiliki angka putus sekolah yang cukup tinggi, memiliki kepala rumah tangga yang tidak muda lagi serta tinggal dengan saudara yang juga putus sekolah. Kata kunci: Bootstrap aggregating (Bagging), Classification and Regression Trees (CART), Karakteristik anak putus sekolah, Ketepatan klasifikasi

SUMMARY DINA SRIKANDI. Classification of Dropout Students by Involving Social Network Variables Using CART Method in Sulawesi. Supervised by ERFIANI and BAGUS SARTONO. Education is one of the children s rights as young generation successor to the nation that must be met by the government. According to Law No. 23 of 2002 Article 4 concerning the protection of children, child is defined as someone who hasn t 18 years old. One of the rights of children which must be met by the government is the right to education. The government's success in meeting its obligations can be seen from how big the school dropout rate. One factor that can be measured by the low level of education is high dropout rates. In 2012, dropout rate for children 7-17 years old in all province at Sulawesi were still higher than national rate. To overcome these problems, efforts are required to identify and search factors that cause of dropouts. The socio-economic and demographic factors or environmental factors, especially social network effect in children s live, so that the measures taken by the government can be precisely targeted. To determine the characteristics of dropout students require to clasify the children 7-17 year old using classification and regression tree (CART) method and then apply the Bagging techniques. This study aims to determine how the characteristics of dropout students 7-17 years old that more detailed in Sulawesi. Classification is built not only consider the socio-economic and demographic factors but also adds social network factors. Furthermore, it will be seen how the effect of these factors into the classification by looking the classification accuracy. The results showed that by adding the social network variables into the classification tree increase of 23.6% classification accuracy and application of Bagging techniques on single CART can improve the classification accuracy of 5.3%. The classification obtained some of the main characteristics of dropout students 7-17 years old in Sulawesi ie they are children who live in an environment that has quite high dropout rate, has a head of household who was not young anymore, and live with brother who also dropped out of school. Keywords: accuracy of classification rate, bootstrap aggregating (Bagging), classification and regression trees (CART), classification of dropout student

Hak Cipta Milik IPB, Tahun 2015 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB

KLASIFIKASI ANAK PUTUS SEKOLAH DENGAN MELIBATKAN PEUBAH JARINGAN SOSIAL MENGGUNAKAN CART DI SULAWESI DINA SRIKANDI Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika Terapan SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2015

Penguji Luar Komisi pada Ujian Tesis: Prof Dr Ir Khairil Anwar Notodiputro, MS

Judul Tesis : Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi Nama : Dina Srikandi NIM : G152130494 Disetujui oleh Komisi Pembimbing Dr Ir Erfiani, MSi Ketua Dr Bagus Sartono Anggota Diketahui oleh Ketua Program Studi Statistika Terapan Dekan Sekolah Pascasarjana Dr Ir Indahwati, MSi Dr Ir Dahrul Syah, MScAgr Tanggal Ujian: 20 Juni 2015 Tanggal Lulus:

PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta ala atas segala karunia-nya sehingga tesis yang berjudul Klasifikasi Anak Putus Sekolah dengan Melibatkan Peubah Jaringan Sosial Menggunakan CART di Sulawesi ini dapat diselesaikan. Terima kasih penulis ucapkan kepada Ibu Dr Ir Erfiani, MSi dan Bapak Dr Bagus Sartono selaku pembimbing, atas kesediaan dan kesabaran untuk membimbing penulis dalam penyusunan tesis ini. Ucapan terima kasih juga penulis sampaikan kepada seluruh Dosen Departemen Statistika IPB yang telah mengasuh dan mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan studi, serta seluruh staf Departemen Statistika IPB atas bantuan, pelayanan, dan kerjasamanya selama ini. Di samping itu, penghargaan penulis sampaikan kepada rekan-rekan pegawai Badan Pusat Statistik yang telah membantu dalam pengumpulan data. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga, atas segala doa dan kasih sayangnya. Semoga tesis ini dapat bermanfaat bagi semua pihak yang membutuhkan. Bogor, Juni 2015 Dina Srikandi

DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN 1 PENDAHULUAN 1 Latar Belakang 1 Pertanyaan Penelitian 2 Tujuan Penelitian 3 2 TINJAUAN PUSTAKA 3 Jaringan Sosial 3 Classification And Regression Tree (CART) 4 Prosedur Pembentukan Pohon Klasifikasi 4 Pemangkasan Pohon Klasifikasi 5 Pemilihan Pohon Klasifikasi Optimal 6 Bootstrap Aggregating (Bagging) 6 3 METODE 7 Data 7 Unit Analisis 7 Peubah Penelitian 8 Metode Analisis 9 4 HASIL DAN PEMBAHASAN 11 Gambaran Umum Anak Putus Sekolah 11 Hubungan Peubah Penjelas dan Peubah Respon 16 Pohon Klasifikasi 18 Klasifikasi Tanpa Peubah Jaringan Sosial 19 Klasifikasi Dengan Peubah Jaringan Sosial 20 Perbandingan Pohon Klasifikasi tanpa Peubah Jaringan Sosial dan Pohon Klasifikasi dengan Peubah Jaringan Sosial 24 Penerapan Teknik Bagging 25 Perbandingan Klasifikasi dengan Metode CART dan Bagging CART 28 5 SIMPULAN 28 DAFTAR PUSTAKA 29 LAMPIRAN 31 RIWAYAT HIDUP 34 vi v v

DAFTAR TABEL 1. Peubah Penjelas yang Digunakan Dalam Penelitian 8 2. Distribusi Persentase Status Bersekolah Anak Berdasarkan Jumlah Anggota Rumah Tangga yang Tidak/Belum Bekerja di Sulawesi, Tahun 2012 13 3. Distribusi Persentase Status Bersekolah Anak Berdasarkan Tingkat Pendidikan Ibu di Sulawesi, Tahun 2012 14 4. Distribusi Persentase Status Bersekolah Anak Berdasarkan Status Pekerjaan Kepala Rumah Tangga (KRT) di Sulawesi, Tahun 2012 14 5. Persentase Anak Usia 7-17 Tahun yang Tidak Bersekolah Lagi Menurut Alasannya 16 6. Nilai Koefisien Asosiasi dan Nilai-p yang diperoleh dari Hasil Tabulasi Silang antara Peubah Penjelas dan Peubah Respon 17 7. Hasil Uji-t pada Uji Beda Dua Rata-rata antara Peubah Penjelas dan Peubah Respon 18 8. Tingkat Kepentingan Peubah pada Pohon Klasifikasi Optimal 19 9. Hasil Klasifikasi Data Testing pada Pohon Klasifikasi Optimal tanpa Peubah Jaringan Sosial 20 10. Tingkat Kepentingan Peubah pada Pohon Klasifikasi Optimal dengan Peubah Jaringan Sosial 21 11. Hasil Klasifikasi Data Testing pada Pohon Klasifikasi Optimal dengan Menambahkan Peubah Jaringan Sosial 23 12. Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon Klasifikasi dengan Peubah Jaringan Sosial 25 13. Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon Klasifikasi dengan Keputusan Putus Sekolah Jika Minimal 30% dari Jumlah Pohon Memilih Kategori Putus Sekolah 27 14. Tingkat Ketepatan Klasifikasi Bagging CART pada Pohon Klasifikasi dengan Peubah Jaringan Sosial 28

DAFTAR GAMBAR 1. Diagram Alir Penelitian 10 2. Angka Putus Sekolah (APTS) Menurut Provinsi di Indonesia, Tahun 2012 11 3. Angka Putus Sekolah (APTS) Menurut Kabupaten di Pulau Sulawesi, Tahun 2012 12 4. Persentase Anak Putus Sekolah Menurut Jenis Kelamin di Sulawesi, Tahun 2012 13 5. Persentase Anak Putus Sekolah Menurut Status Ekonomi Rumah Tangga di Sulawesi, Tahun 2012 15 6. Persentase Anak Putus Sekolah Menurut Klasifikasi Tempat Tinggal di Sulawesi, Tahun 2012 15 7. Plot Biaya Relatif dengan Jumlah Simpul Terminal pada Klasifikasi tanpa Peubah Jaringan Sosial 19 8. Plot Biaya Relatif dengan Jumlah Simpul Terminal pada Klasifikasi dengan Peubah Jaringan Sosial 21 9. Pohon Klasifikasi Optimal dengan Peubah Jaringan Sosial 22 10. Perbandingan Ketepatan Klasifikasi antara Pohon Klasifikasi tanpa Peubah Jaringan Sosial dan dengan Peubah Jaringan Sosial 24 11. Rata-rata Tingkat Kepentingan Peubah pada Pohon Klasifikasi Gabungan dengan Pengulangan Sebanyak 125 kali 26 DAFTAR LAMPIRAN 1. Angka Putus Sekolah (APTS) di Sulawesi Menurut Kabupaten, Tahun 2012 31 2. Gambar Pohon Klasifikasi Optimal Tanpa Peubah Jaringan Sosial 33

1 PENDAHULUAN Latar Belakang Pendidikan memiliki peran strategis dalam pembangunan nasional. Indonesia membutuhkan generasi muda yang memiliki kualitas pendidikan yang baik untuk menjadi bangsa yang maju dan mandiri. Generasi muda yang dimaksud tak lain adalah anak-anak Indonesia sebagai generasi penerus bangsa, sehingga sebagai perwujudannya berimplikasi pada perlunya pemberian perlindungan terhadap anak dan pemenuhan hak-haknya sebagaimana tertuang dalam Undang-Undang No.23 Tahun 2002 pasal 4 tentang perlindungan anak (Depdiknas 2009). Undang-undang ini adalah hasil ratifikasi dari konvensi hakhak anak (Convention On The Rights of The Child) yang disahkan oleh Perserikatan Bangsa-Bangsa (PBB) pada tanggal 20 Nopember 1989. Dalam undang-undang tersebut anak adalah seseorang yang belum berusia 18 Tahun. Pendidikan merupakan salah satu hak anak yang harus dipenuhi dan pemerintah memiliki kewajiban serta tanggung jawab dalam penyelenggaraan pendidikan, sehingga setiap anak Indonesia memiliki kesempatan yang sama dalam memperoleh pendidikan. Namun, pada kenyataannya tidak semua anak mempunyai kesempatan memperoleh pendidikan yang layak dan seluas-luasnya hingga menyebabkan mereka putus sekolah. Rendahnya tingkat pendidikan akan mendorong timbulnya berbagai permasalahan sosial (Rojani 2008). Salah satu faktor yang menjadi indikator rendahnya tingkat pendidikan adalah tingginya angka putus sekolah. Apabila di suatu wilayah memiliki angka putus sekolah yang tinggi, maka dapat dikatakan wilayah tersebut memiliki tingkat pendidikan yang rendah. Seiring perkembangan pengetahuan dan teknologi, pendidikan dasar sembilan tahun dirasakan masih belum cukup untuk mendapatkan kualitas sumber daya manusia yang baik sehingga dalam penelitian ini anak putus sekolah yang diamati adalah anak yang putus pada jenjang pendidikan sekolah dasar hingga sekolah menengah. Putus sekolah tidak hanya disebabkan oleh kondisi ekonomi anak namun juga dapat berasal dari kondisi lingkungan sekitarnya. Faktor lingkungan dapat berupa pola pikir masyarakat secara umum di sekitar tempat tinggal anak atau pun dari pengaruh orang-orang terdekat dalam kesehariannya. Interaksi anak dengan orang-orang disekitarnya atau sering dikenal sebagai jejaring sosial terdiri dari beberapa tingkatan mulai dari tingkatan terendah yaitu keluarga hingga tingkatan tertinggi yaitu Negara. Jaringan sosial adalah sebuah pola koneksi dalam hubungan sosial individu, kelompok dan berbagai bentuk kolektif lain. Sehingga jaringan sosial memiliki peranan penting dalam keberhasilan seseorang untuk mencapai tujuannya (Shakya et al. 2013). Menurut Badan Pusat Statistik (BPS), pada tahun 2012 persentase penduduk usia 7-17 tahun yang pernah sekolah dengan status putus sekolah di Indonesia sebesar 2.72%, artinya dari setiap 1000 orang penduduk usia 7-17 tahun terdapat 27 anak yang putus sekolah. Bila sebaran anak putus sekolah dilihat berdasarkan enam pulau besar di Indonesia yaitu Jawa, Bali-Nusa Tenggara, Kalimantan, Maluku-Papua, Sulawesi, dan Sumatera. Pada Pulau Sulawesi, terdapat fenomena

2 yang menarik yaitu seluruh provinsi di Sulawesi memiliki angka putus sekolah lebih tinggi dibandingkan angka rata-rata nasional. Agar dapat mengatasi masalah anak putus sekolah di Sulawesi, perlu dilakukan upaya untuk mengidentifikasi dan mencari faktor penyebab siswa putus sekolah baik faktor sosial ekonomi dan demografi anak maupun faktor lingkungan khususnya pengaruh jaringan sosial dalam kehidupan anak, sehingga kebijakan yang diambil oleh pemerintah dapat tepat sasaran. Salah satu cara yang dapat dilakukan untuk mengetahui karakteristik anak putus sekolah adalah dengan melakukan klasifikasi anak putus sekolah umur 7-17 tahun. Dalam literatur statistika tersedia beberapa teknik atau metode untuk melakukan klasifikasi pada peubah respon biner antara lain regresi logistik (Agresti 2007), fungsi dikriminan (Johnson and Wichern, 2002) atau Classification and Regression Tree (Izenman 2008). CART adalah salah satu metode klasifikasi nonparametrik yang dibangun dari data respon kategorik. Dibandingkan dengan regresi logistik dan fungsi dikriminan, CART memiliki kelebihan yaitu CART dapat menggunakan peubah yang sama lebih dari sekali di berbagai belahan pohon, kemampuan ini dapat mengungkap saling ketergantungan yang kompleks antar peubah (Timofeev 2004 and Gordon 2013). Pemanfaatan metode CART dalam pengambilan keputusan telah banyak dilakukan pada berbagai bidang kehidupan, diantaranya dalam bidang kesehatan yaitu CART telah digunakan oleh IFPRI (The International Food Policy Research Institute) untuk mengidentifikasi indikator-indikator kerentanan terhadap kelaparan di tingkat rumah tangga dan regional di Afrika (Yohannes dan Webb, 1999). Selain itu, Andriyashin (2005), telah mengaplikasikan CART pada data finansial modern dan menyimpulkan bahwa CART merupakan suatu metode yang sangat bermanfaat dalam aplikasi finansial modern. Menurut Sutton (2005) CART adalah pohon klasifikasi tunggal yang tidak stabil. Ketidakstabilan ini dikarenakan perubahan-perubahan kecil pada data learning akan sangat mempengaruhi hasil akurasi prediksi. Pada tahun 1996 Leo Brieman memperkenalkan tehnik bootstrap aggregating (Bagging) untuk mengatasi masalah tersebut. Bagging merupakan metode yang diterapkan pada algoritma klasifikasi, yang bertujuan meningkatkan akurasi pengklasifikasi dengan menggabungkan pengklasifikasi tunggal (Izenman 2008). Dalam penelitian ini metode CART akan digunakan untuk membentuk klasifikasi anak putus sekolah usia 7-17 tahun di Sulawesi dengan melibatkan karakteristik yang berasal dari faktor lingkungan yaitu jaringan sosial yang dimiliki oleh anak usia 7-17 tahun. Kemudian menerapkan teknik Bagging pada pohon klasifikasi CART untuk meningkatkan ketepatan klasifikasi yang dihasilkan. Pertanyaan Penelitian Berdasarkan latar belakang yang telah dijelaskan sebelumnya, maka masalah yang dibahas dalam penelitian ini adalah: 1. Bagaimana pengaruh jaringan sosial pada pohon klasifikasi karakteristik anak putus sekolah usia 7-17 tahun dengan menggunakan metode CART? 2. Bagaimana pengaruh penerapan tehnik Bagging pada pohon klasifikasi CART? 3. Bagaimana karakteristik anak putus sekolah usia 7-17 tahun di Sulawesi?

3 Tujuan Penelitian Tujuan dari penelitian ini adalah: 1. Menyusun pohon klasifikasi karakteristik anak putus sekolah usia 7-17 tahun di Sulawesi dengan menggunakan metode CART dan melihat pengaruh peubah jaringan sosial pada pohon klasifikasi yang terbentuk. 2. Melihat pengaruh penerapan tehnik Bagging pada pohon klasifikasi CART. 3. Mengidentifikasi karakteristik anak putus sekolah usia 7-17 tahun di Sulawesi. 2 TINJAUAN PUSTAKA Jaringan Sosial Jaringan sosial adalah sebuah struktur sosial yang menghubungkan individu satu dengan individu lainnya melalui dua mekanisme utama yaitu koneksi dan pengaruh dari koneksi tersebut yang pada akhirnya akan mempengaruhi perilaku atau keputusan yang diambil oleh individu tersebut (Shakya et al. 2013). Pemanfaatan jaringan sosial dalam membantu pengambilan keputusan telah banyak dilakukan oleh peneliti sebelumnya. Mansur and Yusof (2012) dalam penelitiannya menggunakan Social Network Analysis (SNA) untuk mengklasifikasikan perilaku siswa. Dalam perspektif sosial, hal utama yang mempengaruhi perilaku remaja adalah sikap dan perilaku teman-temannya yang berada di sekitarnya. Lingkungan sekitar memberikan pengaruh yang cukup besar sehingga didapatkan bahwa angka putus sekolah yang tinggi banyak ditemukan di lingkungan miskin (Crane 1991). Menurut De Witte et al. (2012), resiko putus sekolah dipengaruhi oleh faktor komunitas yaitu karakteristik lingkungan, jaringan antar teman (friends networks), kondisi pekerjaan dalam keluarga dan diskriminasi sosial. Selain dalam bidang pendidikan, jaringan sosial juga dimanfaatkan dalam bidang ekonomi. Provost et al. (2009) menggunakan metode privacy friendly social network untuk mengetahui kecenderungan konsumen dalam memilih merk suatu produk melalui iklan yang ditayangkan pada sebuah situs internet. Kecenderungan seseorang memilih produk dapat dilihat melalui interaksi sosial yang dilakukan pada situs tersebut dan didapatkan bahwa orang yang memiliki hubungan kekerabatan dan hubungan sosial yang serupa memiliki kecenderungan yang sama dalam memilih suatu produk. Dengan demikian perilaku seseorang dalam mengambil keputusan dapat dipengaruhi oleh perilaku orang lain yang berada disekitarnya.

4 Classification And Regression Tree (CART) CART adalah salah satu metode dasar dalam metode pohon keputusan. Bentuk CART bergantung pada peubah respon yang digunakan. Jika peubah respon yang digunakan adalah data kategorik maka CART menghasilkan pohon klasifikasi dan jika peubah responnya berupa data kontinu maka CART menghasilkan pohon regresi. Sebelum membangun sebuah pohon keputusan, data terlebih dahulu dipilah menjadi data learning dan data testing. Pembagian dapat dilakukan dengan proporsi data learning sebesar 90% dan data testing sebesar 10%. Data learning akan digunakan untuk membangun pohon keputusan dan data testing akan digunakan untuk validasi. Validasi dilakukan untuk melihat seberapa besar tingkat akurasi dari prediksi yang dilakukan oleh CART (Duda et al. 2000). Prosedur Pembentukan Pohon Klasifikasi Dalam membentuk sebuah pohon klasifikasi terdapat beberapa hal penting yang perlu diketahui yaitu peubah yang akan dijadikan pemilah dan nilai mana dari peubah tersebut yang menjadi pemilahnya serta ukuran pohon yang tepat sehingga pohon yang terbentuk memiliki kemampuan menduga terbaik. Prosedur pembentukan pohon klasifikasi terbagi kedalam tiga tahap yaitu: 1. Penentuan pemilah Tahapan pemilihan pemilah (Izenman 2008) : a. Menentukan jumlah kemungkinan pemilah yang terbentuk pada satu peubah. Setiap simpul akan dipilah menjadi dua bagian. Terdapat beberapa kemungkinan untuk menentukan nilai atau kriteria yang akan digunakan sebagai pemilah pada satu peubah. Kemungkinan pemilah yang terbentuk bergantung pada jenis peubah yang akan menjadi pemilah. Pada peubah ordinal atau kontinu, jumlah kemungkinan pemilah yang terbentuk adalah M-1 dengan M adalah banyaknya nilai yang berbeda pada peubah yang menjadi kandidat pemilah dan untuk peubah nominal atau kategorik, jumlah kemungkinan pemilah yang terbentuk adalah 2 M-1 1 dengan M adalah banyaknya kategori pada suatu peubah. b. Menentukan fungsi impuritas Pohon klasifikasi dibentuk dengan memilah setiap simpul menjadi dua bagian (simpul kanan dan simpul kiri) dengan tujuan agar nilai-nilai amatan pada peubah respon yang terdapat pada setiap bagian menjadi lebih homogen dibandingkan sebelum dilakukan pemilahan. Metode yang digunakan untuk mengukur penurunan tingkat keheterogenan pada setiap simpul adalah indeks Gini dengan fungsi sebagai berikut. i(t) = p(j t)p(k t) dengan i(t) adalah fungsi keheterogenan indeks gini, p(i t) adalah proporsi kelas i pada simpul t, dan p(j t) adalah proporsi kelas j pada simpul t.

c. Menentukan pemilah terbaik untuk satu peubah Setelah memilih metode pengukuran tingkat keheterogenan kemudian memilih pemilah terbaik berdasarkan kriteria goodness of split yang didefinisikan sebagai i(s, t) = i(t) P. i(t ) P. i(t ) dengan, i(s, t)= besarnya perubahan dari keheterogenan dalam simpul t yang disebabkan oleh pemilah s s = pemilah t = simpul t L = simpul kiri t R = simpul kanan P = proporsi pengamatan pada simpul kiri P = proporsi pengamatan pada simpul kanan i(t ) = nilai indeks gini pada simpul kiri i(t ) = nilai indeks gini pada simpul kanan Nilai i(s, t) dihitung pada seluruh kemungkinan pemilah yang ada. Pemilah terbaik untuk satu peubah adalah pemilah yang menghasilkan nilai i(s, t) terbesar. Pada masing-masing simpul, langkah a-c dilakukan untuk seluruh peubah kemudian peubah yang terpilih menjadi pemilah pada suatu simpul adalah peubah yang memiliki nilai i(s, t) terbesar diantara peubahpeubah penjelas yang ada. 2. Pembentukan simpul terminal Pemilahan simpul pada pembentukan pohon klasifikasi dilakukan hingga setiap simpul terpilah menjadi dua anak simpul (binary tree) dan memiliki tingkat keheterogenan terendah sehingga simpul tersebut tidak dapat dipilah lagi kemudian menjadi simpul terminal. Pada kasus ekstrim namun jarang terjadi, pohon klasifikasi dipilah hingga pada setiap simpul hanya terdapat 1 amatan. Metode lain yang dapat digunakan untuk membentuk simpul terminal adalah dengan menentukan jumlah amatan minimum pada simpul terminal yaitu 5 amatan atau dengan menetapkan besar persentase dari sejumlah data training misal 5 persen. (Duda et al. 2000) 3. Penentuan label kelas pada simpul terminal Pemberian label kelas pada simpul terminal dilakukan berdasarkan aturan jumlah terbanyak. Pemangkasan Pohon Klasifikasi Pohon klasifikasi yang telah dibentuk adalah pohon klasifikasi maksimal (T max ). bila pohon yang terbentuk sangat besar maka dapat dilakukan pemangkasan (Prunning). Pemangkasan dilakukan dengan pendekatan misclassification rate pada setiap simpul. Ukuran pemangkasan yang digunakan untuk memperoleh ukuran pohon yang layak adalah Cost complexity pruning yaitu: R (T) = R(T) + α T dengan, R(T) = Proporsi kesalahan pada sub pohon (Resubstitusion Estimate) α = kompleksitas parameter (complexity parameter) 5

6 T = ukuran banyaknya simpul terminal pohon T Untuk setiap α kita memilih sub pohon T(α) dari T max yang dapat meminimumkan R (T) yaitu, R (T(α)) = min R (T) Jika sub pohon yang terbentuk memenuhi kondisi tersebut maka sub pohon yang terbentuk disebut pohon klasifikasi optimal. Nilai α menentukan ukuran pohon yang terbentuk. Jika α=0 maka pohon yang dibangun adalah T max dimana pada setiap simpul hanya terdapat satu amatan atau dengan kata lain R(T max )=0. Jika α sangat besar maka pohon maksimal (T max ) akan dipangkas hingga yang tersisa hanya simpul utama (Izenman 2008). Pemilihan Pohon Klasifikasi Optimal Berdasarkan T max yang diperoleh, kita dapat membangun sebanyak T 1, T 2, T 3,, T M sub pohon dimana T M adalah sub pohon yang hanya terdiri atas simpul utama dan nilai α 1 <α2<α3<.<α M. Kemudian dari seluruh kemungkinan sub pohon yang terbentuk, dipilih satu sub pohon yang merupakan pohon klasifikasi optimal terbaik. Metode yang digunakan yaitu, 1. Independent test Set Uji ini digunakan bila ukuran data yang dimiliki terbilang besar. 2. Cross-Validation Uji ini digunakan bila ukuran data yang dimiliki relatif kecil. Bootstrap Aggregating (Bagging) Bagging adalah metode pertama yang berhasil meningkatkan akurasi dari algoritma tunggal dengan menggabungkan beberapa algoritma tunggal sehingga dapat mereduksi keragaman dari peubah penjelas. Tehnik Bagging cenderung memberikan peningkatan akurasi yang nyata bila diterapkan pada peubah penjelas yang tidak stabil, namun bila peubah penjelas telah stabil maka hasil yang diperoleh tidak akan jauh berbeda. Bagging CART adalah penerapan prosedur Bagging pada algoritma CART. Tehnik Bagging akan memberikan banyak versi peubah penjelas yang kemudian digabungkan. Dalam kasus klasifikasi, diambil contoh bootstrap sebanyak B contoh dari data learning dengan pemulihan. B adalah banyaknya replikasi yang dilakukan dalam teknik Bagging. Kemudian pada setiap contoh bootstrap tersebut diterapkan metode CART untuk menghasilkan prediksi kelas. Prediksi akhir merupakan kelas yang paling sering terjadi pada hasil prediksi B contoh bootstrap atau disebut prosedur majority-vote. Tingkat akurasi yang dihasilkan oleh teknik Bagging juga bergantung pada banyaknya replikasi yang dilakukan. Tingkat kesalahan klasifikasi akan stabil jika replikasi yang dilakukan antara 75-100 kali (Izenman 2008). Berdasarkan hasil simulasi yang dilakukan oleh Hastie et al. (2001) diperoleh bahwa peningkatan akurasi akan terjadi jika banyaknya replikasi ditingkatkan dari 50 sampai 100 kali dan jika lebih dari 100 kali akan menghasilkan akurasi yang tidak jauh berbeda dengan replikasi 100 kali.

7 3 METODE Data Data yang digunakan adalah data individu hasil Survei Sosial Ekonomi Nasional (SUSENAS). Susenas merupakan survei yang dirancang untuk mengumpulkan data sosial kependudukan dan dilaksanakan setiap tahun. Kuesioner Susenas terdiri atas Susenas Kor dan Susenas Modul. Susenas Kor berisi pertanyaan yang berkaitan dengan pendidikan, kesehatan, perumahan dan pertanyaan lainnya yang bersifat umum, sedangkan Susenas Modul berisi pertanyaan mengenai pengeluaran konsumsi rumah tangga (BPS 2003). Pada penelitian ini data yang digunakan adalah data yang bersumber dari Susenas Kor seluruh provinsi di Sulawesi pada Tahun 2012 yaitu Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, dan Sulawesi Barat. Sejak pertama kali dilaksanakan pada Tahun 1963, metode pengumpulan data Susenas mengalami beberapa kali perubahan. Pada Tahun 1963-1978 Susenas rutin dilakukan 2 tahun sekali, dengan cakupan hanya wilayah Pulau Jawa. Pada Tahun 1978-2004, Susenas rutin dilakukan ditiap pertengahan tahun dengan cakupan seluruh provinsi di Indonesia. Kemudian Tahun 2005-2010 pelaksanaan Susenas berubah menjadi 2 kali dalam setahun. Sejak Tahun 2011, Susenas dilaksanakan setiap triwulan untuk pendugaan tingkat nasional dan provinsi kemudian contoh kumulatif dari 4 triwulan tersebut digunakan untuk melakukan pendugaan pada tingkat kabupaten/kota. Metode sampling yang digunakan yaitu penarikan contoh tiga tahap dengan strata (three stage stratified sampling). Tahapan dari metode ini diuraikan sebagai berikut : 1. Tahap pertama, memilih n wilayah pencacahan (wilcah) dari N secara pps (Probability Proportional to Size) dengan size banyaknya rumah tangga SP2010. Wilcah adalah gabungan dari beberapa blok sensus, yang memiliki jumlah muatan rumah tangga seragam dan saling berdekatan. Status wilayah perkotaan dan perdesaan dijadikan sebagai strata yang harus ada perwakilannya dalam wilcah terpilih. 2. Tahap kedua, memilih BS pada setiap wilcah terpilih secara pps dengan size jumlah rumah tangga SP2010. Selanjutnya blok terpilih Susenas dialokasikan ke 4 triwulan. 3. Tahap ketiga, dari setiap blok sensus terpilih, dipilih 10 rumah tangga biasa secara sistematik berdasarkan hasil pemutakhiran rumah tangga. Pada tahun 2012 contoh untuk Pulau Sulawesi adalah sebanyak 37 393 rumah tangga. Jumlah contoh ini adalah kumulatif dari pengumpulan data yang diambil setiap triwulan, sehingga ada kemungkinan dalam satu tahun data triwulan awal sudah berubah ketika dianalisis pada triwulan akhir. Dalam penelitian ini dianggap perubahan tersebut tidak terjadi. Unit Analisis Pada SUSENAS 2012 di Sulawesi terdapat 37 393 rumah tangga yang terpilih sebagai contoh yang terdiri atas 153 496 individu. Data tersebut kemudian diseleksi untuk memperoleh anak usia sekolah (7-17 tahun) yang belum kawin,

8 yakni sebanyak 36 900 anak. Kemudian dari 36 900 anak diperoleh sebanyak 410 anak yang berstatus tidak pernah sekolah dan 36 490 anak yang masih bersekolah atau tidak bersekolah lagi. Penyeleksian dilanjutkan untuk memperoleh anak yang berstatus masih bersekolah atau tidak bersekolah lagi yang tinggal bersama ibu kandung dan diperoleh sebanyak 31 335 anak. Selanjutnya diamati anak yang tidak tamat SD/sederajat, SMP/sederajat, dan SMA/sederajat sebagai unit analisis yakni 11 094 anak. Dengan demikian anak putus sekolah pada penelitian ini didefinisikan sebagai anak yang berusia 7-17 tahun dengan partisipasi sekolah tidak bersekolah lagi namun belum menyelesaikan pendidikan pada jenjang terakhir yang didudukinya yaitu SD/sederajat, SMP/sederajat, atau SMA/sederajat. Peubah Penelitian Berikut ini merupakan peubah-peubah yang digunakan dalam penelitian ini. Peubah respon (Y) adalah status kelangsungan pendidikan anak dan peubah penjelas yang terdiri atas 9 peubah disajikan pada Tabel 2. Peubah respon Y: Status kelangsungan pendidikan anak 1 = Putus sekolah adalah anak yang tidak bersekolah lagi 2 = Tidak Putus Sekolah adalah anak yang masih bersekolah Tabel 1 Peubah Penjelas yang Digunakan Dalam Penelitian Nama Peubah Keterangan Kriteria X 1 Jenis Kelamin 1 = Laki-laki 2 = Perempuan X 2 Umur Kepala Rumah Tangga (tahun) X 3 Jumlah Anggota Rumah Tangga Yang tidak/belum bekerja 1 = 1-3 orang 2 = 4-6 orang 3 = > 6 orang X 4 Tingkat Pendidikan Ibu 1=Tidak pernah sekolah atau tidak tamat SD 2=Tamat SD/sederajat atau SMP/sederajat 3=Tamat SMA/sederajat ke atas X 5 Status Pekerjaan Kepala Rumah Tangga 1 = Pekerja formal 2 = Pekerja informal 3 = Tidak bekerja X 6 Status Ekonomi 1 = Jika pengeluaran rumah tangga perkapita berada di bawah garis kemiskinan 2 = Jika pengeluaran rumah tangga perkapita sama atau lebih dari garis kemiskinan

9 Nama Peubah Keterangan X 7 Klasifikasi daerah tempat tinggal 1 = Perkotaan 2 = Perdesaan X 8 Kepemilikan saudara yang putus sekolah dan tinggal serumah 1 = Ya 2 = Tidak X 9 Persentase Anak Putus Sekolah di Blok Sensus (BS) 1 tempat tinggal Anak Kriteria Metode Analisis Langkah-langkah analisis data yang dilakukan dalam penelitian ini adalah sebagai berikut: 1. Analisis data dengan menggunakan peubah penjelas X 1 -X 7 Membangun pohon klasifikasi dengan CART, dengan langkah-langkah sebagai berikut : i. Memisahkan data penelitian menjadi 2 (dua) bagian yaitu data learning dan data testing. ii. Membentuk pohon klasifikasi dengan menggunakan data learning. iii. Penghentian pembentukan pohon klasifikasi jika banyaknya objek dalam simpul terminal sebanyak 5. iv. Pemangkasan pohon klasifikasi. v. Pemilihan pohon klasifikasi optimal melalui Independent test Set. vi. Pemilihan pohon klasifikasi terbaik dengan menggunakan kriteria test relative cost. vii. Menguji keakuratan pohon klasifikasi dengan menjalankan data testing kedalam pohon klasifikasi sehingga dihasilkan angka ketepatan klasifikasi. 2. Analisis data dengan menggunakan peubah penjelas X 1 -X 9 Ulangi langkah i-vii pada tahapan 1. 3. Membandingkan ketepatan klasifikasi yang dihasilkan pada tahapan 1 dan 2, pilih pohon klasifikasi CART yang memiliki ketepatan klasifikasi yang lebih baik. 4. Penerapan Bagging CART pada pohon klasifikasi terpilih pada tahapan 3. 5. Membandingkan ketepatan klasifikasi yang dihasilkan oleh CART tunggal dan hasil klasifikasi dengan Bagging CART. 1 BS adalah wilayah yang dibentuk dengan membagi habis satu desa/kelurahan dan didalamnya terdapat beberapa satuan lingkungan setempat utuh dengan jumlah rumah tangga 80-120 ruta.

10 Gambaran mengenai alur metode analisis yang akan digunakan dapat dilihat pada Gambar 1 Mulai Menyiapkan Data Peubah sosial ekonomi dan demografi (X 1-X 7) Peubah Jaringan Sosial (X 8-X 9) Eksplorasi Data Analisis Data menggunakan X 1-X 9 Ya Penggunaan Peubah Jaringan Sosial Tidak Analisis Data menggunakan X 1-X 7 Pilah data menjadi data learning dan data testing Bentuk Pohon Klasifikasi Ya Data Learning Tidak Dibentuk dengan CART Tidak Lakukan Bagging CART pada data learning dan bentuk pohon klasifikasi Ya Bentuk Pohon Klasifikasi sampai diperoleh pohon optimal Jalankan data testing pada pohon klasifikasi dan hitung ketepatan Jalankan data testing pada pohon klasifikasi dan hitung ketepatan klasifikasi antara CART set dat X 1-X 7 dan set data X 1-X 9 Bandingkan Ketepatan Klasifikasinya dan Pilih CART terbaik Bandingkan ketepatan klasifikasi CART dan Bagging CART Pilih Klasifikasi terbaik Selesai Gambar 1 Diagram Alir Penelitian

11 4 HASIL DAN PEMBAHASAN Gambaran Umum Anak Putus Sekolah Salah satu cara untuk mengukur tingkat keberhasilan suatu daerah di bidang pendidikan adalah melalui angka putus sekolah. Semakin kecil angka putus sekolah pada suatu daerah dapat menjadi indikasi keberhasilan pemerintah dalam menerapkan kebijakan-kebijakan di bidang pendidikan yang bertujuan menekan angka putus sekolah. Pada tahun 2012, angka putus sekolah anak usia 7-17 tahun secara nasional tercatat sebesar 2.72%. Hal yang menarik adalah lima provinsi di pulau Sulawesi yaitu Sulawesi Utara (4.52%), Sulawesi Tengah (4.71%), Sulawesi Selatan (3.84%), Sulawesi Tenggara (4.54%), Gorontalo (7.09%), dan Sulawesi Barat (7.01%), seluruhnya berada di atas angka rata-rata nasional, sebagaimana terlihat pada Gambar 2. Gambar 2 Angka Putus Sekolah (APTS) Menurut Provinsi di Indonesia, Tahun 2012 Bila dibandingkan antar provinsi, Sulawesi Selatan adalah provinsi dengan angka putus sekolah terendah di Sulawesi dan Gorontalo merupakan provinsi dengan angka putus sekolah tertinggi sebelum Sulawesi Barat. Seperti yang telah diketahui bahwa dua daerah ini adalah provinsi yang terbilang baru dalam pembentukannya sehingga masih dalam tahap pembenahan disegala bidang termasuk pada bidang pendidikan. Gorontalo dan Sulawesi Barat merupakan daerah pemekaran dari provinsi induknya yaitu Sulawesi Utara dan Sulawesi Selatan. Bila dilihat lebih rinci menurut kabupaten, angka putus sekolah di pulau Sulawesi memiliki keragaman yang cukup tinggi antar kabupaten dengan angka putus sekolah terendah sebesar 1.32% di kabupaten Toraja Utara (Sulawesi Selatan) dan tertinggi 11.27% di kabupaten Gorontalo Utara (Gorontalo). Sebaran anak putus sekolah di Sulawesi dapat dilihat pada Gambar 3.

12 Gambar 3 Angka Putus Sekolah (APTS) Menurut Kabupaten di Pulau Sulawesi, Tahun 2012 Sebagaimana yang telah dijelaskan pada bab sebelumnya bahwa data yang digunakan adalah data Susenas 2012 di lima provinsi di Sulawesi. Berdasarkan hasil survei diperoleh banyaknya contoh anak berusia 7-17 tahun yang pernah/sedang bersekolah dan menjadi unit analisis dalam penelitian ini sebanyak 11 094 anak. Selanjutnya dari jumlah tersebut, anak yang putus sekolah diperoleh sebanyak 1 083 anak atau sekitar 9.7%. Bila ditinjau berdasarkan jenis kelamin, dari 5 880 anak usia sekolah yang berjenis kelamin laki-laki terdapat 12.70% anak putus sekolah, sementara itu dari 5 214 anak usia sekolah yang berjenis kelamin perempuan terdapat 6.44% anak putus sekolah. Hal ini menunjukkan bahwa proporsi anak laki-laki yang putus sekolah lebih besar dibandingkan dengan anak perempuan. Selengkapnya dapat dilihat pada Gambar 4. Di Sulawesi, anak laki-laki lebih banyak berhenti sekolah kemudian bekerja untuk membantu ekonomi keluarga, berdasarkan Susenas 2012 diperoleh bahwa anak laki-laki usia 10-17 tahun di Sulawesi yang bekerja sebanyak 33.23% sedangkan anak perempuan hanya sebesar 7.15%.

13 Gambar 4 Persentase Anak Putus Sekolah Menurut Jenis Kelamin di Sulawesi, Tahun 2012 Secara ekonomi semakin banyak anggota rumah tangga akan semakin banyak biaya yang dikeluarkan. Anggota rumah tangga yang belum bekerja menjadi tanggungan bagi yang sudah bekerja. Sehingga besarnya beban ketergantungan dalam satu rumah tangga sebanding dengan banyaknya anggota rumah tangga yang tidak/belum bekerja. Pada masyarakat yang memiliki tingkat ekonomi menengah kebawah, pemenuhan kebutuhan akan pendidikan bukan merupakan prioritas utama sehingga bila beban ekonomi yang harus ditanggung cukup besar pemenuhan pendidikan bagi anak akan dikesampingkan (Nurdinawati 2013). Hal ini juga tercermin pada kondisi anak putus sekolah di Sulawesi yang disajikan pada Tabel 2. Berdasarkan hasil Susenas, anak yang tinggal di rumah tangga dengan jumlah tanggungan yang sedikit memiliki proporsi putus sekolah yang lebih rendah dibandingkan anak yang tinggal di rumah tangga yang jumlah tanggungannya sebanyak 4-6 orang. Demikian halnya dengan anak yang tinggal dengan rumah tangga yang jumlah tanggungannya sedang (4-6 orang) memiliki proporsi anak putus sekolah yang lebih rendah dibandingkan anak yang tinggal di rumah tangga yang jumlah tanggungannya banyak (> 6 orang). Tabel 2 Distribusi Persentase Status Bersekolah Anak Berdasarkan Jumlah Anggota Rumah Tangga yang Tidak/Belum Bekerja di Sulawesi, Tahun 2012 Jumlah ART yang Tidak/Belum Bekerja Putus Sekolah Status Bersekolah Tidak Putus Sekolah Jumlah < 4 orang 8.36 91.64 100.00 4-6 orang 10.52 89.48 100.00 > 6 orang 10.79 89.21 100.00 Jumlah 9.76 90.24 100.00

14 Pendidikan yang berhasil dicapai oleh seorang anak tidak terlepas dari peran orang tua. Pendidikan orangtua memberikan pengaruh yang kuat terhadap wawasan tentang arti penting pendidikan bagi anak. Orangtua yang berpendidikan cenderung melakukan investasi pendidikan bagi anak mereka (Sclutz 1989). Ibu sebagai orang tua yang lebih dekat dengan anak memiliki peran utama dalam mendidik anakanaknya. Jika dilihat dari tingkat pendidikan ibu yang disajikan pada Tabel 3, proporsi anak putus sekolah usia 7-17 tahun paling tinggi terdapat pada anak yang ibunya berpendidikan rendah, yaitu tidak memiliki ijazah/sttb Sekolah Dasar (SD). Demikian halnya proporsi putus sekolah pada anak dengan ibu yang berpendidikan menengah (memiliki ijzah SD-SMP) lebih besar dibandingkan dengan anak yang ibunya berpendidikan tinggi (minimal memiliki ijazah SMA). Tabel 3 Distribusi Persentase Status Bersekolah Anak Berdasarkan Tingkat Pendidikan Ibu di Sulawesi, Tahun 2012 Tingkat Pendidikan Ibu Putus Sekolah Status Bersekolah Tidak Putus Sekolah Jumlah < SD 15.09 84.91 100.00 SD - SMP 7.88 92.12 100.00 SMA 4.38 95.62 100.00 Jumlah 9.76 90.24 100.00 Berdasarkan Tabel 3 terlihat bahwa proporsi anak putus sekolah yang tinggal dengan kepala rumah tangga yang bekerja di sektor formal lebih kecil jika dibandingkan dengan anak yang tinggal dengan kepala rumah tangga yang bekerja di sektor informal. Demikian halnya jika dibandingkan dengan anak yang tinggal dengan kepala rumah tangga yang tidak bekerja. Dalam hal ini dapat dikatakan, semakin baik pekerjaan kepala rumah tangga maka proporsi anak putus sekolah akan semakin kecil. Hal ini sejalan dengan penelitian Rojani (2008) yang menyatakan bahwa angka melanjutkan sekolah bagi anak yang kepala rumah tangganya bekerja di sektor formal lebih besar daripada informal pada setiap jenjang pendidikan. Tabel 4 Distribusi Persentase Status Bersekolah Anak Berdasarkan Status Pekerjaan Kepala Rumah Tangga (KRT) di Sulawesi, Tahun 2012 Status Pekerjaan KRT Status Bersekolah Putus Sekolah Tidak Putus Sekolah Jumlah Tidak Bekerja 12.12 87.88 100.00 Informal 10.49 89.51 100.00 Formal 7.19 92.81 100.00 Jumlah 9.76 90.24 100.00 Jika dilihat berdasarkan status ekonomi rumah tangga yang disajikan pada Gambar 5, proporsi anak yang putus sekolah lebih banyak terdapat pada anak yang berasal dari rumah tangga miskin yaitu rumah tangga yang pengeluaran perkapita perbulannya berada di bawah garis kemiskinan yakni sebesar 13.80%. Hal ini sejalan dengan temuan Psacharopoulos and Woodhall (1985) yakni tingkat

pendapatan keluarga memiliki pengaruh yang cukup besar pada jumlah pendaftar sekolah di jenjang pendidikan dasar, menengah, dan tinggi. Hasil penelitian lain mengatakan bahwa tingkat kesejahteraan keluarga merupakan salah satu faktor dominan dalam menentukan keputusan seorang anak akan tetap bersekolah atau putus sekolah (Hilliry 1995). 15 Gambar 5 Persentase Anak Putus Sekolah Menurut Status Ekonomi Rumah Tangga di Sulawesi, Tahun 2012 Jika ditelusuri berdasarkan wilayah tempat tinggal anak yang disajikan pada Gambar 6, dari 2 568 anak usia 7-17 tahun yang tinggal di perkotaan terdapat 7,87% yang harus mengalami putus sekolah, sedangkan di wilayah pedesaan angka putus sekolahnya mencapai 10,33% dari sekitar 8 526 anak yang masih termasuk usia sekolah. Hal ini dimungkinkan akibat kurangnya fasilitas sekolah di pedesaan dan lebih banyaknya penduduk miskin di pedesaan. Menurut hasil Susenas 2012 di Sulawesi, penduduk miskin yang tinggal di pedesaan sebesar 22.66% sementara yang tinggal di perkotaan sebesar 12.27%. Gambar 6 Persentase Anak Putus Sekolah Menurut Klasifikasi Tempat Tinggal di Sulawesi, Tahun 2012

16 Banyak faktor yang dapat menjadi penyebab anak usia 7-17 tahun mengalami putus sekolah, baik dari faktor sosial ekonomi maupun demografi. Bila ditelusuri lebih dalam mengenai alasan mengapa mereka pada akhirnya harus berhenti ditengah jalan sebelum menyelesaikan jenjang pendidikan yang pernah didudukinya, didapatkan bahwa dari 9.7% anak putus sekolah, sebanyak 30.66% berhenti karena harus bekerja atau mencari nafkah kemudian sebanyak 24.75% beralasan tidak memiliki biaya untuk melanjutkan sekolah. Dengan demikian lebih dari separuh anak yang putus sekolah disebabkan oleh faktor ekonomi. Selengkapnya dapat dilihat pada Tabel 5. Tabel 5 Persentase Anak Usia 7-17 Tahun yang Tidak Bersekolah Lagi Menurut Alasannya No. Uraian Persentase 1 Tidak ada biaya 24.75 2 Bekerja atau mencari nafkah 30.66 3 Menikah atau mengurus rumah tangga 3.23 4 Merasa pendidikan cukup 15.70 5 Malu karena ekonomi 2.77 6 Sekolah jauh 11.73 7 Cacat 0.09 8 Lainnya 11.08 Hubungan Peubah Penjelas dan Peubah Respon Setelah mengetahui gambaran umum mengenai karakteristik anak putus sekolah usia 7-17 tahun di Sulawesi selanjutnya dilakukan pengujian terhadap sembilan peubah penjelas yang diduga memiliki hubungan dengan peubah respon yaitu status bersekolah anak usia 7-17 tahun. Pengaruh peubah penjelas yang berskala kategorik yaitu jenis kelamin, jumlah anggota rumah tangga yang tidak/belum bekerja, tingkat pendidikan ibu, status pekerjaan kepala rumah tangga, status ekonomi rumah tangga, klasifikasi daerah tempat tinggal, dan kepemilikan saudara putus sekolah yang tinggal serumah terhadap status sekolah anak usia 7-17 tahun akan diuji satu per satu dengan menggunakan tabulasi silang. Hipotesis untuk masing-masing pasangan peubah respon dan peubah penjelas adalah sebagai berikut: H 0 : Tidak ada hubungan antara peubah status sekolah anak usia 7-17 tahun dengan peubah jenis kelamin, jumlah anggota rumah tangga yang tidak/belum bekerja, tingkat pendidikan ibu, status pekerjaan kepala rumah tangga, status ekonomi rumah tangga, klasifikasi daerah tempat tinggal, dan kepemilikan saudara putus sekolah yang tinggal serumah. H 1 : Ada hubungan antara peubah status sekolah anak usia 7-17 tahun dengan peubah jenis kelamin, jumlah anggota rumah tangga yang tidak/belum bekerja, tingkat pendidikan ibu, status pekerjaan kepala rumah tangga, status ekonomi rumah tangga, klasifikasi daerah tempat tinggal, dan kepemilikan saudara putus sekolah yang tinggal serumah.

Tabel 6 Nilai Koefisien Asosiasi dan Nilai-p yang diperoleh dari Hasil Tabulasi Silang antara Peubah Penjelas dan Peubah Respon Uraian Peubah Penjelas Koefisiaen Asosiasi Nilai-p Jenis Kelamin 0.105 0.000 Jumlah ART yang Tidak/Belum Bekerja 0.140 0.000 Tingkat Pendidikan Ibu 0.152 0.000 Status Pekerjaan KRT 0.051 0.000 Status Ekonomi 0.068 0.000 Kalsifikasi Daerah Tempat Tinggal 0.035 0.000 Kepemilikan Saudara Putus Sekolah 0.298 0.000 Hasil pada Tabel 6, memberikan kesimpulan yang sama untuk seluruh peubah penjelas yakni menolak H 0 pada taraf nyata 0.05. Hal ini berarti peubah status bersekolah anak usia 7-17 tahun memiliki hubungan dengan peubah jenis kelamin, jumlah anggota rumah tangga yang tidak/belum bekerja, tingkat pendidikan ibu, status pekerjaan kepala rumah tangga, status ekonomi rumah tangga, klasifikasi daerah tempat tinggal, dan kepemilikan saudara putus sekolah yang tinggal serumah. Namun demikian, seperti terlihat pada besarnya koefisien asosiasi, keeratan hubungan yang dimiliki oleh masing-masing peubah penjelas dengan peubah status sekolah anak sangat kecil. Artinya walaupun hubungan antara peubah penjelas dengan status sekolah anak itu nyata secara statistik tetapi secara praktis nampaknya tidak bermakna. Ini terjadi ketika jumlah contoh sangat besar seperti pada kasus ini. Selanjutnya, untuk melihat hubungan peubah penjelas yang berskala rasio yaitu umur kepala rumah tangga dan persentase anak putus sekolah di blok sensus tempat tinggal anak dengan peubah respon digunakan uji beda rata-rata. Hipotesis uji beda dua rata-rata antara peubah umur kepala rumah tangga dan status bersekolah anak usia 7-17 tahun adalah sebagai berikut: H 0 : μ 1 - μ 2 = 0 Artinya, rata-rata umur kepala rumah tangga dari anak yang berstatus putus sekolah dan tidak putus sekolah adalah sama. H 1 : μ 1 - μ 2 0 Artinya, rata-rata umur kepala rumah tangga dari anak yang berstatus putus sekolah dan tidak putus sekolah adalah tidak sama. Hipotesis uji beda dua rata-rata antara peubah persentase anak putus sekolah di blok sensus tempat tinggal anak dan status bersekolah anak usia 7-17 tahun adalah sebagai berikut: H 0 : μ 1 - μ 2 = 0 Artinya, rata-rata persentase anak putus sekolah di Blok Sensus tempat tinggal anak yang berstatus putus sekolah dan tidak putus sekolah adalah sama. H 1 : μ 1 - μ 2 0 Artinya, rata-rata persentase anak putus sekolah di Blok Sensus tempat tinggal anak yang berstatus putus sekolah dan tidak putus sekolah adalah tidak sama. 17

18 Tabel 7 Hasil Uji-t pada Uji Beda Dua Rata-rata dari Status Sekolah Anak untuk masing-masing Peubah Penjelas Uraian Peubah Penjelas t-hitung Nilai-p Umur Kepala Rumah Tangga 8.79 0.000 Persentase Anak Putus Sekolah di Blok Sensus Tempat Tinggal Anak 50.68 0.000 Pada Tabel 7, hasil uji beda dua rata-rata untuk kedua peubah penjelas memberikan kesimpulan yang sama yakni tolak H 0 pada taraf nyata 0.05. Hal ini menunjukkan bahwa peubah rata-rata umur kepala rumah tangga dan persentase anak putus sekolah di Blok Sensus tempat tinggal anak dari anak yang berstatus putus sekolah dan tidak putus sekolah adalah tidak sama. Pohon Klasifikasi Pembentukan klasifikasi dengan membangun pohon klasifikasi CART diawali dengan membagi data menjadi data learning dan data testing. Secara khusus belum ada literatur yang menyebutkan berapa proporsi terbaik antara data learning dan data testing, namun proporsi data learning harus lebih besar dibandingkan data testing (Breiman 1984 dalam Duda et al. 2000). Pada penelitian ini proporsi data learning dan testing masing-masing adalah 80% dan 20% atau masing-masing sebanyak 8.735 dan 2.359 contoh. Pohon klasifikasi dikembangkan dengan menggunakan metode pemilahan gini sebagai kriteria pemilahan (goodness of split) dan kriteria penghentian pembentukan pohon dipilih berdasarkan jumlah pengamatan dalam tiap simpul anak minimal 5 (Duda et al. 2000). Pembentukan pohon klasifikasi dimulai dengan pembentukan pohon klasifikasi maksimal yang menghasilkan pohon klasifikasi yang sangat besar dengan struktur data yang kompleks. Hal ini akan menyebabkan nilai kompleksitas yang tinggi sehingga perlu dilakukan pemangkasan untuk mendapatkan pohon optimum yang berukuran sederhana. Pemangkasan dilakukan dengan menggunakan kaidah biaya relatif gugus pengujian (test set relative cost) terkecil yang dihitung dengan pendekatan dugaan contoh uji (test sample estimate). Sesuai dengan tujuan penelitian yang telah dijelaskan sebelumnya bahwa penelitian ini ingin mengetahui pengaruh penambahan peubah jaringan sosial pada pohon klasifikasi CART yang dibangun. Klasifikasi akan dilakukan dengan terlebih dahulu membangun pohon klasifikasi CART tanpa memasukkan peubah jaringan sosial kemudian membangun pohon klasifikasi CART dengan memasukkan peubah jaringan sosial. Berikut adalah hasil dari pembentukan pohon klasifikasi.