KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

dokumen-dokumen yang mirip
KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

KLASIFIKASI PENYAKIT DIABETES MELITUS DENGAN METODE CHAID (CHI SQUARE AUTOMATIC INTERACTION DETECTION) DAN CART (CLASSIFICATION AND REGRESSION TREE)

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES)

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART ( CLASSIFICATION AND REGRESSION TREES ) ( STUDI KASUS PENYAKIT DIABETES SUKU PIMA INDIAN )

MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) UNTUK KLASIFIKASI STATUS KERJA DI KABUPATEN DEMAK

PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA QUEST (QUICK, UNBIASED, AND EFFICIENT STATISTICAL TREE) PADA DATA PASIEN LIVER

BAB I PENDAHULUAN. atau benda ke dalam golongan atau pola-pola tertentu berdasarkan kesamaan ciri.

METODE QUEST DAN CHAID PADA KLASIFIKASI KARAKTERISTIK NASABAH KREDIT

SKRIPSI. Disusun Oleh : ZULFA WAHYU MARDIKA NIM. J2E

KETEPATAN KLASIFIKASI KEIKUTSERTAAN KELUARGA BERENCANA MENGGUNAKAN REGRESI LOGISTIK BINER DAN REGRESI PROBIT BINER

BAB II LANDASAN TEORI

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

SKRIPSI. Disusun oleh: DHINDA AMALIA TIMUR

IDENTIFIKASI VARIABEL YANG MEMPENGARUHI BESAR PINJAMAN DENGAN METODE POHON REGRESI (Studi Kasus di Unit Pengelola Kegiatan PNPM Mandiri)

SKRIPSI. Disusun Oleh : DINI PUSPITA JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

Seminar Tugas Akhir. Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING. Surabaya, Juli 2011

SKRIPSI. Disusun Oleh : RAHMA NURFIANI PRADITA

KLASIFIKASI TINGKAT KELANCARAN NASABAH DALAM MEMBAYAR PREMI DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL DAN NAÏVE BAYES SKRIPSI

PEMODELAN TINGKAT PENGANGGURAN TERBUKA DI PROVINSI JAWA TENGAH MENGGUNAKAN REGRESI SPLINE

PERBANDINGAN ANALISIS KLASIFIKASI MENGGUNAKAN METODE K-NEAREST NEIGHBOR

BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

APLIKASI REGRESI DATA PANEL UNTUK PEMODELAN TINGKAT PENGANGGURAN TERBUKA KABUPATEN/KOTA DI PROVINSI JAWA TENGAH

IDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI MAHASISWA PASCASARJANA IPB BERHENTI STUDI MENGGUNAKAN ANALISIS CHAID DAN REGRESI LOGISTIK

KLASIFIKASI RUMAH LAYAK HUNI DI KABUPATEN BREBES DENGAN MENGGUNAKAN METODE LEARNING QUANTIZATION DAN NAIVE BAYES

METODE QUEST DAN CHAID PADA KLASIFIKASI KARAKTERISTIK NASABAH KREDIT [SKRIPSI] KOMPETENSI STATISTIKA

Klasifikasi Kegiatan Partisipasi Ekonomi Perempuan Di Jawa Timur Dengan Pendekatan CART (Classification And Regression Trees)

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) UNTUK KLASIFIKASI STATUS KERJA DI KABUPATEN DEMAK Kishartini 1, Diah Safitri 2, Dwi Ispriyanti 3

KLASIFIKASI DATA BERAT BAYI LAHIR MENGGUNAKAN. (Studi Kasus di Rumah Sakit Islam Sultan Agung Semarang Tahun 2014)

PEMODELAN REGRESI 3-LEVEL DENGAN METODE ITERATIVE GENERALIZED LEAST SQUARE (IGLS) (Studi Kasus: Lamanya pendidikan Anak di Kabupaten Semarang)

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

PEMODELAN GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION

BAB I PENDAHULUAN 1.1.Latar Belakang Masalah

PEMODELAN INDEKS PEMBANGUNAN MANUSIA DI PROVINSI JAWA TENGAH TAHUN DENGAN MENGGUNAKAN REGRESI DATA PANEL

Faktor-Faktor Yang Mem pengaruhi Waktu Penyusunan Tugas Akhir Mahasiswa S1 (Studi Kasus : Mahasiswa FMIPA Unsyiah)

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM)

ANALISIS KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA FEM DAN FAPERTA MENGGUNAKAN METODE CHART

PENENTUAN MODEL KEMISKINAN DI JAWA TENGAH DENGAN MULTIVARIATE GEOGRAPHICALLY WEIGHTED REGRESSION (MGWR)

Implementasi Metode Chi-Squared Automatic Interaction Detection pada Klasifikasi Indeks Prestasi Kumulatif Mahasiswa FMIPA UNIROW

PENERAPAN METODE CART

ANALISIS KEPUASAN PESERTA KURSUS KOMPUTER MENGGUNAKAN METODE CHAID BERBASIS KOMPUTER

PENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA DIMAS FAJAR AIRLANGGA

Oleh TRI SEPTIYANI M SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN METODE CHAID (CHI-SQUARED AUTOMATIC INTERACTION DETECTION) DAN EXHAUSTIVE CHAID PADA KLASIFIKASI PRODUKSI JAGUNG DI PULAU JAWA

DEPARTEMEN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

METODE CART DAN CHAID UNTUK PENGKLASIFIKASIAN MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS JEMBER

KLASIFIKASI KELULUSAN MAHASISWA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS)

PEMODELAN VARIABEL-VARIABEL PENGELUARAN RUMAH TANGGA UNTUK KONSUMSI TELUR ATAU SUSU DI KABUPATEN MAGELANG MENGGUNAKAN REGRESI TOBIT

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEPUASAN MAHASISWA DALAM PEMILIHAN JURUSAN MENGGUNAKAN STRUCTURAL EQUATION MODELING

JURNAL SAINS DAN SENI POMITS Vol. 3, No.1, (2014) ( X Print) D-54

SKRIPSI. Disusun oleh: Alin Citra Suardi

BAB III METODE CHI-SQUARED AUTOMATIC INTERACTION DETECTION

Klasifikasi Penderita Diabetes Melitus dengan Metode CHAID (Chi-Squared Automatic Interaction Detection) dan CART (Classification and Regression Tree)

ANALISIS CHAID UNTUK IDENTIFIKASI KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA

SKRIPSI. Disusun Oleh: MAS AD DEPARTEMEN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG 2016

PERBANDINGAN ANALISIS DISKRIMINAN FISHER DAN NAIVE BAYES UNTUK KLASIFIKASI RISIKO KREDIT

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEMISKINAN DI JAWA TENGAH MENGGUNAKAN MODEL GALAT SPASIAL

IDENTIFIKASI LAMA STUDI BERDASARKAN KARAKTERISTIK MAHASISWA MENGGUNAKAN ALGORITMA C4.5

PEMODELAN PREFERENSI PENGAJUAN KREDIT USAHA MIKRO (KUM) DI BANK X OLEH PEMILIK USAHA MIKRO DI SURABAYA DENGAN METODE CHAID

MENGIDENTIFIKASI DATA REKAM MEDIS. (Studi Kasus Penyakit Diabetes Mellitus di Balai Kesehatan Kementerian. Perindustrian, Jakarta) SKRIPSI

BAB III METODOLOGI PENELITIAN

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA

ANALISIS HUBUNGAN ANTARA LAMA STUDI, JALUR MASUK DAN INDEKS PRESTASI KUMULATIF (IPK) MENGGUNAKAN MODEL LOG LINIER

BAB III LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. konsep-konsep dasar pada QUEST dan CHAID, algoritma QUEST, algoritma

SKRIPSI. Disusun oleh : OKA AFRANDA

METODE KAJIAN Pengumpulan Data

PERBANDINGAN KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES) Abstract

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENERIMAAN PESERTA DIDIK SMA NEGERI 2 SEMARANG MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL

ANALISIS JALUR TERHADAP FAKTOR-FAKTOR YANG MEMPENGARUHI INDEKS PRESTASI KUMULATIF (IPK) MAHASISWA STATISTIKA UNDIP

SKRIPSI. Disusun Oleh : YUSUF ARIFKA RAHMAN

PREFERENSI KARAKTERISTIK KOPI 3 IN 1 MENGGUNAKAN METODE POHON REGRESI DAN KLASIFIKASI FITRIYANTO

FAKTOR-FAKTOR YANG MEMPENGARUHI KRIMINALITAS DI KABUPATEN BATANG TAHUN 2013 DENGAN ANALISIS JALUR

PEMODELAN LAJU KESEMBUHAN PASIEN RAWAT INAP TYPHUS ABDOMINALIS

PEMBENTUKAN POHON KLASIFIKASI DENGAN METODE CHAID

PENDUGAAN PENGELUARAN PER KAPITA DI KABUPATEN BREBES

PEMODELAN REGRESI 2-LEVEL DENGAN METODE ITERATIVE GENERALIZED LEAST SQUARE (IGLS) (Studi Kasus: Tingkat pendidikan Anak di Kabupaten Semarang)

PEMBENTUKAN MODEL DATA PANEL FIXED EFFECT MENGGUNAKAN GUI MATLAB

ANALISIS LAPANGAN PEKERJAAN UTAMA DI JAWA TENGAH BERDASARKAN GRAFIK BIPLOT SQRT (SQUARE ROOT BIPLOT)

SEGMENTASI PASAR MENGGUNAKAN METODE CHI-SQUARED AUTOMATIC INTERACTION DETECTION (CHAID) (Studi Kasus di PD. BPR-BKK Purwokerto Utara)

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI REGRESI LOGISTIK MULTINOMIAL

Analisis Faktor-Faktor yang Mempengaruhi Tingkat Kelahiran di Kabupaten Brebes dengan Pendekatan Regresi Logistik Biner

METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG

KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN FUZZY K-NEAREST NEIGHBOR (FK-NN)

Seminar Hasil Tugas Akhir

BAB III METODE CHAID EXHAUSTIVE

ANALISIS IPK MAHASISWA PENERIMA BEASISWA BIDIK MISI IPB DENGAN PENDEKATAN METODE CHAID FERRY ANTONI MS

BAB II TINJAUAN PUSTAKA. Ki Hajar Dewantara (Bapak Pendidikan Nasional Indonesia, )

Analisis CART (Classification And Regression Trees) pada Faktor-Faktor yang Mempengaruhi Kepala Rumah Tangga di Jawa Timur Melakukan Urbanisasi

BAB I PENDAHULUAN. Universitas Pendidikan Indonesia repository.upi.edu

PEMODELAN JUMLAH UANG BEREDAR MENGGUNAKAN PARTIAL LEAST SQUARES REGRESSION (PLSR) DENGAN ALGORITMA NIPALS (NONLINEAR ITERATIVE PARTIAL LEAST SQUARES)

SKRIPSI. Disusun oleh LANDONG PANAHATAN HUTAHAEAN

Judul : Analisis Pilihan Pekerjaan Setengah Penganggur bagi Angkatan Kerja di Kota Denpasar Nama : Putu Diah Arya Purnama Dewi NIM :

KLASIFIKASI KEIKUTSERTAAN KELUARGA DALAM PROGRAM KELUARGA BERENCANA (KB) DI KOTA SEMARANG MENGGUNAKAN METODE MARS DAN FK-NNC

ANALISIS PENGARUH KURS RUPIAH TERHADAP INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN DISTRIBUTED LAG MODEL SKRIPSI

Transkripsi:

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART SKRIPSI Disusun Oleh : NOVIE ERISKA ARITONANG 24010211140081 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG 2015

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART Oleh : NOVIE ERISKA ARITONANG 24010211140081 Diajukan Sebagai Salah Satu Syarat Memperoleh Gelar Sarjana Sains pada Jurusan Statistika Fakultas Sains dan Matematika Universitas Diponegoro JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG 2015

KATA PENGANTAR Puji syukur penulis ucapkan kepada Tuhan Yesus Kristus yang telah memberikan kasih dan anugerah-nya sehingga penulis dapat menyelesaikan Tugas Akhir yang berjudul Klasifikasi Status Kerja pada Angkatan Kerja Kota Semarang Tahun 2014 Menggunakan Metode CHAID dan CART. Tugas akhir ini tidak akan selesai dengan baik tanpa adanya bantuan dan dukungan dari berbagai pihak. Ucapan terimakasih penulis haturkan kepada: 1. Ibu Dra. Dwi Ispriyanti, M.Si. selaku Ketua Jurusan Statistika Fakultas Sains dan Matematika Universitas Diponegoro. 2. Bapak Drs. Agus Rusgiyono, M.Si dan Ibu Rita Rahmawati, S.Si, M. Si selaku dosen pembimbing I dan dosen pembimbing II yang telah memberikan bimbingan dan pengarahan dalam penulisan Tugas Akhir ini. 3. Bapak dan Ibu Dosen Jurusan Statistika Universitas Diponegoro yang telah memberikan ilmu yang bermanfaat. 4. Semua pihak yang tidak dapat disebutkan satu per satu yang telah mendukung penulis dalam menyelesaikan tugas akhir ini. Penulis berharap Tugas Akhir ini dapat bermanfaat bagi seluruh civitas akademika di Universitas Diponegoro khususnya Jurusan Statistika dan masyarakat pada umumnya. Semarang, Desember 2015 Penulis

ABSTRAK Pertumbuhan angkatan kerja akan meningkat seiring dengan meningkatnya jumlah penduduk. Peningkatan jumlah angkatan kerja ini tentu saja akan berdampak pada status kerjanya, apakah bekerja atau tidak bekerja. Metode yang dapat digunakan untuk melakukan klasifikasi status kerja pada angkatan kerja adalah CHAID (Chi-squared Automatic Interaction Detection) dan CART (Classification and Regression Trees). Kedua metode ini bertujuan untuk mengetahui faktor-faktor apa saja yang mempengaruhi status kerja dari angkatan kerja. Data yang digunakan adalah data angkatan kerja Kota Semarang pada tahun 2014. Berdasarkan metode CHAID faktor-faktor yang mempengaruhi status kerja dari angkatan kerja adalah jenis kelamin, usia serta status kelengkapan pasangan hidup dengan ketepatan hasil klasifikasi sebesar 72,63%. Faktor-faktor yang mempengaruhi status kerja dari angkatan kerja dengan metode CART adalah jenis kelamin, usia, status pendidikan, serta status kelengkapan pasangan hidup dengan ketepatan hasil klasifikasi sebesar 72,79%. Berdasarkan uji proporsi masingmasing metode diperoleh bahwa kedua metode tersebut tidak berbeda signifikan dalam melakukan klasifikasi. Kata kunci: Angkatan kerja, Klasifikasi, CHAID, CART, Ketepatan klasifikasi

ABSTRACT The growth of labor will increase along with increasing population. Increasing the number of this labor of course going to have an impact on his status, whether employ or unemployed. The method can be used to classify the status of the labor is CHAID (Chi-squared Automatic Interaction Detection) and CART (Classification and Regression Trees). Both of these methods aim to identify factors that influence employment status. These methods will be applied for Semarang labor in 2014. Based on CHAID method, the factors that affect the status of the labor is gender, age and status of the completeness of a life partner with accuracy classification results amounted to 72.63%. Factors that affect the status of the labor force with the CART method is gender, age, educational status, and the status of the completeness of a life partner with the accuracy of the classification is 72.79%. Based on proportion test, these methods are same of doing classification employment status. Keywords: Labor, Classification, CHAID, CART, Accuracy of classification

DAFTAR ISI Halaman HALAMAN JUDUL... HALAMAN PENGESAHAN I... HALAMAN PENGESAHAN II... KATA PENGANTAR... ABSTRAK... ABSTRACT... DAFTAR ISI... DAFTAR SIMBOL... DAFTAR GAMBAR... DAFTAR TABEL... DAFTAR LAMPIRAN... i ii iii iv v vi vii x xii xiii xv BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 4 1.3 Batasan Masalah... 4 1.4 Tujuan... 4 BAB II TINJAUAN PUSTAKA... 5 2.1 Angkatan Kerja... 5 2.2 Skala Pengukuran... 8 2.3 CHAID... 9 2.3.1 Konsep CHAID... 9 2.3.2 Variabel-variabel dalam analisis CHAID... 10

2.3.3 Uji Independensi χ (Chi-Square)... 11 2.3.4 Langkah Kerja CHAID... 12 2.3.5 Koreksi Bonferroni... 14 2.3.6 Struktur Pohon Klasifikasi CHAID... 15 2.4 CART... 17 2.4.1 Konsep CART... 17 2.4.2 Struktur Pohon Klasifikasi CART... 17 2.4.3 Langkah Kerja CART... 19 2.5 Ukuran Kinerja Klasifikasi... 24 BAB III METODOLOGI PENELITIAN... 27 3.1 Sumber Data... 27 3.2 Variabel Penelitian... 27 3.3 Tahapan Analisis... 28 3.4 Diagram Alir... 30 BAB IV HASIL DAN PEMBAHASAN... 34 4.1 Analisis Deskriptif Data... 34 4.1.1 Status kerja menurut hubungan dalam rumah tangga... 34 4.1.2 Status kerja menurut jenis kelamin... 35 4.1.3 Status kerja menurut usia... 36 4.1.4 Status kerja menurut kelengkapan pasangan hidup... 36 4.1.5 Status kerja menurut pendidikan... 37 4.1.6 Status kerja menurut pelatihan kerja... 38 4.2 Analisis Klasifikasi Status Angkatan Kerja dengan CHAID... 38 4.2.1 Penggabungan Kategori... 39

4.2.2 Uji independensi variabel independen dengan variabel dependen... 43 4.2.3 Interpretasi hasil klasifikasi... 57 4.3 Analisis Klasifikasi Status Angkatan Kerja dengan CART... 59 4.3.1 Proses pemecahan simpul... 60 4.3.2 Proses pemangkasan pohon... 67 4.3.3 Interpretasi hasil klasifikasi... 72 4.4 Evaluasi Ketepatan Klasifikasi... 74 BAB V KESIMPULAN... 76 DAFTAR PUSTAKA... 77 LAMPIRAN... 78

DAFTAR SIMBOL O : Observasi yang memenuhi sifat variabel pertama kriteria ke-i dan variabel kedua kriteria ke-j, i=1,2,...,r dan j=1,2,...,c E : Nilai harapan observasi yang memenuhi sifat variabel pertama kriteria ke-i dan variabel kedua kriteria ke-j : banyak pengamatan pada baris ke-i kriteria ke-i : banyak pengamatan pada kolom ke-j kriteria ke-j r c a b : banyak kriteria pada variabel pertama : banyak kriteria pada variabel kedua : banyak kategori variabel independen sebelum penggabungan : banyak kategori variabel independen setelah penggabungan n : frekuensi variabel dependen kategori 1 X. B m : variabel independen ke-i kategori ke-j : pengali Bonferroni : nilai terendah dari kategori Δi(s,t) : fungsi pengurangan keragaman pada node t dengan kriteria pemecah s I(t) : fungsi keragaman indeks Gini p(ai t) : peluang kelas i pada node t p(aj t) : peluang kelas j pada node t T T T : pohon klasifikasi maksimal : cabang dari T : banyak simpul-simpul akhir dari pohon klasifikasi

t t : simpul anak kiri : simpul anak kanan, : data yang diklasifikasikan secara benar, : data yang diklasifikasikan tidak tepat P P : proporsi metode CHAID : proporsi metode CART : ukuran sampel pada metode CHAID : ukuran sampel pada metode CART P : proporsi gabungan : probabilitas pada kategori 1 : probabilitas pada kategori 2

DAFTAR TABEL Halaman Tabel 1. Matriks konfusi untuk klasifikasi dua kelas... 25 Tabel 2. Sub tabulasi silang untuk kategori 1 dan kategori 2... 39 Tabel 3. Sub tabulasi silang untuk kategori 2 dan kategori 3... 40 Tabel 4. Keputusan hasil penggabungan kategori... 41 Tabel 5. Sub tabulasi silang untuk penggabungan kategori baru... 42 Tabel 6. Tabulasi silang status hubungan dalam rumah tangga dengan status kerja... 43 Tabel 7. Tabulasi silang jenis kelamin dengan status kerja... 45 Tabel 8. Tabulasi silang usia dengan status kerja... 46 Tabel 9. Tabulasi silang status status kelengkapan pasangan hidup dengan status kerja... 47 Tabel 10. Tabulasi silang pendidikan dengan status kerja... 49 Tabel 11. Tabulasi silang status pendidikan (kategori 3 dan kategori 1) dengan status kerja... 50 Tabel 12. Tabulasi silang status pendidikan (kategori 3 dan kategori 2) dengan status kerja... 51 Tabel 13. Tabulasi silang status pendidikan (kategori 1 dan kategori 2) dengan status kerja... 52 Tabel 14. Tabulasi silang status pelatihan kerja dengan status kerja... 52 Tabel 15. Uji independensi variabel independen dan variabel dependen 54 Tabel 16. Uji independensi untuk jenis kelamin laki-laki... 55

Tabel 17. Uji independensi untuk jenis kelamin laki-laki usia produktif.. 56 Tabel 18. Uji independensi untuk jenis kelamin laki-laki usia produktif dan tidak ada pasangan... 56 Tabel 19. Akurasi ketepatan klasifikasi Chaid... 59 Tabel 20. Peluang kelas bekerja dan tidak bekerja... 60 Tabel 21. Peluang simpul kiri dan simpul kanan... 61 Tabel 22. Peluang tiap kelas pada simpul kiri dan simpul kanan... 61 Tabel 23. Nilai goodness of split pemilah pertama... 63 Tabel 24. Nilai goodness of split untuk jenis kelamin perempuan... 64 Tabel 25. Nilai goodness of split untuk jenis kelamin perempuan usia produktif... 65 Tabel 26. Nilai goodness of split untuk jenis kelamin perempuan usia produktif dan tidak ada pasangan... 66 Tabel 27. Nilai goodness of split untuk jenis kelamin perempuan usia produktif, tidak ada pasangan, dan tidak pernah pelatihan kerja 66 Tabel 28. Nilai goodness of split untuk jenis kelamin perempuan usia produktif, tidak ada pasangan, tidak pernah pelatihan kerja, dan buka kepala rumah tangga... 67 Tabel 29. Hasil proses pemangkasan pohon... 72 Tabel 30. Akurasi ketepatan klasifikasi CART... 74

DAFTAR GAMBAR Halaman Gambar 1. Struktur pohon klasifikasi CHAID... 16 Gambar 2. Struktur pohon klasifikasi CART... 18 Gambar 3. Pohon klasifikasi T... 22 Gambar 4. Branch T... 22 Gambar 5. Branch T-T... 23 Gambar 6. Diagram alir penelitian... 30 Gambar 7. Pembentukan klasifikasi dengan analisis CHAID... 32 Gambar 8. Pembentukan klasifikasi dengan analisis CART... 33 Gambar 9. Persentase angkatan kerja yang bekerja dan tidak bekerja... 34 Gambar 10. Status kerja menurut hubungan dalam rumah tangga... 35 Gambar 11. Status kerja menurut jenis kelamin... 35 Gambar 12. Status kerja menurut kelompok usia... 36 Gambar 13. Status kerja menurut kelengkapan pasangan hidup... 37 Gambar 14. Status kerja menurut status pendidikan... 37 Gambar 15. Status kerja menurut pelatihan kerja... 38 Gambar 16. Pemecahan simpul menjadi simpul kiri dan simpul kanan... 62

DAFTAR LAMPIRAN Halaman Lampiran 1. Data angkatan kerja Kota Semarang tahun 2014... 78 Lampiran 2. Pengolahan software SPSS untuk nilai uji chi-square masing-masing variabel independen... 79 Lampiran 3. Output klasifikasi angkatan kerja dengan metode CHAID.. 3a. Hasil pengklasifikasian dan ketepatan klasifikasi... 86 3b. Pohon klasifikasi CHAID... 87 Lampiran 4. Output klasifikasi angkatan kerja dengan metode CART... 4a. Hasil pengklasifikasian pada pohon klasifikasi sebelum pemangkasan... 88 4b. Hasil pengklasifikasian pada pohon klasifikasi setelah pemangkasan... 90

BAB I PENDAHULUAN 1.1 Latar Belakang Pembangunan nasional ke arah yang lebih baik terus diupayakan oleh setiap negara tidak terkecuali di Indonesia. Dalam mendukung proses pembangunan ini banyak program yang harus dikerjakan. Banyak faktor yang mempengaruhi program-program pembangunan tidak berjalan dengan baik, salah satunya adalah mengenai ketenagakerjaan. Setiap tahun jumlah penduduk semakin bertambah dan tentu saja hal ini mempengaruhi banyak aspek. Pertumbuhan penduduk selalu dialami oleh negara-negara berkembang, salah satunya adalah Indonesia. Indonesia mengalami tingkat pertumbuhan penduduk yang pesat dari tahun ke tahun. Perkembangan penduduk yang pesat ini membawa akibat salah satunya pada tingkat pertumbuhan angkatan kerja. Tingkat pertumbuhan angkatan kerja yang berubah mengakibatkan perubahan pada Tingkat Partisipasi Angkatan Kerja (TPAK). Angkatan kerja dapat dibedakan menjadi penduduk yang bekerja dan tidak bekerja (pengangguran). Kegiatan bekerja didefinisikan sebagai kegiatan ekonomi dengan menghasilkan barang atau jasa yang dilakukan oleh seseorang dengan maksud memperoleh atau membantu memperoleh pendapatan atau keuntungan, paling sedikit satu jam (tidak terputus) dalam seminggu yang lalu. Kegiatan tersebut termasuk pula kegiatan pekerja tak dibayar yang membantu dalam suatu usaha atau kegiatan ekonomi. Pengangguran meliputi penduduk yang sedang 1

2 mencari pekerjaan, atau mempersiapkan suatu usaha, atau merasa tidak mungkin mendapatkan pekerjaan, atau sudah punya pekerjaan tetapi belum mulai bekerja (BPS Provinsi Jawa Tengah, 2015). Data hasil survei angkatan kerja nasional oleh BPS Provinsi Jawa Tengah tahun 2014 mencatat, jumlah angkatan kerja di Jawa Tengah Agustus 2014 sebesar 17,55 juta orang, bertambah sekitar 23 ribu orang dibanding angkatan kerja Agustus 2013 sebesar 17,52 juta orang. Peningkatan jumlah angkatan kerja ini tentu saja akan berdampak pada status kerjanya, apakah bekerja atau tidak bekerja (pengangguran). Penciptaan lapangan kerja diharapkan menjadi solusi atas dampak peningkatan jumlah angkatan kerja. Menurut Widiyanti (1987), lapangan kerja merupakan kunci dari kesejahteraan individu dalam satu masyarakat. Menurut Bakir dan Manning (1984), penciptaan kesempatan kerja merupakan sasaran kebijakan yang harus dilakukan oleh pemerintah. Ketersediaan data angkatan kerja yang di dalamnya terdapat pengelompokan penduduk bekerja dan tidak bekerja dapat membantu pemerintah mengambil tindakan yang efektif. Menurut Prasetyo (2012), klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Klasifikasi dalam ilmu statistika dapat dilakukan dalam berbagai metode. Metode-metode tersebut diantaranya adalah CHAID dan CART. Metode CHAID dan CART ini merupakan metode eksplorasi data berbentuk pohon keputusan. Beberapa penelitian terkait dengan metode ini yaitu, Pratiwi dan Zain (2014) menyatakan bahwa jenis kelamin, pendidikan terakhir, usia, status dalam rumah tangga dan status perkawinan mempengaruhi pengangguran terbuka di

3 provinsi Sulawesi Utara. Dhea (2013) melakukan penelitian menggunakan metode CART dan CHAID untuk klasifikasi pasien penderita Diabetes Melitus. Metode CHAID merupakan algoritma pohon klasifikasi yang pertama kali dikenalkan pada sebuah artikel yang berjudul An Exploratory Technique for Investigating Large Quantities of Categorical Data oleh Dr. G. V. Kass (1980). Menurut Gallagher et al. (2000), CHAID merupakan suatu teknik iteratif yang menguji variabel-variabel independen secara individual yang digunakan dalam klasifikasi dan menyusunnya pada tingkat signifikansi statistik chi-square terhadap variabel dependennya. Metode CART dikembangkan oleh Leo Breiman, Jerome H. Freidman, Richard A. Olshen, dan Charles J. Stone pada tahun 1980- an. Metode CART merupakan suatu metodologi statistik untuk analisis klasifikasi, baik untuk variabel dependen kategorik maupun kontinu. Metode CART akan menghasilkan pohon klasifikasi bila variabel dependennya kategorik dan menghasilkan pohon regresi bila variabel dependennya kontinu. Pada metode CART ini, data akan dieksplorasi untuk mengetahui variabel-variabel independen yang berpengaruh dan mengelompokkan data tersebut ke dalam kategori-kategori yang ada pada variabel dependen. Sama halnya dengan metode CART, cara kerja CHAID bertujuan untuk menduga variabel-variabel independen yang signifikan terhadap variabel respon atau dependennya. Berdasarkan uraian tersebut, pengklasifikasian dengan menggunakan metode CHAID dan CART akan diterapkan pada penulisan tugas akhir ini menggunakan data angkatan kerja Kota Semarang tahun 2014.

4 1.2 Rumusan Masalah Rumusan masalah dari penelitian ini adalah sebagai berikut: 1. Melakukan klasifikasi status kerja dari angkatan kerja Kota Semarang dengan menggunakan metode CHAID dan CART. 2. Mengetahui ketepatan klasifikasi dari metode CHAID dan CART. 1.3 Batasan Masalah Batasan masalah dalam penelitian ini adalah data hasil Survei Angkatan Kerja Nasional Tahun 2014 yang diperoleh dari Badan Pusat Statistik Provinsi Jawa Tengah dengan variabel-variabel yang digunakan adalah status hubungan dalam rumah tangga, jenis kelamin, usia, status perkawinan, status pendidikan, dan status pelatihan kerja. 1.4 Tujuan Tujuan dari penelitian tugas akhir ini adalah sebagai berikut: 1. Mendapatkan hasil klasifikasi dari metode CHAID dan CART 2. Mengetahui ketepatan klasifikasi dari metode CHAID dan CART pada data angkatan kerja Kota Semarang tahun 2014