KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

dokumen-dokumen yang mirip
PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

SKRIPSI. Disusun Oleh : YUSUF ARIFKA RAHMAN

SKRIPSI. Disusun oleh: DHINDA AMALIA TIMUR

KLASIFIKASI KEIKUTSERTAAN KELUARGA DALAM PROGRAM KELUARGA BERENCANA (KB) DI KOTA SEMARANG MENGGUNAKAN METODE MARS DAN FK-NNC

SKRIPSI. Disusun Oleh : DINI PUSPITA JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN FUZZY K-NEAREST NEIGHBOR (FK-NN)

SKRIPSI. Disusun Oleh : CANDRA SILVIA

IDENTIFIKASI LAMA STUDI BERDASARKAN KARAKTERISTIK MAHASISWA MENGGUNAKAN ALGORITMA C4.5

MENGIDENTIFIKASI DATA REKAM MEDIS. (Studi Kasus Penyakit Diabetes Mellitus di Balai Kesehatan Kementerian. Perindustrian, Jakarta) SKRIPSI

KLASIFIKASI TINGKAT KELANCARAN NASABAH DALAM MEMBAYAR PREMI DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL DAN NAÏVE BAYES SKRIPSI

PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA QUEST (QUICK, UNBIASED, AND EFFICIENT STATISTICAL TREE) PADA DATA PASIEN LIVER

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES)

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

KLASIFIKASI RUMAH LAYAK HUNI DI KABUPATEN BREBES DENGAN MENGGUNAKAN METODE LEARNING QUANTIZATION DAN NAIVE BAYES

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

PERBANDINGAN ANALISIS KLASIFIKASI MENGGUNAKAN METODE K-NEAREST NEIGHBOR

KETEPATAN KLASIFIKASI KEIKUTSERTAAN KELUARGA BERENCANA MENGGUNAKAN REGRESI LOGISTIK BINER DAN REGRESI PROBIT BINER

SKRIPSI. Disusun Oleh : RAHMA NURFIANI PRADITA

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) UNTUK KLASIFIKASI STATUS KERJA DI KABUPATEN DEMAK

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA

BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI

IDENTIFIKASI VARIABEL YANG MEMPENGARUHI BESAR PINJAMAN DENGAN METODE POHON REGRESI (Studi Kasus di Unit Pengelola Kegiatan PNPM Mandiri)

PEMODELAN GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

PEMODELAN TINGKAT PENGANGGURAN TERBUKA DI PROVINSI JAWA TENGAH MENGGUNAKAN REGRESI SPLINE

KLASIFIKASI CALON PENDONOR DARAH MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

ANALISIS LAPANGAN PEKERJAAN UTAMA DI JAWA TENGAH BERDASARKAN GRAFIK BIPLOT SQRT (SQUARE ROOT BIPLOT)

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENERIMAAN PESERTA DIDIK SMA NEGERI 2 SEMARANG MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI REGRESI LOGISTIK MULTINOMIAL

PERAMALAN JUMLAH TAMU HOTEL DI KABUPATEN DEMAK

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI KEIKUTSERTAAN KELUARGA DALAM PROGRAM KELUARGA BERENCANA (KB) DI KOTA SEMARANG MENGGUNAKAN METODE MARS DAN FK-NNC

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

PENENTUAN MODEL RETURN HARGA SAHAM DENGAN MULTI LAYER FEED FORWARD NEURAL NETWORK MENGGUNAKAN ALGORITMA RESILENT BACKPROPAGATION SKRIPSI

PROBABILISTIC NEURAL NETWORK BERBASIS GUI MATLAB UNTUK KLASIFIKASI DATA REKAM MEDIS

PEMODELAN DINAMIS PRODUKSI PADI DI JAWA TENGAH MENGGUNAKAN METODE KOYCK DAN ALMON

SKRIPSI. Oleh : PUSPHITA ANNA OCTAVIANI NIM PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM)

SEGMENTASI PASAR PADA PUSAT PERBELANJAAN MENGGUNAKAN FUZZY C-MEANS

KLASIFIKASI KELULUSAN MAHASISWA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS)

PENDUGAAN AREA KECIL TERHADAP PENGELUARAN PER KAPITA DI KABUPATEN SRAGEN DENGAN PENDEKATAN KERNEL SKRIPSI

PEMODELAN KASUS KEMISKINAN DI JAWA TENGAH MENGGUNAKAN REGRESI NONPARAMETRIK METODE B-SPLINE

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman Online di:

PERBANDINGAN ANALISIS DISKRIMINAN FISHER DAN NAIVE BAYES UNTUK KLASIFIKASI RISIKO KREDIT

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

ISSN: JURNAL GAUSSIAN, Volume 5, Nomor 1, Tahun 2016, Halaman Online di:

PERBANDINGAN METODE RUNTUN WAKTU FUZZY-CHEN DAN DI INDONESIA

KLASIFIKASI PERUBAHAN HARGA OBLIGASI KORPORASI DI INDONESIA MENGGUNAKAN METODE NAIVE BAYES CLASSIFICATION

PENDUGAAN PENGELUARAN PER KAPITA DI KABUPATEN BREBES

PENGAMBILAN SAMPEL BERDASARKAN PERINGKAT PADA ANALISIS REGRESI LINIER SEDERHANA

PERBANDINGAN METODE KLASIFIKASI REGRESI LOGISTIK BINER DAN NAIVE BAYES PADA STATUS PENGGUNA KB DI KOTA TEGAL TAHUN 2014

PERBANDINGAN METODE PEMULUSAN EKSPONENSIAL TUNGGAL DAN FUZZY TIME SERIES UNTUK MEMPREDIKSI INDEKS HARGA SAHAM GABUNGAN

SKRIPSI. Disusun Oleh : ZULFA WAHYU MARDIKA NIM. J2E

KOMBINASI METODE K-NEAREST NEIGHBOR DAN NAÏVE BAYES UNTUK KLASIFIKASI DATA

APLIKASI REGRESI DATA PANEL UNTUK PEMODELAN TINGKAT PENGANGGURAN TERBUKA KABUPATEN/KOTA DI PROVINSI JAWA TENGAH

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

PENENTUAN MODEL KEMISKINAN DI JAWA TENGAH DENGAN MULTIVARIATE GEOGRAPHICALLY WEIGHTED REGRESSION (MGWR)

SIMULASI PENGUKURAN KETEPATAN MODEL VARIOGRAM PADA METODE ORDINARY KRIGING DENGAN TEKNIK JACKKNIFE. Oleh : DEWI SETYA KUSUMAWARDANI

ANALISIS NILAI RISIKO (VALUE AT RISK) MENGGUNAKAN UJI KEJADIAN BERNOULLI (BERNOULLI COVERAGE TEST) (Studi Kasus pada Indeks Harga Saham Gabungan)

ii

PREDIKSI INFLASI BEBERAPA KOTA DI JAWA TENGAH TAHUN 2014 MENGGUNAKAN METODE VECTOR AUTOREGRESSIVE (VAR)

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman Online di:

SKRIPSI. Oleh : LAILI ISNA NUR KHIQMAH NIM :

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA

PERBANDINGAN AKURASI KLASIFIKASI TINGKAT KEMISKINAN ANTARA ALGORITMA C 4.5 DAN NAÏVE BAYES

PEMODELAN PERSENTASE BALITA GIZI BURUK DI JAWA TENGAH DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENTS ANALYSIS (GWRPCA)

PEMODELAN UPAH MINIMUM KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHINYA MENGGUNAKAN REGRESI RIDGE

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

SKRIPSI. Disusun Oleh : RIAMA OKTAVIYANI SAMOSIR JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

PERAMALAN BEBAN PEMAKAIAN LISTRIK JAWA TENGAH DAN DAERAH ISTIMEWA YOGYAKARTA DENGAN

ANALISIS SUPPORT VECTOR REGRESSION

SKRIPSI. Disusun Oleh: Ana Kartikawati NIM. J2E009024

PERBANDINGAN K-NEAREST NEIGHBOR DAN NAIVE BAYES UNTUK KLASIFIKASI TANAH LAYAK TANAM POHON JATI

Versi Online tersedia di : JURNAL TECH-E (Online)

ANALISIS PREFERENSI SISWA SMA DI KOTA SEMARANG TERHADAP PROGRAM STUDI DI PERGURUAN TINGGI DENGAN METODE CHOICE-BASED CONJOINT

ANALISIS JALUR TERHADAP FAKTOR-FAKTOR YANG MEMPENGARUHI INDEKS PRESTASI KUMULATIF (IPK) MAHASISWA STATISTIKA UNDIP

SKRIPSI. Disusun oleh: NOVIAN TRIANGGARA

BAB II TINJAUAN PUSTAKA

DEPARTEMEN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:

MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) UNTUK KLASIFIKASI STATUS KERJA DI KABUPATEN DEMAK Kishartini 1, Diah Safitri 2, Dwi Ispriyanti 3

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

KLASIFIKASI STATUS GIZI NARAPIDANA DEWASA MENGGUNAKAN METODE DECISION TREE C4.5 (Studi Kasus : Lembaga Pemasyarakatan Klas IIA Sidoarjo) TUGAS AKHIR

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN KELOMPOK BAHAN MAKANAN DI JAWA TENGAH

PENERAPAN METODE STRUCTURAL EQUATION MODELING UNTUK ANALISIS KEPUASAN PENGGUNA SISTEM INFORMASI AKADEMIK TERHADAP KUALITAS WEBSITE

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

ANALISIS KELOMPOK DENGAN ALGORITMA FUZZY C-MEANS DAN GUSTAFSON KESSEL CLUSTERING PADA INDEKS LQ45

SKRIPSI. Disusun Oleh: SARITA BUDIYANI PURNAMASARI NIM

SKRIPSI APLIKASI METODE GOLDEN SECTION UNTUK OPTIMASI PARAMETER PADA METODE EXPONENTIAL SMOOTHING. Disusun oleh: DANI AL MAHKYA

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

SKRIPSI. Disusun oleh: Alin Citra Suardi

PEMODELAN JUMLAH UANG BEREDAR MENGGUNAKAN PARTIAL LEAST SQUARES REGRESSION (PLSR) DENGAN ALGORITMA NIPALS (NONLINEAR ITERATIVE PARTIAL LEAST SQUARES)

KLASIFIKASI DATA BERAT BAYI LAHIR MENGGUNAKAN. (Studi Kasus di Rumah Sakit Islam Sultan Agung Semarang Tahun 2014)

Transkripsi:

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI Disusun Oleh : ATIKA ELSADINING TYAS 24010211120013 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG 2015

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) Disusun Oleh: ATIKA ELSADINING TYAS 24010211120013 Skripsi Diajukan Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains pada Jurusan Statistika Fakultas Sains dan Matematika Universitas Diponegoro JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG 2015 i

ii

iii

KATA PENGANTAR Puji syukur penulis panjatkan kepada Allah SWT atas rahmat, hidayah, dan karunia-nya sehingga penulis dapat menyelesaikan Tugas Akhir yang diberi judul Ketepatan Klasifikasi Status Kerja di Kota Tegal Menggunakan Algoritma C4.5 dan Fuzzy K-Nearest Neighbor in every Class (FK-NNC). Tugas Akhir ini tidak akan terselesaikan dengan baik tanpa adanya dukungan dan bantuan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih kepada: 1. Ibu Dra. Hj. Dwi Ispriyanti, M.Si. selaku Ketua Jurusan Statistika Fakultas Sains dan Matematika Universitas Diponegoro dan dosen pembimbing I. 2. Bapak Drs. Sudarno, M.Si selaku dosen pembimbing II. 3. Bapak/Ibu dosen jurusan Statistika Fakultas Sains dan Matematika Universitas Diponegoro. 4. Semua pihak yang telah membantu kelancaran penyusunan Tugas Akhir ini, yang tidak dapat penulis sebutkan satu per satu. Penulis menyadari bahwa dalam penyusunan Tugas Akhir ini masih jauh dari sempurna. Oleh karena itu, penulis mengharapkan kritik dan saran demi kesempurnaan penulisan selanjutnya. Semarang, September 2015 Penulis iv

ABSTRAK Masalah pengangguran merupakan masalah yang sangat krusial yang selalu dihadapi negara berkembang dan dapat mempengaruhi pembangunan nasional. Digunakan dua metode untuk melakukan klasifikasi status kerja pada penduduk angkatan kerja di Kota Tegal bulan Agustus tahun 2014 yaitu algoritma C4.5 dan Fuzzy K-Nearest Neighbor in every Class (FK-NNC). Algoritma C4.5 adalah salah satu metode klasifikasi dari data mining yang digunakan untuk mengkonstruksikan pohon keputusan ( decision tree). Fuzzy K-Nearest Neighbor in every Class (FK-NNC) adalah teknik klasifikasi yang melakukan prediksi menggunakan sejumlah K tetangga terdekat pada setiap kelas dari sebuah data uji. Variabel prediktor yang digunakan adalah status dalam rumah tangga, jenis kelamin, umur, status perkawinan, pendidikan, dan pelatihan kerja. Untuk mengevaluasi hasil klasifikasi digunakan perhitungan APER. Berdasarkan analisis tersebut pengklasifikasian status kerja dengan Algoritma C4.5 diperoleh nilai APER = 28,3784% dan ketepatan klasifikasi sebesar 71,6216% sedangkan menggunakan metode FK-NNC diperoleh nilai APER = 21,62% dan ketepatan klasifikasi sebesar 78,38%. Sehingga dapat disimpulkan bahwa metode FK-NNC lebih baik dibandingkan dengan Algoritma C4.5. Kata kunci: Klasifikasi, Algoritma C4.5, Fuzzy K-Nearest Neighbor in every Class (FK-NNC), APER v

ABSTRACT Unemployment is a very crucial problem that always deal a developing country and affected a national foundation. It used two methods for classifying a employment status on productive society in Tegal City on August 2014, the methods are C4.5 Algorithm and Fuzzy K-Nearest Neighbor in every Class (FK- NNC). C4.5 Algorithm is a way of classifying methods from data mining that use to construct a decision tree. FK-NNC is another classification technique that predict using the amount of closest neighbor of K in every class from a testing data. The predictor variables that used on classifying an employment status are neighborhood status, sex, age, marriage status, education, and a work training. To evaluate the result of classification use APER calculation. Based on this analysis, classification of employment status using C4.5 Algorithm obtained APER = 28,3784% and 71,6216% of accuracy, while FK-NNC methods obtained APER = 21,62% and 78,38% of accuracy. So, it can be concluded that FK-NNC is better than C4.5 Algorithm. Keywords: Classification, C4.5 Algorithm, Fuzzy K-Nearest Neighbor in every Class (FK-NNC), APER vi

DAFTAR ISI Halaman HALAMAN JUDUL... HALAMAN PENGESAHAN I... HALAMAN PENGESAHAN II... KATA PENGANTAR... ABSTRAK... ABSTRACT... DAFTAR ISI... DAFTAR TABEL... DAFTAR GAMBAR... DAFTAR LAMPIRAN... i ii iii iv v vi vii x xii xiii BAB I PENDAHULUAN 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 3 1.3 Batasan Masalah... 4 1.4 Tujuan... 4 BAB II TINJAUAN PUSTAKA 2.1 Ketenagakerjaan... 6 2.2 Data Mining... 12 2.3 Algoritma C4.5... 13 2.3.1 Pembentukan Pohon Keputusan Algoritma C4.5... 15 2.3.2 Prosedur Pemilahan Algoritma C4.5... 17 2.3.3 Contoh Pemilahan Pohon Keputusan Algoritma C4.5... 18 vii

2.4 Fuzzy K-Nearest Neighbor in every Class... 22 2.5 Ketepatan Klasifikasi... 27 BAB III METODOLOGI PENELITIAN 3.1 Jenis dan Sumber Data... 29 3.2 Variabel Penelitian... 29 3.3 Teknik Pengolahan Data... 30 3.4 Tahapan Penelitian... 31 BAB IV HASIL DAN PEMBAHASAN 4.1 Analisis Deskriptif Data Status Kerja... 33 4.1.1 Status Kerja Kota Tegal Bulan Agustus 2014... 33 4.1.2 Status Kerja Kota Tegal Bulan Agustus 2014 Berdasarkan Status dalam Rumah Tangga... 34 4.1.3 Status Kerja Kota Tegal Bulan Agustus 2014 Berdasarkan Jenis Kelamin... 36 4.1.4 Status Kerja Kota Tegal Bulan Agustus 2014 Berdasarkan Umur... 37 4.1.5 Status Kerja Kota Tegal Bulan Agustus 2014 Berdasarkan Status Perkawinan... 37 4.1.6 Status Kerja Kota Tegal Bulan Agustus 2014 Berdasarkan Pendidikan... 39 4.1.7 Status Kerja Kota Tegal Bulan Agustus 2014 Berdasarkan Pelatihan Kerja... 40 4.2 Pengklasifikasian Menggunakan Algoritma C4.5... 41 4.2.1 Konstruksi Algoritma C4.5... 42 viii

4.2.2 Analisis Pohon Keputusan... 47 4.2.3 Identifikasi Status Kerja... 48 4.2.4 Pengujian Hasil Pohon Keputusan... 50 4.3 Pengklasifikasian Menggunakan Metode FK-NNC... 50 4.4 Perbandingan Ketepatan Klasifikasi... 57 BAB V KESIMPULAN... 58 DAFTAR PUSTAKA... 59 LAMPIRAN... 61 ix

DAFTAR TABEL Halaman Tabel 1 Data Klasifikasi Bermain Baseball dengan Tipe Atribut Campuran. 19 Tabel 2 Hasil Perhitungan Nilai v untuk Atribut Suhu... 20 Tabel 3 Hasil Perhitungan Entropy dan Gain untuk Node Akar... 21 Tabel 4 Formula Jarak Dua Data dengan Satu Atribut... 23 Tabel 5 Hasil Perhitungan Jarak FK-NNC pada Set Data Buatan... 25 Tabel 6 Matriks Konfusi... 27 Tabel 7 Variabel Penelitian... 29 Tabel 8 Status Kerja Kota Tegal Bulan Agustus 2014... 34 Tabel 9 Status Kerja Berdasarkan Status dalam Rumah Tangga... 35 Tabel 10 Status Kerja Berdasarkan Jenis Kelamin... 36 Tabel 11 Deskriptif untuk Variabel Umur... 37 Tabel 12 Status Kerja Berdasarkan Status Perkawinan... 38 Tabel 13 Status Kerja Berdasarkan Pendidikan... 39 Tabel 14 Status Kerja Berdasarkan Pelatihan Kerja... 40 Tabel 15 Frekuensi Tiap Kelas... 42 Tabel 16 Peluang Masing-masing Kelas... 42 Tabel 17 Frekuensi Masing-masing Kategori pada Atribut Jenis Kelamin Berdasarkan Kelasnya... 43 Tabel 18 Peluang Masing-masing Kategori Berdasarkan Kelasnya... 43 Tabel 19 Nilai Information Gain pada Simpul Akar... 44 x

Tabel 20 Nilai Ambang Batas Atribut Umur pada Proses Pembentukan Pohon Keputusan Tingkat ke-empat... 46 Tabel 21 Matriks Konfusi Data Testing... 50 Tabel 22 Data Training... 52 Tabel 23 Data Testing... 52 Tabel 24 Ketepatan Klasifikasi FK-NNC untuk K = 3... 56 Tabel 25 Hasil Ketepatan Klasifikasi Menggunakan FK-NNC... 56 xi

DAFTAR GAMBAR Halaman Gambar 1 Contoh Pohon Keputusan (Decision Tree)... 14 Gambar 2 Konsep K Tetangga Terdekat dari Setiap Kelas dalam F-KNNC... 22 Gambar 3 Diagram Alir Pengolahan Data Menggunakan Algoritma C4.5 dan F-KNNC... 32 Gambar 4 Diagram Status Kerja... 34 Gambar 5 Diagram Status Kerja Berdasarkan Status dalam Rumah Tangga... 35 Gambar 6 Diagram Status Kerja Berdasarkan Jenis Kelamin... 36 Gambar 7 Diagram Status Kerja Berdasarkan Status Perkawinan... 38 Gambar 8 Diagram Status Kerja Berdasarkan Pendidikan... 39 Gambar 9 Diagram Status Kerja Berdasarkan Pelatihan Kerja... 41 Gambar 10 Pohon Keputusan Tingkat Pertama... 45 xii

DAFTAR LAMPIRAN Halaman Lampiran 1 Data SAKERNAS Kota Tegal Bulan Agustus Tahun 2014... 61 Lampiran 2 Hasil Algoritma C4.5 Menggunakan Data Training... 62 Lampiran 3 Pohon Keputusan yang Terbentuk Menggunakan Data Training... 65 Lampiran 4 Hasil Algoritma C4.5 Menggunakan Data Testing... 66 Lampiran 5 Hasil Pengklasifikasian Menggunakan Algoritma C4.5... 67 Lampiran 6 Output Ketepatan Klasifikasi Menggunakan FK-NNC Untuk K = 3... 73 Lampiran 7 Syntax Matlab untuk FK-NNC... 77 xiii

BAB I PENDAHULUAN 1.1 Latar Belakang Indonesia merupakan negara kepulauan yang memiliki jumlah penduduk yang besar, serta dikategorikan sebagai negara berkembang. Suatu negara dikatakan berkembang atau maju salah satunya adalah dengan melihat pada keberhasilan pembangunan oleh negara yang bersangkutan. Indonesia sebagai negara berkembang perlu melakukan banyak perubahan untuk mendukung pembangunan nasional. Pembangunan nasional bertujuan untuk meningkatkan kesejahteraan masyarakat. Meningkatnya kesejahteraan rakyat yang adil dan merata merupakan tujuan dari pembangunan nasional Indonesia. Namun, dimensi kesejahteraan rakyat disadari sangat luas dan kompleks. Suatu taraf kesejahteraan rakyat hanya dapat dinilai melalui indikator-indikator yang terukur dari berbagai aspek pembangunan. Menurut BPS (2014), aspek -aspek yang dapat menggambarkan kondisi tingkat kesejahteraan rakyat pada saat ini meliputi kependudukan, kesehatan dan gizi, pendidikan, ketenagakerjaan, taraf dan pola konsumsi, perumahan dan lingkungan, kemiskinan, serta sosial lainnya. Salah satu masalah yang menjadi perhatian pemerintah adalah permasalahan di bidang ketenagakerjaan terutama masalah pengangguran. Masalah pengangguran merupakan masalah yang sangat krusial yang selalu dihadapi negara berkembang dan dapat mempengaruhi pembangunan nasional. Tingginya pengangguran di suatu negara mengakibatkan rendahnya partisipasi rakyat dalam pertumbuhan ekonomi yaitu pendapatan rakyat akan berkurang 1

2 sehingga dapat menyebabkan timbulnya kemiskinan dan masalah sosial lainnya. Dari data Badan Pusat Statistik (BPS) diketahui angkatan kerja Indonesia pada Agustus 2014 mencapai angka 121,9 juta orang. Sedangkan, penduduk yang bekerja pada Agustus 2014 adalah sebanyak 114,6 juta orang. Untuk angka Tingkat Pengangguran Terbuka (TPT) pada Agustus 2014, menurut Kepala BPS Suryamin adalah sebesar 5,94%. Jika dibandingkan dengan Agustus 2013, tingkat pengangguran terbuka mengalami penurunan dari 6,17% menjadi 5,94%. Berdasarkan permasalahan di atas, perlu dilakukan pengklasifikasian status kerja bahwa seseorang dikatakan pengangguran atau bukan pengangguran. Pada tugas akhir ini digunakan dua metode untuk mengklasifikasikan data status kerja tersebut, yaitu Algoritma C4.5 dan Fuzzy K-Nearest Neighbor in every Class (FK-NNC), dimana kedua metode tersebut merupakan teknik klasifikasi yang sederhana tetapi mempunyai hasil kerja yang cukup bagus. Algoritma C4.5 adalah salah satu metode klasifikasi dari data mining yang digunakan untuk mengkonstruksikan pohon keputusan ( decision tree). Menurut Prasetyo (2014), pohon keputusan atau decision tree adalah pohon yang digunakan sebagai prosedur penalaran untuk mendapatkan jawaban dari masalah yang dimasukkan. Algoritma C4.5 diperkenalkan oleh Quinlan (1993) sebagai versi perbaikan dari algoritma Iterative Dichotomiser 3 (ID3). Menurut Witten et al., (2011), Algoritma C4.5 memiliki keunggulan dibandingkan dengan ID3 yaitu mampu mengatasi nilai yang hilang ( missing value), mengatasi data bertipe kontinu, dan melakukan pemangkasan pohon (prunning trees). Selain itu, dengan menggunakan Algoritma C4.5 dapat diketahui pula nilai ketepatan klasifikasi.

3 Fuzzy K-Nearest Neighbor in every Class atau dapat disingkat FK-NNC adalah teknik klasifikasi yang melakukan prediksi menggunakan sejumlah K tetangga terdekat pada setiap kelas dari sebuah data uji, bukan K tetangga terdekat seperti pada K-Nearest Neighbor (K-NN) dan Fuzzy K-Nearest Neighbor (FK- NN). Penelitian sebelumnya pernah dilakukan oleh Eko Prasetyo (2012b) pada klasifikasi data set iris dan vertebral column dengan membandingkan tiga metode yaitu metode K-Nearest Neighbor (K-NN), Fuzzy K-Nearest Neighbor (FK-NN), dan Fuzzy K-Nearest Neighbor in every Class (FK-NNC). Pada penelitian tersebut didapatkan kesimpulan bahwa nilai akurasi yang diberikan oleh FK-NNC terbukti lebih tinggi daripada K-NN dan FK-NN. Penelitian status kerja sebelumnya pernah dilakukan oleh Riyan Eko Putri (2014) dengan membandingkan dua metode yaitu Naïve Bayes dan K-Nearest Neighbor (K-NN). Pada tugas akhir ini akan diteliti mengenai data status kerja Kota Tegal tahun 2014 mengunakan Algoritma C4.5 yang akan dibandingkan dengan menggunakan metode Fuzzy K-Nearest Neighbor in every Class (FK- NNC). Dari kedua metode tersebut masing-masing akan menghasilkan nilai ketepatan klasifikasi. Sehingga, dapat dicari ketepatan klasifikasi yang terbaik dari kedua metode tersebut. 1.2 Rumusan Masalah Permasalahan yang akan dibahas pada tugas akhir ini adalah sebagai berikut: 1. Bagaimana penerapan Algoritma C4.5 dalam pembentukan pohon klasifikasi untuk data status kerja di Kota Tegal?

4 2. Bagaimana ketepatan klasifikasi data status kerja untuk Kota Tegal tahun 2014 menggunakan Algoritma C4.5? 3. Bagaimana ketepatan klasifikasi data status kerja untuk Kota Tegal tahun 2014 menggunakan metode Fuzzy K-Nearest Neighbor in every Class (FK-NNC)? 4. Bagaimana perbandingan ketepatan klasifikasi data status kerja untuk Kota Tegal tahun 2014 menggunakan Algoritma C4.5 dan metode Fuzzy K- Nearest Neighbor in every Class (FK-NNC)? 1.3 Batasan Masalah Permasalahan pada tugas akhir ini dibatasi untuk daerah Kota Tegal, sesuai dengan pendataan yang dilakukan oleh BPS pada Agustus 2014. Pengolahan tersebut diberikan batasan masalah pada pembahasan tentang perbandingan hasil ketepatan klasifikasi menggunakan dua metode, yaitu Algoritma C4.5 dan metode Fuzzy K-Nearest Neighbor in every Class (FK-NNC). 1.4 Tujuan Tujuan dari penulisan tugas akhir ini adalah: 1. Membentuk pohon klasifikasi untuk data status kerja di Kota Tegal menggunakan Algoritma C4.5. 2. Mengukur ketepatan klasifikasi data status kerja untuk Kota Tegal tahun 2014 menggunakan Algoritma C4.5.

5 3. Mengukur ketepatan klasifikasi data status kerja untuk Kota Tegal tahun 2014 menggunakan metode Fuzzy K-Nearest Neighbor in every Class (FK-NNC). 4. Membandingkan hasil ketepatan klasifikasi status kerja untuk Kota Tegal tahun 2014 menggunakan Algoritma C4.5 dan metode Fuzzy K-Nearest Neighbor in every Class (FK-NNC).