ii

dokumen-dokumen yang mirip
Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK

SISTEM VALIDASI DOKUMEN TUGAS AKHIR UNIVERSITAS SEBELAS MARET DENGAN METODE FORWARD CHAINING

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

PENGARUH PERBEDAAN STRATEGI METODE SELEKSI DALAM ALGORITMA GENETIKA UNTUK KOMPRESI CITRA FRAKTAL SKRIPSI

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS

PENGARUH DUMMY VARIABLE PADA METODE NAÏVE BAYES DALAM KASUS KLASIFIKASI PENYAKIT KANDUNGAN

SKRIPSI. Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu. Program Studi Informatika. Disusun oleh : FAIRLY OKTA MAL

SHABRINA ROSE HAPSARI M SURAKARTA

SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Jurusan Informatika. Disusun Oleh: WINA ISTI RETNANI NIM.

PENGEMBANGAN APLIKASI ESTIMASI UKURAN PERANGKAT LUNAK DENGAN PENDEKATAN FUNCTION POINT ANALYSIS

DIAGNOSA PENYAKIT PARU EFUSI PLEURA DENGAN PENDEKATAN POSSIBILISTIC FUZZY LEARNING VECTOR QUANTIZATION SKRIPSI

ANALISIS SPAM FILTERING PADA MAIL SERVER DENGAN METODE BAYESIAN CHI-SQUARE DAN NAIVE BAYES CLASSIFIER SKRIPSI

IMPLEMENTASI METODE TOPSIS PADA SISTEM PENDUKUNG KEPUTUSAN SELEKSI CALON TENAGA KERJA DI PT. ASRY AMANAH TIMUR

IDENTIFIKASI KUALITAS BERAS DENGAN CITRA DIGITAL MENGGUNAKAN METODE DECISION TREE ITERATIVE DICHOTOMISER TREE (ID3) DAN C4.5 HALAMAN JUDUL SKRIPSI

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam Menentukan Status Gizi Balita

PEMERINGKATAN PENERIMA BEASISWA BANTUAN BELAJAR MAHASISWA DI FAKULTAS MIPA UNS MENGGUNAKAN FUZZY SIMPLE ADDITIVE WEIGHTING

PENGEMBANGAN APLIKASI DETEKSI HAMA DAN PENYAKIT TANAMAN PADI DI INDONESIA DENGAN METODE ASSOCIATION RULE DAN COSINE SIMILARITY

DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS

PERBANDINGAN EFEKTIFITAS METODE USER-BASED COLLABORATIVE FILTERING DENGAN METODE USER-ITEM BASED COLLABORATIVE FILTERING

Analisis Perbandingan Vector Space Model dan Weighted Tree Similarity pada Pencarian Informasi Ebook Pedoman Pengobatan Dasar di Puskesmas SKRIPSI

PERINGKASAN TEKS BAHASA INDONESIA SECARA OTOMATIS MENGGUNAKAN METODE SENTENCE SCORING DAN DECISION TREE

PEMODELAN PENJADWALAN MULTILEVEL FEEDBACK QUEUE MENGGUNAKAN DYNAMIC TIME QUANTUM PADA KASUS PEMESANAN MAKANAN DI RESTORAN

PENERAPAN METODE ASSOCIATION RULES DAN COSINE SIMILARITY UNTUK PENGEMBANGAN FITUR DETEKSI DINI PENYAKIT

KLASIFIKASI TEKS MENGGUNAKAN ALGORITMA NAIVE BAYES UPDATEABLE PADA SOAL UJIAN SBMPTN HALAMAN JUDUL

SISTEM REKOMENDASI MAKANAN PENDAMPING AIR SUSU IBU (MPASI) DENGAN METODE NAÏVE BAYES DAN ATURAN MPASI

SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Jurusan Informatika. Disusun Oleh: AISHA ALFIANI MAHARDHIKA

LAPORAN SKRIPSI PENERAPAN ALGORITMA FUZZY C_MEANS DALAM PENENTUAN BEASISWA. Oleh : ARI IRAWAN

PENGGABUNGAN ALGORITMA GENETIKA DENGAN TABU SEARCH UNTUK PENGEMBANGAN METODE PENJADWALAN MATA KULIAH DI UNIVERSITAS SEBELAS MARET SURAKARTA SKRIPSI

RATA-RATA KUADRAT SESATAN PENDUGA REGRESI DENGAN KOMBINASI LINIER DUA VARIABEL BANTU PADA SAMPEL ACAK SEDERHANA

INTRUSION DETECTION SYSTEM (IDS) MENGGUNAKAN JARINGAN SYARAF TIRUAN ENSEMBLE

PEMANFAATAN METODE SIMPLE ADDITIVE WEIGHTING (SAW) DALAM PENENTUAN MAHASISWA BERPRESTASI TINGKAT UNIVERSITAS SEBELAS MARET SURAKARTA SKRIPSI

SISTEM INFORMASI MANAJEMEN SEKOLAH SUB SISTEM PENJADWALAN TUGAS AKHIR

PENGUKURAN KINERJA METODE NAIVE BAYES PADA SISTEM DETEKSI KERUSAKAN MOTOR

ASSOCIATION RULE UNTUK MENENTUKAN POLA PASIEN RAWAT INAP MENGGUNAKAN ALGORITMA FP- GROWTH (STUDI KASUS RSUD SUKOHARJO)

SKRIPSI. Pencarian Lokasi Wisata Berbasis Android (Study Kasus Kota Nabire)

ASSOCIATION RULE MINING DATA PEMINJAMAN PERPUSTAKAAN MENGGUNAKAN KOMBINASI APRIORI DAN JACCARD SIMILARITY

PENDEKATAN BARU PENYELESAIAN KASUS PENJADWALAN UJIAN AKHIR SEMESTER SEKOLAH MENENGAH ATAS (STUDI KASUS SMA NEGERI 3 SURAKARTA)

IMPLEMENTASI ALGORITMA PALGUNADI DALAM OPTIMALISASI VEHICLE ROUTING PROBLEM DELIVERY AND PICK-UP (VRPDP)

RIZAL KUSUMAJATI NUGROHO

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

OPTIMASI PRODUKSI MENGGUNAKAN ALGORITMA FUZZY LINEAR PROGRAMMING (STUDI KASUS: PRODUKSI TAS UKM CANTIK SOUVENIR) SKRIPSI

Aplikasi Dashboard sebagai Modul Executive Information System untuk Analisis Data Eksport Furniture di Indonesia SKRIPSI

PENGEMBANGAN SUB SISTEM ASET PADA SISTEM INFORMASI MANAJEMEN SEKOLAH TUGAS AKHIR

PEMANFAATAN WEB SERVICE MOODLE BERBASIS REST- JSON UNTUK MEMBANGUN MOODLE ONLINE LEARNING EXTENSION BERBASIS ANDROID

DETEKSI HAMA DAN PENYAKIT TANAMAN PADI MEMANFAATKAN INPUT TEKSTUAL DENGAN METODE COSINE SIMILARITY SKRIPSI

PEMBANGUNAN SISTEM INFORMASI KEPEGAWAIAN SUB EKIVALENSI WAKTU MENGAJAR PENUH (EWMP) DOSEN UNIVERSITAS SEBELAS MARET

SKRIPSI. Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Jurusan Informatika. Disusun Oleh : YOSEFIN EVA CHRISTANTI M

CLUSTERING DOKUMEN MENGGUNAKAN ALGORITMA SELF-ORGANIZING MAP (SOM) (STUDI KASUS : DOKUMEN SKRIPSI DI FAKULTAS PERTANIAN UNS)

PEMANFAATAN METODE K-MEANS CLUSTERING DALAM PENENTUAN PENJURUSAN SISWA SMA SKRIPSI

SEGMENTASI KANDIDAT PARASIT MALARIA DARI CITRA MIKROSKOPIS APUSAN TEBAL DARAH MENGGUNAKAN ACTIVE CONTOUR WITHOUT EDGE

PERBANDINGAN ALGORITMA LEVENBERG-MARQUARDT DENGAN BACKPROPAGATION UNTUK MENDIAGNOSA JENIS PENYAKIT KANDUNGAN

PENGARUH KEAKTIFAN BERORGANISASI TERHADAP KOMPETENSI INTERPERSONAL MAHASISWA PENDIDIKAN AKUNTANSI FKIP UNS TAHUN 2016

IMPLEMENTASI ALGORITMA PALGUNADI UNTUK MENYELESAIKAN SINGLE DAN MULTI PRODUCT VEHICLE ROUTING PROBLEM

APLIKASI MASALAH 0/1 KNAPSACK MENGGUNAKAN ALGORITMA GREEDY

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

SKRIPSI SISTEM PENDUKUNG KEPUTUSAN PENILAIAN KINERJA MAHASISWA PENERIMA BEASISWA MAGANG PADA UNIVERSITAS MURIA KUDUS DENGAN METODE AHP BERBASIS WEB

SISTEM PENDUKUNG KEPUTUSAN KREDIT SEPEDA MOTOR DENGAN METODE DECISION TREE SKRIPSI AGUSTINA MANURUNG

PERBANDINGAN DECISION TREE

PEMBUATAN APLIKASI MONITORING PERKULIAHAN DI DIPLOMA III TEKNIK INFORMATIKA FMIPA UNIVERSITAS SEBELAS MARET SURAKARTA

SIMULASI PENYEBARAN PENYAKIT MENULAR HIV/AIDS DI PROVINSI JAWA TENGAH MENGGUNAKAN MODEL EPIDEMI SIR (SUSCEPTIBLE, INFECTED, REMOVED)

PERBANDINGAN TINGKAT AKURASI REGRESI NONPARAMETRIK SPLINE DAN REGRESI NONPARAMETRIK KERNEL PADA PERTUMBUHAN BALITA DI KOTA SURAKARTA

APLIKASI PENGARSIPAN DATA MAHASISWA PENERIMA DANA KASIH DI UNIVERSITAS SEBELAS MARET

PEMBUATAN APLIKASI PUSHING BERBASIS ANDROID. Program Studi Diploma III Teknik Informatika

PENGEMBANGAN APLIKASI SKRIPSI (TUGAS AKHIR) BERBASIS WEB MENGGUNAKAN METODE SCRUM

PENERAPAN METODE KNN (K-NEAREST NEIGHBOR) PADA SISTEM PENDUKUNG KEPUTUSAN PEMBELIAN RUMAH

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK PREDIKSI PENERIMA BEASISWA BERDASARKAN PRESTASI DI SMA NEGERI 6 SURAKARTA SKRIPSI

oleh FAIFAR NUR CHAYANINGTYAS M SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

PENGARUH PENGGUNAAN METODE INDEX CARD MATCH TERHADAP PRESTASI BELAJAR MATEMATIKA SISWA TUNANETRA KELAS V SLB-A YKAB SURAKARTA TAHUN AJARAN 2014/2015

Oleh : ENDANG DWIASTUTI B

LAPORAN TUGAS AKHIR PEMBUATAN APLIKASI PERPUSTAKAAN BERBASIS WEB PADA INSTANSI PEMERINTAH BADAN PUSAT STATISTIK KABUPATEN KARANGANYAR

SIMULASI PEMILIHAN SUPPLIER SIMPLISIA TERBAIK DI PT. AIR MANCUR MENGGUNAKAN METODE ADDITIVE RATIO ASSESSMENT

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR

ANALISIS PERBANDINGAN MENGGUNAKAN METODE AHP, TOPSIS, DAN AHP-TOPSIS DALAM STUDI KASUS SISTEM PENDUKUNG KEPUTUSAN PENERIMAAN SISWA PROGRAM AKSELERASI

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN LOKASI CABANG USAHA MENGGUNAKAN METODE AHP DAN VISUALISASI PETA (STUDI KASUS TOKO IVO BUSANA PADANG)

SISTEM INFORMASI MANAGEMENT SEKOLAH SUB SISTEM PENERIMAAN PESERTA DIDIK BARU UNTUK SEKOLAH DASAR TUGAS AKHIR

oleh LILIS SETYORINI NIM. M SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG

DAFTAR ISI PHP... 15

Fakultas Ekonomi Universitas Sebelas Maret Surakarta 2015 commit to user

PEMBANGUNAN SISTEM INFORMASI KEPEGAWAIAN UNIVERSITAS SEBELAS MARET SURAKARTA SUB PENILAIAN ANGKA KREDIT DOSEN FUNGSIONAL TUGAS AKHIR

PEMBANGUNAN SISTEM INFORMASI EVALUASI PEMBELAJARAN MENGAJAR SMK NEGERI 1 SUKOHARJO TUGAS AKHIR

SISTEM PENDUKUNG KEPUTUSAN UNTUK SELEKSI PENERIMAAN SISWA BARU TINGKAT SEKOLAH MENENGAH KEJURUAN (SMK) DENGAN METODE PROMETHEE

MODIFIKASI LEAST SIGNIFICANT BIT UNTUK MENINGKATKAN KETAHANAN PESAN TERHADAP CROPPING DAN NOISE SKRIPSI

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

PEMBUATAN SISTEM INFORMASI KOST KENTINGAN BERBASIS ANDROID

SISTEM REKOMENDASI PEMINJAMAN VCD DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

Oleh TRI SEPTIYANI M SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

SISTEM INFORMASI PENJADWALAN SMK NEGERI 1 KEMUSU BOYOLALI TUGAS AKHIR

PEMBUATAN SISTEM INFORMASI PENGELOLAAN DAN PELAPORAN UANG MASUK YPPP VETERAN SUKOHARJO MENGGUNAKAN FRAMEWORK YII2 TUGAS AKHIR

1. Pendahuluan 1.1 Latar Belakang

PEMBUATAN PROGRAM APLIKASI ADMINISTRASI NILAI BERBASIS JAVA STUDI KASUS DI SD KRISTEN BANJARSARI

PEMBUATAN APLIKASI PETA WISATA GUNUNG KIDUL BERBASIS FLASH TUGAS AKHIR

PERANCANGAN DAN IMPLEMENTASI SISTEM PEMINATAN SISWA SMA DENGAN ALGORITMA C4.5 PADA SMAK HARAPAN DENPASAR

CD PEMBELAJARAN TEMATIK UNTUK SEKOLAH DASAR KELAS 1 SEMESTER 1 BERTEMA KELUARGA BERBASIS ADOBE FLASH TUGAS AKHIR

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PENERIMA BEASISWA MENGGUNAKAN METODE FUZZY MULTIPLE ATTRIBUTE DECISION MAKING PADA SMA TAMAN SISWA SAWIT SEBERANG

OPTIMASI FUZZY TSUKAMOTO DUA TAHAP MENGGUNAKAN ALGORITMA GENETIKA UNTUK SELEKSI CALON KARYAWAN (STUDI KASUS: Perusahaan Bio-2000)

HUBUNGAN ANTARAKREATIVITAS SISWA DAN KEMAMPUAN NUMERIKDENGAN KEMAMPUAN KOGNITIF FISIKA SISWA SMPKELAS VIII

Transkripsi:

KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun oleh: MUH. SAFRI JULIARDI NIM. M0512038 PROGRAM STUDI INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2017

ii

iii

HALAMAN PERSEMBAHAN Tugas akhir ini ku persembahkan untuk Ayah, Ibu, dan kedua kakakku tercinta, keluarga Informatika UNS angkatan 2012, keluarga besar UPT TIK UNS iv

MOTTO Inna ma al usri yusroo. Sesungguhnya bersama kesulitan itu ada kemudahan. (QS. Al Insyirah: 6) Man jadda wajada. Barangsiapa bersungguh-sungguh maka berhasillah dia. (Mahfudhot) The First Rule of Programming: It s Always Your Fault (Coding Horror) v

KATA PENGANTAR Segala puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya karena berkat rahmat dan karunia-nya penulis dapat menyelesaikan skripsi berjudul Klasifikasi Pendaftar Beasiswa Bidikmisi Universitas Sebelas Maret dengan Algoritma C4.5 ini untuk memenuhi salah satu syarat memperoleh gelar Sarjana Komputer pada Program Studi Informatika Universitas Sebelas Maret. Keberhasilan penelitian dan penyusunan skripsi ini tidak lepas dari bantuan dan dukungan berbagai pihak. Untuk itu penulis mengucapkan terima kasih sebesar-besarnya kepada : 1. Ayah dan Ibu serta kedua kakak penulis yang selalu mendidik, mendukung, dan mendoakan penulis. 2. Bapak Ristu Saptono, S.Si., M.T. dan Ibu Denis Eka Cahyani, S.Kom, M.Kom selaku dosen pembimbing yang dengan penuh kesabaran telah memberikan ilmu dan bimbingan terbaik kepada penulis. 3. Biro Administrasi Kemahasiswaan Pusat Universitas Sebelas Maret yang telah memberikan izin dan data yang diperlukan guna menyelesaikan penelitian ini. 4. Para Dosen Program Studi Informatika Universitas Sebelas Maret yang telah memberikan ilmu yang bermanfaat kepada penulis. 5. Para Staff dan karyawan serta keluarga SAT UPT TIK Universitas Sebelas Maret yang telah mendukung dan memberikan pengalaman yang berharga kepada penulis. 6. Keluarga besar S1 Informatika FMIPA UNS, khususnya angkatan 2012. Semoga tulisan ini dapat memberikan manfaat kepada para pembaca. Surakarta, Februari 2017 Penulis vi

KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 MUH. SAFRI JULIARDI Program Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret ABSTRAK Beasiswa Bidikmisi adalah salah satu beasiswa untuk mahasiswa kurang mampu namun berprestasi. Dengan banyaknya pendaftar Bidikmisi perlu digunakan sebuah metode yang akurat untuk membantu proses seleksi penerima beasiswa Bidikmisi khususnya di lingkungan Universitas Sebelas Maret (UNS). Pada penelitian ini, algoritma C4.5 diusulkan sebagai metode untuk membantu proses seleksi penerima beasiswa Bidikmisi. Dataset yang digunakan adalah data pendaftar Bidikmisi tahun 2014 dan 2015. Data pendaftar tahun 2014 digunakan sebagai data latih sedangkan data pendaftar tahun 2015 digunakan sebagai data uji. Selain itu, teknik oversampling dan undersampling juga digunakan untuk mengatasi masalah ketidakseimbangan kelas pada data training. Pada akhirnya akurasi dari pohon keputusan dari dataset hasil sampling akan dibandingkan untuk melihat teknik sampling yang lebih baik. Hasil penelitian ini menunjukkan bahwa pohon keputusan yang diuji menggunakan data pendaftar tahun 2015 memiliki nilai accuracy 79,80 % dan nilai Area Under Curve 0.5539. Sementara itu, untuk membandingkan teknik oversampling dan undersampling dipilih pohon keputusan terbaik dari masing-masing hasil sampling. Teknik oversampling menghasilkan nilai precision 82,69 %, recall 91,22 %, dan accuracy 77,16 %. Sedangkan teknik undersampling menghasilkan nilai precision 82,78 %, recall 91,22 %, dan accuracy 77,27 %. Sehingga dapat disimpulkan bahwa teknik undersampling memiliki akurasi yang lebih baik daripada teknik oversampling. Kata kunci : Algoritma C4.5, Bidikmisi, Pohon Keputusan, Oversampling, Undersampling vii

UNIVERSITAS SEBELAS MARET BIDIKMISI APPLICANT S CLASSIFICATION USING C4.5 ALGORITHM MUH. SAFRI JULIARDI Department of Informatics, Faculty of Mathematics and Natural Science, Sebelas Maret University ABSTRACT Bidikmisi scholarship is a scholarship for poor but outstanding students. Because of the amount applicants, there is a need to use an accurate method in the selection process of Bidikmisi scholarship, especially in Universitas Sebelas Maret s (UNS) environment. In this paper, C4.5 algorithm is proposed as a method to help on Bidikmisi recipients selection process. The dataset which is used is Bidikmisi applicants data from 2013 to 2015. The applicant s data from 2013 and 2014 is used as training data and the applicant s data from 2015 is used as testing data. Furthermore, oversampling and undersampling technique is used to address the class imbalance problem in training data. Finally the accuracy for each decision trees are compared to see which sampling method is better. The result of this study shows that the accuracy of the C4.5 algorithm decision tree with the applicant s data from 2015 as testing data is 79,80% and Area Under Curve (AUC) value 0.5539. Meanwhile, to compare the sampling method, the best decision tree based on testing result is chosen. Oversampling technique produce 82,69 % for precision, 91,22 % for recall, and 77,16 % for accuracy. While undersampling technique produce 82,78 % for precision, 91,22 % for recall, and 77,27 % for accuracy. Therefore it is concluded that undersampling technique gives a better accuracy than oversampling technique. Keywords : Bidikmisi, C4.5 algorithm, decision tree, Oversampling, Undersampling viii

DAFTAR ISI HALAMAN PERSETUJUAN...ii HALAMAN PENGESAHAN...Error! Bookmark not defined. HALAMAN PERSEMBAHAN...iv MOTTO...v KATA PENGANTAR... vi ABSTRAK...vii ABSTRACT...viii DAFTAR ISI... ix DAFTAR TABEL...xi DAFTAR GAMBAR...xii DAFTAR LAMPIRAN... xiii BAB I PENDAHULUAN...1 1.1. Latar Belakang...1 1.2. Rumusan Masalah...3 1.3. Batasan Masalah... 3 1.4. Tujuan Penelitian...3 1.5. Manfaat Penelitian...4 1.6. Sistematika Penulisan...4 BAB II TINJAUAN PUSTAKA...5 2.1. Dasar Teori...5 2.1.1. Algoritma C4.5...5 2.1.2. Data Preprocessing... 7 2.1.3. Oversampling dan Undersampling...8 2.1.4. Pengertian Beasiswa Bidikmisi...9 2.2. Penelitian Terkait...10 ix

2.3. Kerangka Pemikiran...12 BAB III METODOLOGI PENELITIAN...14 3.1. Pengumpulan Data...14 3.2. Data Preprocessing...15 3.3. Pelatihan Algoritma C4.5...17 3.4. Pengujian dan Analisa Hasil...17 BAB IV HASIL DAN PEMBAHASAN...21 4.1. Deskripsi Data...21 4.2. Data Preprocessing...24 4.2.1. Data Cleaning... 24 4.2.2. Data Transformation... 24 4.2.3. Sampling... 27 4.3. Pelatihan Algoritma C4.5...28 4.4. Pengujian dan Analisa Hasil...30 BAB V PENUTUP...38 5.1. Kesimpulan... 38 5.2. Saran... 38 DAFTAR PUSTAKA... 40 LAMPIRAN...42 x

DAFTAR TABEL Tabel 3.1. Tabel Konversi Nilai Atribut Penghasilan... 16 Tabel 3.1 Confusion Matrix...17 Tabel 4.1. Jumlah Data Pendaftar Bidikmisi Tahun 2013, 2014, dan 2015... 21 Tabel 4.2. Data Nilai Unik Tiap Atribut...21 Tabel 4.3. Contoh Data Pendaftar Bidikmisi... 23 Tabel 4.4. Tabel Konversi Nilai Atribut Penghasilan... 25 Tabel 4.5. Contoh Data Setelah Melewati Tahap Data Cleaning dan Data Transformation... 26 Tabel 4.6. Tabel Rasio Kelas...28 Tabel 4.7. Contoh Hasil Klasifikasi...31 Tabel 4.8. Confusion Matrix untuk Tiap Pohon Keputusan... 32 Tabel 4.9. Nilai Precision, Recall, Accuracy, dan False Positive Rate pohon keputusan PKA...34 Tabel 4.10. Nilai Precision, Recall, Accuracy, dan False Positive Rate pohon keputusan PKO...34 Tabel 4.11. Nilai Precision, Recall, Accuracy, dan False Positive Rate pohon keputusan PKU...34 xi

DAFTAR GAMBAR Gambar 3.1. Diagram Alir Metodologi Penelitian... 14 Gambar 3.2. Contoh ROC Curve... 19 Gambar 4.1. Contoh Pohon Keputusan C4.5... 29 Gambar 4.2. Contoh Visualisasi Pohon Keputusan C4.5...29 Gambar 4.3. Kurva ROC... 37 xii

DAFTAR LAMPIRAN LAMPIRAN 1... 42 LAMPIRAN 2... 43 LAMPIRAN 3... 44 xiii