KOMPARASI ALGORITMA C4.5 DENGAN NAÏVE BAYES DALAM PENGKLASIFIKASIAN TINGKAT PENDIDIKAN ANAK MISKIN. Andi Nurhayati 1, Andi Baso Kaswar 2

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB 3 METODE PENELITIAN

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

BAB II LANDASAN TEORI

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

BAB 2 TINJAUAN PUSTAKA

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK PREDIKSI PENERIMA BEASISWA BERDASARKAN PRESTASI DI SMA NEGERI 6 SURAKARTA

DAFTAR ISI. ABSTRAK... i. ABSTRACT... ii. KATA PENGANTAR... iii. UCAPAN TERIMA KASIH... iv. DAFTAR ISI... vi. DAFTAR TABEL... ix. DAFTAR GAMBAR...

BAB I PENDAHULUAN Latar Belakang

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes (Studi Kasus: Fasilkom Unilak)

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU


IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG

Jurnal KomTekInfo Fakultas Ilmu Komputer, Volume 1, No. 2, Desember 2014 ISSN :

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

BAB II LANDASAN TEORI

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

DAFTAR ISI. ABSTRAK...i. ABSTRACT...ii. KATA PENGANTAR...iii. UCAPAN TERIMAKASIH...iv. DAFTAR ISI...vi. DAFTAR TABEL...ix. DAFTAR GAMBAR...

Abidah Elcholiqi, Beta Noranita, Indra Waspada

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI PROFIL LULUSAN STMIK LPKIA

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)


APLIKASI DATA MINING DENGAN METODE CLASSIFICATION BERBASIS ALGORITMA C4.5

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN 1-1

Implementasi Metode Klasifikasi Naïve Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

BAB II KAJIAN PUSTAKA. pola seperti teknik statistic dan matematika (Larose, 2005).

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

ALGORITMA BAYESIAN CLASSIFICATION UNTUK MEMPREDIKSI HEREGRISTRASI MAHASISWA BARU DI STMIK WIDYA PRATAMA

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI DATA ULANG PENSIUN

BAB I PENDAHULUAN. berjudul Kualitas SDM Indonesia di Dunia, Indonesia berada pada peringkat 108

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier

Versi Online tersedia di : JURNAL TECH-E (Online)

ALGORITMA DECISION TREE (C4.5) UNTUK MEMPREDIKSI KEPUASAN MAHASISWA TERHADAP KINERJA DOSEN POLITEKNIK TEDC BANDUNG

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

BAB III METODOLOGI PENELITIAN

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

ANALISA DATA PENJUALAN OBAT DENGAN MENGGUNAKAN ALGORITMA APRIORI PADA RUMAH SAKIT UMUM DAERAH H. ABDUL MANAN SIMATUPANG KISARAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN

BAB II TINJAUAN PUSTAKA


BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

REKOMENDASI PENENTUAN PENERIMA BANTUAN IURAN (PBI) MENGGUNAKAN KLASIFIKASI ALGORITMA NAIVE BAYES

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

BAB III METODE PENELITIAN

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

DAFTAR ISI Transformasi data... 47

APLIKASI DATA MINING UNTUK POLA PERMINTAAN DARAH DI UDD ( UNIT DONOR DARAH ) PMI KOTA SURABAYA MENGGUNAKAN METODE APRIORI

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

SISTEM PREDIKSI PENGUNDURAN DIRI PESERTA DIDIK MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER

ALGORITMA NAÏVE BAYES UNTUK PENENTUAN JURUSAN PADA SISWA MADRASAH ALIYAH

TINJAUAN PUSTAKA. Definisi Data Mining

Analisa Data Mining Menggunakan Metode Bayes Untuk Mengukur Tingkat Kerusakan Mesin Motor (Studi Kasus Pada AHASS Astra Motor Kudus)

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

PERBANDINGAN AKURASI KLASIFIKASI TINGKAT KEMISKINAN ANTARA ALGORITMA C 4.5 DAN NAÏVE BAYES

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

SISTEM INFORMASI PENILAIAN SISWA UNTUK PENJURUSAN PADA SMA NEGERI 1 PLOSOKLATEN KEDIRI MENGGUNAKAN METODE NAIVE BAYES SKRIPSI

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

JURNAL PENERAPAN ALGORITMA NAIVE BAYES UNTUK PREDIKSI LAMA STUDI MAHASISWA PADA JURUSAN SISTEM INFORMASI SEKOLAH TINGGI MANAJEMEN INFORMATIKA

CONTOH KASUS DATA MINING

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

BAB III METODOLOGI PENELITIAN

BAB IV HASIL DAN PEMBAHASAN

SISTEM PENDUKUNG KEPUTUSAN UNTUK MEMPREDIKSI KETEPATAN LAMARAN KERJA SISWA MENGGUNAKAN METODE NAIVE BAYES DI SMK ISLAM 1 DURENAN

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

KLASIFIKASI KECENDERUNGAN PENYAKIT MATA DI JAWA BARAT DENGAN ASSOCIATION RULE DAN NAÏVE BAYES CLASSIFIER

KLASIFIKASI PADA TWEET BERBAHASA INDONESIA MENGGUNAKAN METODE GRAVITASI DATA TUGAS AKHIR. Disusun Oleh : Mufida Lutfiah Ulfa

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

Transkripsi:

KOMPARASI ALGORITMA C4.5 DENGAN NAÏVE BAYES DALAM PENGKLASIFIKASIAN TINGKAT PENDIDIKAN ANAK MISKIN Andi Nurhayati 1, Andi Baso Kaswar 2 1),2) Teknik Informatika Universitas Cokroaminoto Palopo Jl Latammacelling No 19 Kota Palopo, 91913 Email : andinurhayati991@gmail.com 1), a.baso.kaswar@gmail.com 2) Abstrak Pendidikan merupakan hal sangat penting bagi setiap orang untuk meningkatkan kualitas Sumber Daya Manusia (SDM). Pendidikan merupakan suatu proses untuk mendapatkan pengajaran dan pelatihan, baik itu melalui pendidikan formal, non formal, maupun informal. Oleh karena itu, perludilakukan klasifikasi terhadap tingkat pendidikan anak miskin di Indonesia dengan menggunakan teknik data mining klasifikasi. Penelitian ini bertujuan untuk membandingkan tingkat pendidikan anak miskin dengan tingkat kesejahteraan 30% dengan menggunakan algoritma C 4.5 dan Naïve Bayes. Perbandingan dilakukan untuk mendapatkan algoritma klasifikasi dengan tingkat akurasi, presisi, dan recall yang tinggi. Hasil penelitian menunjukkan bahwa algoritma C4.5 memiliki persentase tingkat akurasi sebesar 90,48% dibandingkan dengan Naïve Bayes yang persentase tingkat akurasinya hanya berkisar 25,32%. Selain itu, nilai presisi dan recall C4.5 yang berkisar antara 0,8-0,9 juga menunjukkan bahwa algoritma C 4.5 lebih baik dibandingkan Naïve Bayes. Sehingga, dalam pengklasifikasian tingkat pendidikan anak miskin, algoritma C4.5 lebih baik dibandingkan Naïve Bayes.s Kata kunci:c4.5, Naïve Bayes, Pendidikan 1. Pendahuluan Pendidikan merupakan hal yang sangat penting bagi setiap orang untuk meningkat kualitas Sumber Daya Manusia (SDM). Pendidikan merupakan suatu proses untuk mendapatkan pengajaran dan pelatihan, baik itu melalui pendidikan formal, non formal, maupun informal. Hasil survey data statistik dari Badan Pusat Statistik (BPS) menunjukkan bahwa dari 261890,90 ribu jiwa penduduk Indonesia pada tahun 2016, ada sekitar 3,9% yang tidak/belum sekolah, 12,27 % yang tidak tamat SD, 33,08% yang pendidikannya hanya sampai Sekolah Dasar, 16,49% yang pendidikannya hanya sampai Sekolah Menengah, dan 34,27% yang pendidikannya sampai Sekolah Tinggi [1]. Melihat data tersebut, dapat dilihat bahwa tingkat pendidikan di Indonesia masih rendah jika dibandingkan dengan negaranegara lainnya. Hal ini didukung dengan fakta yang didapatkan dari OECD (Organization for Economic Co-operation and Development), yang menyatakan bahwa pada tahun 2017, Indonesia menempati peringkat ke 57 dari total 65 negara [2]. Sementara di ASEAN, Indonesia menempati peringkat 5 dari 10 negara [3]. Berdasarkan hal tersebut, perlu dilakukan klasifikasi terhadap tingkat pendidikan anak miskin di Indonesia dengan menggunakan teknik data mining. Istilah data mining sering juga disebut sebagai Knowledge Discovery in Database (KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar[4]. Singkatnya, data mining merupakan suatu Hal 105 dari 271

proses untuk mendapatkan pola dari sejumlah data dalam pengambilan keputusan. Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu: Deskripsi, estimasi, prediksi, klasifikasi, pengklusteran, dan asosiasi. Namun, dalam penelitian ini, teknik data mining yang digunakan ialah klasifikasi. Klasifikasi adalah sebuah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas daari suatu objek yang labelnya tidak diketahui. Hal ini juga juga dapat dikatakan sebagai pembelajaran (klasifikasi yang dapat memetakan sebuah unsur (item) data kedalam salah satu dari beberapa kelas yang sudah didefinisikan [5]. Dalam memecahkan masalah klasifikasi data mining, ada beberapa teknik yang digunakan, seperti: Algoritma CART (Classification and Regreesion Trees), algoritma k-nearest neighbor, algoritma C4.5, dan algoritma Naïve Bayes, dll. Pada klasifikasi tingkat pendidikan anak miskin di Indonesia, digunakan algoritma klasifikasi, baik itu algoritma C 4.5 dan Naive Bayes. Dalam penelitian ini, kedua metode dibandingkan untuk melihat algoritma klasifikasi yang paling baik digunakan untuk mengklasifikasikan tingkat pendidikan anak miskin di Indonesia. 2. Pembahasan Dalam penelitian ini, terdapat 6 tahapan metodologi yang digunakan, mulai dari pengambilan data, transformasi data, cleaning data, evaluasi model, dan penarikan kesimpulan. Lebih jelasnya, hal ini dapat digambarkan dalam bentuk diagram alir sebagai berikut. Pengambilan Data Transformasi Data Cleaning Data Evaluasi Model Algoritma C 4.5 Algoritma Naïve Bayes Hal 106 dari 271 Penarikan Kesimpulan

Gambar 1. Diagram Alir Metodologi Penelitian Pengambilan Data Pada tahapan ini dilakukan proses pengambilan data yang didapatkan dari sebuah situs yang dikenal dengan nama Satu Data Indonesia, dengan alamat website data.go.id. Satu Data Indonesia adalah portal resmi data terbuka Indonesia, yang berisi data kementerian, lembaga pemerintahan, pemerintahan daerah, dan semua instansi lain yang terkait yang menghasilkan data yang berhubungan dengan Indonesia. Satu Data adalah sebuah inisiatif Pemerintah Indonesia untuk meningkatkan interoperabilitas dan pemanfaatan data pemerintah. Pemanfaatan data pemerintah tidak terbatas pada penggunaan internal antar instansi, tetapi juga sebagai bentuk pemenuhan kebutuhan data publik bagi masyarakat. [6]. Pada situs Satu Data ini terdapat sekumpulan dataset yang ada di Indonesia dan dapat diakses oleh publik. Adapun dataset yang dipilih dalam penelitian ini ialah dataset tentang tingkat pendidikan anak miskin dengan kesejahteraan 30% di Indonesia. Datasetdengan jumlah data sebanyak 463, terdiri atas lima atribut, yakni nama provinsi, jenis kelamin, tingkat pendidikan, jumlah individu, dan kode provinsi. Transformasi Data Pada tahapan ini dilakukan transformasi dataset yang telah didapatkan dari data.go.id untuk diolah dan dianalisis dengan menggunakan software WEKA Tools. Dataset yang semula masih berekstensi csv ditransformasikan ke dalam bentuk dataset yang berekstensi arff, sehingga datasetdapat diproses oleh WEKA Tools. Cleaning Data Sebelum data diolah dan dianalisis dengan menggunakan software WEKA Tools, dilakukan cleaning data, yakni menghapus beberapaatribut yang tidak diperlukan atau tidak relevan dengan apa yang akan dianalisis. Untuk datasettingkat pendidikan anak miskin, beberapa atribut seperti kode provinsi dan nama provinsi dihapus karena kedua atribut tersebut tidak berpengaruh terhadap proses analisis. Evaluasi Model Pada tahapan ini dataset mulai diolah dan dianalisis dengan menggunakan software WEKA Tools. Pengolahan dataset dilakukan dengan menggunakan dua metode algoritma klasifikasi yang berbeda, yakni metode algoritma C4.5 dan Naïve Bayes. Hasil pengolahan datasetberupa tabel informasi, kemudian dilakukan perbandingan terhadap tabel informasi tersebut sehingga dapat ditemukan perbedaan dari kedua metode, baik itu metode algoritma C 4.5 atau Naïve Bayes. Hal 107 dari 271

Penarikan Kesimpulan Setelah dilakukan evaluasi dari kedua metode yang digunakan, dilakukan penarikan kesimpulan, yakni dengan melihat tingkat akurasi, presisi, ataupun recall dari kedua metode. Berdasarkan hasilanalisis dataset denganmenggunakan software WEKA Tools, hasil klasifikasinya ditampilkan dalam bentuk confusion matrix 7 x 7. Confusion matrix adalah suatu metode yang digunakan untuk melakukan perhitungan akurasi pada konsep data mining [7]. Adapun model confusion matrixnya ditunjukkan pada tabel 1. Asli 1 2 3 4 5 6 7 Tabel 1 Model Confussion Matrix7 x 7 Hasil Prediksi 1 2 3 4 5 6 7 K11 K12 K13 K14 K15 K16 K17 K21 K22 K23 K24 K25 K26 K27 K31 K32 K33 K34 K35 K36 K37 K41 K42 K43 K44 K45 K46 K47 K51 K52 K53 K54 K55 K56 K57 K61 K62 K63 K64 K56 K66 K67 K71 K72 K73 K74 K57 K76 K77 Untuk penggambarannya, didapatkan tabel Confussion Matrix untuk metode C4.5 dan Naïve Bayes. Hasilnya dapat dilihat pada gambar 2 untuk metode C4.5 dan gambar 3 untuk metode Naïve Bayes. Gambar 2 Confussion MatrixC4.5 Hal 108 dari 271

Gambar 3 Confussion MatrixNaïve Bayes Berdasarkan evaluasi dari confussion matrix, maka dapat diketahui tingkat akurasi dari masing-masing metode, baik itu metode C4.5 ataupun metode Naïve Bayes. Adapun hasil perbandingan tingkat akurasi dari kedua metode tersebut dapat dilihat pada tabel 2. Tabel 2 Tingkat Akurasi Metode C4.5 dan Naïve Bayes Metode Akurasi C4.5 90.4762 % Naïve Bayes 25.3247 % Selain tingkat akurasi, didapatkan pula nilai presisi dan recall dari masing-masing metode. Presisi didefinisikan sebagai rasio item relevan yang dipilih terhadap semua item terpilih. Presisi merupakan probabilitas bahwa sebuah item yang dipilih adalah relevan. Dapat diartikan sebagai kecocokan antara permintaan informasi dengan jawaban terhadap permintaan itu [8]. Sementara itu, recall adalah probabilitas informasi relevan yang didapatkan kembali oleh sistem dibandingkan jumlah informasi-informasi yang relevan [9]. Recall dapat dihitung dengan jumlah rekomendasi yang relevan yang dipilih oleh user dibagi dengan jumlah semua rekomendasi yang relevan baik dipilih maupun rekomendasi yang tidak terpilih [8]. Hasil nilai presisi dan recall berkisar antara 0-1, dimana semakin tinggi nilainya, maka semakin baik pula metode tersebut. Adapun nilai presisi dan recall yang diperoleh dari model klasifikasi dari metode C4.5 ditujukkan pada tabel 3 dan metode Naïve Bayes ditunjukkan pada tabel 4 Tabel 3 Nilai Presisi dan Recall C4.5 Klasifikasi Presisi Recall M. Aliyah 0.840 0.955 M. Ibtidaiyah 0.810 0.970 M. Tsanawiyah 0.859 0.833 Perguruan Tinggi 0.920 0.697 SD/SDLB/Paket A 0.985 1.000 SMA/SMK/SMALB/Paket C 0.968 0.924 SMPT/SMPLB/Paket B 0.984 0.955 Tabel 4 Nilai Presisi dan RecallNaïve Bayes Klasifikasi Presisi Recall M. Aliyah 0.396 0.606 M. Ibtidaiyah 0.000 0.000 M. Tsanawiyah 0.072 0.091 Perguruan Tinggi 0.310 0.667 SD/SDLB/Paket A 0.750 0.273 Hal 109 dari 271

SMA/SMK/SMALB/Paket C 0.106 0.106 SMPT/SMPLB/Paket B 0.059 0.030 Berdasarkan nilai presisi dan recall C4.5 dan Naïve Bayes seperti yang ditunjukkan pada tabel 3 dan 4, maka dapat dilihat bahwa metode C4.5 memiliki nilai presisi dan recall yang lebih baik dibandingkan Naïve Bayes. 3. Kesimpulan Berdasarkan hasil analisis dataset tingkat pendidikan anak miskin dengan menggunakan software WEKA Tools, dihasilkan 7 kelompok kelas klasifikasi, diantaranya: M. Aliyah, M. Ibtidaiyah, M.Tsanawiyah,Perguruan Tinggi, SD/SDLB/Paket A, SMA/SMK/SMALB/Paket C, dan SMPT/SMPLB/Paket B. Selanjutnya hasil perbandingan dataset dengan menggunakan kedua metode klasifikasi, yakni algoritma C4.5 dan Naïve Bayes, menunjukkan bahwa algoritma C4.5 memiliki tingkat akurasi klasifikasi 65.1515% yang lebih tinggi dibandingkan Naïve Bayes. Dari hasil analisis, dapat dilihat pula hasil nilai presisi dan recall yang cukup jauh dari kedua metode tersebut. Jika nilai presisi dan recall pada algoritma C4.5 berkisar antara 0,9 0,8, maka padaalgoritma Naïve Bayes, nilai presisi dan recallnya berkisar antara 0,0-0,3. Sehingga hal tersebutmenunjukkan bahwa algoritma C4.5 lebih baik dibandingkannaïve Bayesdalam mengklasifikasian tingkat pendidikan anak miskin. Daftar Pustaka [1] [BPS] Badan Pusat Statistik. 2016. Indikator Pendidikan 1994-2016. Jakarta. 1 hal. [2] Portal Pendidikan Indonesia. 2017. Pendidikan Indonesia Beradadi Peringkat ke 57 Dunia Versi OECD http://edupost.id/internasional/pendidikan-indonesia-berada-diperingkat-ke-57-dunia-versi-oecd/diakses pada 09 Juli 2017 [3] DW Akademie. 2017. Rangking Pendidikan Negara-Negara ASEAN http://www.dw.com/id/rangking-pendidikan-negara-negara-asean/g-37594464diakses pada 09 Juli 2017 [4] Ridwan, Mujib, Suyono, Hadi, dan Sarosa, M. 2013. Penerapan Data Mining Untuk Evaluasi Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes Classifier Jurnal EECCIS Vol 7 (1): 59-64 [5] Kusrini, dan Luthfi, Emha Taufiq, 2009. Algoritma Data Mining. Yogyakarta: C.V Andi Offset. [6] Satu Data Indonesia. 2015. Tentang Satu Data Indonesia http://data.go.id/tentang/ Diakses pada 09 Juli 2017 [7] Mayadewi, Paramita dan Rosely, Ely. 2015. Prediksi Nilai Proyek Akhir Mahasiswa Menggunakan Algoritma Klasifikasi Data Mining. Seminar Nasional Sistem Informasi Indonesia. Surabaya. 2-3 November 2015. [8] Swastina, Liliana. 2013. Penerapan Algoritma C4.5 untuk Penentuan Jurusan Mahasiswa. Jurnal GEMA AKTUALITA Vol 2 (1): 93-98 [9] Anggaraini, Ratih Nur Esti, Zinni, Mohammad Ahmaluddin, dan Rochimah, Siti. 2016. Kakas Bantu Pendeteksi Kesalahan Tanda Baca pada Karya Tulis Ilmiah Jurnal Ilmiah Teknolog Infornasi Vol 14(1): 117-125 Hal 110 dari 271