Versi Online tersedia di : JURNAL TECH-E (Online)

dokumen-dokumen yang mirip
TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

PERBANDINGAN DECISION TREE

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

BAB III ANALISA DAN DESAIN SISTEM

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

khazanah Aplikasi Pemrediksi Masa Studi dan Predikat Kelulusan Mahasiswa Informatika Universitas Muhammadiyah Surakarta Menggunakan Metode Naive Bayes

BAB III ANALISIS DAN DESAIN SISTEM

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB III ANALISA DAN PERANCANGAN

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

BAB IV HASIL DAN UJICOBA

BAB III METODOLOGI PENELITIAN

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

BAB IV PERANCANGAN SISTEM

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

PENGEMBANGAN PERANGKAT LUNAK DIAGNOSA PENYAKIT DIABETES MELLITUS TIPE II BERBASIS TEKNIK KLASIFIKASI DATA ABSTRACT

Burhanudin Junardi Karim Dr. Lintang Yuniar Banowosari, S.Kom., M.Sc

Implementasi Metode K-Nearest Neighbor Pada Aplikasi Data Penjualan PT. Multitek Mitra Sejati

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

BAB IV ANALISA DAN PERANCANGAN

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

KOMPARASI ALGORITMA NAÏVE BAYES DAN K- NEAREST NEIGHBOR UNTUK DETEKSI KANKER PAYUDARA

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

BAB III METODE PENELITIAN

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

BAB 3 METODE PENELITIAN

Prediksi Kenaikan Rata-Rata Volume Perikanan Tangkap Dengan Teknik Data Mining

Oleh: Astrid Darmawan Pembimbing: Selvia Lorena Br. Ginting, M.T Wendi Zarman, M.Si

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

SILABUS MATAKULIAH. Revisi : 4 Tanggal Berlaku : 04 September Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

Klasifikasi Berbasis Algoritma C4.5 untuk Deteksi Kenaikan Case Fatality Rate Demam Berdarah

Klasifikasi Penerima Bantuan Kredit Koperasi Dengan Metode ID3

Berdasarkan sistem yang sedang berjalan, tahapan-tahapan proses. deteksi adanya viskositas darah dalam tubuh adalah sebagai berikut :

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III ANALISIS DAN DESAIN SISTEM

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

Educational Data Mining untuk Mengetahui Pola Minat Kerja Mahasiswa

SILABUS MATAKULIAH. Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

BAB III ANALISA DAN DESAIN SISTEM

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

BAB III ANALISA DAN DESAIN SISTEM

BAB II LANDASAN TEORI

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI

BAB 1 PENDAHULUAN Latar Belakang

KLASIFIKASI PENERIMA BEASISWA KOPERTIS DENGAN MENGGUNAKAN ALGORITMA C.45

SISTEM PREDIKSI PENYAKIT DIABETES BERBASIS DECISION TREE

BAB III ANALISIS DAN PERANCANGAN

BAB II LANDASAN TEORI

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

KAJIAN PERANCANGAN RULE KENAIKAN JABATAN PADA PT. ABC

SKRIPSI TI S1 FIK UDINUS 1

Pemanfaatan Educational Data Mining (EDM)...

DATA DAN METODE Data

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

MODEL ALGORITMA K-NEAREST NEIGHBOR

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR

BAB III ANALISA DAN DESAIN SISTEM

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

BAB III ANALISIS DAN DESAIN SISTEM

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

BAB IV HASIL DAN PEMBAHASAN

Pengolahan Data. Algoritma C4.5 Menghitung entropi : Data Training (75%) = 220 data Data Testing (25%) = 73 data

BAB IV HASIL DAN UJICOBA

BAB IV ANALISIS DAN PERANCANGAN SISTEM. permasalahan dari suatu sistem informasi. Hasil akhir dari analisis sistem

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

SISTEM REKOMENDASI PROSES KELULUSAN MAHASISWA BERBASIS ALGORITMA KLASIFIKASI C4.5

TINJAUAN PUSTAKA. Definisi Data Mining

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

Technologia Vol 7, No.3, Juli September OPTIMASI KLASIFIKASI PENILAIAN AKREDITASI LEMBAGA KURSUS MENGGUNAKAN METODE K-NN DAN NAIVE BAYES

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

60 Register: Jurnal Ilmiah Teknologi Sistem Informasi, Juli 2016, Volume 2, Nomor 2

BAB I PENDAHULUAN 1-1

IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Transkripsi:

JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada Universitas Buddhi Dharma Menggunakan Perbandingan Algoritma C4.5 dan K- NN Suwitno 1 1 Universitas Buddhi Dharma, Sistem Informasi, Banten, Indonesia JEJAK PENGIRIMAN Diterima: Agustus 15, 2017 Revisi Akhir: Agustus 20, 2017 Tersedia Online: September 13, 2017 KATA KUNCI C4.5, K-NN, Kelulusan Tepat Waktu, Prediksi KORESPONDENSI Telepon: 0813111008 E-mail: suwit.ang1305@gmail..com A B S T R A K Koleksi data pada database sistem informasi akademik Perguruan Tinggi sering tidak dimanfaatkan secara maksimal, padahal dari data tersebut dengan teknik data mining dapat memberikan pengetahuan yang belum diketahui sebelumnya. Tujuan dalam penelitian ini yaitu mengetahui cara membentuk model prediksi tingkat kelulusan mahasiswa tepat waktu pada Universitas Buddhi Dharma Tangerang melalui data kelulusan mahasiswa. Evaluasi kinerja klasifikasi dilakukan untuk mengetahui seberapa baik keakuratan dari suatu model yang terbentuk dengan perbandingan algoritma C4.5 dan K-NN. Pengujian dilakukan dengan Confusion Matrix dan kurva ROC. Hasil akurasi yang diperoleh membuktikan bahwa Algoritma C4.5 menghasilkan persentase akurasi 0% dan K- NN menghasilkan persentase akurasi 87%. Dengan demikian algoritma C4.5 memiliki nilai akurasi lebih tinggi dibanding K-NN. Algoritma C4.5 ini dapat digunakan untuk pembuatan aplikasi prediksi kelulusan mahasiswa tepat waktu pada Universitas Buddhi Dharma. PENGANTAR Perkembangan teknologi informasi yang begitu maju saat ini, menyebabkan tingkat akurasi suatu data sangat dibutuhkan dalam kehidupan sehari-hari. Setiap informasi yang ada menjadi suatu hal penting untuk menentukan setiap keputusan dalam situasi tertentu. Hal ini memyebabkan penyediaan informasi menjadi sarana untuk dianalisa dan diringkas menjadi suatu pengetahuan dari data yang bermanfaat ketika pengambilan suatu keputusan dilakukan. Dalam sistem pendidikan, mahasiswa adalah aset penting bagi sebuah institusi pendidikan dan untuk itu perlu diperhatikan tingkat kelulusan mahasiswa tepat pada waktunya. Prosentase naik turunnya kemampuan mahasiswa untuk menyelesaikan studi tepat waktu merupakan salah satu elemen penilaian akreditasi universitas. Untuk itu perlu adanya pemantauan maupun evaluasi terhadap kecenderungan mahasiswa lulus tepat waktu atau tidak.

I. METODE Algoritma C4.5 Algoritma C4.5 didesain oleh J. Ross Quinlan, dinamakan C4.5 karena merupakan keturunan dari pendekatan ID3 untuk membangun pohon keputusan. C4.5 merupakan algoritma yang cocok digunakan untuk masalah klasifikasi pada machine learning dan data mining[1]. C4.5 memetakan atribut dari kelas sehingga dapat digunakan untuk menemukan prediksi terhadap data yang belum muncul. Didalam pohon keputusan node pusat merupakan attribut dari data yang diuji (tuple), cabang merupakan hasil dari pengujian atribut, dan daun merupakan kelas yang terbentuk[2]. Tahapan dalam algoritma C4.5, yakni: a. Perhatikan label pada data, jika sudah sama semua, maka akan dibentuk daun dengan nilai label data keseluruhan. b. Menghitung nilai total informasi (Entropy) m Entropy = p i log 2 (p i ) i=1 c. Menghitung nilai info setiap atribut (Info) v Info A (D) = D j D Info(D j) j=1 d. Menghitung nilai gain setiap atribut (Gain) Gain(A) = Entropy Info A (D) e. Setelah cabang pohon keputusan terbentuk, perhitungan dilakukan kembali seperti pada tahap a sampai d. Namun jika cabang telah mencapai maksimal cabang yang diperbolehkan, daun akan terbentuk dengan nilai mayoritas dari nilai data. Algoritma K-Nearest Neighbor (K-NN) Algoritma K-Nearest Neighbor (K-NN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan obyek tersebut[5]. Algoritma K-NN menggunakan algoritma supervised. Perbedaan antara supervised learning dengan unsupervised learning adalah pada supervised learning bertujuan untuk menemukan pola baru dalam data dengan menghubungkan pola data yang sudah ada dengan data yang baru. Sedangkan pada unsupervised learning, data belum memiliki pola apapun, dan tujuan unsupervised learning untuk menemukan pola dalam sebuah data. Nearest Neighbor adalah suatu pendekatan untuk melakukan proses penghitungan kedekatan antara kasus baru dengan kasus lama, yaitu berdasarkan pada pencocokan dari sejumlah fitur yang ada. Untuk mendefinisikan jarak antara dua titik yaitu titik pada data training (x) dan titik pada data testing (y) maka digunakan rumus Euclidean, dengan persamaan: n D (x, y) = (x i y j ) 2 i=1 Tahapan dalam algoritma K-NN yakni: a. Menentukan parameter k (jumlah tetangga paling dekat). b. Menghitung kuadrat jarak Euclidean (queri instance) masing-masing objek terhadap data training yang telah diberikan. c.kemudian mengurutkan objek-objek tersebut ke dalam kelompok yang mempunyai jarak Euclidean terkecil. d. Mengumpulkan kategori baru k (klasifikasi Nearest Neighbor) e. Dengan menggunakan kategori Nearest Neighbor yang paling mayoritas maka dapat diprediksi nilai queri instance yang dihitung. Penelitian yang akurat akan diperoleh jika suatu penelitian memiliki jumlah pengambilan sampel dalam jumlah yang besar didalam suatu populasi. Pada penelitian ini, pengujian aplikasi untuk prediksi ketepatan waktu lulus mahasiswa dan metode pengambilan sampel menggunakan metode systematic sampling. Data kelulusan yang digunakan sebagai sampel dalam penelitian ini diperoleh dari database Sistem Informasi Akademik (SIA) Perguruan Tinggi. Data yang digunakan sejumlah 30 data mahasiswa yang telah lulus dengan 300 data sebagai data training dan 0 data sebagai data testing. Tujuan dari algoritma klasifikasi adalah untuk menemukan relasi antara beberapa variabel yang tergolong dalam kelas yang sama. Relasi tersebut akan digambarkan dengan aturan- 30

aturan agar dapat memprediksi kelas dari data yang attributnya sudah diketahui. Klasifikasi C4.5 dan K-Nearest Neighbor dipilih karena metode ini memiliki tingkat ketelitian dan kecepatan yang tinggi saat diaplikasikan untuk jumlah data yang besar dan dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. II. HASIL Langkah penting dalam penelitian ini adalah pemakaian algoritma C4.5 dan K-NN untuk membentuk sebuah model. Model yang dihasilkan akan dilakukan komparasi untuk menemukan tingkat akurasi yang paling baik yang akan digunakan untuk mengetahui pola kemampuan mahasiswa yang memiliki kemampuan lulus tepat waktu atau tidaknya. Dalam penelitian ini dilakukan proses validasi untuk menemukan, dan mengkonversi data agar dapat digunakan dalam metode algoritma data mining dan memperoleh akurasi serta performasi yang baik. Dalam dataset yang akan digunakan ini, validasi data yang digunakan adalah dengan hapus data yang tidak lengkap atau kosong yang tidak memiliki nilai (null). Setelah itu dilakukan seleksi atribut untuk memilih atribut mana saja yang dibutuhkan dari dataset yang digunakan dalam proses menganalisis kelulusan mahasiswa tepat waktu pada Universitas Buddhi Dharma. Tabel 1. Daftar Atribut dan Keterangannya No Atribut 1 Waktu Kuliah 2 Jenis Kelamin 3 Prodi 4 IPS1 5 IPS2 6 IPS3 7 IPS4 Keterangan Waktu Kuliah Jenis Kelamin Program Studi Ips Semester 1 Ips Semester 2 Ips Semester 3 Ips Semester 4 8 IPK_4 10 11 12 Total_ SKS_ Lulus4 Jur_Asl_Seko lah Status_Asal_ Sklh 13 Cuti Status_Pek_ Ortu Ipk Semester 4 Total SKS yang telah lulus hingga semester 4 Jurusan Asal Sekolah Status Asal Sekolah Status Pekerjaan Orang Tua Jumlah Cuti yang pernah diambil Data kelulusan untuk data latih dan data uji yang dikumpulkan memiliki 30 records dan 13 atribut. Semua atribut tersebut dikumpulkan dan dianalisa untuk melihat pola data dan tipe data yang dominan untuk membantu dalam proses pemilihan metode dan algoritma data mining yang tepat. Tabel 2. Perbandingan tingkat akurasi dan AUC Prediksi Algoritma C4.5 Algoritma K-NN Sukses prediksi Tepat Waktu 171 16 Sukses Prediksi Tidak Tepat 3 Waktu Tingkat Akurasi 0% 87.33% AUC 0,874 0,500 Dengan melihat perbandingan tingkat akurasi dan AUC, maka dapat diketahui bahwa algoritma C4.5 memiliki akurasi dan performansi terbaik, sehingga rule yang dihasilkan oleh algoritma C4.5 dijadikan sebagai rule untuk pembuatan prototipe yang dapat memudahkan dalam prediksi kelulusan mahasiswa tepat waktu yang di dapat mahasiswa. 31

Gambar 1: Akurasi Algoritma C4.5 Gambar 2: Tingkat AUC Algoritma C4.5 Gambar 3: Akurasi Algoritma K-NN Gambar 4: Tingkat AUC Algoritma K-NN 32

Gambar 5: Pohon Keputusan Algoritma C4.5 Rule yang dihailkan dari pohon keputusan (decision tree) berdasarkan data training adalah sebagao berikut: mengunakan metode confusion matrix, yaitu tabel yang digunakan sebagai alat ukur yang berguna untuk melakukan analisis seberapa baik pengklasifikasian benar dan salah dari prediksi yang dilakukan. Accuracy yang didapat dapat dihitung dengan rumus: Accuracy = correct predictions correct and incorect predictions Sedangkan untuk menghitung Error rate dapat digitung dengan rumus: Error rate = incorrect predictions correct and incorect predictions III. PEMBAHASAN Salah satu hal yang paling penting untuk menentukan kesalahan-kesalahan atau kekurangan-kekurangan pada aplikasi prediksi yang dikembangkan adalah melakukan pengujian. Pengujian dilakukan sebanyak sembilan kali yang mana melibatkan 0 data selain data training dan Tabel 3. Hasil Pengujian Pengujian ke- accuracy error rate K-1 80% 20% K-2 0% 10% K-3 100% 0% K-4 0% 10% K-5 100% 0% K-6 0% 10% K-7 100% 0% K-8 0% 10% K- 80% 20% 33

Prototipe SI Prediksi Kelulusan Mhsw Tepat Waktu view data training list data testing <extend> <include> login User summary data impor data testing prediksi data baru Gambar 6: Use Case Diagram Sistem User form login entry username & password [invalid] [valid] login view Menu tampilan lihat data training menampilkan data training lihat data testing menampilkan data testing import data testing summary data testing entry data testing baru prediksi data baru logout keluar dari sistem Gambar 7: Activity Diagram 34

Dari sembilan percobaan yang telah dilakukan, maka didapat summary yaitu: untuk tingkat accuracy sebesar: 80 + 0 + 100 + 0 + 100 + 0 + 100 + 0 + 80 = 820 x 100% x 100% = 1, 11% dan untuk tingkat error rate sebesar: 20 + 10 + 0 + 10 + 0 + 10 + 0 + 10 + 20 = 80 x 100% = 8, 8% x 100% IV. KESIMPULAN Dari pengukuran kinerja dan performasi yang telah dilakukan terhadap dua metode algoritma klasifikasi, maka hasil dari penelitian ini dapat disimpulkan bahwa: 1. Metode klasifikasi data mining tepat untuk diimplementasikan kedalam prototipe sistem informasi prediksi kelulusan mahasiswa tepat waktu. 2. Algoritma C4.5 memiliki tingkat akurasi paling baik diantara kedua algoritma klasifikasi tersebut. Sehingga algoritma inilah yang akan di implementasikan kedalam prototipe prediksi kelulusan mahasiswa tepat waktu. Hal ini dapat dilihat bahwa algoritma C4.5 memiliki nilai akurasi sebesar 0% dan nilai AUC 0,874 yang termasuk kategori good classification. 3. Dengan adanya penelitian ini membantu manajemen perguruan tinggi dalam melakukan evaluasi dan pemantauan terhadap mahasiswa yang lulus tepat waktu atau tidak. 35

REFERENSI Alpaydın, E., Introduction to Machine Learning. Second., London: The MIT Press, 2012. Chapman, P., CRISP-DM 1.0, Step-by-step data mining guide, 2000. Gorunescu, F., Data Mining Concepts, Models and Techniques, Springer, 2011. Hall, T., A Systematic Literature Review on Fault Prediction Performance in Software Engineering, 2011. Vercellis, C., Business Intelligence : Data Mining and Optimization for Decision Making, John Wiley & Sons, Inc, 200. Witten et al., Data Mining Practical Machine Learning Tools and Techniques 3rd, Burlington: Elsevier Inc, 2011. Wu, X. et al., Top 10 algorithms in data mining, A Chapman & Hall Book, 2008. RIWAYAT HIDUP Suwitno Lulus pada Program Studi Sistem Informasi (S1) di bidang Perusahaan, 2015, Program Studi Ilmu Komputer (S2) di bidang Rekayasa Komputasi Terapan, 2017. Saat ini Sebagai Dosen Tetap pada Program Studi Sistem Informasi, Universitas Buddhi Dharma. 36