Educational Data Mining (EDM) untuk Memprediksi Keterlambatan Masa Studi Mahasiswa Menggunakan Algoritma C4.5

dokumen-dokumen yang mirip
Pemanfaatan Educational Data Mining (EDM)...

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

Versi Online tersedia di : JURNAL TECH-E (Online)

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

PENGEMBANGAN PERANGKAT LUNAK DIAGNOSA PENYAKIT DIABETES MELLITUS TIPE II BERBASIS TEKNIK KLASIFIKASI DATA ABSTRACT

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

PERBANDINGAN DECISION TREE

Pengolahan Data. Algoritma C4.5 Menghitung entropi : Data Training (75%) = 220 data Data Testing (25%) = 73 data

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

Educational Data Mining untuk Mengetahui Pola Minat Kerja Mahasiswa

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

BAB III METODE PENELITIAN

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

Prosiding SNATIF Ke-1 Tahun 2014 ISBN:

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

BAB I PENDAHULUAN 1.1 Latar Belakang

PENGAMBILAN KEPUTUSAN UNTUK PENENTUAN BEASISWA TEPAT SASARAN MENGGUNAKAN METODE DECISION TREE DI SMK TARUNA BAKTI KERTOSONO

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB II LANDASAN TEORI

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

KAJIAN ALGORITMA NAÏVE BAYES DALAM PEMILIHAN PENERIMAAN BEASISWA TINGKAT SMA

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

SNIPTEK 2014 ISBN:

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa

IMPLEMENTASI TEKNIK SELEKSI FITUR INFORMATION GAIN PADA ALGORITMA KLASIFIKASI MACHINE LEARNING UNTUK PREDIKSI PERFORMA AKADEMIK SISWA

BAB II LANDASAN TEORI

PENERAPAN DECISION TREE UNTUK MENGANALISIS KEMUNGKINAN PENGUNDURAN DIRI CALON MAHASISWA BARU

Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes (Studi Kasus: Fasilkom Unilak)

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

BAB III METODOLOGI PENELITIAN. Dataset

BAB 2 LANDASAN TEORI

60 Register: Jurnal Ilmiah Teknologi Sistem Informasi, Juli 2016, Volume 2, Nomor 2

Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes: Studi Kasus UIN Syarif Hidayatullah Jakarta

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Application Determination Of Credit Feasibility in Sharia Cooperative

PREDIKSI CALON MAHASISWA BARU MENGUNAKAN METODE KLASIFIKASI DECISION TREE

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

BAB II TINJAUAN PUSTAKA

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

PENERAPAN DATA MINING KLASIFIKASI DENGAN MENGGUNAKAN ALGORITNMA C 4.5 PADA DATA NASABAH KREDIT KOPERASI SIMPAN PINJAM GRAHA MANDIRI TEGAL

Prediksi Ketepatan Waktu Kelulusan Dengan Algoritma Data Mining C4.5

PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI PROFIL LULUSAN STMIK LPKIA

PREDIKSI KETEPATAN KELULUSAN MAHASISWA MENGGUNAKAN METODE DECISION TREE BERBASIS PARTICLE SWARM OPTIMATION (PSO)

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

Triuli Novianti 1) Abdul Aziz 2) Program Studi D3 Teknik Komputer UMSurabaya, Surabaya ),

ISSN : e-proceeding of Management : Vol.4, No.2 Agustus 2017 Page 1472

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

SISTEM REKOMENDASI PROSES KELULUSAN MAHASISWA BERBASIS ALGORITMA KLASIFIKASI C4.5

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA

DATA MINING UNTUK REKOMENDASI KERJA BAGI ALUMI DENGAN ALGORITMA GARC(GAIN BASED ASSOCIATION RULE CLASSIFICTION)

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS

KLASIFIKASI TINGKAT PENGETAHUAN IBU DALAM PEMBERIAN ASI EKSLUSIF DENGAN METODE DECISION TREE

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

SKRIPSI TI S1 FIK UDINUS 1

TINJAUAN PUSTAKA. Definisi Data Mining

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB I PENDAHULUAN Latar Belakang

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

Manfaat Pohon Keputusan

DATA MINING CLASSIFICATION UNTUK PREDIKSI LAMA MASA STUDI MAHASISWA BERDASARKAN JALUR PENERIMAAN DENGAN METODE NAIVE BAYES

Transkripsi:

Prosiding Seminar Nasional Masif II Tahun 2016 285 Educational Data Mining (EDM) untuk Memprediksi Keterlambatan Masa Studi Mahasiswa Menggunakan Algoritma C4.5 Defri Kurniawan 1), Wibowo Wicaksono 2), Yani Parti Astuti 3) 1,2,3) Universitas Dian Nuswantoro (Udinus) 1defri.kurniawan@dsn.dinus.ac.id, 2 wibowo.wicaksono@dsn.dinus.ac.id 3yanipartiastuti@dsn.dinus.ac.id Abstrak Bagaimana mahasiswa dapat lulus dengan tepat waktu merupakan suatu upaya yang terus dilakukan oleh tiap pengelola akademik. Mahasiswa yang memiliki masa studi lebih (tidak tepat waktu) merupakan ancaman bagi keberhasilan studinya danuniversitas. Educational Data mining diusulkan sebagai suatu upayadalam memprediksi masa studi mahasiswadengan melihat data profil mahasiswa dan data akademik, apakah mahasiswa tersebut dapat lulus tepat waktu atau tidak tepat waktu. Algoritma C4.5 diterapkan untuk memberikan gambaran klasifikasi masa studi mahasiswa melalui pohon keputusan (decision tree) yang terbentuk. Penelitian menunjukkan algoritma C4.5 mampu memberikan hasil akurasi sebesar 73,68% dari pengolaan data mahasiswa Teknik Informatika Udinus angkatan 2008 sampai dengan 2011. Kata Kunci: Masa Studi Mahasiswa, Educational Data Mining, Data Mining, Algoritma C4.5, Decision Tree. I. PENDAHULUAN Tersedianya data yang melimpah pada institusi pendidikan harus dimanfaatkan dengan baik. Salah satu cara untuk mencapai tingkat kualitas tertinggi dalam sistem pendidikan adalah dengan menemukan pengetahuan dari data-data pendidikan untuk dapat mempelajari atribut utama yang dapat mempengaruhi kinerja siswa[1]. Atribut masa studi merupakan hal penting bagi pengelola universitas, bagaimana mahasiswa dapat lulus dengan tepat waktu merupakan suatu upaya yang terus dilakukan. Mahasiswa yang memiliki masa studi lebih (tidak tepat waktu) memiliki potensi tidak lulus pada studinya. Menjadi suatu tantangan bagi univeritas modern saat ini, untuk dapat menganalisa kinerja mahasiswa (student performance), mengidentifikasi keunikankeunikan yang ada pada mahasiswa dan membangun suatu strategi pengembangan lebih lanjut dan tindakan-tindakan di masa depan[2].sulitnya memahami dan menemukan pola studi mahasiswa dari data profil dan akademik mahasiswa dalam jumlah databesar yang berpengaruh terhadapmasa studi mahasiswa menjadi suatu permasalahan yang akan dijawab. Data mining dapat diusulkan sebagai salah satu pendekatan yang dapat dilakukan untuk memprediksi kinerja siswa [3].Data mining merupakan suatu cara dalam menggali informasi dari sejumlah data yang biasanya tersimpan dalam repositori dengan menggunakan teknologi pengenalan pola, statistik dan teknik matematika [4].Klasifikasi dan Prediksi merupakan pekerjaan-pekerjaan yang dapat dilakukan pada data mining. Klasifikasi adalah proses menemukan model (atau fungsi) yang menggambarkan dan membedakan kelas data atau konsep[5]. Model tersebut akan digunakan untuk melakukan prediksi output terhadap sekumpulan data yang belum diketahui label kelasnya.model terbentuk dari analisis suatu kumpulan data pelatihan (data objek yangtelah memiliki label kelas) dengan menggunakan algoritma atau teknik tertentu. Penerapan metode data mining dalam menganalisis data yang tersedia di lembaga pendidikan didefinisikan sebagai Educational Data Mining (EDM) [6]. EDM berkaitan dengan pengembangan metode untuk mengeksplorasi jenis yang unik dari data-data pada pengelolaan pendidikan dan menggunakannya untuk lebih memahami siswa dan pengelolaannya [7]. EDM merupakan suatu aliran yang relatif baru dalam penelitian data mining. Pada penelitian Pandey dan Pal[8] EDM digunakan untuk mengukur kinerja siswa pendatang baru, apakah mereka bisa menjalankan studinya dengan baik (performed) atau tidak dengan memilih 600 mahasiswa dari perguruan tinggi yang berbeda dari Dr. R. M. L. Awadh University, Faizabad, India dengan menggunakan Byes Classification. Bharadwaj dan Pal[9] melakukan penelitian pada kinerja siswa dengan memilih 300 mahasiswa dari 5 perguruan tinggi sederajat yang berbeda pada BCA (Bachelor of Computer ISBN 978-602-74268-1-8 FPMIPATI, Universitas PGRI Semarang

286 Prosiding Seminar Nasional Masif II Tahun 2016 Application) dari Dr. R. M. L. Awadh University, Faizabad, Indiadengan menggunakan metode klasifikasi Bayesian pada 17 atribut, ditemukan bahwa faktor-faktor seperti ujian SLTA, lokasi tinggal, media pengajaran, kualifikasi ibu, kebiasaan lain mahasiswa, pendapatan tahunan keluarga dan status keluarga siswa tersebut sangat terkait dengan prestasi akademiksiswa. Penelitian oleh Z. J. Kovacic[10] berdasarkan studi kasus mengidentifikasi sampai sejauh mana data pendaftaran dapat digunakan untuk memprediksi keberhasilan siswa. Algoritma CHAID dan CART diterapkan pada data pendaftaran mahasiswa Sistem Informasi politeknik terbuka New Zealand untuk mendapatkan dua pohon keputusan dalam mengelompokkan siswa sukses dan tidak sukses. Akurasi diperoleh masing-masinguntuk CHAID dan CART adalah 59,4dan 60,5. Penelitian Yadav dan Pal [11]melakukan prediksi pada data pendidikan untuk mengidentifikasi siswa yang lemah dan membantu mereka untuk mencetak nilai yang lebih baik. Algoritma C4.5, ID3 dan CART diterapkan dan dibandingkan akurasinya, hasil menunjukkan bahwa teknik C4.5 memiliki akurasi paling tinggi yaitu 67,78% dibandingkan dengan teknik lainnya. Berdasarkan penelitian-penelitian yang telah dilakukan sebelumnya, algoritma C4.5 akan digunakan pada penelitian ini karena memiliki tingkat akurasi yang lebih baik dan dapat memberikan gambaran klasifikasi mahasiswa yang tepat waktu atau tidak tepat waktu berupa pohon keputusan (Decision Tree) yang bermanfaat bagi pengelola akademik. Algoritma C4.5 merupakan penerus dari ID3 yang dikembangkan oleh Quinlan Ross[12].Langkah awal algoritma C4.5 adalah dengan menghitung nilai gain ratiodari setiap atribut. Nilai gain ratio tertinggi akan menjadi simpul akar (root node). C4.5 akan menghilangkan cabang yang tidak perlu dalam pohon keputusan untuk meningkatkan akurasi klasifikasi[11].algoritma C4.5, ID3 dan CART termasuk dalam pembelajaran pohon keputusan (Decision Tree Learner). Decision Treemenyerupai sebuah struktur pohon dimana terdapat node internal (bukan daun) yang mendeskripsikan atribut-atribut, setiap cabang menggambarkan hasil dari atribut yang diuji, dan setiap daun menggambarkan kelas[5]. Pohon keputusan bekerja mulai dari akar paling atas (root node), jika diberikan sejumlah data uji, misalnya X dimana kelas dari data X belum diketahui, maka pohon keputusan akan menelusuri mulai dari akar sampai node dan setiap nilai dari atribut sesuai data X diuji apakah sesuai dengan aturandecision Tree, kemudian pohon keputusan akan memprediksi kelas dari tupel X. II. METODE PENELITIAN Metode penelitian yang dilakukan adalah metode penelitian eksperimen dengan tahapan penelitian sebagai berikut [13]: PENGUMPULAN DATA Data profil mahasiswa dan data akademik mahasiswa Teknik Informatika (TI) S-1 UDINUS Angkatan 2008 s.d 2011 PENGOLAHAN AWAL DATA Data awal diolah dengan menggabungkan data ldentitas mahasiswa dengan data akademik mahasiswa (data integration) dan melakukan pengurangan atribut dan record (data reduction) MODEL/METODE YANG DIUSULKAN Model Pembelajaran Decision Tree dengan Algoritma C4.5 EKSPERIMEN DAN PENGUJIAN MODEL Eksperimen dan pengujian model dilakukan dengan bantuan Software Orange Berbasis Bahasa Phyton EVALUASI DAN VALIDASI HASIL Evaluasi dan validasi hasil dilakukan dengan mengukur tingkat akurasi klasifikasi dengan menggunakan tabel Confusion Matrix Gambar 1. Tahapan Metode Penelitian A. Pengumpulan Data Data set yang digunakan dalam penelitian ini adalah data mahasiswa Teknik Informatika (TI) S-1 angkatan 2008, 2009, 2010, 2011sejumlah 1473 records. Data mahasiswa yang diambil adalah data identitas mahasiswayang menggambarkan informasi profil mahasiswa dan data akademik yang menggambarkan informasi akademik mahasiswa berupa IPK dan Masa Studi. B. Pengolahan Awal Data Pengolahan awal data diperlukan untuk proses penyederhanaan data, agar data tersebut dapat dikenali dan digunakan dalam algoritma yang diusulkan. Proses pengolahan awal data tersebut adalah: 1. Data Integration yaitu menyatukan tempat penyimpanan. Data identitas FPMIPATI, Universitas PGRI Semarang ISBN 978-602-74268-1-8

Prosiding Seminar Nasional Masif II Tahun 2016 287 dan mahasiswa yang diperoleh disatukan dalam satu media penyimpanan. 2. Data reduction yaitu untuk memperoleh data yang mempunyai atribut dan record yang lebih sedikit dengan cara mengurangi record yang tidak diperlukan atau yang tidak terisi. Pada data reduction,data yang tidak terisi selanjutnya dieliminasi yaitu dari atribut lokasi tinggal dan nama sekolah asal yang sering sekali tidak terisi. Atribut lokasi tinggal digunakan untuk menentukan status tinggal mahasiswa bersama orang tua atau tidak bersama orang tua. Atribut sekolah asal digunakan untuk mengkategorikan jenis sekolah SMA, SMK, Sekolah Lanjut, MA, Pesantren. Hasil pengolahan data awal (preprocessing) mengahasilkan data valid sejumlah 948 recordsserta atribut-atribut yang digunakan dalam penelitian yang tersaji pada tabel 1. IPK Status Masa Studi Menjelaskan nilai Index Prestasi Komulatif (IPK) Atribut Status Masa Studi merupakan variabel outputatau label. Jika masa studi lebih besar dari empat tahun maka Tidak Tepat Waktu. Namun Jika kurang dari sama dengan empat, maka Tepat Waktu 0 s.d 4,00 Tepat Waktu atau Tidak Tepat Waktu Tabel 1. Atribut-atribut Data Pada Penelitian Atribut Deskripsi Nilai Jenis Menjelaskan L atau P Kelamin jenis kelamin mahasiswa lakilaki (L) atau perempuan (P). Jenis Menjelaskan SMA, Sekolah jenis sekolah SMK, Asal asal dari MA, mahasiswa yang bersangkutan. Pesantren, Sekolah Status Tinggal Pekerjaa n Orang Tua Wali (Job) Menjelaskan status tinggal mahasiswa. Apakah tinggal bersama orang tuanya atau tidak. Menjelaskan status pekerjaan orang tua wali mahasiswa. Lanjut Bersama Orang Tua atau Tidak Bersama Orang Tua PNS, Swasta, TNI/POLRI, Wirausaha, Petani/Peter nak, Lainnya C. Model/Metode Yang Diusulkan Model/metode yang diusulkan dalam penelitian ini menggunakan pembelajaran pohon keputusan (Decision Tree Learner)dengan Algoritma C4.5. D. Eksperimen Dan Pengujian Model Tahapan eksperimen dan pengujian model pada penelitian ini adalah: 1. Menyiapkan data untuk melakukan eksperimen. 2. Pengolahan awal data (preprocessing) dengan mereduksi data data yang kosong. 3. Implementasi data mining menggunakan bantuan softwareorange untuk membangun model klasifikasi algoritma C4.5.Orange merupakan free software dengan model perangkat lunak berbasis komponen untuk machine learning dan data miningyang dikembangkan pada Bioinformatics Laboratory, Faculty of Computer and Information Science, University of Ljubljana,Slovenia, bersama dengan komunitas open source http://orange.biolab.si/ 4. Menguji model algoritma C4.5dengan menghitung nilai akurasi klasifikasi dengan confusion matrix. ISBN 978-602-74268-1-8 FPMIPATI, Universitas PGRI Semarang

288 Prosiding Seminar Nasional Masif II Tahun 2016 Gambar 2. Confusion Matrix Kasus Dua Kelas Model Kolom a (true positive-tp) dan d (true negative-tn) merupakan klasifikasi yang benar, dimana classifier memprediksi secara tepat dengan kondisi sebenarnya. Sedangkan Suatu false negative-fn / kolom b adalah suatu kondisi yang salah prediksi, ketika diperkirakan sebagai no (negative) namun hasil sebenarnya yes atau positif. Sedangkan false positive-fp / kolom c adalah suatu kondisi salah yaitu ketika diperkirakan yes atau positif, namun sebenarnya no atau negative[5]. Berdasarkan empat kondisi yang dihasilkan confusion matrix, nilai akurasi klasifikasi dapat dihitung sesuai dengan rumus (1). Accuracy = TP+TN TP+TN+FP+FN (1) 5. Menganalisa hasil dari penggunaan algoritma C4.5. Gambar 3. Penerapan Random Sampling Dengan Orange Software Data testing selanjutnya diuji dengan model klasifikasi yang telah dibangun dari data training untuk memprediksikan tingkat akurasi dari data pengujian yang digunakan.akurasi klasifikasi didapatkan berdasarkan tabel confusion matrix. Confusion matrixdari data testing yang digunakan dengan keluaran Tepat Waktu dan Tidak Tepat Waktu sepeti pada gambar dibawah ini: III. HASIL DAN PEMBAHASAN Pada implementasi data mining, data dibagi menjadi 2 (dua) yaitu data training dan data testing. Data training digunakan sebagai data pelatihan untuk membangun model klasifikasi berdasarkan algoritma C4.5. Data testing digunakan sebagai pengujian untuk mengevaluasi kinerja dari algoritma yang digunakan. Pada penelitian ini menggunakan random samplinguntuk memilih data secara acak yang digunakan sebagai data training dan data testing dengan pembagian data training sebesar 80% dari 948 data yaitu 758 data. Data testing sebesar 20% dari 948 data yaitu 190 data. Gambar 4 Hasil Tabel Confusion Matrix Menggunakan OrangeSoftware Berdasarkan pengolahan data di atas, didapatkan tingkat akurasi klasifikas algoritma C4.5 sebesar 73,68%.Penerapakan algoritma C4.5 menghasilkan pohon keputusan (decision tree)terhadap output kelas yang disajikan pada Gambar 4. Terlihat bahwa IPK merupakan atribut paling menentukan (root node) dari atribut-atribut lainnya. Warna merah mewakili Kelas Tidak Tepat Waktu dan warna biru mewakili Kelas Tepat Waktu. FPMIPATI, Universitas PGRI Semarang ISBN 978-602-74268-1-8

Prosiding Seminar Nasional Masif II Tahun 2016 289 V. DAFTAR PUSTAKA IV. Gambar 5. Hasil Pohon Keputusan Kelas Tepat Waktu Dan Tidak Tepat Waktu SIMPULAN Pada penelitian ini, penggunaan algoritma C4.5 mampu melakukan prediksi dengan baik (73,68%) terhadap masa studi mahasiswa yang tepat waktu dan tidak tepat waktu. Pembentukan pohon keputusan (Decision Tree) dapat digunakan oleh pengelola akademik di dalam memetakan mahasiswayang berpotensi mengalami keterlambatan masa studi di masa mendatang. Penerapan Educational Data Mining(EDM) memberikan kemajuan dan kontribusi pada dunia pendidikan dan pada bidang riset data mining. REKOMENDASI Berdasarkan penelitian yang telah dilakukan, banyak atribut data yang tidak lengkap seperti alamat mahasiswa, pekerjaan orang tua wali, nama sekolah asal membuat banyak data yang tidak terpakai. Kami merekomendasikan untuk pengisian data mahasiswa harus divalidasi ketika akan melanjutkan perkuliahan. Jangan sampai mahasiswa lulus, data mahasiswa tidak lengkap. Sehingga data mahasiswa dapat digunakan untuk penelitian dengan baik. UCAPAN TERIMA KASIH Penelitian ini tidak akan selesai, jika tidak ada dukungan dari berbagai pihak. Kami ucapkan terima kasih atas anggota tim penelitian ini ibu Yani Parti Astuti S.Si, M.Kom dan bapak Wibowo Wicaksono ST, M.Kom serta Kepala Pusat Sistem Informasi (PSI) bapak Ifan Rizqa M.Kom. [1] Mohammed M Abu Tair and Alaa M Al- Helees, "Mining Educational Data to Improve Students Performance: A Case Study," International Journal of Information and Communication Technology Research, vol. 2, February 2012. [2] Dorina Kabakchieva, "Predicting Student Performance by Using Data Mining," Cybernetics and Information Technologies, 2013. [3] Edin Osmanbegovic and Mirza Suljic, "Data Mining Approach For Predicting Student Performance," Journal of Economics and Business, vol. X, no. 1, May 2012. [4] Daniel T Larose, Data Mining Methods and Models. Hoboken, New Jersey, United State of America: John Wiley & Sons, Inc., 2006. [5] Jiawei Han and Micheline Kamber, Data Mining Concepts and Techniques, 2nd ed. San Francisco, United State America: Morgan Kaufmann Publishers, 2007. [6] Cristobal Romero and Sebastian Ventura, "Educational Data Mining: A Review of the State-of-the-Art," IEEE Transactions On Systems, Man, And Cybernatics, 2007. [7] R Baker, Data Mining for Education, 3rd ed. UK: Elsevier, 2010. [8] U. K. Pandey and S. Pal, "Data Mining: A prediction of performer or underperformer using classification," (IJCSIT) International Journal of Computer Science and Information Technology, vol. 2(2), no. ISSN:0975-9646, pp. 686-690, 2011. [9] Bharadwaj B.K and Pal. S, "Data Mining: A prediction for performance improvement using classification," International Journal of Computer Science and Information Security (IJCSIS), vol. 9, no. 4, pp. pp. 136-140, 2011. [10] Kovacic Z. J, "Early prediction of student success: Mining student enrollment data," in Proceedings of Informing Science & IT Education Conference, 2010. [11] Surjeet Kumar Yadav and Saurabh Pal, "Data Mining A Prediction for Performance Improvement of Engineering Students using Classification," World of Computer Science ISBN 978-602-74268-1-8 FPMIPATI, Universitas PGRI Semarang

290 Prosiding Seminar Nasional Masif II Tahun 2016 and Information Technology Journal (WCSIT), vol. 2, pp. 51-56, 2012. [12] Quinlan J. R, C4.5: Programs for Machine Learning.: Morgan Kaufmann Publishers, Inc, 1992. [13] Budi Santoso, Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu, 2007. FPMIPATI, Universitas PGRI Semarang ISBN 978-602-74268-1-8