Pengklasifikasian Kemampuan Akademik Mahasiswa

dokumen-dokumen yang mirip
KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

IMPLEMENTASI METODE NAIVE BAYES UNTUK MEMPREDIKSI KELULUSAN MAHASISWA DI PROGRAM STUDI TEKNIK INFORMATIKA FT UN PGRI KEDIRI

SISTEM KLASIFIKASI PENYEBARAN PENYAKIT MATA DI JAWA BARAT DENGAN ALGORITMA ITERATIVE DICHOTOMISER 3 DAN NAÏVE BAYES CLASSIFIER

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

SISTEM PENDUKUNG KEPUTUSAN UNTUK MEMPREDIKSI KETEPATAN LAMARAN KERJA SISWA MENGGUNAKAN METODE NAIVE BAYES DI SMK ISLAM 1 DURENAN

BAB I PENDAHULUAN 1.1 Latar Belakang

Abidah Elcholiqi, Beta Noranita, Indra Waspada

REKOMENDASI TOPIK TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA DI UNIVERSITAS MUHAMMADIYAH JEMBER MENGGUNAKAN METODE NAÏVE BAYESIAN CLASSIFIER

Prosiding SNATIF Ke-1 Tahun 2014 ISBN:

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES

BAB 3 METODE PENELITIAN

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

KLASIFIKASI KECENDERUNGAN PENYAKIT MATA DI JAWA BARAT DENGAN ASSOCIATION RULE DAN NAÏVE BAYES CLASSIFIER

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

SISTEM REKOMENDASI PENGAMBILAN KATEGORI SKRIPSI DENGAN PERHITUNGAN NAIVE BAYES

BAB 2 LANDASAN TEORI

Klasifikasi. Diadaptasi dari slide Jiawei Han

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

SISTEM PREDIKSI PENGUNDURAN DIRI PESERTA DIDIK MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

Klasifikasi. Diadaptasi dari slide Jiawei Han

PENENTUAN PENANGANAN KERUSAKAN MESIN PRODUKSI RESLETING DI PT. HERO TOP ZIP MENGGUNAKAN CASE BASED REASONING DAN SORENSEN COEFFICIENT

ARTIKEL SISTEM PAKAR PENDETEKSI GIZI BURUK PADA ANAK MENGGUNAKAN METODE DECISSION TREEC4.5

BAB I PENDAHULUAN I - 1

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK PREDIKSI PENERIMA BEASISWA BERDASARKAN PRESTASI DI SMA NEGERI 6 SURAKARTA

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

BAB I PENDAHULUAN. 1.1 Latar Belakang

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

PREDIKSI JUMLAH PRODUKSI BARANG BEDASARKAN JUMLAH PERMINTAAN DAN DATA JUMLAH PERSEDIAAN CV.CIHANJUANG INTI TEKNIK MENGGUNAKAN LOGIKA FUZZY MAMDANI

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

( ) ( ) (3) II-1 ( ) ( )

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB 1 PENDAHULUAN 1-1

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

PREDIKSI PENJUALAN BUKU MENGGUNAKAN DATA MINING DI PT. NIAGA SWADAYA

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. tindakan di antara beberapa alternatif yang tersedia. Setiap proses pengambilan. mencapai tujuan melalui pelaksanaan atau tindakan.

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

Sistem Pendukung Keputusan Vendor Management...

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

Klasifikasi & Prediksi

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

PERANCANGAN DATA WAREHOUSE UNIT DONOR DARAH PADA PALANG MERAH INDONESIA KOTA BANDUNG

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Pengolahan Data. Algoritma C4.5 Menghitung entropi : Data Training (75%) = 220 data Data Testing (25%) = 73 data

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan.

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

Implementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier

SISTEM PREDIKSI SERVIS BERKALA KENDARAAN BERMOTOR

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

BAB II LANDASAN TEORI

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

MODEL SUPPLY CHAIN OPERATION REFERENCE (SCOR) DAN ANALYTIC HIERARCHY PROCESS (AHP) UNTUK SISTEM PENGUKURAN KINERJA SUPPLY CHAIN MANAGEMENT

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN KARYAWAN TETAP MENGGUNAKAN METODE NAIVE BAYES

SISTEM REKOMENDASI PENERIMAAN BANTUAN SISWA MISKIN (BSM)

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

Pada penelitian ini dilakukan kajian terhadap PMI cabang Kabupaten Demak yang dalam penyeleksian calon pendonor darah masih dilakukan

a. Prosesor yang digunakan adalah Intel Core i3 1.9 Ghz b. RAM dengan ukuran 2GB c. Harddisk dengan ukuran 500GB d. Layar monitor 14.

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

ANALISIS PREDIKSI TINGKAT KETIDAKDIPLINAN SISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER (STUDI KASUS : SMK NEGERI 1 PACITAN)

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

Educational Data Mining untuk Mengetahui Pola Minat Kerja Mahasiswa

PROGRAM BANTU PENEMPATAN PERSEDIAAN BARANG SANITER PADA DUA TOKO DENGAN METODE NAÏVE BAYES

BAB II KAJIAN PUSTAKA. pola seperti teknik statistic dan matematika (Larose, 2005).

PERANCANGAN GAME TURN BASED STRATEGY MENGGUNAKAN LOGIKA FUZZY DAN NAIVE BAYES CLASSIFIER

MENGGUNAKAN DATA MINING

OPTIMALISASI PENJADWALAN ACARA TELEVISI SWASTA MENGGUNAKAN ALGORITMA GENETIKA

OPTIMALISASI LAHAN TANAH UNTUK AREA RUMAH DAN JALAN MENGGUNAKAN ALGORITMA GENETIKA

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN)

Model Arsitektur Backpropogation Dalam Memprediksi Faktor Tunggakan Uang Kuliah (Studi Kasus AMIK Tunas Bangsa)

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.

Modul IV KLASIFIKASI

SISTEM INFORMASI EKSEKUTIF PT. PLN (PERSERO) SUMEDANG RAYON TANJUNGSARI

BAB I PENDAHULUAN. mahasiswa dan faktor-faktor penyebabnya merupakan topik yang menarik untuk

Transkripsi:

Pengklasifikasian Kemampuan Akademik Mahasiswa (Alfajri dkk.) PENGKLASIFIKASIAN KEMAMPUAN AKADEMIK MAHASISWA MENGGUNAKAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER DALAM PREDIKSI PENYELESAIAN STUDI TEPAT WAKTU Rd Muhammad Alfajri *, Yulison Herry Chrisnanto, Rezki Yuniarti Jurusan Informatika, Fakultas MIPA, Universitas Jenderal Achmad Yani Jl. Terusan Jenderal Sudirman PO BOX 148 Cimahi * Email: alfajri607@gmail.com Abstrak Data mahasiswa merupakan data yang berlimpah terdiri dari awal masuk sampai dengan kelulusan. dikarenakan data yang sangat banyak faktor data warehouse menjadi peluang besar untuk mencul, data yang masuk secara beruntun pada setiap tahunnya memiliki pola tertentu sehingga diperlukan suatu teknik analisis data yang dapat mengambil informasi yang berharga dari sekian banyak data yang terkumpul pada suatu perangkat komputer atau pelaporan. penelitian ini dilakukan pada Universitas Jenderal Achmad Yani tepatnya pada jurusan informatika diperlukan suatu teknik analisis data untuk menganalisis data tersebut. Pada penelitian kali ini data latih sebanyak 82 dan data uji sebanyak 35 diperlukan beberapa atribut dalam menyelesaikan persolanan tersebut diantaranya NIM, nama mahasiswa matakuliah semester 1 sampai dengan 6 dengan total jumlah matakuliah sebanyak 65 dengan penyelesaian studi tepat waktu < 4 tahun dan > 4 tahun metode yang digunakan adalah Naïve Bayes classifier penelitian ini memperoleh nilai akurasi sebelum menggunakan seleksi fitur sebesar 62 % dan setelah menggunakan seleksi fitur meningkat tidak signifikan sebesar 6 % atau menjadi 68 % sehingga seleksi fitur menggunakan information gain dapat menghilangkan noise dalam proses pengklasifikasian menggunakan naive bayes classifier. Kata kunci: KHS, mata kuliah semester 1-6, naïve bayes classifier 1. PENDAHULUAN Mahasiswa merupakan peserta didik yang sedang dalam proses pembelajaran pada tingkat perguruan tinggi, institut maupun akademi. Mahasiswa tingkat akhir telah melakukan proses pembelajaran yang sangat lama dalam kurun waktu 4 tahun lamanya. Sehingga untuk memprediksi mahasiswa sangatlah mungkin terjadi untuk penelitian ini salah satu penyebab yang digunakan berupa nilai hasil akhir matakuliah karena proses rekapitulasi nilai akademis adalah rutin dilakukan dan selain itu hampir setiap mahasiswa yang lulus tepat waktu atau terlambat tercerminkan melalui nilai matakuliah yang diperoleh sehingga tidak salahnya untuk menentukan kelulusan berdasarkan suatu kemampuan akademis untuk data yang digunakan berupa nilai hasil akhir matakuliah yang berada pada kartu hasil studi atau dikenal dengan KHS untuk studi kasus yang digunakan di jurusan informatika universitas jenderal achmad yani.untuk mengetahui mahasiswa yang lulus tepat waktu atau terlambat digunakan suatu teknik metode naïve bayes classifier Naïve bayes classifier yaitu suatu teknik pengklasifikasian dengan probabilitas sederhana yang mengaplikasikan teorema bayes dalam teori probabilitas dan statistika, teorema bayes adalah sebuah penafsiran berbeda dalam penafsiran teorema ini menyatakan seberapa jauh derajat kepercayaan subjektif harus berubah secara rasional ketika ada petunjuk baru. Beberapa penelitian telah dilakukan menggunakan distribusi normal sebagai perhitungan probabilitas dalam mengklasifikasikan sebuah kasus baru seperti klasifikasi status gizi (Arifin, 2015), kemudian terdapat penelitian yang memiliki kasus sama dan tidak menggunakan distribusi normal seperti Evaluasi kinerja akademik mahasiswa(yunus, 2015), Sistem pendukung keputusan untuk menentukan kelulusan(kusumadewi, 2009), tidak menggunakan metode naive bayes seperti desain model kelulusan dengan decision tree (Laily dkk, 2014), kemudian seleksi fitur menggunakan information gain dalam klasifikasi dalam prediksi komunikasi (Mujib dkk, 2013), klasifikasi berita hoax (Purwarianti, 2015), klasifikasi data momentum (Wasiati, 2015), dan penelitian yang memiliki kasus berbeda tetapi menggunakan distribusi normal seperti kelayakan calon tenaga kerja (Maharani, 2009). 144 ISBN 978-602-99334-5-1

F.25 2. METODOLOGI PENELITIAN 2.1. Data Cleaning Data cleaning adalah proses pengecekan data untuk konsistensi data meliputi pemeriksaan data yang out of range yaitu tidak konsisten secara logika terdapat nilai ekstrim dan nilai nilai yang tidak terdefinisi. 2.2. Transformasi Data Tujuan utama dari transformasi data ini adalah untuk mengubah skala pengukuran data asli menjadi bentuk lain sehingga data dapat memenuhi asumsi-asumsi yang mendasari analisis. 2.3. Seleksi Fitur Seleksi fitur yang digunakan dalam penelitian ini menggunakan information gain dengan mengambil nilai info gain berdasarkan nilai threshold yang telah ditentukan. 2.4. Data mining Dengan menggunakan teknik naïve bayes classifier yang diaplikasikan pada data untuk mencari pola atau informasi dari data informasi yang ingin dicari yaitu kelas tepat waktu dan terlambat. 2.5. Evaluasi Pola Tahapan ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah terakhir data mining adalah mempresentasikan pengetahuan dalam bentuk yang mudah dipahami pengguna. 3. HASIL DAN PEMBAHASAN 3.1 Klasifikasi Naive Bayes Classifier Ketika atribut bertupe kuantitatif maka peluang akan sangat kecil sehingga membuat persamaan tersebut tidak dapat diandalkan untuk permasalahan atribut bertipe kuantitatif. Maka untuk menangani atribut kuantitatif, ada beberapa cara pendekatan yang dapat digunakan seperti distribusi normal (Gaussian) merupakan salah satu distribusi probabilitas yang paling banyak digunakan dalam analisis statistika.dengan formulasi berikut. P(Xi xi Y yj )...(1) Berikut adalah sampel data masukan yang berjumlah 82 mahasiswa sebagai data latih dengan TW adalah tepat waktu dan TR adalah terlambat berikut pada Tabel 3.1 No Tabel 1. Data Masukan NIM Alpro P.Alpro Matdas... S.Distribusi Kelas 1 3411061003 4 4 2... 3 TR.. 2 3411071010 2 2 3... 3 TW 3 3411071019 3 2 2... 4 TR 4 3411081001 3 3 3... 4 TW 5 3411081018 2 2 2... 4 TW 6 3411081032 2 2 2... 4 TW........................ 81 3411071041 3 2 2... 3 TW 82 3411107047 2 2 2... 4 TR Prosiding SNST ke-7 Tahun 2016 Fakultas Teknik Universitas Wahid Hasyim Semarang 145

Pengklasifikasian Kemampuan Akademik Mahasiswa (Alfajri dkk.) Berikut adalah pengujian data yang dilakukan terhadap data kasus lama sebagai pengetahuan dari penelitian ini berkit adalah sebagian data uji dari 35 mahasiswa dalam penelitian ini pada Tabel 2. Tabel 2. Data Uji NIM Alpro P.Alpro matda... Teori_game Sist_distribusi Kelas 34111???? 4? s?...?? TW 34111???? 4??...?? TR Sebelum menentukan probabilitas setiap kelas terhadap masing-masing mahasiswa menggunakan distribusi normal terlebih dahulu dilakukan pemisahan antara likelihood tepat waktu dan likelihood terlambat dengan persamaan 1 untuk Likelihood tepat waktu P (MK001) 4 Kelas Tepat waktu. 0.579 x 0.579 x 0.2711 0.1570 Likelihood terlambat P (MK002) 4 Kelas Terlambat 0.6632 x 0.6632 x 0.0358 0.0237 Berikut adalah contoh hasil normalisasi setelah melalui proses menghitung menggunakan distribusi normal di setiap matakuliah pada data uji. Likelihood Tepat Waktu : 0.1570 x 0.220 x 0.417 x.. x 0.379 2.31213 x 10-29 Likelihood Terlambat : 0.035 x 0.099 x 0.118 x x 0.247 1.04468 x 10-51 Untuk menghasilkan nilai Probabilitas maka dilakukan normalisasi terhadap likelihood tepat waktu dan terlambat. Diketahui likelihood tepat waktu dengan nilai probabilitas 1 yaitu bilai dipersentasikan adalah 100% sehingga mahasiswa tersebut akan diprediksikan lulus tepat waktu. Disebabkan memiliki data yang sangat banyak terdiri dari 65 kolom dan 82 baris sehingga perlu adanya bantuan sistem diperoleh nilai akurasi keseluruhan sebelum menggunakan seleksi fitur dengan pemahaman konsep pada sebelumnya adalah 62 % berikut pada Gambar 1. 146 ISBN 978-602-99334-5-1

F.25 Gambar 1. Akurasi Sistem Setelah Seleksi Fitur 3.2 Information Gain ( Seleksi Fitur ) Entrophy merupakan ukuran ketidak pastian dimana semakin tinggi entrophy maka semakin tinggi ketidakpastian. Rumus dari entrophy ( Slocum,2012 ) :...(2) Dimana: E(S) adalah total informasi entrophy untuk atrubut S N adalah junlah nilai pada atribut S Fs(j) adalah frekuensi dari nilai S terhdap J atau kelas Log2 adalah logaritma biner Information gain dari output data atau variable dependent Y (kelas) yang dikelompokan berdasarkan atribut A, dinotasikan dengan gain(y,a). Information gain (y,a) dari atribut A relative terhadap output data y adalah (Santosa, 2007) :...(3) Dimana nilai(a) adalah semua nilai yang mungkin dari atribut A, dan yc adalah subset dari y dimana A mempunyai nilai c. Term yang pertama pada rumus information gain di atas adalah entrophy total y dan term kedua adalah entrophy sesudah dilakukan pemisahan data berdasarkan atribut A. Pada penelitian ini untuk kelas tepat waktu dan 38 untuk kelas terlambat sehingga hasil perhitungan untuk 2 kelas tepat waktu dan terlambat adalah sebagai berikut menggunakan persamaan 3 : E ((-44/82)log2(44/82)) + ((-38/82)log2(38/82))0.996...(4) Jika pada algoritma dan pemrograman terdapat nilai 2 maka hitung jumlah 2 pada algoritma & pemrograman untuk kelas tepat waktu dan untuk kelas terlambat maka menghasilkan nilai sejumlah 13 untuk kelas tepat waktu dan 27 untuk kelas terlambat berikut adalah peroleh entrophy setiap pada setiap nilainya yaitu menggunakan persamaan 4 : Entrophy (2) Entrophy [13,23] Entrophy (3) Entrophy [23,13] Entrophy (4) Entrophy [8,2] Diketahui nilai akurasi sebelum menggunakan seleksi fitur adalah 62 % kemudian setelah mengetahui setiap nilai information gain pada setiap matakuliah pada kasus lama kemudian dihilangkan satu persatu dengan menghilangkan nilai information gain yang paling kecil yang Prosiding SNST ke-7 Tahun 2016 Fakultas Teknik Universitas Wahid Hasyim Semarang 147

Pengklasifikasian Kemampuan Akademik Mahasiswa (Alfajri dkk.) dijadikan sebagai nilai trhreshold sehingga diperoleh akurasi terbaik setelah menggunakan information gain pada Gambar 2. Gambar 2. Hasil Akurasi Setelah Menggunakan Seleksi Fitur Dari hasil penseleksian fitur akurasi 68 % adalah nilai akurasi terbaik yang diperoleh dengan fitur yang terpilih hanyalan 10 dari 65 matakuliah yang di inputkan sebagai pengukuran prediksi kelulusan mahasiswa. 4. KESIMPULAN Berdasarkan hasil dari penelitian yang dilakukan untuk mengklasifikasi mahasiswa konsentrasi IF dengan data latih yang digunakan dari lulusan tahun 2012 2014 dan data uji sebayak 35 mahasiswa untuk lulusan tahun 2015 kemudian diuji cobakan terhadap data uji baru dengan akurasi kebenaran 62 % ini di sebabkan jumlah data uji untuk pengklasifikasian hanya 35 mahasiswa dan terdapat beberapa faktor internal lain seperti pergantian matakuliah yang menyebabkan pengujian tidak maksimal karena tidak terdapat pada kasus lama kemudian untuk meningkatkan akurasi digunakan teknik information gain hanya 10 matakuliah dari 65 matakuliah yang digunakan untuk pengklasifikasian kemudian hasil seleksi diuji cobakan terhadap data uji baru dan hasilnya tidak jauh beda yakni 68 % dengan ini disimpulkan bahwa dalam memprediksi kelulusan menggunakan atribut matakuliah tidak harus semua matakuliah diproses hanya beberapa matakuliah saja yang sebenarnya baik untuk dijadikan sebuah pengklasifikasian dalam memprediksi kelulusan mahasiswa tepat waktu dan terlambat. Untuk Penelitian selanjutnya dalam menguji pelatihan sebaiknya menggunakan metode khusus seperti K-fold corss validation dan untuk data sebaiknya di tambahkakan faktor eksternal yaitu diluar faktor nilai matakuliah atau perkuliahan serta bukan satu konsentrasi saja. DAFTAR PUSTAKA Arifin Muhammad, IG-KNN Untuk Prediksi Customer Churn Telekomunikasi, SIMETRIS, ISSN: 2252-4983,vol 6, no 1 April 2015. D. P. K. Muhammad Yunus, Desain Model Prediksi Kelulusan Mahasiswa Dengan Algoritma Decision Tree, Matrik, vol. 2, no. 13, pp. 1-5, 2015. Kusumadewi Sri, Klasifikasi Status Gizi Menggunakan Naïve Bayesian Classification, commit, vol.3 no. 1,pp. 6-11, 2009. Laily Diana, Fithri, darmanto Eko,Sistem Pendukung Keputusan Untuk Memprediksi Kelulusan Mahasiswa menggunakan Metode Naïve Bayes,Proseding SNATIF Ke-1, ISBN:978-602- 1180, pp. 319 324, 2014. Mujib Ridwan, Suryono Hadi, M.Sarosa,Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa menggunakan Algoritma Naïve Bayes,EECCIS, vol 7 no. 1,pp. 59 64, 2013. 148 ISBN 978-602-99334-5-1

F.25 Purwarianti Ayu, Eksperimen pada Sistem Klasifikasi berita Hoax Berbahasa Indonesia Berbasis Pembelarajan mesin, Rasywir Erissya, Cybermatika, Vol 3, no.2, pp 1-8, 2015. W. D. Hera Wasiati, Sistem Pendukung Keputusan Penentuan Kelayakan Calon Tenaga Kerja Inddonesia Menggunakan Metode Naive Bayes (Studi Kasus: Di P.T. Karyatama Mitra Sejati Yogyakarta), IJNS, vol. 3, no. 2, pp. 45-51, 2014. W. Maharani, Klasifikasi Data Menggunakan JST Backpropagation Momentum Dengan Adaptive Learning Rate, semnasif, pp. D-25 - D-31, 2009. Prosiding SNST ke-7 Tahun 2016 Fakultas Teknik Universitas Wahid Hasyim Semarang 149