IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG

dokumen-dokumen yang mirip
Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

BAB II LANDASAN TEORI

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

ALGORITMA BAYESIAN CLASSIFICATION UNTUK MEMPREDIKSI HEREGRISTRASI MAHASISWA BARU DI STMIK WIDYA PRATAMA

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI PROFIL LULUSAN STMIK LPKIA

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

Pemanfaatan Educational Data Mining (EDM)...

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR

APLIKASI PENENTUAN ANGGOTA KELAS UNGGULAN DENGAN METODE NAÏVE BAYES

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

KOMPARASI ALGORITMA C4.5 DENGAN NAÏVE BAYES DALAM PENGKLASIFIKASIAN TINGKAT PENDIDIKAN ANAK MISKIN. Andi Nurhayati 1, Andi Baso Kaswar 2

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

APLIKASI DATA MINING UNTUK MENGHASILKAN POLA KELULUSAN SISWA DENGAN METODE NAÏVE BAYES

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

BAB II KAJIAN PUSTAKA. pola seperti teknik statistic dan matematika (Larose, 2005).

Kerusakan Barang Jadi

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PROMOSI (Studi kasus Universitas Bina Darma Palembang)

APLIKASI DATA MINING DENGAN METODE CLASSIFICATION BERBASIS ALGORITMA C4.5

SISTEM INFORMASI PENILAIAN SISWA UNTUK PENJURUSAN PADA SMA NEGERI 1 PLOSOKLATEN KEDIRI MENGGUNAKAN METODE NAIVE BAYES SKRIPSI

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

JURNAL PENERAPAN ALGORITMA NAIVE BAYES UNTUK PREDIKSI LAMA STUDI MAHASISWA PADA JURUSAN SISTEM INFORMASI SEKOLAH TINGGI MANAJEMEN INFORMATIKA

PERBANDINGAN DECISION TREE

BAB III METODELOGI PENELITIAN

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

SKRIPSI. Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Program Studi Teknik Informatika OLEH :

JURNAL. Sistem Bantu Pemilihan Penerima Bantuan Siswa Miskin Menggunakan KNN (K-NEAREST NEIGHBOR)

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

SNIPTEK 2014 ISBN:

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

JURNAL PENERAPAN ALGORITMA NEAREST NEIGHBOR (K-NN) BAGI HAKIM DALAM MENENTUKAN PERTIMBANGAN HUKUMAN TINDAK PIDANA PENCURIAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

Prediksi Tingkat Kelulusan Siswa Dalam UAN Di SMP Negeri 2 Deket Dengan Menggunakan Metode Teorema Bayes

BAB 1 PENDAHULUAN 1-1

BAB I PENDAHULUAN 1.1 Latar Belakang

SISTEM UNTUK DETEKSI KERUSAKAN MESIN DIESEL MOBIL PANTHER DENGAN METODE NAÏVE BAYES

BAB 3 LANDASAN TEORI

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

SISTEM PENDUKUNG KEPUTUSAN UNTUK MEMPREDIKSI KETEPATAN LAMARAN KERJA SISWA MENGGUNAKAN METODE NAIVE BAYES DI SMK ISLAM 1 DURENAN

KOMBINASI METODE K-NEAREST NEIGHBOR DAN NAÏVE BAYES UNTUK KLASIFIKASI DATA

Abidah Elcholiqi, Beta Noranita, Indra Waspada

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. Hal ini dibuktikan dengan adanya fakta yang diungkap oleh World Health

SISTEM CERDAS DIAGNOSA PENYAKIT AYAM

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

BAB 2 TINJAUAN PUSTAKA

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

LAPORAN SKRIPSI PANJI SINGGIH SETIAJI DOSEN PEMBIMBING. Rina Fiati, ST, M.Cs. Arief Susanto, ST M.Kom PROGRAM STUDI TEKNIK INFORMATIKA

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

PERBANDINGAN K-NEAREST NEIGHBOR DAN NAIVE BAYES UNTUK KLASIFIKASI TANAH LAYAK TANAM POHON JATI

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

SAINTEKBU: Jurnal Sains dan Teknologi Volume 9 No.2 Mei 2017 EVALUASI INTERNAL PROGRAM STUDI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC)

Rancang Bangun Sistem Pendukung Keputusan Penerimaan Beasiswa Menggunakan Meotde Naive Bayes Classiffier

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

KLASIFIKASI STATUS GIZI MENGGUNAKAN K-NEAREST NEIGHBOR INTISARI

IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN:

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

ANALISIS DAN PEMBUATAN COMPANY PROFILE SEKOLAH MENENGAH ATAS NEGERI 1 GAMBUT BERBASIS FLASH NASKAH PUBLIKASI

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

DAFTAR ISI PHP... 15

BAB II TINJAUAN PUSTAKA

Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes: Studi Kasus UIN Syarif Hidayatullah Jakarta

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

BAB 3 METODE PENELITIAN

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI DATA ULANG PENSIUN

BAB 1 PENDAHULUAN 1-1

ANALISIS PENENTUAN KARYAWAN TERBAIK MENGGUNAKAN METODE ALGORITMA NAIVE BAYES (STUDI KASUS PT. XYZ)

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

JURNAL KHATULISTIWA INFORMATIKA, VOL. 2 NO. 1 JUNI 2014 PERANCANGAN SISTEM INFORMASI AKADEMIK SEKOLAH BERBASIS WEB DENGAN JAVA

CONTOH KASUS DATA MINING

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Transkripsi:

1 IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG Muhammad Efendi Program Studi Teknik Informatika S1, Fakultas Ilmu Komputer, Universitas Dian Nuswantoro Jl. Nakula 1 No. 5-11 Semarang 50131 email : pakepen@gmail.com Abstract - The resignation of prospective students are already common in universities. In Universitsas Dian Nuswantoro for example, in 2010 only 1147 students who registered for the Faculty of Computer Science.Where the university knew of students who will resign, then the students who managed to get into university is definitely more. One way to predict the resignation of prospective students are using data mining methods. The purpose of this research is to develop an application to determine which students will resign. This application can estimate the prospective students who will resign at the faculty of computer science at the University of Dian Nuswantoro. References used in this application using a data PMB 2013 with variables that will be used is the id list, name, registration, city, course of study, the status of registration, and waves. The algorithm will be used using the naïve Bayes calculations using probabilities, and to measure the performance and accuracy of applications using Confussion Matrix. Based on the research conducted, it was found that several factors influence the final outcome of the application is the city, the course, the status of registration, and waves. Measuring accuracy of the applications created using the confusion matrix, and the result is equal to78%. Keywords Data Mining, Naïve Bayes, The Withdrawal of Students I. PENDAHULUAN 1 Dalam beberapa tahun terakhir, penggunaan data mining di dunia pendidikan yang dikenal sebagai educational data mining (EDM) semakin berkembang (Rahmayuni, 2014). Menurut Williams (2011), data mining merupakan bagian dari seni dan ilmu tentang intelligent data analysis yang bertujuan untuk mendapatkan informasi dari suatu data. Oleh karena itu Data mining sering dijadikan metode yang dipakai dalam menyelesaikan sebuah masalah. Banyak teknik dari data mining yang dapat digunakan. Dalam penelitian ini data mining digunakan untuk memperkirakan pengunduran diri calon mahasiswa di Universitas Dian Nuswantoro. Pengunduran diri calon mahasiswa merupakan hal yang biasa terjadi pada setiap universitas, yang mengakibatkan universitas tidak mendapat jumlah mahasiswa yang maksimal. Kebanyakan calon mahasiswa mengundurkan diri karena tidak melakukan tahap registrasi (Kusrini, 2009), seperti data dari BIKU di Universitas Dian Nuswantoro pada tahun 2010 misalnya, yang berhasil masuk menjadi mahasiswa pada FIK 1147 dari total pendaftar sebanyak 2555. Pihak universitas pasti menginginkan agar dapat mengetahui calon mahasiswa mana saja yang diperkirakan akan mengundurkan diri, karena ketika dapat diketahui calon mahasiswa yang akan mengundurkan diri sejak dini, pihak kampus dapat mencari solusi untuk memperkecil jumlah calon mahasiswa yang mengundurkan diri. Penelitian yang dilakukan (Kusrini, 2009) untuk menentukan pengunduran diri calon mahasiswa menggunakan penalaran berbasis kasus (case based reasoning), dengan membandingkan data kasus yang baru dengan data kasus yang lama untuk mencari solusi yang akan digunakan. Sedangkan algoritma yang dipakai menggunakan C4.5 dan Nearest Neighbor. Hasil dari perbandingan algoritma C4.5 dan Nearest Neighbor menunjukan bahwa Nearest Neighbor tidak lebih akurat dibanding algortima C4.5, dan tahap proses klasifikasi yang dilakukan lebih panjang dan memakan waktu yang cukup lama. Sedangkan penulis ingin mencoba menggunakan algoritma Naïve Bayes dalam menentukan pengunduran diri calon mahasiswa, karena dari studi pustaka yang dilakukan, Naïve Bayes juga akurat dari beberapa algoritma klasifikasi yang sering digunakan.

A. Data Mining II. METODE YANG DIUSULKAN Data mining merupakan suatu metode menemukan suatu pengetahuan dalam suatu database yang cukup besar. Data mining sendiri adalah proses menggali dan menganalisa sejumlah data yang sangat besar untuk memperoleh sesuatu yang benar, baru, sangat bermanfaat dan akhirnya dapat dimengerti suatu corak atau pola dalam data tersebut. Menurut (Jananto, 2010) alasan utama mengapa data mining diperlukan adalah karena adanya sejumlah besar data yang dapat digunakan untuk menghasilkan informasi dan knowledge yang berguna. Informasi yang didapat tersebut dapat digunakan pada banyak bidang, mulai dari bisnis, kontrol produksi, kesehatan, dan lain-lain. Secara sederhana, data mining dapat diartikan sebagai proses mengekstrak atau menggali knowledge yang ada pada sekumpulan data. Banyak orang setuju bahwa data mining adalah sinonim dari Knowledge Discovery in Database, atau sering disebut dengan KDD. Dari sudut pandang yang lain, data mining dianggap sebagai suatu langkah yang penting dalam KDD (Jananto, 2010). Proses KDD ini terdiri dari serangkaian langkah-langkah transformasi, dari proses data preprocessing dan proses data postprocessing dari data yang merupakan hasil penggalian. Tujuan dari proses data preprocessing adalah untuk mengubah data input mentah menjadi format yang sesuai untuk analisis selanjutnya B. Naïve Bayes Simple Naive Bayesian Classifier merupakan salah satu metode pengklasifikasi berpeluang sederhana yang berdasarkan pada penerapan Teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen). Algoritma ini memanfaatkan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa sebelumnya. Dua kelompok peneliti, satu oleh Pantel dan Lin, dan yang lain oleh Microsoft Research memperkenalkan metode statistik Bayesian ini pada teknologi anti spam filter. Tetapi yang membuat algoritma Bayesian filtering ini popular adalah pendekatan yang dilakukan oleh Paul Graham. Menurut (Jananto, 2013) algortima Naïve Bayes atau Bayesian Classification adalah pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Bayesin classification didasarkan pada teorema bayes yang memiliki kemampuan klasifikasi serupa dengan decision tree dan neural network. Bayesin classification terbukti memiliki kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar. Teorema Bayes memiliki bentuk umum sebagai berikut : X = Data dengan class yang belum diketahui H = Hipotesis data X merupakan suatu class spesifik P(H X) = Probabilitas hipotesis H berdasarkan kondisi x (posteriori prob.) P(H) = Probabilitas hipotesis H(prior prob.) P(X H) = Probabilitas X berdasarkan kondisi tersebut P(X) = Probabilitas dari X A. Frekuensi Kemunculan III. IMPLEMENTASI Contoh hasil perhitungan frekuensi kemunculan : Contoh kasus baru yang akan diinputkan : 1. Nama : Muhammad Efendi 2. Gelombang : IIA 3. Kota : Pemalang 4. Pilihan : Teknik Informatika 5. Jalur : Bebas Tes Untuk menentukan hasil registrasi atau tidaknya dari data tersebut maka perlu dilakukan perhitungan probabilitas dengan acuan data frekuensi kemunculan pada table sebelumnya. Untuk penyelesaian, yang pertama dilakukan yaitu hitung nilai probabilitas tiap-tiap atribut, perhitungannya sebagai berikut : P( Tidak Registrasi) = = 0,45 P( Registrasi) = = 0,55 P( IIA Tidak Registrasi) = = 0,0711 P( IIA Registrasi) = = 0,2109 P(Pemalang Tidak Registrasi) = = 0,0356 P(Pemalang Registrasi) = = 0,0127 P(Teknik Informatika Tidak Registrasi) = = 0,6044 P(Teknik Informatika Registrasi) = = 0,5273 P(Bebas Tes Tidak Registrasi) = = 0,4267 P(Bebas Tes Registrasi) = = 0,7055 Bandingkan hasil akhir probabilitas dari class Registrasi dan class Tidak Registrasi - Class Tidak Registrasi P( Tidak Registrasi) * P( IIA Tidak Registrasi) * P(Pemalang Tidak Registrasi) * P(Teknik Informatika Tidak Registrasi) * P(Bebas Tes Tidak Registrasi) = 0,45 * 0,0711 * 0,0356 * 0, 6044 * 0, 4267 = 0,00029375 - Class Registrasi

3 P(Registrasi) * P( IIA Registrasi) * P(Pemalang Registrasi) * P(Teknik Informatika Registrasi) * P(Bebas Tes Registrasi) = 0,55 * 0, 2109 * 0,0127 * 0,5273 * 0, 7055 = 0,00054802 Dari hasil diatas nilai class Registrasi lebih besar probabilitasnya dibandingkan dengan nilai class Tidak Registrasi, jadi calon mahasiswa diprediksikan melakukan Registrasi dengan class akhir YA B. Akurasi Dalam mengukur pada akurasi pada aplikasi ini menggunakan confusion matrix. Confusion matrix diterapkan pada 300 data testing yang sudah disiapkan, data testing tersebut dihitung dengan menggunakan algoritma naïve bayes, kemudian hasil dari semua data testing dipakai dalam menentukan akurasi dengan menggunakan confusion matrix. Keputusan Identifikasi Identifikasi Ya Asli Tidak Oleh Oleh Naïve Naïve Bayes Bayes Tidak = TN FN Ya = FP TP Tabel Tabel Confussion Matrix TN = Hasil yang diidentifikasi oleh Naïve Bayes TIDAK dengan class asli TIDAK FN = Hasil yang diidentifikasi oleh Naïve Bayes YA dengan class asli TIDAK FP = Hasil yang diidentifikasi oleh Naïve Bayes TIDAK dengan class asli YA TP = Hasil yang diidentifikasi oleh Naïve Bayes YA dengan class asli YA 2. Presision Presision merupakan proporsi kasus dengan hasil positif yang benar, rumusnya sebagai berikut : TP / ( FP + TP ) * 100% Dengan data pada table kinerja maka : 174 / ( 26 + 174 ) * 100% = 81,69% Presision yang dihasilkan sebesar 81,69%. 3. Akurasi Akurasi merupakan perbandingan kasus yang diidentifikasi benar dengan jumlah semua kasus, rumusnya sebagai berikut : ( TN + TP ) / ( TP + TN + FP + FN ) *100% Dengan memakai data pada tabel kinerja maka : ( 61 + 174 ) / ( 174 + 61 + 26 + 39 ) *100% = 78,33% Akurasi yang dihasilkan sebesar 78,33%. A. Context Diagram IV. HASIL & PEMBAHASAN Keputusan Asli Tidak = 100 Identifikasi Identifikasi Tidak Oleh Ya Oleh Naïve Bayes Naïve Bayes 61 39 Ya = 200 26 174 Tabel Tabel Kinerja Context Diagram merupan diagram yang terdiri dari proses yang menggambarkan suatu sistem. Contex Diagram merupakan level tertinggi dari Data Flow Diagram yang menggambarkan seluruh input ke sistem atau output dari sistem. Tabel diatas merupakan hasil perhitungan dari data testing setelah dihitung dengan algoritma naïve bayes. Untuk melakukan proses kinerja pada data mining maka dilakukan perhitungan presision, recal, dan akurasi. 1. Recal Recal adalah proporsi kasus posotif yang diidentifikasi dengan benar, rumus dari recal sebagai berikut : TP / ( FN + TP ) * 100% Dengan data pada table kinerja maka : 174 / ( 39 + 174 ) * 100% = 87% Recal yang dihasilkan aplikasi sebesar 87%.

B. DFD Level 1 - Menu Hitung Ulang digunakan untuk menghitung ulang frekuensi kemunculan apabila di inputkan data baru pada databse. - Menu Frekuensi Kemunculan digunakan untuk menampilkan frekuensi kemunculan dari database. DFD lvl 1 merupakan pemecahan dari context diagram, yang ditujukan unutk menggambarkan keseluruhan proses kerja sistem. E. Halaman Kinerja Use Pada halaman ini user dapat melihat akurasi dari aplikasi data mining. - Menu Kinerja untuk menunjukan semua data testing yang akan dipakai dalam menghitung akurasi. - Menu Lakukan Proses Kinerja digunakan untuk menghitung ulang data yang ada, apabila ada data testing baru yang dimasukan kedalam database. - Menu Tabel Penilaian digunakan untuk melihat hasil akurasi pada aplikasi. C. Halaman homepage Pada halaman menu merupakan halaman sambutan bagi user, pilih menu menu yang ada untuk menggunakan aplikasi, Menu yang tersedia diantaranya :Data Mahasiswa, Naïve Bayes, Kinerja, Penentu Keputusan, dan About. D. Halaman Naïve Bayes Pada halaman naïve bayes di tunjukan frekuensi dari jumlah data yang akan digunakan, frekuensi kemunculan ini nantinya akan digunakan dalam menentukan pengunduran diri calon mahasiswa. F. Halaman Penentu Keputusan Pada halaman ini dimana user menginput data baru yang akan diprediksi dan hasilnya akan langsung ditunjukan dibawah form input. - Button Input digunakan untuk perintah input pada data mahasiswa baru. - Menu Edit digunakan untuk mengedit informasi pada data mahasiswa baru. - Menu Perhitungan digunakan untuk menunjukan perhitungan pada kasus yang baru di inputkan.

5 A. Kesimpulan V. PENUTUP Hasil yang dapat diambil dari penelitian ini adalah algoritma Naïve Bayes dapat digunakan dalam prediksi registrasi calon mahasiswa baru pada Universitas Dian Nuswantoro dengan keakuratan sebesar 78%. Aplikasi ini dapat memudahkan pihak universitas dalam melakukan pencegahan calon mahasiswa yang akan mengundurkan diri agar dapat memperoleh jumlah calon mahasiswa yang maksimal. Penulis berharap aplikasi ini dapat membantu pihak universitas karena pengguna aplikasi ini cukup mengisi form yang berisi data calon mahasiswa. Selanjutnya aplikasi akan memberikan hasil dimana calon mahasiswa tersebut akan registrasi atau tidak. 2. S. H. R. W. A. H. Kusrini, "Perbandingan Metode Nearest Neighbor dan Algoritma C4.5 Untuk Menganalis Kemungkinan Pengunduran Diri Calon Mahasiswa di STIMIK AMIKOM YOGYAKARTA," 2009 3. K. Hastuti, "Analisis Komparasi Algoritma Klasisfikasi Data Mining Untuk Prediksi Mahasiswa Non Aktif," 2012. 4. J. Han, Data Mining Concept and Technique. San Fransisco: Diane Cerra, 2006. 5. A. Jananto, "Algoritma Naive Bayes untuk Mencari Perkiraan Waktu Studi Mahasiswa," 2013. 6. A. Jananto, "Perbandingan Performasi Algoritma Nearest Neighbor dan SLIQ untuk Prediksi Kinerja Akademik Mahasiswa Baru," 2010. 7. M. Rudyanto Arief, Pemrograman Web Dinamis Menggunakan PHP. yogyakarta: C.V ANDI OFFSET, 2011. B. Saran Saran yang penulis berikan untuk penelitian selanjutnya adalah sebagai berikut : 1. Perbaiki desain aplikasi, karena untuk aplikasi sekarang masih menggunakan desain yang sangat sederhana. 2. Keterbatasan aplikasi ini yaitu hanya dapat digunakan pada fakultas ilmu computer saja. Jadi penulis menyarankan untuk menggunakan semua data fakultas yang ada di UDINUS, karena data sangat berpengaruh pada penggunaan algoritma naïve bayes. Apabila menggunakan data semua fakultas, maka aplikasi ini dapat memprediksi calon mahasiswa dari semua jurusan. 3. Menggunakan perhitungan probabilitas dalam menentukan prediksi, penelitian selanjutnya diharapkan dapat menggukanan algortima data mining yang lain untuk dibandingkan hasilnya dengan penelitian saat ini. REFERENCES 1. Rahmayuni, "Perbandingan Performasi Algoritma C4.5 dan Cart Dalam Klasifikasi Data nilai Mahasiswa Prodi Teknik Komputer Politeknik Negeri Padang," 2014.