Oleh: Astrid Darmawan Pembimbing: Selvia Lorena Br. Ginting, M.T Wendi Zarman, M.Si

dokumen-dokumen yang mirip
TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

BAB IV HASIL DAN PEMBAHASAN

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

BAB III ANALISA DAN PERANCANGAN

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

BAB IV HASIL DAN UJI COBA

PENERAPAN DATA MINING UNTUK RENCANA SUKSESI SUMBER DAYA MANUSIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DI PT POS INDONESIA

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

Versi Online tersedia di : JURNAL TECH-E (Online)

BAB II LANDASAN TEORI

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA

BAB 1 PENDAHULUAN Latar Belakang

IMPLEMENTASI METODE K-NEAREST NEIGHBOR DALAM PERAMALAN PENJUALAN MOBIL PADA PT BENGAWAN ABADI MOTOR

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 2 TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB III ANALISIS DAN PERANCANGAN. Pada bab ini akan dijelaskan mengenai proses analisa perangkat lunak dan perancangan atau desain perangkat lunak.

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan informasi yang akurat

BAB I PENDAHULUAN 1.1 Latar Belakang

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan Lulus Tepat Waktu (Studi Kasus : Fakultas Ilmu Komputer Universitas Brawijaya)

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

CARA MENJALANKAN APLIKASI

BAB 2 TELAAH PUSTAKA

TINJAUAN PUSTAKA. Definisi Data Mining

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

BAB III METODOLOGI PENELITIAN

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI)

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

APLIKASI PREDIKSI STATUS KELULUSAN MAHASISWA MENGGUNAKAN k- NEAREST NEIGHBOR (STUDI KASUS PADA JURUSAN KIMIA - FST UNDANA)

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN)

BAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek

BAB III ANALISA DAN PERANCANGAN

BAB 2 LANDASAN TEORI

PEMBANGUNAN SISTEM INFORMASI PERSONEL PADA DINAS ADMINISTRASI PERSONEL ARMADA REPUBLIK INDONESIA KAWASAN BARAT

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK

UKDW BAB I PENDAHULUAN Latar Belakang

Muhammad Syukri Mustafa* 1, I Wayan Simpen 2 1,2. Teknik Informatika STMIK Dipanegara * 1 2

BAB III ANALISA DAN PERANCANGAN. Pada dasarnya perancangan sistem yang dibuat oleh peneliti adalah

Penyederhanaan fungsi Boolean

BAB III ANALISA DAN DESAIN SISTEM

BAB I PENDAHULUAN I-1

PENGEMBANGAN SISTEM PAKAR BERBASIS ATURAN UNTUK MENENTUKAN MATA KULIAH YANG AKAN DIAMBIL ULANG (REMEDIAL) DENGAN METODE FORWARD CHAINING

MODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015

BAB 2 TINJAUAN PUSTAKA DAN LANDASAN TEORI

PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak

BAB 3 METODOLOGI PENELITIAN

PENGELOMPOKAN PROGRAM PNPM MANDIRI DENGAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN METODE K-NEAREST NEIGHBOR TUGAS AKHIR

BAB 1 PENDAHULUAN Building A Data WareHouse for Decision Support Second Edition Data Mining : Concepts, Models, Methods, and Algorithms

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB I PENDAHULUAN. Oleh karena itu dalam melakukan Kegiatan usahanya sehari-hari bank harus

BAB 2 LANDASAN TEORI

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA. Susanti, Shantika Martha, Evy Sulistianingsih INTISARI


PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

BAB IV ANALISA DAN PERANCANGAN

BAB IV HASIL DAN PEMBAHASAN

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

PENERAPAN ALGORITMA K-NEAREST NEIGHBOR (K-NN) UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB IV IMPLEMENTASI SISTEM DAN PENGUJIAN

BAB IV HASIL DAN UJI COBA

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

khazanah Aplikasi Pemrediksi Masa Studi dan Predikat Kelulusan Mahasiswa Informatika Universitas Muhammadiyah Surakarta Menggunakan Metode Naive Bayes

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

BAB II LANDASAN TEORI

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

Implementasi Metode K-Nearest Neighbor dalam Peramalan Jumlah Penduduk pada Kabupaten Grobogan, Demak dan Sragen

BAB III ANALISIS DAN DESAIN SISTEM

BAB IV HASIL DAN UJICOBA

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN Pengantar

Jurnal SCRIPT Vol. 3 No. 1 Desember 2015

Model Aplikasi Penentuan Jenis Beasiswa Berbasis Algoritma K-NN Termodifikasi

BAB 2 LANDASAN TEORI

BAB IV HASIL DAN UJI COBA

BAB III ANALISA DAN DESAIN SISTEM

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

BAB IV HASIL DAN UJI COBA

PENERAPAN ALGORITMA K-NEARST NEIGHBOR PADA NUPTK UNTUK PREDIKSI PESERTA SERTIFIKASI GURU

BAB I PENDAHULUAN. dunia teknologi informasi. Saat ini dikenal adanya social network dimana chatting

BAB III ANALISIS DAN PERANCANGAN SISTEM

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Transkripsi:

PEMBUATAN APLIKASI DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD (Studi Kasus Data Akademik Jurusan Teknik Komputer-S1 Universitas Komputer Indonesia) Oleh: Astrid Darmawan 10207104 Pembimbing: Selvia Lorena Br. Ginting, M.T Wendi Zarman, M.Si 1 JURUSAN TEKNIK KOMPUTER FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS KOMPUTER INDONESIA 2012

Pendahuluan Latar Belakang Maksud dan Tujuan Batasan Masalah 2

Latar Belakang Adanya tumpukan data 3

Maksud: Membuat perancangan aplikasi untuk mengklasifikasi masa studi mahasiswa di Jurusan Teknik Komputer dengan menggunakan Algoritma K-Nearest Neighborhood. Tujuan: Untuk memprediksi tingkat kelulusan dan persentase kelulusan mahasiswa di Jurusan Teknik Komputer khususnya S1. 4

Batasan Masalah Data yang digunakan hanya data Indeks Prestasi (IP) mahasiswa jurusan Teknik Komputer Program Sarjana (S1) dari semester 1 sampai semester 6. Data yang digunakan telah dibersihkan secara manual sebelum diproses mining. Visual Basic 6.0 sebagai aplikasi sistem antarmuka. Pengolahan basis data menggunakan database Microsoft Access 2007. Data yang digunakan adalah data akademik mahasiswa Jurusan Teknik Komputer tahun 2001-2006 5

Dasar Teori Data Mining Klasifikasi Algoritma Nearest Neighborhood 6

Data Mining Data mining merupakan proses menemukan pengetahuan yang baru dari data yang berjumlah besar yang disimpan di dalam database, gudang data atau repositori informasi. 7

Pengelompokan Data Mining Data Mining Predictive Descriptive Classification (Klasifikasi) Regression (Regresi) Time Series Analysis Clustering Association Rules Summarization Sequence Discovery 8

Klasifikasi Klasifikasi: tugas pembelajaran sebuah fungsi target f yang memetakan setiap himpunan atribut x ke salah satu class label y yang telah didefinisikan sebelumnya. Input Output Atribut Set (x) Classification model Class Label y Gambar.2.2 Model Klasifikasi Hal.7 9

Algoritma Nearest Neighborhood (NN) Nearestneighbor Pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru (testing data) dengan kasus lama (training sample). Jenis algoritma Nearestneighbor: 1-NN, yaitu pengklasifikasikan dilakukan terhadap 1 labeled data terdekat. K-NN, yaitu pengklasifikasikan dilakukan terhadap k labeled data terdekat dengan K>1. 10

Algoritma K-Nearest Neighborhood (KNN) Mulai For I = 1 to n-1 Mulai Sorted=true Ecludian Distance: Tentukan K For j= 0 to (n-1)-i Euclidian A[j]>a[j+1] Ya Atribut Data Training Atribut Data Testing Sorting Cari K data terdekat Temp=a[j] A[j]=a[j+1] A[j+1]=Temp Sorted=false Tidak Persamaan 2.1 Cari label mayoritas j Sorted=true Hasil Tidak i Ya Selesai 11 Gambar 3.13 (A) Algoritma KNN & (B) Algoritma Sorting Selesai

Perancangan Aplikasi data mining yang dibuat terdiri dari dua data, yaitu: Data Testing 1. NIM 2. Indeks Prestasi (IP) mahasiswa dari semester satu sampai enam. Data Training 1. NIM 2. Indeks Prestasi (IP) mahasiswa dari semester satu sampai enam. 3. Keterangan (Kategori Kelulusan) 12

Data training memiliki kategori sebagai berikut: Tabel 3.4 Kategori Kelulusan Berdasarkan Lama Studi Lulus <= 5 Tahun Lulus Kategori Ya Lulus > 5 Tahun Tidak 13

APLIKASI DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD (STUDI KASUS DATA AKADEMIK JURUSAN TEKNIK KOMPUTER UNIVERSITAS KOMPUTER INDONESIA) Tabel 3.17 Tabel Penjelasan tentang PerancanganForm Orang No Keterangan Logo UNIKOM 1 Data Grid untuk menampilkan data training. 1 Data Training Hapus Kembali Keluar 12 11 10 2 Pemilihan Tabeldatabase data testing 3 Option untuk memilih semester. 4 Button untuk mencari NIM. 15 2 3 4 Pilih Data Training Pilih Data Testing Pilih Semester Semester 1&2 Semester 1,2,3 &4 Semester 1,2,3,4 & 6 NIM IP Semester 1 Cari IP Semester 3 Nilai K IP Semester 5 Hitung Jarak yang termasuk kelompok nilai K 14 9 Listbox untuk keluaran hasil perhitungan jarak 5 sebelum di sorting. Listbox untuk keluaran hasil perhitungan jarak 6 setelah di sorting. 7 Listbox untuk kategori IP Semester 2 IP Semester 4 IP Semester 6 Persentase Peluang Kelulusan 8 8 Listbox untuk peluang kelulusan 9 Button untuk hitung jarak. Hasil kategori 7 10 Button untuk keluar Hasil Jarak Sebelum di sorting Hasil Jarak yang sudah di sorting 11 Button untuk menghapus. Hasil Kecocokan 13 12 Button untuk kembali ke Form Utama. 5 6 Perancangan Aplikasi Data Mining untuk 1 Data Mahasiswa 13 Listbox untuk hasil kecocokan hasil data uji tehadap data asli. 14 Listbox untuk hasil dari nilai K 15 Pemilihan Tabeldatabase data training 14

Tabel 3.20 Tabel Penjelasan tentang Form Keseluruhan Logo UNIKOM APLIKASI DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD (STUDI KASUS DATA AKADEMIK JURUSAN TEKNIK KOMPUTER UNIVERSITAS KOMPUTER INDONESIA) No 1 Keterangan Data Grid untuk menampilkan datatrainingdan data testing. 11 2 Option untuk pemilihan semester. 1 Record data Jarak yang termasuk kelompok nilai K 3 combobox untuk memilih Tabel data testing. 4 List box untuk hasil jarak baru sebelum disorting 2 Pilih Semester 1&2 Semester 1,2,3 &4 Semester 1,2,3,4 & 6 Pilih Data Training Pilih Data Testing Nilai k Peluang Kelulusan 12 3 List box untuk menampilkan hasil jarak yang sudah 5 disorting. 6 Button untuk kembali ke form utama. Hitung 9 10 7 Button untuk menghapus. 8 Button untuk keluar dari aplikasi data mining. Persentase Kelulusan 13 9 Buttin untuk menghitung jarak 4 10 Listbox untuk keluaran hasil klasifikasi. Hasil Jarak Sebelum di sorting Hasil Jarak yang sudah di sorting Persentase Tingkat Keberhasilan Sistem 14 11 Listbox untuk hasil pengelompokan nilai K. 5 12 combobox untuk memilih Tabel data training. Kembali Hapus Keluar 13 Listbox untuk menampilkan persentase kecocokan data. Perancangan Aplikasi Data Mining untuk 1 Database 15 6 7 8 14 Listbox untuk menampilkan persentase prediksi kelulusan.

Contoh Kasus Tabel.1 data training M SEMESTER X 11 = 1 X 12 =2 X 13 =3 X 14 =4 X 15 =5 X 16 =6 Y=Klasifikasi 1 3.94 4 4 4 3.89 3.58 Ya 2 1.68 1.84 1.53 2.32 2.88 2.69 Tidak 3 2.63 1.63 2.42 2.58 3 3.56 Tidak 4 3.21 3.42 3.84 2.79 3.6 3.75 Ya 5 3.11 3.58 3.35 3 3.11 3.21 Ya 6 2.68 2.79 3.16 2.95 3.23 3.68 Ya 7 2 1.53 2.11 2.16 2 1.88 Tidak 16 Label class y

Tabel 3.6 Data Testing SEMESTER M Y=Klasifikasi X 21 = 1 X 22 =2 X 23 =3 X 24 =4 X 25 =5 X 26 =6 1 2.95 2.76 2.32 1.8 2.75 2.87? Label class y 17

Proses Parameter yang dipakai adalah K=5 Menghitung kuadrat jarak Euclid (query instance) masingmasing objek terhadap sampel data atau training sample yang diberikan dengan menggunakan rumus: 18

M=1 dst sampai M=7 19

Tabel 3.7 Square Instance to Query Distance M SEMESTER X 11 =1 X 12 =2 X 13 =3 X 14 =4 X 15 =5 X 16 =6 Square instance to query distance 1 3.94 4 4 4 3.89 3.58 3.46 2 1.68 1.84 1.53 2.32 2.88 2.69 1.84 3 2.63 1.63 2.42 2.58 3 3.56 1.59 4 3.21 3.42 3.84 2.79 3.6 3.75 2.3 5 3.11 3.58 3.35 3 3.11 3.21 1.86 6 2.68 2.79 3.16 2.95 3.23 3.68 1.73 7 2 1.53 2.11 2.16 2 1.88 2.03 20

Kemudian mengurutkan objek-objek tersebut ke dalam kelompok yang mempunyai jarak Euclid terkecil. Tabel 3.8 Mengurutkan Objek ke dalam Kelompok ke Jarak Euclid Terkecil m SEMESTER X 11 = 1 X 12 =2 X 13 =3 X 14 =4 X 15 =5 X 16 =6 Square instance to query distance Jarak terkecil Apakah termasuk nearestneighbor (k) 1 3.94 4 4 4 3.89 3.58 3.46 7-2 1.68 1.84 1.53 2.32 2.88 2.69 1.84 3 Ya 3 2.63 1.63 2.42 2.58 3 3.56 1.59 1 Ya 4 3.21 3.42 3.84 2.79 3.6 3.75 2.3 6-5 3.11 3.58 3.35 3 3.11 3.21 1.86 4 Ya 6 2.68 2.79 3.16 2.95 3.23 3.68 1.73 2 Ya 21 7 2 1.53 2.11 2.16 2 1.88 2.03 5 Ya

Mengumpulkan label class Y (klasifikasi nearest neighbor). Tabel 3.9 Label Class Y M SEMESTER X 11 =1 X 12 =2 X 13 =3 X 14 =4 X 15 =5 X 16 =6 Square instance to query distance Jarak terkecil Apakah termasuk nearestneighbor (k) Y=Klasifikasi 1 3.94 4 4 4 3.89 3.58 3.46 7 - Ya 2 1.68 1.84 1.53 2.32 2.88 2.69 1.84 3 Ya Tidak 3 2.63 1.63 2.42 2.58 3 3.56 1.59 1 Ya Tidak 4 3.21 3.42 3.84 2.79 3.6 3.75 2.3 6 - Ya 5 3.11 3.58 3.35 3 3.11 3.21 1.86 4 Ya Ya 6 2.68 2.79 3.16 2.95 3.23 3.68 1.73 2 Ya Ya 7 2 1.53 2.11 2.16 2 1.88 2.03 5 Ya Tidak 22

Mencari Mayoritas Kategori Tabel 6 Hasil Akhir SEMESTER Square Apakah m X 11 =1 X 12 =2 X 13 =3 X 14 =4 X 15 =5 X 16 =6 instance to query distance Jarak terkecil termasuk nearestneighbor (k) Y=Klasifikasi 1 3.94 4 4 4 3.89 3.58 3.46 7 - Ya 2 1.68 1.84 1.53 2.32 2.88 2.69 1.84 3 Ya Tidak 3 2.63 1.63 2.42 2.58 3 3.56 1.59 1 Ya Tidak 4 3.21 3.42 3.84 2.79 3.6 3.75 2.3 6 - Ya 5 3.11 3.58 3.35 3 3.11 3.21 1.86 4 Ya Ya 6 2.68 2.79 3.16 2.95 3.23 3.68 1.73 2 Ya Ya 7 2 1.53 2.11 2.16 2 1.88 2.03 5 Ya Tidak Ya=2 Tidak=3 Jadi, Data Testing tersebut termasuk kategori Lulus > 5 23

PENGUJIAN Pengujian terdiri dari 2 proses yaitu: 1. Pengujian 1 database mahasiswa (data training = 30) 2. Pengujian 1 database mahasiswa (data training = 61) Masing-masing proses pengujian tersebut menggunakan Indeks Prestasi (IP) 1. Dua semester (semester 1 dan 2), 2. Empat semester (semester 1-4) dan 3. Enam semester (semester 1-6) Menggunakan nilai k yang berbeda. Untuk mengetahui tingkat keberhasilan pada sistem ini maka penulis menggunakan rumus: 24

25 Gambar 4.12 Testing dengan 1 Database mahasiswa (data training=30 data)

26 Gambar 4.19 Testing dengan 1 Database Mahasiswa (data training=61 data)

Kesimpulan 1. Aplikasi data mining ini telah berhasil membuat aplikasi yang dapat memprediksi masa studi mahasiswa menggunakan algoritma k-nearest neighborhood yang akan diterapkan di Jurusan Teknik Komputer. 2. Aplikasi data mining ini dapat memprediksi dengan menggunakan 1 data mahaisawa atau 1 database mahasiswa. 3. Untuk menggunakan data training yang berjumlah 30 data dengan menguji data testing berjumlah 60 data, maka didapatkan nilai k yang terbaik untuk memprediksi masa studi mahasiswa yaitu sebagai berikut: Untuk dua semester yaitu nilai k yang terbaik untuk digunakan memprediksi studi mahasiswa adalah nilai k=10 dengan tingkat keberhasilan 81.66%. Untuk empat semester yaitu nilai k yang terbaik untuk digunakan memprediksi studi mahasiswa adalah nilai k=10 dengan tingkat keberhasilan 76.66%. Untuk enam semester yaitu nilai k=10merupakan nilai k yang terbaik untuk digunakan memprediksi masa studi mahasiswa dengan tingkat keberhasilan 81.66%. 4. Untuk menggunakan data training yang berjumlah 30 data dengan menguji data testing berjumlah 60 data, maka didapatkan nilai k yang terbaik untuk memprediksi masa studi mahasiswa yaitu sebagai berikut: Untuk dua semester yaitu nilai k yang terbaik untuk memprediksi masa studi mahasiswa adalah nilai k=10 dengan tingkat keberhasilan 80%. Untuk empat semester, nilai k yang terbaik untuk memprediksi masa studi mahasiswa adalah nilai k=30 dengan tingkat keberhasilan 78.33%. Untuk enam semester, nilai k yang terbaik untuk memprediksi masa studi mahasiswa adalah nilai k=20 dan k=30 dengan tingkat keberhasilan 85%. 5. Setelah melakukan pengujian dengan melakukan perubahan pada nilai k, maka akan menghasilkan prediksi kelulusan yang bervariasi. 6. Nilai k yang terbaik juga tergantung pada jumlah data yang digunakan. Ukuran nilai k yang besar untukmemprediksi masa studi mahasiswa belum tentu menjadi nilai k yang terbaik dengan tingkat keberhasilan yang tinggi begitupun juga sebaliknya. 27

SARAN Aplikasi data mining ini dapat dibuat dengan menggunakan jaringan LAN sehingga nanti tidak hanya digunakan oleh satu pengguna di satu tempat saja tetapi dapat digunakan oleh banyak pengguna (para dosen dan pihak jurusan ) di tempat yang berbeda. Aplikasi data mining ini belum memperhitungkan faktor luar yang terjadi pada mahasiswa tersebut sehingga mahasiswa tersebut tidak lulus tepat waktu. Faktor luar tersebut dapat menjadi sebuah parameter baru dalam aplikasi ini. Kasus ini dapat diterapkan dengan menggunakan metode algoritma data mining yang lainnya, misalnya ID3. Penulis juga menyarankan agar aplikasi data mining ini dapat diterapkan menggunakan teknik data warehouse, sehingga tidak hanya menggunakan data akademik 1 jurusan saja tetapi dapat menggunakan banyak data akademik dari jurusan lain. 28

29