CLASTERING DATA AKADEMIK MAHASISWA FAKULTAS TEKNIK USNI DENGAN ALGORITMA K-MEANS LAPORAN AKHIR PENELITIAN

dokumen-dokumen yang mirip
IMPLEMENTASI METODE K-MEANS CLUSTERING UNTUK ANALISA PRESTASI SISWA BERDASARKAN DATA SISWA DI SMA NEGERI 1 GROGOL SKRIPSI

KLASIFIKASI DATA MAHASISWA MENGGUNAKAN METODE K- MEANS UNTUK MENUNJANG PEMILIHAN STRATEGI PEMASARAN

BAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek

Lillyan Hadjaratie Jurusan Teknik Informatika Universitas Negeri Gorontalo

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS

Abidah Elcholiqi, Beta Noranita, Indra Waspada

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

BAB IV PENGOLAHAN DATA

PENERAPAN K-MEANS CLUSTER UNTUK PENGARUH KECERDASAN EMOSI DAN STRES TERHADAP PRESTASI BELAJAR MAHASISWA

PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING

KLASTERISASI KOMPETENSI GURU MENGGUNAKAN HASIL PENILAIAN PORTOFOLIO SERTIFIKASI GURU DENGAN METODE DATA MINING

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

BAB I PENDAHULUAN 1.1 Latar Belakang

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU

PENGELOMPOKAN PROGRAM PNPM MANDIRI DENGAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN METODE K-NEAREST NEIGHBOR TUGAS AKHIR

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG

PENGELOMPOKAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

Pemanfaatan Educational Data Mining (EDM)...

PENGELOMPOKAN DAN ANALISIS PELANGGAN DENGAN MENGGUNAKAN FUZZY C-MEANS CLUSTERING

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

SKRIPSI TI S1 FIK UDINUS 1

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT

IMPLEMENTASI DATA MINING UNTUK PENGELOMPOKKAN DATA SISWA MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (STUDI KASUS : SMKN 1 KEDIRI) SKRIPSI

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan

Implementasi Algoritma K-Means Dalam Keputusan Pemberian Beasiswa (Studi Kasus SMA Santo Bernadus Pekalongan) Artikel Ilmiah

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

IMPLEMENTASI ALGORITMA K-MEANS UNTUK KLASTERISASI MAHASISWA BERDASARKAN PREDIKSI WAKTU KELULUSAN SKRIPSI

SISTEM PENDUKUNG KEPUTUSAN UNTUK MEMPREDIKSI KETEPATAN LAMARAN KERJA SISWA MENGGUNAKAN METODE NAIVE BAYES DI SMK ISLAM 1 DURENAN

BAB 1 PENDAHULUAN. Dengan kemajuan teknologi informasi sekarang ini, kebutuhan akan

BAB I PENDAHULUAN Latar Belakang Masalah

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS

PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS

Student Clustering Based on Academic Using K-Means Algoritms

IMPLEMENTASI METODE KLASTERING K-MEANS UNTUK MENGELOMPOKAN HASIL EVALUASI MAHASISWA. FEBRIZAL ALFARASY SYAM Dosen STMIK Dharmapala Riau ABSTRAK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

BAB II LANDASAN TEORI

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

khazanah informatika 1 Program studi Informatika Universitas Muhammadiyah Surakarta Surakarta 1.

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

BAB I PENDAHULUAN 1.1 Latar Belakang

MODEL ALGORITMA K-NEAREST NEIGHBOR

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

BAB I PENDAHULUAN 1.1. Latar Belakang

1. PENDAHULUAN. Kata Kunci: Data Mining, Clustering, Fuzzy C-Means

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

PENERAPAN DATA MINING DALAM PEMILIHAN PENERIMA BEASISWA BERPRESTASI DI POLITEKNIK DAN STMIK LPKIA DENGAN MENERAPKAN METODE K-MEANS CLUSTERING

Pemetaan Penyebaran Guru di Provinsi Banten dengan Menggunakan Metode Spatial Clustering K-Means (Studi kasus : Wilayah Provinsi Banten)

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

SISTEM PEMBAGIAN KELOMPOK BIMBINGAN BELAJAR DENGAN METODE K-MEANS CLUSTERING

IMPLEMENTASI METODE NAIVE BAYES UNTUK MEMPREDIKSI KELULUSAN MAHASISWA DI PROGRAM STUDI TEKNIK INFORMATIKA FT UN PGRI KEDIRI

PENGELOMPOKAN PEMINJAM BUKU DENGAN METODE K-MEANS DI PERPUSTAKAAN PUSAT UPN VETERAN JAWA TIMUR SKRIPSI

Analisa Data Mahasiswa Baru Terhadap Program Studi Yang. Dipilih Di Universitas Pembangunan Nasional Veteran Jawa

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

Bab 2 Tinjauan Pustaka

MODUL 6 ANALISIS CLUSTER

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

Aplikasi Algoritma Competitive Network Untuk Clustering Minat Mahasiswa Terhadap Topik-Topik Penelitian

PENERAPAN ASSOCIATION RULE DENGAN ALGORITMA APRIORI PADA TRANSAKSI PENJUALAN DI MINIMARKET SKRIPSI. Diajukan Untuk Memenuhi Sebagian Syarat Guna

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

LAPORAN PENELITIAN KEBIJAKAN DAN KELEMBAGAAN DANA PNBP TAHUN ANGGARAN 2012

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

BAB 1 PENDAHULUAN 1-1

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR

Penerapan Algoritma K-Means dalam Data Mining untuk Peminatan Jurusan Bagi Siswa Kelas X (Studi Kasus: SMA Negeri 29 Jakarta)

PREDIKSI KETEPATAN KELULUSAN MAHASISWA MENGGUNAKAN METODE DECISION TREE BERBASIS PARTICLE SWARM OPTIMATION (PSO)

SISTEM PENDUKUNG KEPUTUSAN PENERIMAAN SISWA BARU DI SMA NEGERI 2 PEMALANG DENGAN METODE SIMPLE ADDITIVE WEIGHTING

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PROMOSI (Studi kasus Universitas Bina Darma Palembang)

R Dimas Adityo 1), Herti Miawarni 2) Teknik Informatika Universitas Bhayangkara Surabaya 1) Teknik Elektro Universitas Bhayangkara Surabaya 2)

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

The 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Transkripsi:

CLASTERING DATA AKADEMIK MAHASISWA FAKULTAS TEKNIK USNI DENGAN ALGORITMA K-MEANS LAPORAN AKHIR PENELITIAN Disusun Oleh Bosar Panjaitan, S.Kom, M.Kom (KETUA) Turkhamun Adi Kurniawan, ST, M.Kom (Anggota) Teknik Informatika Fakultas Teknik Universitas Satya Negara Indonesia JAKARTA 2016 1

i

DAFTAR ISI Halaman DAFTAR ISI... ii BAB I PENDAHULUAN... 1 1.1 Latar Belakang Masalah... 1 1.2 Rumusan Masalah... 1 1.3 Batasan Masalah... 2 1.4 Tujuan Penelitian... 2 1.5 Manfaat Penelitian... 2 BAB II TINJAUAN PUSTAKA... 3 2.2 Penelitian Relepan... 3 2.2 Data Mining... 3 2.3 Clustering... 4 2.4 K-Means... 4 2.5 Algoritma K-Means... 5 BAB III METODE PENELITIAN... 6 3.1 Objek Penelitian... 6 3.2 Jadwal Penelitian... 7 BAB IV... 8 HASIL DAN PEMBAHASAN... 8 Tabel 4.1. Data Inisial... 8 Tabel 4.2 Data Hasil seleksi... 9 Tabel 4.5 Tabel Keanggotaan... 10 Tabel 4.9 Deskipsi Data Per Cluster... 25 BAB V... 27 5.1 Kesimpulan... 27 5.2 Saran... 27 ii

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Seiring dengan perkembangan teknologi, perguruan tinggi perguruan tinggi di Jakarta semakin megalami persaingan yang ketat dalam memperoleh calon mahasiswa. Teknologi bukan lah segalanya dalam menentukan strategi penerimaan mahasiswa baru tetapi harus diikuti dengan analisis data. Fakultas Teknik Universitas Satya Negara Indonesia (USNI) sebagai institusi pendidikan telah memiliki data akademik dan administrasi dalam jumlah yang sangat besar, tetapi belum dimanfaatkan secara maksimal. Data akademik mahasiswa merupakan data yang dihimpun dari hasil kegiatan penerimaan mahasiswa baru, dan proses belajar lulus dari suatu perguruan tinggi. Data pribadi mahasiswa, data rencana studi, dan data hasil studi (nilai dan indeks prestasi) merupakan contoh data akademik suatu perguruan tinggi. Di samping itu, bagian admisi pada setiap awal tahun akademik melakukan rekrutmen calon mahasiswa baru. Data mahasiswa baru yang dihimpun pada saat pendaftaran dan/atau registrasi berupa nilai ujian nasional (UN) ratarata dan/atau nilai hasil tes masuk perguruan tinggi. Jumlah data yang terakumulasi dari tahun ke tahun perlu dilakukan analisis untuk dapat membuka peluang dihasilkannya informasi yang berguna dalam pembuatan alternatif keputusan bagi manajemen perguruan tinggi. Untuk memperoleh calon mahasiswa yang lebih banyak, diperlukan strategi promosi yang tepat dengan dasar pengolan data terhadap data-data mahasiswa baru yang sudah ada antara lain asal sekolah, prestasi akademik, lokasi tempat tinggal, tren keminatan calon mahasiswa, kemampuan calon mahasiswa (akademik dan/atau finansial), proses pembelajaran, serta prospek lulusan kedepannya 1.2 Rumusan Masalah Adapun rumusan masalah dalam penelitian ini adalah Bagaimana mengklaster data akademik mahasiswa Fakultas Teknik USNI dengan algoritma K-Means? 1

1.3 Batasan Masalah Agar tidak terjadi melebarnya pokok permasalahan a. Data yang digunakan dalam penelitian ini adalah data akademik tahun 2014/2015 b. Variabel pengukuran hanya menggunakan Nilai UN dan IPK mahasiswa baru 1.4 Tujuan Penelitian Adapun tujuan dari penelitian ini adalah mengklaster data akademik mahasiswa fakultas teknik Universitas Satya Negara Indonesia 1.5 Manfaat Penelitian Membantu pihak manajemen Fakultas Teknik dalam menyusun strategi penerimaan mahasiswa baru. 2

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.2 Penelitian Relepan PENERAPAN METODE KLASTERING UNTUK MEMETAKAN POTENSI TANAMAN KEDELAI DI JAWA TENGAH DENGAN MENGGUNAKAN METODE FUZZY C-MEAN oleh Indra Setiawan Teknik Informatika Universitas Dian Nuswantoro Semarang CLUSTERING KUALITAS BERAS BERDASARKAN CIRI FISIK MENGGUNAKAN METODE K-MEAN oleh Silvi Agustina1), Dhimas Yhudo2), Hadi Santoso3), Nofiadi Marnasusanto4), Arif Tirtana5), Fakhris Khusnu6*) Optimasi K-Means Clustering Menggunakan Particle Swarm Optimization pada Sistem Identifikasi Tumbuhan Obat Berbasis Citra K-Means Clustering Optimization Using Particle Swarm Optimization on Image Based Medicinal Plant Identification System FRANKI YUSUF BISILISIN 1, YENI HERDIYENI 1*, BIB PARUHUM SILALAHI 2.2 Data Mining Teknologi data mining merupakan salah satu alat bantu untuk penggalian data pada basis data berukuran besar dengan spesifikasi kerumitan tinggi dan telah banyak digunakan pada lingkungan aplikasi bisnis seperti perbankan, provider telekomunikasi, perusahaan pertambangan, perminyakan, dan lain-lain [1]. Clustering merupakan salah satu teknik data mining yang berfungsi melakukan pengelompokan sejumlah data atau objek ke dalam cluster (group) sehingga setiap cluster akan berisi data yang semirip mungkin dan berbeda dengan objek dalam cluster yang lainnya. Teknik klasifikasi merupakan pendekatan fungsi klasifikasi dalam data mining yang digunakan untuk melakukan prediksi atas informasi yang belum diketahui sebelumnya. Beberapa algoritma yang dapat digunakan antara lain adalah algoritma Decission Tree C.45, Artificial Neural Networks (ANN), K-Nearest Neighbor (KNN), algoritma Naive Bayes, Neural Network serta algoritma lainnya. 3

2.3 Clustering Klasterisasi merupakan teknik atau metode untuk mengelompokkan sejumlah besar data menjadi suatu bagian-bagian kecil data yang mempunyai atribut kemiripan dalam sifat, letak, ciri atau filter lain yang telah ditentukan. Teknik atau metode klasterisasi dapat dikelompokkan menjadi dua kategori besar, yaitu (1) Metode Hirarki (Hierarchical Clustering) dan (2) Metode Non-Hirarki/Partisi (Partitional Hierarchical). Referensi [1] menunjukkan bahwa Algoritma K- Modes merupakan metode pengembangan dari K-Means yang mampu mengelompokkan data kategorikal dan menghasilkan klaster yang lebih stabil dengan waktu komputasi yang lebih singkat daripada metode K-Means. Teknik klasifikasi merupakan pendekatan untuk menjalankan fungsi klasifikasi dalam data mining yaitu untuk menggolongkan data. Teknik klasifikasi ini dapat pula digunakan untuk melakukan prediksi atas informasi yang belum diketahui sebelumnya. Beberapa algoritma yang dapat digunakan antara lain adalah algoritma Decission Tree C.45, Artificial Neural Networks (ANN), K-Nearest Neighbor (KNN), algoritma Naive Bayes, Neural Network serta algoritma lainnya. Tujuan pekerjaan pengelompokan (clustering) data dapat dibedakan menjadi dua, yaitu pengelompokan untuk pemahaman dan pengelompokan untuk penggunaan. Jika tujuannya untuk pemahaman, kelompok dalam tujuan ini hanya sebagai proses awal untuk kemudian dilanjutkan dengan pekerjaan inti seperti peringkasan atau summarization (rata-rata, atau standar deviasi), pelabelan kelas untuk setiap kelompok untuk kemudian digunakan sebagai data latih klasifikasi, dan sebagainya. Sementara jika untuk penggunaan, tujuan utama pengelompokan biasanya adalah mencari prototipe kelompok yang paling representatif terhadap data, memberikan abstraksi dari setiap objek data dalam kelompok dimana sebuah data terletak di dalamnya. 2.4 K-Means K-Means merupakan salah satu metode pengelompokan data nonhierarki(sekatan) yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. Metode ini mempartisi data ke dalam kelompok sehingga data yang berkarakteristik berbeda dikelompokkan yang lain. Adapun tujuan pengelompokan data ini adalah untuk memiminimalkan fungsi objektib yang diset dalam pengelompokan, yang pada umumnya 4

berusaha meminimalkan variasi di dalam satu kelompok dan memaksimalkan variasi antar kelompok. 2.5 Algoritma K-Means 1) Menentukan Jumlah kelompok; 2) Menentukan koordinat titik tengah setiap cluster; 3) Menentukan jarak setiap objek terhadap koordinat titik tengah; 4) Mengelompokkan objek objek tersebut berdasarkan pada jarak minimumnya; 5) Tentukan pusat cluster baru ; 6) Apakah ada selisih antara cluster lama dengan cluster baru?, Jika masih ada kembali ke langkah-1, jika tidak lanjut kelangkah 6. 7) Selesai. Pada langkah 2 lokasi sentroid(titik pusat) setiap kelompok yang diambil dari rata-rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M menyatakan jumlah data dalam sebuah kelompok, i menyatakan fitur ke i dalam sebuah kelompok, dan P menyatakan dimensi data, untuk menghitung sentroid fitur ke-i digunakan formula Ci= 1 M M j=1 x j Formula tersebut dilakukan sebanyak P dimensi sehingga i mulai dari 1 sampai P. Sedangkan pada langkah 4 dilakukan perhitungan jarak dengan menggunakan formula Euclidean D(x2,x1)= ( p j=1 x 2j x 1j ). 5

BAB III METODE PENELITIAN BAB III METODE PELATIHAN 3.1 Objek Penelitian Objek penelitian bersumber dari data mahasiswa yang telah melakukan registrasi di Universitas Satia Negara Indonesia. Atribut data yang akan digunakan adalah nama mahasiswa, jurusan SLTA, nilai UAN, kota asal mahasiswa, program studi yang dipilih dan IPK. Hasil yang diperoleh dari penelitian ini diharapkan dapat menampilkan profil mahasiswa, keterkaitan antara nilai UN terhadap IPK mahasiswa, serta sebaran asal sekolahnya. Dari hasil analisis tersebut diharapkan dapat membantu pihak admisi perguruan tinggi dalam menyusun strategi promosi program studi yang menjadi target. Penggalian informasi pada sebuah data yang berukuran besar (mempunyai jumlah record dan jumlah atribut yang cukup banyak) tidak dapat dilakukan dengan mudah. Prosedur pelaksanaan yang dilakukan dalam penelitian ini meliputi 1) Menghimpun data yang bersumber dari bagian akademik dan admisi untuk mahasiswa jenjang D3 dan S1, selanjutnya diintegrasikan untuk dilakukan data cleaning. 2) Menentukan jumlah cluster yang akan diproses lebih lanjut dan menetapkan titik pusat dari masing-masing cluster. 3) Selanjutnya langkah-langkah yang dilakukan adalah menyusun data-data yang akan diolah termasuk parameter dan alternatif yang akan dirangking, merancang dan memproses perhitungan menggunakan metode K-Means untuk mendapatkan nilai pengelompokan mahasiswa berdasar-kan Nila Rata-rata UN dan IPK. 4) Hasil proses yang telah dinyatakan valid selanjutnya dilakukan analisis yang dikaitkan dengan kelompok dari asal kota sekolahnya. 6

3.2 Jadwal Penelitian Tabel 3.1 Jadwal Penelitian No. 1 Rencana Kerja Perencanaan proposal Penelitian Bulan 11 12 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 2 Kegiatan Proposal 3 Penelitian Lapangan Pengumpulan hasil 4 penelitian lapangan 5 Pengumpulan Data 6 Pengolahan Data 7 8 9 10 Analisis dan Pembahasan Kegiatan hasil Penelitian Seminar hasil Penelitian Penyusunan Laporan Hasil Penelitian 7

BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Setelah dilakukan pengumpulan data dari data-data mahasiswa dengan tahun masuk tahun akademik 2012/2013, 2013/2014, dan 2014/205 maka diperoleh data seperti dalam tabel berikut ini Tabel 4.1. Data Inisial NO NO NIM... Asal Sekolah NEM IPK Formulir 1 011401001 011401503125001 SMK Darus Salam 5,83 2,96 2 011401045 011401503125002 SMKN 1 Geneng 7,73 3,18 3 011401016 011401503125004 SMK Nusantara 8,27 3,05 4 011401011 011401503125005 SMK Jakarta 1 7,22 3,14 5 011401085 011401503125006 SMK Yadika 2 7,38 2,30 6 011401089 011401503125007 SMK Triarga 2 7,30 1,74 7 011401103 011401503125008 SMKN 1 Ketapang 7,35 2,96 8 011401073 011401503125009 SMKN 59 8,10 2,54 9 011401006 011401503125012 SMK K.Bayangkara 5,17 2,84 10 011401137 011401503125014 SMU Al-Fajar 8,62 3,27 11 011401001 011401503125018 SMA N 24 Jakarta 6,73 3,16 12 011401200 011401503125021 SMA N 1 Pondok Aren 8,37 2,83 13 011401150 011401503125022 SMK Yadika 4 4,22 2,70 14 011401219 011401503125023 SMKN 3 Bandar Lam 7,18 3,23 15 011401227 011401503125024 SMK PGRI 25 4,88 2,83 16 011401228 011401503125025 SMK 5 Muhammadyah 5,07 2,27 17 011401274 011401503125026 SMK N 2 Klaten 8,25 2,27 18 011401204 011401503125033 SMK Bina Siswa 7,29 2,66 19 011401214 011401503125034 SMKN Jenawi 8,16 2,99 20 011401246 011401503125035 SMK N 18 Jakarta 7,79 2,85 21 011401316 011401503125037 SMK 4 Yadika 4 6,83 2,10 240 11202246 11205503215047 SMK Sasmita Jaya 2 6,90 2,31 Setelah mengumpulkan data maka dilanjutkan dengan pemilihan atribut yang dibutuhkan untuk proses Algoritma K-Means. 8

NO NEM IPK 1 5,83 2,96 2 7,73 3,18 3 8,27 3,05 4 7,22 3,14 5 7,38 2,30 6 7,30 1,74 7 7,35 2,96 8 8,10 2,54 9 5,17 2,84 10 8,62 3,27 11 6,73 3,16 12 8,37 2,83 13 4,22 2,70 14 7,18 3,23 15 4,88 2,83 16 5,07 2,27 17 8,25 2,27 18 7,29 2,66 19 8,16 2,99 20 7,79 2,85 21 6,83 2,10 240 6,90 2,31 Tabel 4.2 Data Hasil seleksi Setelah data hasil seleksi ini diperoleh, maka dilanjutkan dengan pengolahan data. Data diolah dengan menggunakan SPSS versi 21 diperoleh hasil sebagai berikut Tabel 4.3 Initial Cluster Centers Cluster 1 2 3 NEM 3,37 6,22 9,23 IPK 2,12 3,35 2,21 9

Tabel 4.4 Iteration History a Iteration Change in Cluster Centers 1 2 3 1,947,685 1,119 2,740,053,162 3,278,099,029 4,182,132,023 5,096,093,028 6,045,058,028 7,014,022,014 8,013,022,013 9,000,007,007 10,000,000,000 a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is,000. The current iteration is 10. The minimum distance between initial centers is 3,104. Tabel 4.5 Tabel Keanggotaan NO NEM IPK CLUSTER 1 5,83 2,96 1 2 7,73 3,18 3 3 8,27 3,05 3 4 7,22 3,14 2 5 7,38 2,3 2 6 7,30 1,74 2 7 7,35 2,96 2 8 8,10 2,54 3 10

NO NEM IPK CLUSTER 9 5,17 2,84 1 10 8,62 3,27 3 11 6,73 3,16 2 12 8,37 2,83 3 13 4,22 2,7 1 14 7,18 3,23 2 15 4,88 2,83 1 16 5,07 2,89 1 17 8,25 2,27 3 18 7,29 2,66 2 19 8,16 2,99 3 20 7,79 2,85 3 21 6,38 2,1 2 22 8,45 3,11 3 23 7,95 2,64 3 24 8,09 2,91 3 25 8,52 2,93 3 26 8,08 2,97 3 27 7,68 2,7 3 28 7,73 2,71 3 29 6,69 3,04 2 30 8,32 2,87 3 31 8,05 2,94 3 32 9,23 2,21 3 33 6,12 2,29 1 34 7,13 3,13 2 35 7,75 2,78 3 36 7,02 3,16 2 37 5,97 2,94 1 38 7,45 2,95 2 39 7,73 3,15 3 40 6,05 3,22 1 41 9,03 2,21 3 42 5,05 2,7 1 43 7,92 2,76 3 44 4,83 3,37 1 45 7,97 2,41 3 46 7,20 2,87 2 47 7,06 1,85 2 48 8,57 2,22 3 11

NO NEM IPK CLUSTER 49 9,40 2,97 3 50 7,37 3,24 2 51 8,37 3,27 3 52 5,83 3,17 1 53 5,08 3,26 1 54 5,85 3,17 1 55 5,90 3,74 1 56 7,65 3,52 3 57 8,35 2,61 3 58 8,80 3,55 3 59 6,37 3,26 2 60 7,50 3,37 3 61 4,55 2,77 1 62 7,25 1,63 2 63 8,79 3,51 3 64 6,98 3,22 2 65 5,58 3,01 1 66 7,63 3,18 3 67 7,13 2,76 2 68 6,63 2,96 2 69 4,73 2,61 1 70 5,33 2,95 1 71 7,78 3,29 3 72 5,97 2,49 1 73 5,48 2,11 1 74 7,88 1,64 3 75 5,48 2,72 1 76 7,22 2,83 2 77 3,37 2,12 1 78 6,75 3 2 79 6,50 1,97 2 80 5,48 2,61 1 81 5,23 3,17 1 82 5,12 2,52 1 83 6,67 2,92 2 84 6,10 3,12 1 85 7,98 1,7 3 86 8,40 2,53 3 87 5,27 2,72 1 88 7,08 3,06 2 12

NO NEM IPK CLUSTER 89 5,33 2,1 1 90 7,37 2,74 2 91 8,13 2,72 3 92 7,85 1,96 3 93 6,42 3,49 2 94 7,08 2,97 2 95 6,88 3,38 2 96 8,34 3,18 3 97 7,59 3,25 3 98 8,38 3,52 3 99 6,03 1,65 1 100 5,43 2,3 1 101 8,37 2,34 3 102 7,57 3,07 2 103 5,83 2,83 1 104 5,80 2,68 1 105 7,60 2,21 2 106 5,92 3,03 1 107 6,62 2,86 2 108 5,07 2,43 1 109 7,38 3,25 2 110 5,83 1,97 1 111 7,48 2,46 2 112 8,77 2,96 3 113 6,73 2,89 2 114 7,47 2,79 2 115 8,60 3,21 3 116 8,05 2,09 3 117 7,16 2,89 2 118 5,32 2,73 1 119 7,72 2,88 3 120 7,07 2,68 2 121 7,37 2,9 2 122 8,21 3,03 3 123 7,08 2,62 2 124 8,95 3,15 3 125 5,55 2,84 1 126 6,51 3,06 2 127 8,63 3,07 3 128 7,39 2,86 2 13

NO NEM IPK CLUSTER 129 7,37 2,59 2 130 8,07 2,8 3 131 6,03 2,59 1 132 8,78 2,53 3 133 8,83 3,3 3 134 8,38 2,86 3 135 9,03 3,22 3 136 8,20 2,73 3 137 7,95 2,84 3 138 7,58 2,42 2 139 8,87 2,89 3 140 6,90 2,61 2 141 7,02 2,84 2 142 6,57 2,72 2 143 8,72 2,92 3 144 7,38 2,71 2 145 7,28 2,92 2 146 6,44 2,72 2 147 5,72 2,01 1 148 6,43 3,17 2 149 6,65 2,82 2 150 6,18 1,25 1 151 4,42 2,05 1 152 7,40 2,15 2 153 8,68 2,7 3 154 6,18 3,02 1 155 7,03 3,15 2 156 6,52 2,61 2 157 7,12 2,54 2 158 6,07 2,71 1 159 7,18 2,57 2 160 5,77 1,89 1 161 6,67 2,85 2 162 8,08 3,32 3 163 8,32 3,35 3 164 6,55 2,9 2 165 7,37 1,98 2 166 7,65 3,23 3 167 6,00 2,94 1 168 5,52 2,84 1 14

NO NEM IPK CLUSTER 169 7,03 2,68 2 170 8,38 3,09 3 171 6,85 2,9 2 172 8,72 3,13 3 173 6,75 2,84 2 174 5,07 2,87 1 175 7,88 3,13 3 176 8,27 3,13 3 177 5,15 2,88 1 178 6,70 2,96 2 179 7,17 2,93 2 180 6,90 2,88 2 181 7,68 3,04 3 182 7,23 2,85 2 183 5,48 2,85 1 184 5,80 1,42 1 185 8,32 3,27 3 186 7,48 3,23 2 187 7,87 2,92 3 188 7,52 1,5 2 189 5,73 1,33 1 190 8,25 3,49 3 191 6,85 2,58 2 192 7,73 3,25 3 193 7,48 2,98 2 194 8,00 2,83 3 195 6,07 3,11 1 196 6,85 3,16 2 197 7,27 3 2 198 7,60 3,04 3 199 8,26 3,38 3 200 6,45 3,31 2 201 8,60 3,34 3 202 6,27 2,82 2 203 5,68 0,95 1 204 5,82 2,88 1 205 7,13 3,03 2 206 8,32 2,55 3 207 6,93 0,94 2 208 7,80 2,75 3 15

NO NEM IPK CLUSTER 209 8,62 2,69 3 210 6,85 2,32 2 211 5,18 2,37 1 212 7,67 2,6 3 213 7,67 1,73 2 214 6,27 2,49 1 215 2,85 2,43 1 216 8,82 3,19 3 217 8,92 3,16 3 218 6,63 3,4 2 219 7,63 2,7 2 220 8,53 2,94 3 221 5,84 3,03 1 222 7,98 3,26 3 223 7,75 2,5 3 224 6,22 3,35 2 225 6,39 3,4 2 226 7,70 2,88 3 227 7,79 3,31 3 228 8,00 3,32 3 229 6,82 2,97 2 230 8,22 2,98 3 231 7,34 2,82 2 232 8,18 3,11 3 233 6,98 2,89 2 234 7,25 2,89 2 235 7,30 3 2 236 7,65 2,47 2 237 7,73 3,01 3 238 6,28 2,81 2 239 7,40 2,24 2 240 6,90 2,31 2 Tabel 4.6 Final Cluster Centers Cluster 16

1 2 3 NEM 5,52 7,03 8,22 IPK 2,61 2,77 2,93 Tabel 4.7 Distances between Final Cluster Centers Cluster 1 2 3 1 1,521 2,723 2 1,521 1,202 3 2,723 1,202 Tabel 4.8 Number of Cases in each Cluster 1 58,000 Cluster 2 92,000 3 90,000 Valid 240,000 Missing,000 4.2 Pembahasan Dari hasil eksekusi program dapat ditampilkan data per Cluster sebagai berikut a. Seluruh Cluster 3 Tabel 4.8 Cluster 3 NO NEM IPK CLUSTER 1 4,42 2,05 3 17

2 7,40 2,15 3 3 8,68 2,7 3 4 6,18 3,02 3 5 7,03 3,15 3 6 6,52 2,61 3 7 7,12 2,54 3 8 6,07 2,71 3 9 7,18 2,57 3 10 5,77 1,89 3 11 6,67 2,85 3 12 8,08 3,32 3 13 8,32 3,35 3 14 6,55 2,9 3 15 7,37 1,98 3 16 7,65 3,23 3 17 6 2,94 3 18 5,52 2,84 3 19 7,03 2,68 3 20 8,38 3,09 3 21 6,85 2,9 3 22 8,72 3,13 3 23 6,75 2,84 3 24 5,07 2,87 3 25 7,88 3,13 3 26 8,27 3,13 3 27 5,15 2,88 3 28 6,7 2,96 3 18

29 7,17 2,93 3 30 6,9 2,88 3 31 7,68 3,04 3 32 7,23 2,85 3 33 5,48 2,85 3 34 5,8 1,42 3 35 8,32 3,27 3 36 7,48 3,23 3 37 7,87 2,92 3 38 7,52 1,5 3 39 5,73 1,33 3 40 8,25 3,49 3 41 6,85 2,58 3 42 7,73 3,25 3 43 7,48 2,98 3 44 8 2,83 3 45 6,07 3,11 3 46 6,85 3,16 3 47 7,27 3 3 48 7,6 3,04 3 49 8,26 3,38 3 50 6,45 3,31 3 51 8,6 3,34 3 52 6,27 2,82 3 53 5,68 0,95 3 54 5,82 2,88 3 55 7,13 3,03 3 19

56 8,32 2,55 3 57 6,93 0,94 3 58 7,8 2,75 3 59 8,62 2,69 3 60 6,85 2,32 3 61 5,18 2,37 3 62 7,67 2,6 3 63 7,67 1,73 3 64 6,27 2,49 3 65 2,85 2,43 3 66 8,82 3,19 3 67 8,92 3,16 3 68 6,63 3,4 3 69 7,63 2,7 3 70 8,53 2,94 3 71 5,84 3,03 3 72 7,98 3,26 3 73 7,75 2,5 3 74 6,22 3,35 3 75 6,39 3,4 3 76 7,7 2,88 3 77 7,79 3,31 3 78 8 3,32 3 79 6,82 2,97 3 80 8,22 2,98 3 81 7,34 2,82 3 82 8,18 3,11 3 20

83 6,98 2,89 3 84 7,25 2,89 3 85 7,3 3 3 86 7,65 2,47 3 87 7,73 3,01 3 88 6,28 2,81 3 89 7,4 2,24 3 90 6,9 2,31 3 b. Seluruh Cluster 2 Tabel 4.8 Cluster 2 NO NEM IPK CLUSTER 1 6,37 3,26 2 2 7,5 3,37 2 3 4,55 2,77 2 4 7,25 1,63 2 5 8,79 3,51 2 6 6,98 3,22 2 7 5,58 3,01 2 8 7,63 3,18 2 9 7,13 2,76 2 10 6,63 2,96 2 11 4,73 2,61 2 12 5,33 2,95 2 13 7,78 3,29 2 14 5,97 2,49 2 15 5,48 2,11 2 16 7,88 1,64 2 17 5,48 2,72 2 21

18 7,22 2,83 2 19 3,37 2,12 2 20 6,75 3 2 21 6,5 1,97 2 22 5,48 2,61 2 23 5,23 3,17 2 24 5,12 2,52 2 25 6,67 2,92 2 26 6,1 3,12 2 27 7,98 1,7 2 28 8,4 2,53 2 29 5,27 2,72 2 30 7,08 3,06 2 31 5,33 2,1 2 32 7,37 2,74 2 33 8,13 2,72 2 34 7,85 1,96 2 35 6,42 3,49 2 36 7,08 2,97 2 37 6,88 3,38 2 38 8,34 3,18 2 39 7,59 3,25 2 40 8,38 3,52 2 41 6,03 1,65 2 42 5,43 2,3 2 43 8,37 2,34 2 44 7,57 3,07 2 45 5,83 2,83 2 46 5,8 2,68 2 47 7,6 2,21 2 22

48 5,92 3,03 2 49 6,62 2,86 2 50 5,07 2,43 2 51 7,38 3,25 2 52 5,83 1,97 2 53 7,48 2,46 2 54 8,77 2,96 2 55 6,73 2,89 2 56 7,47 2,79 2 57 8,6 3,21 2 58 8,05 2,09 2 59 7,16 2,89 2 60 5,32 2,73 2 61 7,72 2,88 2 62 7,07 2,68 2 63 7,37 2,9 2 64 8,21 3,03 2 65 7,08 2,62 2 66 8,95 3,15 2 67 5,55 2,84 2 68 6,51 3,06 2 69 8,63 3,07 2 70 7,39 2,86 2 71 7,37 2,59 2 72 8,07 2,8 2 73 6,03 2,59 2 74 8,78 2,53 2 75 8,83 3,3 2 76 8,38 2,86 2 77 9,03 3,22 2 23

78 8,2 2,73 2 79 7,95 2,84 2 80 7,58 2,42 2 81 8,87 2,89 2 82 6,9 2,61 2 83 7,02 2,84 2 84 6,57 2,72 2 85 8,72 2,92 2 86 7,38 2,71 2 87 7,28 2,92 2 88 6,44 2,72 2 89 5,72 2,01 2 90 6,43 3,17 2 91 6,65 2,82 2 92 6,18 1,25 2 c. Seluruh Cluster 1 Tabel 4.8 Cluster 1 NO NEM IPK CLUSTER 1 5,83 2,96 1 2 7,73 3,18 1 3 8,27 3,05 1 4 7,22 3,14 1 5 7,38 2,3 1 6 7,3 1,74 1 7 7,35 2,96 1 8 8,1 2,54 1 9 5,17 2,84 1 10 8,62 3,27 1 11 6,73 3,16 1 12 8,37 2,83 1 13 4,22 2,7 1 14 7,18 3,23 1 15 4,88 2,83 1 16 5,07 2,89 1 24

17 8,25 2,27 1 18 7,29 2,66 1 19 8,16 2,99 1 20 7,79 2,85 1 21 6,38 2,1 1 22 8,45 3,11 1 23 7,95 2,64 1 24 8,09 2,91 1 25 8,52 2,93 1 26 8,08 2,97 1 27 7,68 2,7 1 28 7,73 2,71 1 29 6,69 3,04 1 30 8,32 2,87 1 31 8,05 2,94 1 32 9,23 2,21 1 33 6,12 2,29 1 34 7,13 3,13 1 35 7,75 2,78 1 36 7,02 3,16 1 37 5,97 2,94 1 38 7,45 2,95 1 39 7,73 3,15 1 40 6,05 3,22 1 41 9,03 2,21 1 42 5,05 2,7 1 43 7,92 2,76 1 44 4,83 3,37 1 45 7,97 2,41 1 46 7,2 2,87 1 47 7,06 1,85 1 48 8,57 2,22 1 49 9,4 2,97 1 50 7,37 3,24 1 51 8,37 3,27 1 52 5,83 3,17 1 Dari data-data di atas diperoleh deskripsi data sebagai berikut Tabel 4.9 Deskipsi Data Per Cluster 25

N.MIN IPK.MIN N.MAKS IPK. MAKS RATA N RATA2IPK C1 2,85 0,95 6,27 3,74 5,46 2,61 C2 6,22 0,94 7,67 3,49 7,02 2,77 C3 7,50 1,64 9,40 3,55 8,22 2,92 Sebagai sasaran PMB terbaik tentunya adalah calon mahasiswa yang mempunyai NEM terbaik dan IPK terbaik. Hal ini terdapat di Cluster 3 dengan nilai rata-rata NEM=8.22 dan ratarata IPK 2,92. Setelah dilakukan Query ternyata pada kluster 3 tidak ada asal sekolah yang mendominasi hanya beberapa siswa yang berasal dari sekolah yang sama. Dari SMK Media informatika 4 orang, SMK Budi Mulia 3 orang, SMK Triguna 2 orang, SMK Muhammadiah 9 2orang, SMK YUPPEN EK1 3 orang, SMK N 15 2 orang, SMK Pertiwi 2 2 orang, SMK KARTIKA 2 orang, selainnya 1 orang. 26

BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan Dari hasil dan pembahasan pada penelitian ini dapat diperoleh 1. Dari sampel yang diambil 240 mahasiswa, ada 58 orang ada di Cluster1, 92 orang ada di Cluster2, dan 90 orang ada di Cluster3; 2. Rata-rata NEM dan IPK pada Cluster 3 adalah 8,22 dan 2,92; 3. Dari 90 data Asal sekolah hanya 4 siswa yang berasal dari SMK Meidya Informatika, 3 siswa dari SMK Budi Mulya, 3 siswa dari SMK YUPPEN EK1, dan masing-masing 2 siswa dari SMK Triguna, SMK Muhammadiah 9, SMK Pertiwi 2, SMK N 15,dan SMK KARTIKA; selainnya masing-masing1 siswa dari 70 sekolah; 4. Distribusi Asal sekolah sangat beragam (tidak ada dominasi); Dari hasil tersebut dapat disimpulkan bahwa sasaran PMB fakultas teknik tidak perlu terfokus pada sekolah tertentu 5.2 Saran Dari pengalaman sipeneliti tentang pengumpulan data mengalami hal yang cukup menyulitakan dikarenakan data base PMB kurang lengkap yaitu Nilai UAN(NEM) tidak, sehingga perlu data base PMB dilengkapi supaya untuk pengolahan data sesuai keperluan manajemen bisa lebih cepat. Diharapkan juga untuk penelitian berikut dilakukan untuk seluruh USNI. 27

DAFTAR PUSTAKA DAFTAR PUSTAKA [1] Eko Prasetyo, Data Mining,Edisi ke-1, C.V ANDI OFFSET, Yogjakarta 2012. [2] Andi Syafrianto, Perancangan aplikasi K-means untuk pengelompokan mahasiswa STMIK EL-ERHAMA Yogyakarta berdasarkan frekuensi kunjungan ke perpustakaan dan IPK, Yogyakarta STMIK EL-ERHAMA, 2005. [3] Efraim T., Decision support systems and intelligent systems, Edisi ke-7, Andi, Yogyakarta, 2005. [4] Jiawei Han and Micheline Kamber, Data mining concepts and techniques second edition, San Francisco Morgan Kauffman, 2001. [5] Oyelade, Oladipupo, Obagbuwa, Application of K-Menas clustering algorithm for prediction of students acaddemic performance, International Journal of Computer Science and Information Security, Volume 7, 2010 28