PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

dokumen-dokumen yang mirip
MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

BAB 2 TINJAUAN PUSTAKA

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

Bab 2 Tinjauan Pustaka

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan

BAB IV ANALISIS DAN PERANCANGAN

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

Jl. Raya Dukuhwaluh Purwokerto )

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

Abidah Elcholiqi, Beta Noranita, Indra Waspada

PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

BAB 3 ANALISA SISTEM

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS

Student Clustering Based on Academic Using K-Means Algoritms

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENERAPAN K-MEANS CLUSTERING PADA DATA PENERIMAAN MAHASISWA BARU (STUDI KASUS : UNIVERSITAS POTENSI UTAMA)

DATA MINING DAN WAREHOUSE A N D R I

DATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Pengenalan Pola. K-Means Clustering

PENERAPAN METODE CLUSTERING UNTUK MEMETAKAN POTENSI TANAMAN KEDELAI DI JAWA TENGAH DENGAN ALGORITMA FUZZY C- MEANS

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek

PENGELOMPOKAN PROGRAM PNPM MANDIRI DENGAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN METODE K-NEAREST NEIGHBOR TUGAS AKHIR

Prosiding SENATEK 2015 Fakultas Teknik, Universitas Muhammadiyah Purwokerto Purwokerto, 28 November 2015, ISBN

IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMBAGIAN KELAS SISWA

SISTEM PEMBAGIAN KELOMPOK BIMBINGAN BELAJAR DENGAN METODE K-MEANS CLUSTERING

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

PENERAPAN DATA MINING DALAM PEMILIHAN PENERIMA BEASISWA BERPRESTASI DI POLITEKNIK DAN STMIK LPKIA DENGAN MENERAPKAN METODE K-MEANS CLUSTERING

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN Building A Data WareHouse for Decision Support Second Edition Data Mining : Concepts, Models, Methods, and Algorithms

KLASTERISASI KOMPETENSI GURU MENGGUNAKAN HASIL PENILAIAN PORTOFOLIO SERTIFIKASI GURU DENGAN METODE DATA MINING

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

khazanah informatika 1 Program studi Informatika Universitas Muhammadiyah Surakarta Surakarta 1.

BAB 2 TINJAUAN PUSTAKA

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING PENENTUAN JURUSAN BAHASA MANDARIN GERMAN DAN PRANCIS

BAB 1 PENDAHULUAN. Universitas Muhammadiyah Surakarta merupakan salah satu dari beberapa instansi

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

SISTEM PENDUKUNG KEPUTUSAN MINAT PEMILIHAN JURUSAN SMA DENGAN METODE K-MEANS CLUSTER ANALYSIS

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

CLUSTERING PENENTUAN POTENSI KEJAHATAN DAERAH DI KOTA BANJARBARU DENGAN METODE K-MEANS

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

MODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

BAB 1 PENDAHULUAN. Wiley & Sons, 2003, Hal : 1. 1 Poe Vidette, Klauer Patricia dan Brobst Stephen, Building A Data WareHouse for Decision Support

BAB II TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI

PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS

Gambar 5.1 Form Master Pegawai

PENGELOMPOKAN KOLEKSI BUKU PERPUSTAKAAN BERDASARKAN LAMA PEMINJAMAN BUKU MENGGUNAKAN K-MEANS

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

Penerapan Metode Clustering K- Means Untuk Mengukur Tingkat Kedisplinan Siswa Di SMK Perikanan Nusantara Demak

ANALISIS CLUSTER PADA DOKUMEN TEKS

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN 1-1

IMPLEMENTASI DATA MINING UNTUK PENGELOMPOKKAN DATA SISWA MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (STUDI KASUS : SMKN 1 KEDIRI) SKRIPSI

BAB I PENDAHULUAN I.1 Latar Belakang

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Implementasi Algoritma K-Means Dalam Keputusan Pemberian Beasiswa (Studi Kasus SMA Santo Bernadus Pekalongan) Artikel Ilmiah

PENGELOMPOKAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

Clustering Data Ujian Tengah Semester (UTS) Data Mining Menggunakan Algoritma K-Means

BAB II LANDASAN TEORI. Nama Judul. Hasil Peneliti, Penelitian. Penelitian Tahun 1. Johan. Implementasi

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG

BAB 1 PENDAHULUAN 1.1. Latar Belakang

Penerapan Algoritma Fuzzy Clustering Untuk Penentuan Jurusan Sekolah Menengah Kejuruan ( SMK Negeri 1 Rambah )

TESIS ADYA ZIZWAN PUTRA

Penerapan Algoritma K-Means untuk Clustering

Transkripsi:

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas Sumatera Utara Jl. Dr. T. Mansyur No. 9 Kampus USU Medan 20155 nur4ziah@gmail.com1, m.zarlis@yahoo.com2, bnasution@yahoo.com3 Abstrak Data mining merupakan teknik pengolahan data dalam jumlah besar untuk pengelompokan.teknik ini digunakan dalam proses Knowledge Discovery in Database (KDD). Teknik tersebut mempunyai beberapa metode dalam pengelompokannya Naïve-Bayes dan Nearest Neighbour, pohon keputusan (KD-Tree), ID3, K-Means, text mining dan dbscan. Dalam hal ini penulis mengelompokan data siswa baru sekolah menengah kejuruan tahun ajaran 2014/2015. Pengelompokan tersebut berdasarkan kriteria kriteria data siswa. Pada penelitian ini, penulis menerapkan algoritma K-Means Clustering untuk pengelompokan data siswa baru sekolah menengah kejuruan. Dalam hal ini, pada umumnya untuk memamasuki jurusan hanya disesuaikan dengan nilai siswa saja namun dalam penelitian ini pengelompokan disesuaikan kriteria kriteria siswa seperti penghasilan orang tua, tanggungan anak orang tua dan nilai tes siswa. Penulis menggunakan beberapa kriteria tersebut agar pengelompokan yang dihasilkan menjadi lebih optimal. Tujuan dari pengelompokan ini adalah terbentuknya kelompok jurusan pada siswa yang menggunakan algoritma K-Means clustering. Hasil dari pengelompokan tersebut diperoleh tiga kelompok yaitu kelompok tidak lulus, kelompok rekayasa perangkat lunak dan kelompok teknik komputer jaringan. Terdapat pusat cluster dengan Cluster-1=1.4;2.2;2.2, Cluster-2= 2.28;1.64;4 dan Cluster-3=5;2;6. Pusat cluster tersebut didapat dari beberapa iterasi sehingga mengahasilakan pusat cluster yang optimal. Keywords Kriteria, K-Means, Data Mining, Jurusan I. PENDAHULUAN Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan (unsupervised) dan suatu metode untuk mencari dan mengelompokan data yang memiliki kemiripan karakteristik antara satu data dengan data lain[1]. Menurut kategori kekompakan, pengelompokan terbagi menjadi dua, yaitu komplet dan parsial. Jika semua data dapat bergabung menjadi satu, dapat dikatakan semua data kompak menjadi satu kelompok[2]. Pada clustering ini terdapat beberapa algoritma pengelompokan untuk mengelompokan data secara mudah. Salah satunya adalah algoritma KMeans yang merupakan metode analisis kelompok yang mengarah pada partisian N objek pengamatan ke dalam K kelompok, di mana setiap objek pengamatan sebuah kelompok data dengan mean (rata-rata) terdekat[2]. Pengelompokan pada umumnya diterapkan untuk mengelompokan dokumen atau benda yang tidak tersusun dengan rapi dan tidak sesuai sususannya pada tempatnya. Namun fungsi dari pengelompokan tidak hanya sekedar mengelompokan dokumen atau benda. Pengelompokan (clustering) dapat diterapkan dalam hal penentuan jurusan sekolah agar jurusan tersebut sesuai dengan kemampuan siswa. Banyak lembaga pendidikan seperti sekolah menengah kejuruan yang hanya menggunakan nilai sebagai tolak ukur untuk memilih jurusan, sehingga pada akhirnya siswa menjadi salah mengambil jurusan dan tidak dapat menyesuaikan kemampuan yang siswa miliki dengan jurusan yang telah diambil. Dalam hal ini, untuk pengelompokan jurusan yang sesuai dengan kemampuan siswa adalah dapat ditentukan dengan data data setiap siswa. Data yang dapat menjadi tolak ukur untuk pengelompokan jurusan yaitu nilai tes masuk sekolah menengah kejuruan, penghasilan orang tua, dan tanggungan anak orang tua. Dengan demikian pengelompokan jurusan yang diambil siswa akan lebih efektif bagi siswa itu sendiri. Algoritma K-Means dalam hal ini akan mengelompokan data tersebut sesuai kriteria kriteria yang dipilih dari data siswa. II. PENDAHULUAN A. Data Mining Istilah data mining mulai dikenal sejak tahun 1990, ketika pekerjaan pemanfaatan data menjadi sesuatu yang penting dalam berbagai bidang, mulai dari bidang akademik, bisnis hingga medis[2]. Munculnya data mining didasarkan pada jumlah data yang tersimpan dalam basis data semakin besar. Dalam berbagai literatur, teori-teori pada data mining sudah ada sejak lama seperti antara lain Naïve-Bayes dan Nearest Neighbour, Pohon Keputusan, aturan asosiasi, K-Means Clustering dan text mining[3]. 100

Data mining disebut juga dengan knowledgediscovery in database (KDD) ataupun pattern recognition. Istilah KDD atau disebut penemuan pengetahuan data karena tujuan utama data mining adalah untuk memanfaatkan data dalam basis data dengan mengolahnya sehingga menghasilkan informasi baru yang berguna. Sedangkan istilah pattern recognition atau disebut pengenalan pola mempunyai tujuan pengetahuan yang akan digali dari dalam bongkahan data yang sedang dihadapi. B. Dasar Cluster Analisis kelompok (cluster analysis) adalah mengelompokkan data (objek) yang didasarkan hanya pada informasi yang ditemukan dalam data yang menggambarkan objek tersebut dan hubungan diantaranya[1]. Analisis Cluster sebagai metodologi untuk klasifikasi data secara otomatis menjadi beberapa kelompok dengan menggunakan ukuran asosiasi, sehingga data yang sama berada dalam satu kelompok yang sama dan data yang berbeda berada dalam kelompok data yang tidak sama. Masukan (input) untuk sistem analisis cluster adalah seperangkat data dan kesamaan ukuran (atau perbedaan) antara dua data. Sedangkan keluaran (output) dari analisis cluster adalah sejumlah kelompok yang membentuk sebuah partisi atau struktur partisi dari kumpulan data. Salah satu hasil tambahan dari analisis cluster adalah deskripsi umum dari setiap cluster dan hal itu sangat penting untuk analisis lebih dalam dari karakteristik data set tersebut. Ada saatnya di mana set data yang akan diproses dalam data mining belum diketahui label kelasnya. Pengelompokan data dilakukan dengan menggunakan algoritma yang sudah ditentukan dan selanjutnya data akan diproses oleh algoritma untuk dikelompokkan menurut karakteristik alaminya. {xi i=1,...,n}. Algoritma K-Means mengelompokan semua titik data dalam X sehingga setiap titik xi hanya jatuh dalam satu K partisi[4]. Tujuan pengelompokan ini adalah untuk meminimalkan fungsi objek yang diset dalam proses pengelompokan, yang pada umumnya berusaha meminimalkan variasi di dalam suatu kelompok dan memaksimalkan variasi antarkelompok. Parameter yang hrsus dimasukkan ketika menggunakan algoritma K-Means adalah nilai K. Nilai K yang digunkan pada umumnya didasarkan pada informasi yang diketahui sebelumnya mengenai sebenarnya berapa banyak cluster yang muncul dalam X, berapa banyak yang digunakan untuk penerapnnya, atau jenis cluster dicari dengan melakukan percobaan dengan beberapa nilai K. Set representatif cluster dinyatakan C={cj j=1,,k}. sejumlah K representatif cluster tersebut sebagai cluster centroid (titik pusat cluster). Untuk set data dalam X dikelompokan berdasarkan konsep kedekatan atau kemiripan, namun kuantitas yang digunkan untuk mengukurnya adalah ketidakmiripan. Metrik yang umum digunakan untuk ketidakmiripan tersebut adalah Euclidean. Secara umum algoritma K-Means memiliki langkah-langkah dalam pengelompokan, diantaranya: 1) Inisilisasi: menentukan nilai K centroid yang diinginkan dan metrik ketidakmiripan (jarak) yang diinginkan. 2) Memilih K data dari set X sebagai centroid. Untuk menentukan centroid dapat menggunakan persamaan (1). (1) 3) 4) 5) Mengalokasikan semua data ke centroid terdekat dengan metrik jarak yang telah ditetapkan. Menghitung kembali centroid C berdasarkan data yang mengikuti cluster masing masing. Mengulangi langkah 3 dan 4 hingga kondisi konvergen tercapai. Berikut ini adalah rumus untuk menentukan jumlah cluster: (2) Keterangan: K = klaster N = jumlah data Gbr. 1 Pengelompokan dengan clustering C. Algoritma K-Means Algoritma K-Means merupakan algoritma pengelompokan iteratif yang melakukan partisi set data ke dalam sejumlah K cluster yang sudah ditetapkan di awal. Algoritam K-Means sederhana untuk diimplementasikan dan dijalankan, relatif cepat, mudah beradaptasi, umum penggunaannya dalam praktek[2]. K-Means dapat diterapkan pada data yang direpresentasikan dalam r-dimensi ruang tempat. Kmeans mengelompokan set data r-dimensi, X= Menghitung jarak pada ruang jarak Euclidean menggunakan formula: 2= Keterangan: D = euclidean distance x = banyaknya objek Ʃp = jumlah data record 101 2 (3)

III. HASIL DAN PEMBAHASAN Penelitian ini bertujuan untuk mengelompokan data siswa baru sekolah menengah kejuruan dengan menggunakan algoritma K-Means. Agar tercapai tujuan tersebut, penulis akan melakukan pengujian dengan menggunakan data pada salah satu sekolah menengah kejuruan di medan yaitu SMK swasta medan area-1 tahun ajaran 2014/2015. Adapun pengelompokan tersebut menggunakan langkah langkah sebagai berikut: X1, Tanggungan anak diubah menjadi X2, dan hasil nilai tes diubah menjadi X3. TABEL III HASIL INISIALISASI DATA A. Sumber Data Dalam penelitian ini, sumber data diambil dari smk swasta medan area-1dimana data tersebut merupakan data siswa baru tahun ajaran 2014/2015. TABEL I DATA SISWA BARU B. Pengolahan Data Sebelum data siswa baru tersebut dikelompokan ke dalam jurusan yang sesuai kriteria. Data mentah tersebut akan ditransformasi dengan cara menginisialisasi data ke dalam bentuk angka yang dapat diolah dalam pengelompokan. C. Proses Data Setelah data diolah, maka langkah selanjutnya adalah data diproses untuk membentuk pengelompokan data ke dalam jurusan sesuai kriteria yang telah ditentukan. Data yang telah ditransformasi tersebut akan diproses dengan menggunakan sebuah algoritma pengelompokan (cluster) yaitu algoritma Kmeans. Berikut ini adalah sebuah flowchart dalam pengelompokan jurusan pada siswa baru sekolah menengah kejuruan. TABEL II RANGE PENGELOMPOKAN JURUSAN Berdasarkan range yang telah ditentukan pada pengelompokan jurusan, maka dapat disimpulkan bahwa pengelompokan data siswa baru ke dalam jurusan tanpa menggunakan metode. Pada data tersebut, tidak semua kriteria yang dapat menjadi patokan. Dalam hal ini, kriteria yang diinisialisasikan adalah penghasilan orang tua menjadi 102

TABEL IV TARGET K-MEANS DATA SAMPEL SISWA BARU SMK UNTUK C1 Setelah pengelompokan untuk kelompok pertama (cluster-1) telah terkelompok. Maka dapat dilakukan untuk pengelompokan data kelompok kedua (cluster2). TABEL V TARGET K-MEANS DATA SAMPEL SISWA BARU SMK UNTUK C2 Gbr. 2 Flowchart Pengclusteran K-Means Pada tahapan ini yaitu menentukan centroid Kmeans dari data siswa baru sekolah menengah kejuruan tahun ajaran 2014/2015. Dalam menentukan target K-means tersebut bertujuan untuk mendapatkan target data atau jarak kelompok yaitu titik pusat (centroid) kelompok awal untuk menghitung algoritma K-means. Pada tabel 4 merupakan hasil perhitungan K-means untuk data sampel siswa baru tahun ajaran 2014/2015 pada sekolah menengah kejuruan medan area-1 yang berdasarkan kriteria kriteria yang telah ditentukan untuk setiap kelompok (cluster). Dalam hal ini, pengelompokan yang terbentuk terjadi sebanyak 3 kelompok (cluster). Untuk perhitungan secara lengkap terdapat pada tabel tabel berikut: Data yang dikelompokan lainnya akan masuk pada kelompok 3 (cluster 3) yaitu hanya terdapat satu record data pada kelompok 3. TABEL VI TARGET K-MEANS DATA SAMPEL SISWA BARU SMK UNTUK C3 103

setelah semua data telah terkelompok, maka untuk menentukan titik pusat pada cluster dapat diambil nilai rata rata dari setiap cluster. Adapun tahapan proses algoritma K-means adalah sebagai berikut: 1. Menentukan nilai k dari jumlah cluster yang akan dibentuk. Pada tahapan ini cluster yang terbentuk sebanyak 3 cluster. 2. Menentukan titik pusat (centroid) awal dari setiap cluster. Dalam penelitian ini titik pusat awal ditentukan dengan menggunakan range dari jurusan. TABEL VIII PERHITUNGAN EUCLIDEAN ITERASI-1 TABEL VII CENTROID AWAL CLUSTER 3. Setelah titik pusat cluster ditentukan, maka tahap selanjutnya adalah menghitung jarak terdekat atau euclidean dengan menggunakan persamaan 3, yaitu menghitung jarak dari data siswa baru pertama ke titik pusat cluster. Setelah data dikelompokan pada iterasi pertama, maka langkah selanjutnya adalah membentuk titik pusat baru dengan menentukan nilai rata rata dari setiap data yang sudak memebentuk cluster untuk melanjutkan perhitungan jarak terdekat iterasi kedua dan akan menunjukkan cluster yang terbentuk selanjutnya dapat membentuk cluster yang konvergen. Dari hasil perhitungan di atas didapatkan bahwa jarak terdekat bernilai 1.48657. Selanjutnya perhitungan jarak data pertama untuk cluster kedua. Dari hasil perhitungan tersebut didapatkan jarak terdekat bernilai 1.72627. Kemudian perhitungan jarak data pertama untuk cluster ketiga. Dari hasil perhitungan tersebut didapatkan jarak terdekat bernilai 4.47214. Berdasarkan perhitungan euclidean untuk data pertama diperoleh jarak terdekat cluster adalah 1.48657 yang terkelompok pada cluster kesatu (C1) dan untuk TABEL IX CENTROID BARU PERTAMA Jika cluster belum konvergen, maka centroid akan dibangkitkan kembali dan menghitung kembali euclidean dari setiap data siswa. Langkah perhitungan jarak terdekat seperti langkah ketiga sebelumnya. Berikut perhirtungan jarak terdekat untuk data kedua. Dari hasil perhitungan tersebut didapatkan jarak terdekat bernilai 2.0518. Untuk perhitungan euclidean dapat dilihat secara lengkap pada tabel di bawah ini. 104

jurusan pada sekolah menengah menggunakan algoritma K-Means. TABEL X PERHITUNGAN EUCLIDEAN ITERASI-2 kejuruan IV. KESIMPULAN Dari hasil penelitian yang telah dilakukan, maka penulis dapat menarik beberapa kesimpulan, diantaranya sebagai berikut: 1. Pengujian yang dilakukan dalam penelitian ini, iterasi clustering pada data siswa baru SMK terjadi sebanyak 3 kali iterasi. 2. Berdasarkan hasil cluster dengan menerapkan beberapa kriteria dari calon siswa menggunakan K-Means dapat diambil pengelompokan dengan rata rata jurusan yang diambil adalah rekayasa perangkat lunak dan sedikit jumlah siswa yang tidak lulus. Bahkan ada beberapa jurusan yang tidak dibuka dikarenakan kriteria kriteria siswa tidak dapat lulus dalam jurusan tersebut. Pada perhitungan jarak terdekat di atas centroid baru yang dibangkitkan ternyata belum konvergen, sehingga iterasi harus dilanjutkan. Dalam penelitian ini, iterasi clustering data siswa terjadi sebanyak 3 kali iterasi. Pada pengelompokan data di atas didapat titik cluster baru dengan nilai sebagai berikut: TABEL XI CENTROID BARU KEDUA REFERENCE [1] [2] [3] [4] Y. Agusta, "K-Means Penerapan, Permasalahan dan Metode Terkait," Jurnal Sistem dan Informatika, vol. 3, pp. 47-60, Pebruari 2007. M. Kantardzic, J. Wiley and Sons, Data Mining: Concepts, Models, methods, and Algorithms, 2003 N. P. E. Merliana, Ernawati and A. J. Santoso, "Penentuan Jumlah Cluster Terbaik Pada Metode KMeans Clustering," SENDI_U. Mardiani, "Perbandingan Algoritma K-Means dan EM untuk Clusterisasi Nilai Mahasiswa Berdasarkan Asal Sekolah," Citec Journal, vol. 1, no. 4, pp. 316-325, Agustus-Oktober 2014. Centroid baru kedua yang dibangkitkan ternyata sudah konvergen, sehingga perhitungan jarak terdekat clustering berhenti pada iterasi-3. Adapun perhitungan secara lengkapnya sebagai berikut: TABEL XII PERHITUNGAN EUCLIDEAN ITERASI-3 Pada iterasi-3 tersebut, titik pusat dari setiap cluster sudah tidak berubah dan tidak ada lagi terdapat data yang berpindah dari satu cluster ke cluster yang lain. Maka dari itu, data siswa baru SMK telah terkelompok sesuai kriteria yang ditentukan untuk memasuki 105