PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

dokumen-dokumen yang mirip
PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

Klasifikasi Daun Dengan Centroid Linked Clustering Berdasarkan Fitur Bentuk Tepi Daun

OPTIMASI PUSAT KLASTER MENGGUNAKAN ALGORITMA FAST GENETIC KMEAN PADA DATA BERDISTRIBUSI NORMAL

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

WEB MINING UNTUK PENCARIAN DOKUMEN BAHASA INGGRIS MENGGUNAKAN HILL CLIMBING AUTOMATIC CLUSTER

Gambar 1 Peningkatan Jumlah Mahasiswa Prodi Teknik Informatika

PENGELOMPOKAN GAMBAR BERDASARKAN WARNA DAN BENTUK MENGGUNAKAN FGKA (FAST GENETIC KMEANS ALGORITHM) UNTUK PENCOCOKAN GAMBAR

ANALISA KINERJA AGENT PADA CALL CENTER PT.INDOSAT,Tbk DENGAN IMPLEMENTASI DATA MINING CLUSTERING METODE K-MEANS

RANCANG BANGUN PENCARIAN TUGAS AKHIR DENGAN METODE HILL CLIMBING AUTOMATIC CLUSTER TUGAS AKHIR

APLIKASI KOMPRESI CITRA BERBASIS ROUGH FUZZY SET

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

PENGELOMPOKAN GAMBAR BERDASARKAN FITUR WARNA DAN TEKSTUR DENGAN FGKA CLUSTERING (FAST GENETICS K-MEANS ALGORITHM) UNTUK PENCOCOKAN GAMBAR

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521

DATA MINING DAN WAREHOUSE A N D R I

CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH

KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH

PENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET

BAB 1 PENDAHULUAN Latar Belakang

IMPLEMENTASI METODE SINGLE LINKAGE UNTUK MENENTUKAN KINERJA AGENT PADA CALL CENTRE BERBASIS ASTERISK FOR JAVA

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMBAGIAN KELAS SISWA

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

CLUSTERING UNTUK DATA KOMPETENSI WIDYAISWARA MENGGUNAKAN ALGORITMA KMEANS

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

JURNAL KLASIFIKASI JENIS TANAMAN MANGGA BERDASARKAN TULANG DAUN MENGGUNAKAN METODE K-MEANS

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

PENGELOMPOKAN KOLEKSI BUKU PERPUSTAKAAN BERDASARKAN LAMA PEMINJAMAN BUKU MENGGUNAKAN K-MEANS

KLASTERISASI KOMPETENSI GURU MENGGUNAKAN HASIL PENILAIAN PORTOFOLIO SERTIFIKASI GURU DENGAN METODE DATA MINING

PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

KLASIFIKASI SISWA KELAS UNGGULAN MENGGUNAKAN FUZZY C-MEANS

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

Sistem Pengemudian Otomatis pada Kendaraan Berroda dengan Model Pembelajaran On-line Menggunakan NN

BAB I PENDAHULUAN 1.1. Latar Belakang

I. PENDAHULUAN. Contoh untuk proses segmentasi citra yang digunakan adalah klasterisasi (clustering).

BAB II LANDASAN TEORI

CLUSTERING PENGGUNAAN BANDWIDTH MENGGUNAKAN METODE K-MEANS ALGORITHM PADA PENERAPAN SINGLE SIGN ON (SSO) UNIVERSITAS SEBELAS MARET

BAB 2 TINJAUAN PUSTAKA

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS

Faktor-Faktor Yang Mem pengaruhi Waktu Penyusunan Tugas Akhir Mahasiswa S1 (Studi Kasus : Mahasiswa FMIPA Unsyiah)

Fuzzy C-means Clustering menggunakan Cluster Center Displacement

Pengenalan Pola. K-Means Clustering

(M.6) FUZZY C-MEANS CLUSTERING DENGAN ANALISIS ROBUST

SISTEM PENDUKUNG KEPUTUSAN PEMASARAN PRODUK MENGGUNAKAN DATA MINING DENGAN K-MEANS CLUSTERING

PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR

SISTEM TEMU KEMBALI INFORMASI PENENTUAN LOKASI DOKUMEN DENGAN CLUSTER DAN ALGORITMA CRAWLER

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 9 NO. 1 April 2016

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

STUDI KOMPARATIF PENERAPAN METODE HIERARCHICAL, K-MEANS DAN SELF ORGANIZING MAPS (SOM) CLUSTERING PADA BASIS DATA. Abstract

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

Fuzzy Pattern Recognition. Logika Fuzzy

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

Penerapan Metode Clustering Dengan K-Means Untuk Memetakan Potensi Tanaman Padi Di Kota Semarang

CLUSTERING LULUSAN MAHASISWA MATEMATIKA FMIPA UNTAN PONTIANAK MENGGUNAKAN ALGORITMA FUZZY C-MEANS

PERAMALAN CUACA KOTA SURABAYA TAHUN 2011 MENGUNAKAN METODE MOVING AVERAGE DAN KLASIFIKASI NAIVE BAYES

ANALISIS CLUSTER MENGGUNAKAN ALGORITMA K-MEANS

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

PENERAPAN DATA MINING DALAM PEMILIHAN PENERIMA BEASISWA BERPRESTASI DI POLITEKNIK DAN STMIK LPKIA DENGAN MENERAPKAN METODE K-MEANS CLUSTERING

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

BAB I PENDAHULUAN A. Latar Belakang

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

Pengelompokan Data Guru Untuk Pemilihan Calon Pengawas Satuan Pendidikan Menggunakan Metode Fuzzy C-Means dan Kohonen Self Organizing Maps

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak

Pengolahan Data. Algoritma C4.5 Menghitung entropi : Data Training (75%) = 220 data Data Testing (25%) = 73 data

MODUL 6 ANALISIS CLUSTER

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN

TEKNIK KLUSTERING UNTUK MENGANALISA PEMINATAN SEKOLAH PADA PENERIMAAN PESERTA DIDIK ONLINE TINGKAT SMA DI KOTA SEMARANG. Eko Nur Wahyudi ABSTRAK

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

BAB III ANALISA DAN PERANCANGAN SISTEM

PREDIKSI OUTLIER MENGGUNAKAN DATA TEPI CLUSTER UNTUK MENINGKATKAN KUALITAS PENGETAHUAN HASIL DATA MINING

BAB 1 PENDAHULUAN. Universitas Muhammadiyah Surakarta merupakan salah satu dari beberapa instansi

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN 1.1 Latar Belakang

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN

IMPLEMENTASI METODE SINGLE LINKAGE UNTUK MENENTUKAN KINERJA AGENT PADA CALL CENTRE BERBASIS ASTERISK FOR JAVA

APLIKASI IDENTIFIKASI ISYARAT TANGAN SEBAGAI PENGOPERASIAN E-KIOSK

BAB I PENDAHULUAN. 1.1 Latar Belakang

SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING

Abstrak. Kata Kunci : Citra, kerahasiaan, enkripsi, piksel citra

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS

Clustering. Virginia Postrel

BAB I PENDAHULUAN 1.1. Latar Belakang

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA

ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

PEMETAAN SEBARAN MUTU PENDIDIKAN DASAR MENGGUNAKAN METODE SELF ORGANIZING MAPS

CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN

BAB I PENDAHULUAN Latar Belakang

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

Transkripsi:

PENGGUNAAN PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI Entin Martiana S.Kom,M.Kom, Nur Rosyid Mubtada i S. Kom, Edi Purnomo Jurusan Teknik Informatika Politeknik Elektronika Negeri Surabaya Institut Teknologi Sepuluh Nopember Kampus ITS Keputih Sukolilo Surabaya 60111, Indonesia Tel:+62315947280 Fax:+62315946114 Email: entin@eepisits.edu, rosyid@eepisits.edu, edi_ephor@yahoo.co.id Abstrak Tugas Akhir merupakan salah satu kewajiban mahasiswa, khususnya di PENSITS, yang harus dikerjakan sebagai syarat kelulusan. Namun tidak jarang mahasiswa mengalami kesulitan dalam penyelesaian tugas akhir tersebut. Salah satu penyebabnya adalah faktor kemampuan mahasiswa dalam bidang Tugas Akhir yang dikerjakannya. Penelitian ini membahas penggunaan metode clustering dan inner product untuk menentukan bidang Tugas Akhir mahasiswa Teknik Informatika PENSITS berdasarkan nilai yang didapat mulai dari semester pertama sampai dengan semester sebeum penentuan judul TA. Tiap bidang disusun oleh mata kuliahmata kuliah tertentu. Nilai mata kuliahmata kuliah tersebutlah yang digunakan sebagai atribut data dalam sistem ini. Metode clustering yang digunakan adalah Hierarchical, Hierarchical, dan KMeans. Metodemetode clustering tersebut digunakan untuk melakukan training data sehingga terbentuk clustercluster. Clustercluster yang terbentuk kemudian dilabelkan dengan Inner Product. Inner Product dilakukan dengan mengalikan centroid tiap cluster dengan nilai minimum (dari data training) untuk atribut centroid (mata kuliah) yang tidak mempengaruhi bidang TA dan mengalikan dengan nilai maximum (dari data training) untuk atribut centroid (mata kuliah) yang mempengaruhi bidang TA yang sedang diproses. Hasil Inner Product yang paling besar menunjukkan bahwa cluster tersebut memiliki label bidang TA yang sedang diproses. Pengujian dilakukan dengan data baru (data uji) yang memiliki atribut (mata kuliah) yang sama dengan data training. Data uji tersebut dihitung jaraknya menggunakan Euclidean Distance dengan masingmasing cluster yang telah berlabel (bidang TA). Jarak yang terdekat menujukkan data tersebut merupakan anggota cluster yang dimaksud yang berarti data baru tersebut termasuk ke bidang yang diwakili cluster yang berjarak paling dekat tersebut. Hasil percobaan menunjukkan bahwa metode centroid linkage memiliki nilai variance (Vw/Vb) paling kecil yang menandakan bahwa metode tersebut menghasilkan cluster paling baik dibanding dengan metode single linkage dan KMeans pada kasus ini. Kata kunci : Hierarchical, Clustering,,,, KMeans, variance, Euclidean Distance, Inner Product, Bidang Tugas Akhir. 1. PENDAHULUAN Sekarang ini sudah terbukti peran mahasiswa PENSITS dalam kemajuan teknologi bangsa sangatlah besar. Banyak mahasiswa PENSITS yang telah berhasil menemukan dan membuat teknologi tepat guna yang dapat langsung dipakai di masyarakat maupun di lingkungan yang lain seperti industri, akademis, dan lainlain. Banyak dari mereka yang membuat teknologi tepat guna tersebut ketika masih menyandang status sebagai mahasiswa, terutama mahasiswa semester akhir. Mereka yang sudah berada pada semester akhir membuat Tugas Akhir baik yang berupa analisa maupun aplikasi yang sangat berguna. Namun sayang sekali masih banyak mahasiswa yang mengalami perpanjangan masa studi mereka karena kesulitan dalam tugas akhirnya. Ada beberapa hal yang dapat membuat mahasiswa merasa sulit dalam pengerjaan Tugas Akhir tersebut, diantaranya adalah faktor kemampuan dan minat mahasiswa. Tidak jarang mahasiswa PENSITS merasa kebingungan dengan bidang Tugas Akhir yang akan mereka ambil karena merasa ragu untuk mengambil suatu bidang yang ada dengan alasan merasa tidak mampu. Oleh karena itulah perlu dibuat suatu aplikasi yang dapat membantu para mahasiswa PENSITS, khusunya mahasiswa jurusan Teknik Informatika untuk menentukan bidang tugas 1

akhir yang sebaiknya mereka ambil berdasarkan nilainilai mata kuliah yang mereka miliki. Aplikasi yang dibuat dalam penelitian ini menggunakan metode clustering. Hal ini dikarenakan metode clustering telah terbukti dapat digunakan untuk menyelesaikan persoalah seperti ini. Seperti yang pernah dilakukan oleh Mulyoto jurusan Matematika ITS dalam thesisnya yang telah menggunakan metode clustering Fuzzy CMeans dan JST KohonenSOM untuk membuat aplikasi penjurusan siswa SMA. Permasalahan yang dihadapi dalam menyelesaikan penelitian ini adalah: 1. Bagaimana menentukan nilainilai mahasiswa Teknik Informatika yang akan digunakan untuk data input. 2. Bagaimana melakukan clustering terhadap nilainilai mahasiswa Teknik Informatika. 3. Bagaimana menentukan label dari cluster yang didapat. 4. Bagaimana menentukan minat bidang tugas akhir yang sebaiknya diambil. 5. Bagaimanakah hasil dari penentuan bidang untuk masingmasing metode clustering. 2. TEORI PENUNJANG 2. 1. CLUSTERING Clustering merupakan proses mengelompokkan suatu set obyek menjadi kelaskelas yang terdiri dari obyekobyek yang sama. Dengan kata lain clustering adalah proses mengelompokkan obyekobyek berdasarkan kesamaan karakteristik diantara obyekobyek tersebut. 2.1. 1. Pada algoritma single linkage, dilakukan pengukuran dan pencarian jarak dengan yang terdekat (minimum distance). gambar 2: Ilustrasi 2.1. 3. Algoritma KMeans adalah metode clustering berbasis jarak yang membagi data ke dalam sejumlah cluster dan algoritma ini hanya bekerja pada atribut numerik. Algoritma ini pada awalnya mengambil sebagian dari banyaknya komponen dari populasi yang akan dijadikan sebagai pusat cluster awal. Pada step ini pusat cluster dipilih secara acak dari sekumpulan populasi data. Berikutnya KMeans menguji masingmasing komponen di dalam populasi data dan menandai komponen tersebut ke salah satu pusat. Cluster yang telah didefinisikan tergantung dari jarak minimum antar komponen dengan tiaptiap pusat cluster. Posisi pusat cluster ke dalam tiaptiap pusat cluster dan terakhir akan terbentuk pusat cluster baru. Gambar 3: Ilustrasi KMeans 2. 2. EUCLIDEAN DISTANCE Euclidean distance merupakan salah satu metode penghitungan jarak yang paling sederhana. Jika terdapat n buah variabel maka perhitungan jarak menggunakan metode Euclidean dinyatakan sebagai berikut: Gambar 1: Ilustrasi 2.1. 2. adalah proses pengclusteran yang didasarkan pada jarak antar centroidnya.metode ini bagus untuk memperkecil variance within cluster karena melibatkan centroid pada saat penggabungan antar cluster.metode ini juga baik untuk data yang mengandung outlier. dimana x dan y merupakan dua objek yang dihitung jaraknya, x 1, x 2,..., x n dan y 1, y 2,..., y n merupakan atributatribut sebanyak n buah dari objek x dan y. 2. 3. INNER PRODUCT Inner product yang merupakan istilah lain dari dot product atau dapat juga disebut sebagai scalar product adalah perkalian antara dua vektor yang dapat berupa vektor baris atau vektor kolom, sehingga hasilnya berupa scalar. 2

Rumus dasar inner product adalah sebagai berikut: dengan clustercluster yang berlabel. Sama seperti prose training, hasil inner product yang paling besar menunjukkan data test tersebut memasuki cluster (bidang) yang telah diproses. Contoh perhitungan dari persamaan di atas dapat diliat pada contoh berikut: Penghitungan Jarak Cluster Berlabel HASIL PENGUJIAN Gambar 6: Proses Testing 3. PERENCANAAN Dalam sistem ini terdapat tahapan standar, yaitu: input, proses, dan output. Secara garis besar dapat digambarkan dengan blok diagram sebagai berikut: Data Data Test Proses Proses Pengujian HASIL PENGUJIAN Gambar 4: Diagram Sistem Hasil Input yang dimasukkan pada sistem ini adalah nilainilai mahasiswa selama kuliah sebelum pengambilan judul Tugas Akhir. Tahapan proses terdapat dua macam proses yaitu proses training dan proses testing (pengujian). Data Clustering Inner Product Cluster Berlabel Gambar 5: Proses Proses training dilakukan dengan mencluster data training dengan metode clustering centroid linkage hierarchical, single linkage hierarchical, dan kmeans. Cluster yang terbentuk kemudian dilabelkan dengan nama bidang tugas akhir yang ada. Cara pelabelan yang digunakan adalah dengan inner product. Hasil inner product terbesar antara suatu cluster dengan suatu bidang menunjukkan bahwa label cluster tersebut adalah nama bidang yang diinner productkan. Proses testing dilakukan dengan menggunakan inner product antara data test Output yang dihasilkan dari sistem ini adalah bidang tugas akhir yang sesuai dengan data (mahasiswa) yang dijadikan sebagai data test. 4. UJI COBA Uji coba dilakukan denga menggunakan data nilai mahasiswa D3 angkatan 2005, nilai mahasiswa D4 angkatan 2005, dan nilai mahasiswa D3 angkatan 2006. Langkah pertama uji coba adalah melakukan proses training. Dari proses training tersebut diperoleh hasil (variance) sebagai berikut. Clustercluster Tabel 1: Hasil Data Metode Variance(Vw/Vb) 4.20175804379966E D3 angkatan 2005 3.991511126649698E KMeans 0.013409520461774616 6.499494834298336E D4 angkatan 2005 5.265828882966592E KMeans 0.07738628536451325 5.0296972276279414E D3 angkatan 2006 3.720404007614485E KMeans 0.02686628144403626 Dari hasil training didapatkan nilai variance yang paling optimal adalah pada metode centroid linkage. Sehingga metode centroid linkage merupakan metode yang menghasilkan cluster paling ideal pada kasus ini. Setelah dilakukan proses training, proses selanjutnya adalah pengujian. Proses pengujian dilakukan untuk mengetahui bidang yang seharusnya diambil oleh data uji berdasarkan training yang dilakukan. Berikut hasil pengujian yang telah dilakukan. Data uji: nilai mahasiswa D3 angkatan 2005 dengan NRP 7405030041 3

Tabel 2: Hasil Uji Coba 1 7405030 041 KOMPUTASIONA L KOMPUTASIONA L BASIS DA N INFOR MASI _K OMPUTASIONAL 22.585166942124 278% 21.531039962562 158% 20.634668204250 35%.303084878206 125% 16.946040012857 09% 22.564046051659 123% 21.486314757117 935% 20.890696923369 347%.216741737486 07% 16.842200530367 528% 43.085282697122 52% 30.439229598906 074% 26.475487703971 4% Data uji: nilai mahasiswa D4 angkatan 2005 dengan NRP 7405040046 Tabel 3: Hasil Uji Coba 2 7405040 046 21.28880% 20.86355% 19.50891% 19.39374%.94501% 21.27241% 20.92956% 20.84420% 19.48323% 17.47060% 21.25102% 20.74937% 20.10002% 19.40424%.49535% Data uji: nilai mahasiswa D3 angkatan 2006 dengan NRP 7406030071 Tabel 4: Hasil Uji Coba 3 7406030071 21.34397% 20.07383% 19.85669% 19.71591% 19.00960% 21.33103% 20.09147% 19.89190% 19.69720%.98839% 36.64076% 31.82588% 31.53336% Dari percobaan di atas, masingmasing metode menghasilkan output yang berbeda untuk data uji yang sama. Dalam artian setiap metode akan menghasilkan nilai perentase jarak yang berbeda untuk masingmasing data. Hal ini dipengaruhi oleh letak centroid cluster (dalam hal ini bidang TA) hasil training yang berbedabeda. Untuk metode hierarchical, centroid cluster didapat dari ratarata data. didapat dengan hanya menggunakan satu kali percobaan. Karena metode ini memiliki sifat iteratif pada waktu pembentukan cluster. Sehingga berapapun jumlah percobaannya jika menggunakan data yang sama akan menghasilkan hasil yang sama juga. Namun untuk mendapatkan centroid di metode k means diperlukan beberapa iterasi sampai terbentuk centroid akhir. Setiap metode memiliki perbedaan variance optimal yang berbeda. Variance pada metode hierarchical akan selalu tetap. Metode ini cenderung memiliki variance yang lebih kecil dibanding dengan metode KMeans pada percobaanpercobaan yang dilakukan. Sedangkan variance pada cluster KMeans dapat berubahubah. Hal ini dikarenakan pembangkitan centroid awal yang random membuat cluster KMeans memiliki hasil cluster yang berbeda untuk setiap proses pengclusteran. Hasil cluster pada percobaan menunjukkan data mengumpul pada suatu cluster. Hal ini dapat dikarenakan metode clustering yang digunakan tidak dapat mengenali perbedaan atribut untuk menghitung 4

suatu jarak. Jadi jika suatu jarak minimal didapat dari penghitungan jarak dari data atribut suatu bidang memiliki jarak yang sama dekatnya dengan jarak minimal yang didapat dari perhitungan data dari atribut bidang yang lain, maka kedua data akan dijadikan satu cluster. Padahal seharusnya kedua data tersebut berada dalam cluster yang berbeda. 5. KESIMPULAN DAN SARAN 5.1 KESIMPULAN Setelah dilakukan pengujian dan analisa program, maka dapat diperoleh kesimpulan sebagai berikut : Pada kasus ini metode clustering yang dipakai memiliki hasil yang berbeda. Namun jika dilihat dari nilai variance yang didapat, metode centroid likage hierarchical lah yang memiliki nilai variance yang paling optimal. Program yang dibuat berhasil menentukan data uji untuk memilih bidang apa seharusnya dia ambil. Jika dilihat pada hasil training yang dilakukan, penyebaran data pada masingmasing cluster memiliki kemiripan. 5.2 SARAN Dari beberapa kesimpulan yang telah diambil, maka dapat dikemukakan saransaran yang akan sangat membantu untuk pengembangan aplikasi ini selanjutnya. Untuk mendapatkan keputusan dengan pertimbangan yang beragam sebaiknya selain menggunakan metodemetode tersebut digunakan juga metode yang lain. Untuk mendapatkan hasil yang optimal pada metode hierarchical diperlukan suatu metode untuk mengenali atributatribut yang dihitung jaraknya. Sehingga data yang diproses tidak mengumpul pada cluster tertentu saja. [5]. Barakbah A.R., Clustering, In Workshop Data Mining 2006, Jurusan Teknologi Informasi Politeknik Elektronika Negeri Surabaya, ITS. [6]. Barakbah A.R., Cluster Analysis, Jurusan Teknologi Informasi Politeknik Elektronika Negeri Surabaya, ITS, 2006. [7]. Huang, Z., 2005, A Fast Clustering Algorithm to Cluster Very Large Categorical Data Sets in Data Mining. CSIRO Mathematical and Information Sciences Australia. [8]. Hasniawati, Helmi, 2007, Image Clustering Berdasarkan Warna Untuk Identifikasi Buah Dengan Metode Valley Tracing, Jurusan Teknologi Informasi Politeknik Elektronika Negeri Surabaya,ITS. [9]. Wirya Wardhana, Gede, 2007, Image Clustering Berdasarkan Warna Untuk Identifikasi Jenis Buah Dengan Metode Hill Climbing. Jurusan Teknologi Informasi Politeknik Elektronika Negeri Surabaya,ITS. DAFTAR PUSTAKA [1]. Mulyoto.2007.Metode Clustering JST KohonenSOM dan Fuzzy C Means: Aplikasinya pada Penjurusan Siswa SMA. [2]. Fadli M. Qoyyim. 2007. Pemilihan warna cat sesuai kepribadian dengan inner product. [3]. Apostol, Tom.M.1967.CALCULUS Volume 1 Second Edition. New York: John Wiley & Sons, Inc. [4]. Anderberg, M. R. 1973.Cluster analysis for applications. New York: Academic Press. 5