Analisis Perbandingan Metode K-Means Dengan Improved Semi- Supervised K-Means Pada Data Indeks Pembangunan Manusia (IPM)
|
|
- Inge Hermawan
- 6 tahun lalu
- Tontonan:
Transkripsi
1 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Vol. 1, No. 9, Juni 2017, hlm Analisis Perbandingan Metode K-Means Dengan Improved Semi- Supervised K-Means Pada Data Indeks Pembangunan Manusia (IPM) Gusti Ngurah Wisnu Paramartha 1, Dian Eka Ratnawati 2, Agus Wahyu Widodo 3 Program Studi Teknik Informatika, 1 wisnuparamartha9@gmail.com, 2 dian_ilkom@ub.ac.id, 3 a_wahyu_w@ub.ac.id Abstrak Saat ini dengan jumlah informasi yang semakin besar, konsep data mining semakin dikenal sebagai sebuah tools yang penting dalam manajemen informasi. Mengacu pada konsep data mining, salah satu teknik yang terdapat dalam konsep ini adalah teknik clustering. Salah satu metode clustering data yang paling terkenal adalah k-means. Namun pada penerapannya metode k-means memiliki beberapa masalah seperti penentuan nilai K klaster dan penentuan pusat klaster awal yang dilakukan secara random yang membuat proses tidak konsisten dan hasil klaster menjadi buruk. Oleh karena itu terdapat sebuah metode untuk mengatasi masalah tersebut yaitu improved semi-supervised k-means clustering. Dengan metode improved semi-supervised k-means clustering yang menggabungkan konsep supervised dan unsupervised clustering, pengguna hanya perlu melabeli sedikit data yang belum berlabel, kemudian data berlabel tersebut dipakai untuk mencari nilai pusat klaster awal dan nilai K yang optimal yang akan mengoptimakan proses dan hasil. Pada bagian pengimplementasian, penelitian ini membandingkan dua algoritma yaitu k-means tradisional dan semi-supervised k-means untuk klastering data indeks pembangunan manusia (IPM). Data IPM dipilih karena memiliki karakteristik yang tepat untuk klastering seperti jumlah data yang banyak dan data yang terbagi menjadi beberapa klaster. Pengujian metode improved semi-supervised k-means memeberikan rata-rata akurasi sebesar 90.3%, lebih baik dari metode k-means yang memberikan nilai akurasi 73.7%. Pengujian kedua, metode improved semisupervised k-means menghasilkan nilai rata-rata waktu untuk satu kali konvergen detik, lebih baik dari k-means dengan rata-rata detik. Pengujian ketiga, metode improved semi-supervised k-means menghasilkan rata-rata jumlah iterasi untuk satu kali konvergen yang lebih efisien dari algoritma k-means dengan jumlah iterasi 7.11 berbanding Terakhir pada pengujian kualitas klaster dengan metode silhouette coefficient, metode improved semi-supervised k-means memberikan rata-rata nilai , lebih baik dari k-means tradisional dengan rata-rata nilai Kata kunci: indeks pembangunan manusia, ipm, data mining, klastering, k-means, semi-supervised k-means. Abstract At this time with the growing amount of information, the concept of data mining getting known as an important tool in the management information. Refers to the concept of data mining, the most popular concept in data mining is a clustering technique. One well known clustering method is k-means traditional. But in its application, k-means method has some problems such as determining the value of K cluster and determining the initial cluster centers were done randomly making process was inconsistent and the results of the cluster becomes worse. Therefore, there is a method to overcome these problems are improved semi-supervised k-means clustering. With improved semi-supervised method that combines the supervised and unsupervised method, users only need to label a bit of data that has not been labeled, then the labeled data is used to find the optimal value of initial cluster center and K cluster that will optimizes the process and result of clustering process. On implementation, this research combine k-means algorithm and improved semi-supervised k-means to clustering human development index (HDI) data. HDI data chosen because it has the right characteristics for clustering such amounts of data and the data is divided into several clusters. On the testing improved semisupervised k-means method giving out the average accuracy of 90.3%, better than k-means clustering that giving 73.7% accuracy. In the second testing, improved semi-supervised k-means method produces an average time for one convergent seconds, better than k-means with seconds. The third testing, improved semi-supervised k-means generates an average number of iterations for one Fakultas Ilmu Komputer Universitas Brawijaya 813
2 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 814 convergent more efficient than k-means with the number of iterations of 7.11 compared Last, on the cluster quality testing using silhouette coefficient, improved semi-supervised k-means method giving average value , better than the traditional k-means with an average value of Keywords: human development index, hdi, data mining, clustering, k-means, semi-supervised k-means. 1. PENDAHULUAN Dengan jumlah informasi yang semakin besar, pada saat ini konsep data mining semakin dikenal sebagai sebuah tools yang penting dalam manajemen informasi. Menurut (Santosa, 2007), data mining disebut sebagai knowledge discovery in database (KDD), yaitu kegiatan yang meliputi pengumpulan dan pemakaian data historis yang bertujuan menemukan keteaturan dan pola hubungan pada data set yang memiliki ukutan besar. Output dari data mining ini dapat digunakan untuk pengambilan keputusan di masa yang akan datang. Mengacu pada konsep data mining, salah satu teknik yang terdapat dalam konsep tersebut adalah teknik clustering. Clustering adalah sebuah teknik yang dipakai untuk memasukan data ke dalam sebuah kelompok atau grup yang memiliki kedekatan khusus pada masing-masing objek. Secara umum konsep clustering ini mengelompokan sekumpulan objek ke dalam beberapa grup dilakukan tanpa pengetahuan yang mendalam tentang group tersebut. Tujuan utama dari clustering adalah mengelompokan sebuah set data ke dalam cluster yang memiliki karakteristik yang hapir sama dan antar cluster mempunyai karakteristik yang berbeda-beda. Salah satu teknik dalam clustering adalah teknik k-means. K-means adalah sebuah metode pengklasteran memakai konsep partitioning yang nantinya dalam prosesnya algoritma akan memisahkan data-data dalam beberapa cluster/kelompok berbeda. Dengan partitioning yang dilakukan secara iteratif, k-means dapat menurunkan rata-rata nillai dari jarak/distance data ke masing-masing klasternya (MacQueen, 1967). Sifat dari k-means ini sendiri adalah metode yang menerapkan klastering tanpa adanya arahan (unsupervised). Hal tersebut didasarkan pada adanya dataset yang data itemnya sejak awal mempunyai label kelas dan dataset yang data itemnya tidak mempunyai label kelas (Agusta, 2007). Menurut (Hanmin, 2016) dalam k-means tradisional terdapat banyak masalah seperti inisial K klaster dan pusat klaster awal yang dilakukan secara random terkadang membuat proses tidak konsisten sehingga terkadang membutuhkan waktu yang cukup lama dalam melakukan iterasi untuk menemukan output klaster akhir. Masalah lain yang timbul pada k- means clustering tradisional adalah proses yang tidak bisa dipastikan dan sulit diestimasi. Dalam hal ini pengguna tidak dapat menentukan parameter yang tepat untuk menghasilkan output yang maksimal. Dengan adanya ketidakpastian tersebut, menyebabkan data hasil pengelompokan dan akurasi menjadi buruk. Selain itu karena inisialisasi pusat klaster yang tidak konsisten terkadang menyebabkan masalah local optimum pada proses k-means tradisional. Dengan masalah yang ditemui pada klastering data set menggunakan metode k- means tradisional, terdapat sebuah pendekatan yang diharapkan mampu mengatasi permasalahan tersbut yaitu dengan metode semisupervised k-means clustering (Agusta, 2007). Sesuai pada penelitian yang dilakukan oleh (Hanmin, 2016) yang membahas tentang penggunaan metode semi-supervised k-means clustering sebagai solusi permasalahan yang ada pada k-means tradisional menyebutkan bahwa metode semi-supervised k-means clustering adalah metode yang menggabungkan pendekatan supervised dan unsupervised dalam mengelompokan data set yang memiliki label kelas ataupun tidak memiliki label kelas ke dalam beberapa klaster. Untuk permasalahan ini kita hanya perlu memberikan label sebagian kecil objek dari set untuk mengklaster banyak objek yang sebelumya tidak berlabel. Sedikit objek data set yang berlabel tersebut digunakan untuk menentukan nilai K klaster dan pusat klaster awal. Dengan nilai K klaster dan pusat klaster awal yang lebih rasional maka akan memberikan hasil cluster dengan akurasi yang lebih baik dan meningkatkan efisiensi dari komputasi. Hasil dari penelitian yang dilakukan oleh (Hanmin, 2016) menghasilkan bahwa metode semi-supervised k-means clustering menghasilkan pusat klaster yang lebih baik yang lebih baik dari metode k-means tradisional. Pada penelitian lain yang dilakukan oleh (Zhenpeng, et al., 2014) yang melakukan perbandingan antara metode k-means
3 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 815 tradisional, seed-k-means, dan improved semisupervised k-means. Pada penelitian ini memberikan hasil akurasi dari improved semisupervised k-means lebih baik 17% sampai 18% dari metode k-means tradisional dan seed-kmeans. Serta jumlah iterasi berkurang sebanyak 1/3 dari k-means tradisional dan 1/2 dari seed-kmeans. Dalam penelitian dengan judul Analisis Perbandingan Metode K-means dengan improved semi-supervised K-means pada Data Indeks Pembangunan Manusia (IPM) ini lebih menekankan pada penerapan metode semisupervised k-means clustering dalam mengatasi permasalahan yang ada pada metode k-means tradisional dengan metode semi-supervised k- means clustering dengan mengukur tingkat akurasi yang dihasilkan dan membandingkan tingkat akurasi dari masing-masing metode menggunakan metode silhouette coefficient. Dengan adanya penelitian ini diharapkan akan mempermudah dalam klastering data pada indeks pengembangan manusia dan mengatasi masalah pada algoritma k-means tradisional. Untuk mengetahui perbandingan dari kedua algoritma akan dilakukan pengujian pada tingkat akurasi, waktu komputasi dan kualitas klaster dengan silhouette coefficient pada masingmasing algoritma. Sehingga dengan mengetahui perbedaan dari algoritma peneliti dapat mengetahui algoritma mana yang sesuai untuk diterapkan pada domain masalah indeks pengembangan manusia. 2. DASAR TEORI 2.1 K-means clustering K-means clustering adalah metode klastering yang dilakukan secara partisi (partitional clustering). Pengelompokan menggunakan k-means bermaksud untuk mempartisi n objek ke dalam k kelompok dimana setiap objek dimasukan ke dalam mean k terdekat. Metode ini menghasilkan kelompok k dengan perbedaan yang memungkinkan. Jumlah terbaik dari kelompok k didasari pada jarak yang disebut apriori dan harus dihitung dari data yang ada dan sesuai dengan kebutuhan. (Taft, 2005). Algoritma k-means adalah algoritma yang memerlukan parameter masukan sebanyak k klaster, selanjutnya membagi sekumpulan n data obyek ke k klaster sampai tingkat kemiripan dari antar anggota yang ada dalam satu klaster menjaddi tinggi tinggi dan kemiripan dengan anggota klaster lain menjadi sangat rendah (Agusta, 2007). Kemiripan data pada suatu klaster diukur sesuai dengan kedekatan obyek terhadap nilai rata-rata pada klaster atau disebut sebagai centroid, pusat massa, atau pusat klaster. 2.2 Semi-Supervised K-means Clustering Menurut (Hanmin,2016), metode semisupervided k-means adalah metode yang diciptakan untuk mengatasi masalah pada algoritma k-means tradisional dalam klasterisasi kelompok set data yang memiliki jumlah label data yang kecil. Sebelumnya k-means tradisional ini sendiri hanya dirancang sebagai klastering data unsupervised. Dengan itu muncul metode semi supervised k-means clustering untuk mengatasi permasalahan tersebut dengan hanya perlu memberikan label pada sedikit objek pada dataset yang besar. Pelabelan sedikit objek tersebut berfungsi untuk mencari nilai K dan intial cluster center yang optimal. Dengan nilai K dan pusat klaster awal yang optimal maka akan meningkatkan akurasi dari hasil clustering dan mengefisienkan waktu dan proses komputasi. Sesuai dengan karakteristik data yang merupakan data berjenis klastering, metode semi-supervised k-means clustering ini dianggap cocok dalam mengatasi permasalahan pada algoritma k-means traditional dengan memanfaatkan data eksternal yang berlabel untuk mencari nilai K dan pusat klaster awal yang optimal. Dalam hal ini kita hanya perlu melabeli sedikit data yang sudah ada sebelumnya. Sehingga dengan penelitian ini diharapkan metode semi-supervised k-means clustering dapat dijadikan perbandingan apakah metode tersebut layak digunakan atau tidak pada domain permasalahan indeks pembangunan manusia. MULAI K L = Jumlah label yang berbeda (X L); Pilih objek K L dengan label yang berbeda dari X L If(K L N { K = K L; do{ for each xi X if (xi X L) Menetapkan xi ke klaster yang pusat klaster awalnya memiliki label sama; else
4 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 816 Menetapkan xi ke cluster terdekat; update clusters; }sampai convergen; } else{ for (k= K L+1; k N;k++ ){ pilih objek terjauh dari KL objek baru sebagai inisialisasi titik tengah klaster; do{ for each xi X if (xi X L) Menetapkan xi ke klaster yang pusat klaster awalnya memiliki label sama; else Menetapkan xi ke cluster terdekat; update clusters; }sampai converges; k k i=1 J k = d(ci, xi) i=1 } Pilih minimum j k dan K=k; } Output K klaster dan K inisial pusat klaster; END Sama seperti fungsi k-means tradisional, improved semi supervised k-means clustering memerlukan data masukan berupa data set X={x1, x2,,xn} yang mana N adalah jumlah dari data objek pada data set X. Selanjutnya ada variabel XL = {xl1, xl2,,xlabel1} yang merupakan semua objek data yang berlabel dari data set X. KL adalah jumlah dari label XL yang berbeda. Jika p clustering telah ditentukan sebelumnya, ide utama dari penentuan pusat klastering selanjutnya adalah dengan memilih data objek yang terjauh dari p pusat klaster. Untuk menentukan nilai K yang optimal, perlu untuk menentukan rentang pencarian terlebih dahulu (Hanmin, 2016). Pada penelitian yang dilakukan (Hanmin, 2016) mengenai algoritma improved semi supervised k-means clustering, terdapat dua kondisi untuk data set. Kondisi yang pertama adalah dataset dengan jumlah labeled data yang banyak. Sedangkan kondisi yang kedua adalah dengan jumlah labeled data yang sedikit. 2.3 Silhouette Coefficient Metode silhouette coefficient pertama kali dikembangkan oleh (Rousseeuw, 1987) yang mana metode silhouette coefficient merujuk pada validasi dan penafsiran set data. Metode silhouette coefficient berfungsi untuk mengukur kualitas pada sebuah klaster. Fungsi lain dari silhouette coefficient adalah untuk mengindikasikan derajat kepemilikan setiap objek yang ada di dalam klaster. Metode silhouette coefficient menggabungkan konsep cohesion dan separation sebagai validasi dari hasil klastering. Untuk menghitung nilai silhoutte coefisient diperlukan jarak antar dokumen dengan menggunakan rumus euclidean distance. Setelah itu tahapan untuk menghitung nilai silhoutte coeffisien adalah sebagai berikut (Rousseeuw, 1987): 1. Pada setiap objek data i, hitung nilai rata-rata jarak objek data i dengan seluruh objek data yang berada pada satu klaster yang sama. Nilai rata-rata pada bagian ini dapat didefinisikan dengan a(i). Dalam hal ini rumus dari mencari nilai a(i) adalah: a (i) = D(i,j) A 1 (2.1) 2. Untuk setiap objek data i, hitung nilai ratarata jarak objek data i dengan semua objek yang ada di klaster lainnya. Dari semua jarak rata-rata yang dihasilkan tersebut, akan diambil rata-rata jarak yang memiliki nilai terkecil. Nilai terkecil ini disebut bi. Rumus dalam mencari nilai dari bi adalah sebagai berikut: b (i) = min(d(i,c)) (2.2) 3. Setelah itu maka untuk objek i memiliki nilai silhoutte coefisien: Si = (bi-ai)/max (ai,b) (2.3) Hasil perhitungan nilai silhoutte coeffisien bervariasi dengan rentang -1 sampai 1. Nilai clustering dapat dikatakan baik jikai nilai silhoutte coeffisien bernilai positif yaitu (ai < bi) dan ai mendekati 0. Dengan hal tersebut akan menghasilkan nilai silhoutte coeffisien yang maksimal adalah 1 ketika ai = 0. Jika si = 1 menandakan bahwa klaster i telah berada pada klaster yang tepat. Namun jika nilai si adalah 0 maka objek i berada di antara dua cluste, dengan itu dapat dikatakan bahwa objek tersebut memiliki struktur yang tidak jelas. Namun jika nilai si = -1 berarti struktur dari klaster memiliki nilai overlapping, dengan itu objek i lebih tepat dimasukan ke dalam klaster lain. Pada teorinya, nilai rata-rata silhoutte coeffisien dari tiap data objek dalam suatu klaster adalah suatu ukuran yang menunjukan seberapa ketat data
5 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 817 dikelompokan dalam klaster tersebut. Berikut adalah nilai silhoutte berdasarkan (Rousseeuw, 1987): <SC<=1 Struktur yang kuat (strong structure) < SC <=0.7 Struktur yang standar (medium structure) < SC <= 0.5 Struktur yang lemah (weak structure) 4. SC <=0.25 Tidak memiliki struktur (no structure) 2.4 IPM (Indeks Pembangunan Manusia) Menurut (BPS, 2015), IPM (Indeks Pembangunan Manusia) adalah sebuah indikator penting dalam mengukur kemajuan pembangunan suatu bangsa di masing-masing negara atau bahkan tiap-tiap daerah di suatu negara. IPM menjelaskan bagaimana penduduk dapat mengakses hasil pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan, dan sebagainya. IPM diperkenalkan oleh UNDP pada tahun 1990 dan dipublikasikan secara berkala dalam laporan tahunan Human Development Report (HDR). Dalam konsep IPM yang terbaru dibentuk oleh 3 (tiga) dimensi dasar: 1. Umur panjang hidup sehat (a long and healthy life) 2. Pengetahuan (knowledge) 3. Standar hidup layak (decent standard of living) IPM memiliki berbagai manfaat antara lain IPM merupakan indikator penting untuk mengukur keberhasilan dalam upaya membangun kualitas hidup manusia (masyarakat/penduduk). Manfaat lain dari IPM adalah dapat menentukan peringkat atau level pembangunan suatu wilayah/negara. Bagi Indonesia sendiri, IPM merupakan data strategis karena selain sebagai ukuran kinerja Pemerintah, IPM juga digunakan sebagai salah satu alokator penentuan Dana Alokasi Umum (DAU) (BPS, 2015). Beberapa feature yang digunakan dalam penelitian ini dibagi menjadi 4 bagian. Bagian pertama yaitu angka harapan hidup yang merupakan representasi dari dimensi kesehatan, rata-rata lama sekolah dan angka harapan lama sekolah yang merupakan representasi dimensi pendidikan, dan pengeluaran per kapita yang disesuaikan yang merupakan representasi dari dimensi pendidikan. 3. PERANCANGAN & IMPLEMENTASI 3.1 K-means Clustering K-means clustering adalah metode klastering yang dilakukan secara partisi (partitional clustering). Clustering data menggunakan metode k-means bertujuan untuk mempartisi/membagi n objek data ke dalam K kelompok data. Selanjutnya semua objek data dimasukan ke klaster yang memiliki jarak terdekat. Algoritma ini memberikan nilai akhir berupa K kelompok kluster dengan perbedaan yang tinggi (Taft, 2005). Pada tahapan awal, algoritma k-means memilih secara acak k titik data sebagai pusat atau centroid. Nilai k juga dapat diinisialisasikan pada tahapan awal. Selanjutnya, jarak antar data dengan pusat klaster (centroid) dihitung dengan euclidian distance atau dapat dilakukan dengan memakai teknik lain. Data ditempatkan ke dalam centroid (pusat klaster) yang paling dekat, dihitung dari titik tengah klaster. Centroid yang baru ditentukan jika semua objek data sudah ditempatkan ke dalam klaster yang memiliki jarak paling dekat. Proses penentuan centroid dan penempatan data dalam klaster akan terus diulang hingga centroid dari semua klaster tidak ada yang berubah lagi atau nilai centroid konvergen. Selain itu perulangan dapat dihentikan jika sudah memenuhi kondisi perulangan yang telah ditentukan sebelumnya. Misalnya perulangan hanya dilakukan 100 kali, maka setelah sampai ke perulangan yang ke-100 maka proses akan berhenti walaupun tidak konvergen. Namun secara umum penggunaan metode k-means menghentikan iterasinya jika hasil klaster telah convergen (A. K. Jain, 2009). Flowchart dari langkah-langkah metode clustering yang menggunakan algoritma k- means tradisional ditunjukkan pada Gambar 3.1. Pengelompokkan data memakai algoritma k- means akan terus dilakukan hingga menemukan hasil iterasi yang stabil atau convergen. Berikut penjelasan dari Gambar 3.1: 1. Algoritma k-means menerima inputan dari pengguna berupa nilai jumlah klaster sebanyak k klaster, dan suatu dataset yang ingin dikelompokkan. 2. Sebanyak k data dipilih secara random dari suatu dataset yang kemudian ditentukan sebagai initial centroid. 3. Ulang langkah 4, 5 dan 6 hingga tidak ada lagi objek yang berubah di dalam suatu klaster.
6 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Hitung jarak masing-masing titik objek data ke masing-masing intial centroid. 5. Mengalokasikan masing-masing titik data ke dalam klaster dengan jarak paling minimum. 6. Menghitung rata-rata dari semua data yang terdapat di dalam klaster tersebut sebagai pusat klaster baru. Ulangi langkah sebelumnya sampai terbentuk klaster yang stabil. Cluster yang stabil terbentuk saat hasil klastering data dari iterasi memberikan hasil yang sama dengan hasil iterasi sebelumnya. Saat klaster sudah stabil maka proses k-means selesai. Gambar 3.2 Perancangan sistem Gambar 3.1 Flowchart K-means 3.2 Semi-supervised k-means clustering Pada bagian implementasi sistem menjelaskan bagaimana alur sistem tersebut menyelesaikan permasalahan yang telah didefinisikan pada proses sebelumnya. Menurut (Hanmin,2016), alur dari implementasi dari metode semi-supervised k-measns clustering adalah membagi proses ke dalam dua garis besar.pada proses pertama adalah untuk jumlah data set dengan banyak labeled data berbeda. Sedangkan pada proses kedua adalah untuk jumlah data set dengan sedikit labeled data berbeda. Data set akan masuk pada proses pertama jika memenuhi kondisi KL N. Jika tidak maka akan ke proses dua. Dalam algoritma improved semisupervised k-means clustering yang dikemukakan oleh (Hanmin,2016), terdapat dua kondisi yaitu kondisi untuk dataset dengan jumlah labeled data yang banyak dan labeled data yang sedikit. Proses secara rinci dari algoritma adalah sebagai berikut: 1. Inisialisasi data set awal. Dalam inisialisasi dataset dilakukan pelabelan dari sedikit objek data yang ada. Hal tersebut berguna untuk mendapatkan nilai K klaster dan initial cluster center yang optimal. 2. Setelah melakukan inisialisasi data, langkah selanjutnya adalah menentukan nilai K klaster dan initial cluster center. Nilai K didapat dari nilai KL, dalam hal ini KL adalah jumlah label yang berbeda. Initial cluster center didapat dengan memilih sebanyak KL objek yang memiliki label yang berbeda dari XL. 3. Langkah selanjutnya adalah menentukan dataset masuk ke kondisi pertama atau kedua. Kondisi pertama, kondisi pertama adalah saat nilai KL N bernilai benar. Kondisi ini adalah untuk data training dengan banyak data yang brelabel.
7 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 819 Langkah-langkahnya adalah sebagai berikut: a. Menghitung jarak objek ke titik pusat klaster lalu mengelompokannya ke klaster terkait sesuai dengan algoritma improved semi-supervised k-means. Sesuai pada algoritma pada penelitian yang dilakukan (Hanmin,2016), terdapat dua kondisi untuk menentukan masingmasing objek masuk ke klaster mana. Kondisi pertama adalah jika xi XL, maka objek xi akan masuk ke klaster awalnya. Dengan kata lain untuk objek data yang berlabel klasternya tidak akan berubah. Kondisi kedua adalah ketika konsisi bernilai xi XL salah. Maka objek xi akan masuk ke klaster dengan jarak terdekat. b. Langkah selanjutnya adalah mencari centroid baru untuk melakukan update klaster. Langkah yang dilakukan adalah dengan menghitung centroid pada setiap klaster. Perhitungannya adalah dengan mengambil nilai rata-rata semua nilai data pada setiap fiturnya. c. Setelah mendapatkan hasil akhir berupa centroid baru, langkah selanjutnya adalah ulangi langkah a dan b sampai objek data pada klaster sebelumnya dengan klaster yang baru menjadi konvergen. Kondisi kedua, kondisi kedua adalah saat nilai KL N bernilai salah. Pada kondisi ini adalah untuk data training dengan sedikit data yang berlabel. Langkah-langkahnya adalah sebagai berikut: a. Menghitung jarak objek ke titik pusat klaster lalu mengelompokannya ke klaster terkait sesuai dengan algoritma improved semi-supervised k-means. Sesuai pada algoritma pada penelitian yang dilakukan (Hanmin,2016), terdapat dua kondisi untuk menentukan masingmasing objek masuk ke klaster mana. Kondisi pertama adalah jika xi XL, maka objek xi akan masuk ke klaster awalnya. Dengan kata lain untuk objek data yang berlabel klasternya tidak akan berubah. Kondisi kedua adalah ketika konsisi bernilai xi XL salah. Maka objek xi akan masuk ke klaster dengan jarak terdekat. b. Berbeda dengan kondisi pertama, pada kondisi kedua terlebih dahulu akan melakukan pengecekan untuk kondisi perulangan for (k= KL+1; k N;k++). c. Selanjutnya adalah memilih objek yang memiliki jarak terjauh dari objek KL sebagai pusat klaster. Jarak terjauh tersebut nanti yang digunakan sebagai inisial pusat cluster selanjutnya. d. Langkah selanjutnya adalah mencari centroid baru untuk melakukan update cluster. Langkah yang dilakukan adalah dengan menghitung centroid pada setiap klaster. Perhitungannya adalah dengan mengambil nilai rata-rata semua nilai data pada setiap fiturnya. e. Setelah mendapatkan hasil akhir berupa centroid baru, langkah selanjutnya adalah ulangi langkah a dan b sampai objek data pada klaster sebelumnya dengan klaster yang baru menjadi konvergen. 4. PENGUJIAN ANALISIS Pada penelitian ini dilakukan empat kali skenario pengujian dari perbandingan kedua metode. Skenario pengujian tersebut antara lain tingkat akurasi terhadap jumlah varian data training, waktu komputasi satu kali konvergen terhadap jumlah varian data training, jumlah iterasi satu kali konvergen terhadap varian data training, dan silhouette coefficient terhadap varian data training. a. Hasil pengujian tingkat akurasi terhadap jumlah varian data training pada metode improved semi supervised k-means dengan k-means Pengujian pertama digunakan untuk mengetahui perbandingkan rata-rata tingkat akurasi dari metode improved semi supervised k- means dan k-means tradisional. Pada bagian ini tiap proses pada masing-masing algoritma menggunakan 100, 200, 300, 400, dan 500 data
8 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 820 training. Untuk masing-masing data training pada algoritma k-means tradisional dilakukan percobaan sebanyak 5 kali, kemudian akan diambil rata-rata tingkat akurasi dari 5 kali percobaan tersebut. Sedangkan pada algoritma improved semi-supervised k-means akan dilakukan perulangan untuk mencari konvergen sebanyak KL+1 sampai N. Tabel 4.1 Tabel hasil pengujian tingkat akurasi terhadap jumlah varian data training pada metode improved semi supervised k-means dengan k-means Dari data pada tabel 4.1 dapat dibuat grafik hasil uji coba rata-rata tingkat akurasi yang dipengraruhi oleh variasi jumlah data training. Gambar 4.1 Grafik pengujian tingkat akurasi terhadap jumlah varian data training pada metode improved semi-supervised k-means dengan k-means tinggi dan stabil Hal tersebut disebabkan karena pada algoritma improved semi supervised k- means clustering mendapatkan nilai pusat klaster awal yang lebih rasional dari data yang berlabel. Selain itu dengan algoritma improved semi-supervised k-means akan langsung menggenerate nilai K yang optimal, sehingga memberikan hasil yang lebih baik dan lebih baik dan konsisten dari algoritma k-means tradisional. Namun dengan hal tersbut juga menyebabkan metode improved semi supervised k-means clustering sangat bergantung dari seberapa baiknya data yang berlabel. Semakin baik data yang berlabel akan semakin meningkatkan tingkat akurasi dari metode improved semi supervised k-means clustering. b. Hasil pengujian waktu satu kali konvergen algoritma improved semi supervised k-means dengan k-means tradisional Pengujian kedua dilakukan untuk mengetahui perbandingkan rata-rata waktu untuk mencari satu kali konvergen pada algoritma improved semi supervised k-means clustering dengan algoritma k-means tradisional. Sama seperti pengujian pertama, data training yang digunakan sebanyak 500 data yang dibagi menjadi lima bagian pengujian yaitu pengujian untuk 100, 200, 300, 400, dan 500 data training. Pada algoritma improved semi supervised k- means clustering nilai rata-rata waktu untuk satu kali konvergen didapatkan dari pembagian antara total waktu dalam satu kali proses dibagi jumlah iterasi untuk mencari konvergen. Sedangkan untuk algoritma k-means tradisional rata-rata satu kali konvergen didapatkan dari rata-rata waktu pada masing-masing bagian data training (100, 200, 300, 400, dan 500 data training) yang akan diuji sebanyak lima kali proses. Dari grafik pada Gambar 4.1 dapat disimpulkan bahwa secara keseluruhan algoritma improved semi-supervised k-means menghasilkan tingkat akurasi yang lebih tinggi dan lebih konsisten dari algoritma k-means tradisional. Pada algoritma k-means tradisional akan cenderung menghasilkan tingkat akurasi yang meningkat jika data training yang digunakan semakin banyak. Sedangkan untuk algoritma semi-supervised k-means clustering cenderung menghasilkan tingkat akurasi yang
9 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 821 Tabel 4.2 Tabel hasil pengujian waktu satu kali konvergen terhadap jumlah varian data training pada metode improved semi supervised k-means dengan k-means Dari data pada tabel 4.2 dapat dibuat grafik hasil uji coba rata-rata waktu untuk satu kali konvergen yang dipengraruhi oleh variasi jumlah data training. Gambar 6.2 Grafik pengujian waktu komputasi terhadap jumlah varian data training pada metode improved semi-supervised k-means dengan k-means Dari grafik pada Gambar 6.2 dapat disimpulkan bahwa semakin banyak data training yang digunakan akan membuat waktu komputasi untuk mencari satu kali konvergen pada masing-masing algoritma akan semakin banyak. Hal tersebut dikarenakan tiap sub proses pada masing-masing algoritma akan semakin memakan waktu untuk memproses jumlah data yang semakin besar. Dengan data training yang semakin beragam, juga akan memperlama suatu proses untuk mencari nilai konvergen. Jika dibandingkan, algoritma improved semi supervised k-means memberikan rata-rata waktu komputasi yang lebih baik dari pada metode k- means tradisional pada tiap varian data training. Hal tersebut dikarenakan pusat klaster awal yang dihasilkan pada metode k-means tradisional dipilih secara acak sehingga proses dari algoritma menjadi tidak stabil. Berbeda dengan algoritma improved semi supervised k-means yang menggunakan data training yang telah berlabel untuk mencari nilai pusat klaster awal yang lebih optimal. Dengan pusat klaster awal yang lebih optimal akan membuat waktu proses algoritma lebih baik dan lebih baik. c. Hasil jumlah iterasi dalam satu kali konvergen terhadap jumlah varian data training pada metode improved semi supervised k-means dengan k-means Pada pengujian ketiga dilakukan untuk menguji perbandingan nilai rata-rata jumlah iterasi dalam satu kali konvergen terhadap jumlah varian data training antara algoritma k- means tradisional dan improved semi-supervised k-means. Sama seperti pengujian pertama dan kedua, data training yang digunakan dibagi menjadi lima jumlah varian data yaitu 100, 200, 300, 400, dan 500 jumlah data. Pada masingmasing varian data dipilih secara acak dari total sekitar 2000 data training dalam rentang tahun 2012 sampai Pada pengujian algoritma improved semi-supervised k-means, nilai ratarata waktu untuk satu kali konvergen didapatkan dari pembagian antara total iterasi untuk satu kali konvergen dibagi jumlah iterasi untuk mencari satu kali konvergen. Sedangkan untuk algoritma k-means tradisional rata-rata iterasi untuk satu kali konvergen didapatkan dari rata-rata iterasi pada masing-masing bagian data training (100, 200, 300, 400, dan 500 data training) yang akan diuji sebanyak lima kali proses. Tabel 4.3 Tabel hasil pengujian jumlah iterasi terhadap jumlah varian data training pada metode improved semi supervised k-means dengan k-means Dari data pada tabel 4.3 dapat dibuat grafik hasil uji coba jumlah iterasi yang dipengraruhi oleh variasi jumlah data training.
10 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 822 dari percobaan lima set data training. Sedangkan pengujian pada algoritma improved semisupervised k-means akan dilakukan perulangan untuk mencari konvergen sebanyak KL+1 sampai N. Selelah melalui beberapa proses konvergen akan dipilih nilai JK (objektif) yang terkecil. Nilai pusat klaster pada JK terkecil tersebutlah yang akan diuji pada algoritma improved semi supervised k-means clustering. Gambar 4.3 Grafik hasil uji coba silhouette coefficient Dari Gambar 6.3 dapat diketahui bahwa semakin banyak data training yang digunakan akan membuat rata-rata iterasi untuk mencapai satu kali konvergen pada algoritma semisupervised k-means memberikan hasil rata-rata yang lebih efisien dari algoritma k-means tradisional pada semua varian data training. Selain itu dalam pengujian ini algoritma improved semi-supervised k-means menghasilkan rata-rata iterasi yang cenderung meningkat jika data training yang digunakan semakin banyak. Sedangkan untuk algoritma k- means tradisional menghasilkan rata-rata iterasi yang tidak konsisten pada masing-masing jumlah varian data. Hal tersebut dikarenakan pusat klaster awal yang dihasilkan pada algoritma k-means tradisional dipilih secara acak sehingga proses dari algoritma menjadi tidak stabil. Berbeda dengan algoritma improved semi supervised kmeans clustering yang menggunakan data training yang telah berlabel untuk mencari nilai pusat klaster awal yang lebih optimal. Dengan pusat klaster awal yang lebih optimal akan membuat proses algoritma menjadi lebih efisien dalam melakukan banyak iterasi untuk satu kali konvergen. d. Hasil pengujian perbandingan silhouette coefficient terhadap jumlah varian data training pada metode improved semi supervised k-means dengan k-means Pada pengujian ketiga berguna untuk mengetahui perbandingan nilai kualitas klaster menggunakan metode evaluasi silhouette coefficient antara algoritma improved semi supervised k-means clustering dan k-means tradisional dengan konsep pengujian yang sama dengan pengujian pertama dan kedua. Pengujian pada algoritma algoritma k-means tradisional dilakukan percobaan sebanyak lima kali pada lima set data training yang berbeda, kemudian akan diambil rata-rata nilai silhouette coefficient Tabel 4.4 Tabel hasil pengujian silhouette coefficient terhadap jumlah varian data training pada metode improved semi supervised k-means dengan k-means Dari data pada tabel 4.4 dapat dibuat grafik hasil uji coba nilai rata-rata silhouette coefficient yang dipengraruhi oleh variasi jumlah data training. Gambar 4.4 Grafik hasil uji coba silhouette coefficient Dari Gambar 4.4 dapat diketahui bahwa secara umum algoritma improved semisupervised k-means menghasilkan nilai silhouette coefficient yang lebih baik. Hasil yang lebih baik pada algoritma improved semisupervised k-means juga terlihat pada masingmasing varian data training. Pada lima kali pengujian menggunakan aloritma improved semi supervised k-means clustering rata-rata menghasilkan nilai silhouette coefficient dengan strong structure (nilai rentang 0.7 sampai 1). Hal tersebut dikarenakan algoritma improved semi-
11 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 823 supervised k-means menghasilkan nilai klaster pusat awal yang lebih rasional daripada algoritama k-means tradisional. Lebih rasional dikarenakan pencarian pusat klaster awal pada algoritma improved semi-supervised k-means didapatkan melalui data yang telah dilabeli sebelumnya. Dengan menggunakan data yang berlabel untuk mencari nilai pusat klaster, akan memberikan pusat klaster awal yang lebih baik dibanding mencari pusat klaster awal secara random pada algoritma k-means tradisional. Dengan data yang didapatkan secara random akan membuat hasil tidak konsisten. Oleh karena itu hasil klaster yang dihasilkan pada algortma improved semi-supervised k-means lebih relevan dibanding algoritma k-means tradisional saat dilakukan pengujian menggunakan 25 data uji silhouette coefficient yang diambil secara acak. 5. KESIMPULAN DAN SARAN Bab ini membahas kesimpulan dari hasil penelitian beserta saran yang dapat digunakan dalam pengembangan penelitian yang lebih lanjut tentang analisis perbandingan metode k- means dengan improved semi-supervised k- means clustering pada data indeks pembangunan manusia (IPM). 5.1 Kesimpulan Berdasarkan hasil penelitian tentang analisis perbandingan metode k-means dengan improved semi-supervised k-means clustering pada data indeks pembangunan manusia (IPM) bisa disimpulkan bahwa: 1. Penggunaan algoritma semi-supervised k- means clustering pada data indeks pembangunan manusia (IPM) mampu mengatasi permasalahan yang ada pada algoritma k-means tradisional dengan memberikan hasil pusat klaster yang lebih optimal yang didapatkan dari data yang telah dilabeli sebelumnya. Dari data yang telah dilabeli tersebut memberikan pusat klaster awal yang lebih optimal dan nilai K klaster yang lebih optimal ketimbang algoritma k- means tradisional yang pada penerapannya terkadang memberikan hasil yang tidak konsisten. Dengan pusat klaster dan nilai K yang optimal memberikan hasil yang lebih baik dalam hal tingkat akurasi, rata-rata waktu komputasi per satu kali konvergen, dan validasi hasil pusat klaster menggunakan silhouette coefficient pada metode semi-supervised k-means clustering. 2. Dari pengujian yang dilakukan yang menggunakan data training dengan variasi data sebanyak 100, 200, 300, 400, dan 500 menggunakan algoritma semi-supervised k- means clustering dan algoritma k-means tradisional dengan 100 data uji yang diambil secara acak memberikan rata-rata tingkat akurasi yang lebih baik yaitu 90.3%. Sedangkan untuk rata-rata hasil k-means tradisional memberikan tingkat akurasi sebesar 73.7%. Selain itu untuk setiap variasi data pada metode semi-supervised k- means clustering memberikan hasil yang lebih konsisten dengan perbedaan presentase akurasi paling besar yaitu 2%, sedangkan untuk algoritma k-means tradisional perbedaan hasil akurasi terbesar adalah 13.6%. 3. Pada pengujian rata-rata jumlah iterasi untuk satu kali konvergen algoritma improved semi-supervised k-means menghasilkan rata-rata proses iterasi yang lebih efektif dibandingkan dengan algoritma k-means tradisional dengan nilai rata-rata iterasi yang dihailkan pada lima varian data bernilai 7.11 kali iterasi berbanding 9.72 kali iterasi. Selain itu untuk algoritma improved semisupervised k-means menghasilkan hasil yang lebih konsisten pada bagian jumlah iterasi ketimbang algoritma k-means tradisional pada pengujian jumlah iterasi dalam satu kali konvergen terhadap jumlah varian data training. 4. Metode improved semi-supervised k-means clustering memberikan rata-rata waktu komputasi untuk satu kali konvergen yang lebih baik dibandingkan dengan metode k- means tradisional. Hal tersebut dapat dilihat dari pengujian mengunakan lima variasi jumlah data yaitu 100, 200, 300, 400, dan 500 data training metode semi-supervised k- means clustering memberikan hasil yang lebih baik dengan rata-rata waktu komputasi sebesar detik. Sedangkan untuk algoritma k-means tradisional memberikan rata-rata waktu komputasi sebesar detik. Dalam pengujian rata-rata waktu komputasi kedua metode memberikan nilai rata-rata waktu komputasi yang semakin meningkat jika data training yang digunakan semakin banyak, begitupun sebaliknya. Pengklusteran data indeks pembangunan manusia menggunakan algoritma semisupervised k-means clustering menggunakan metode silhouette coefficient menghasilkan nilai
12 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 824 validasi yang lebih baik dari metode k-means tradisional. Pada lima variasi jumlah data training yaitu 100, 200, 300, 400, dan 500 data, nilai rata-rata yang dihasilkan menggunakan algoritma semi-supervised k-means clustering menghasilkan nilai silhouette coefficient sebesar sedangkan untuk algoritma k-means tradisional menghasilkan silhouette coefficient sebesar Saran Berikut saran yang dapat ditawarkan sebagai bahan untuk pengembangan penelitian lebih lanjut: 1. Metode akan lebih optimal digunakan pada data yang memiliki banyak jumlah data yang berlabel. Pada data indeks pembangunan manusia memiliki jumlah data yang berlabel sebanyak empat, sehingga algoritma improved semi-supervied k-means clustering yang menggunakan data training yang semakin banyak akan melipatgandakan waktu komputasi. 2. Pada penelitian selanjutnya yang menggunakan algoritma improved semi supervised k-means clustering sebaiknya tidak diimplementasikan menggunakan Bahasa pemrograman PHP karena dengan proses dengan loop dan data yang banyak pemrograman yang berbasis pada browser memiliki limit pemrosesan data dan browser rentan hang saat proses dijalankan dengan data yang banyak. 3. Pada penelitian selanjutnya perlu sebuah improvisasi pada metode semi-supervised k- means untuk menentukan jumlah iterasi untuk mencari konvergen sesuai dengan jumlah data yang berlabel berbeda dan jumlah data training. clustering algorithm. Guilin, China, IEEE Conference Publications. MacQueen, J. B., Some Methods for. Berkeley, University of California Press. Rousseeuw, P. J., Silhouette: A Graphical Aid To The Interpretation and Validation of Cluster Analysis. Journal of Computational and Applied Mathematics, Issue 20, pp Taft, M. K. R. H. M. M. D. T. G. S. e. a., Oracle Data Mining Concepts. Zhenpeng, L. et al., An Improved semisupervised K-means Algorithm Based on Information Gain. Baoding, China, IEEE Publisher. DAFTAR PUSTAKA A. K. Jain, M. N. M. P. J. F., Data Clustering: A Review.. U. S, Michigan State University. Agusta, Y., K-means Penerapan, Permasalahan dan Metode Terkait. Jurnal Sistem dan Informatika, Volume 3, pp BPS, S. B. P., Indeks Pembangunan Manusia 2014 Metode Baru. 1 penyunt. Jakarta: Badan Pusat Statistik. Hanmin, Y., Hao, L. & Qianting, S., An improved semi-supervised K-means
PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN
PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas
Lebih terperinciMETODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami
METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering
Lebih terperinciPENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU
PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU Gita Premashanti Trayasiwi Program Studi Teknik Informatika S1,
Lebih terperinciJURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1
JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 ANALISA PERBANDINGAN METODE HIERARCHICAL CLUSTERING, K-MEANS DAN GABUNGAN KEDUANYA DALAM MEMBENTUK CLUSTER DATA (STUDI KASUS : PROBLEM KERJA PRAKTEK JURUSAN
Lebih terperinciAnalisis Perbandingan Algoritma Fuzzy C-Means dan K-Means
Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.
Lebih terperinciJURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521
JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: 2301-9271 A-521 Analisa Perbandingan Metode Hierarchical Clustering, K-means dan Gabungan Keduanya dalam Cluster Data (Studi kasus : Problem Kerja Praktek Jurusan
Lebih terperinciPENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA
PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo
Lebih terperinciPartitional clustering KLASTERING DENGAN METODE K-MEANS
Partitional clustering KLASTERING DENGAN METODE K-MEANS PENDAHULUAN K-mean merupakan teknik klastering yang paling umum dan sederhana. Tujuan klastering ini adalah mengelompokkan obyek ke dalam k klaster/kelompok.
Lebih terperinciPENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING
A-99 PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING Rachmad Zaini Alberto 1, Winda Kurnia Sari 2, Samsuryadi 3, Anggina Primanita 4 1,2,3,4 Fakultas
Lebih terperinciSeminar NasionalTeknologiInformasi 2015
SISTEM PREDIKSI CUSTOMER LOYALTY DENGAN METODE SEGMENTASI RFM DAN PENGELOMPOKKAN DENGAN ALGORITMA CLUSTERING MODIFIED K-MEANS PADA PERUSAHAAN PU IBUKOTA Herwin 1) Teny Handhayani 2) Dyah E Herwindiati
Lebih terperinciJURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010
PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification
Lebih terperinciPenerapan Algoritma K-Means untuk Clustering
Seminar Perkembangan dan Hasil Penelitian Ilmu Komputer (SPHP-ILKOM) 71 Penerapan Algoritma K-Means untuk ing Dokumen E-Jurnal STMIK GI MDP Ernie Kurniawan* 1, Maria Fransiska 2, Tinaliah 3, Rachmansyah
Lebih terperinciDATA MINING DAN WAREHOUSE A N D R I
DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung
Lebih terperinciIMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA
IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA Nama : Nandang Syaefulloh NPM : 55412243 Fakultas : Teknologi Industri Jurusan : Teknik Informatika Pembimbing
Lebih terperinciTEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)
TEKNOSI, Vol. 02, No. 03, Desember 2016 31 PENERAPAN DATA MINING DALAM MENINGKATKAN MUTU PEMBELAJARAN PADA INSTANSI PERGURUAN TINGGI MENGGUNAKAN METODE K-MEANS CLUSTERING (STUDI KASUS DI PROGRAM STUDI
Lebih terperinciPENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS
PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to
Lebih terperinciBAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam
BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri
Lebih terperinciBAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk
BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.
Lebih terperinciJl. Raya Dukuhwaluh Purwokerto )
Sistem Klasterisasi Menggunakan Metode K-Means dalam Menentukan Posisi Access Point Berdasarkan Posisi Hotspot di Universitas Muhammadiyah Purwokerto (Clustering System Using K-Means Method in Determining
Lebih terperinciPerbandingan Metode Single Linkage dan Fuzzy C Means Untuk Pengelompokkan Trafik Internet
Perbandingan Metode Single dan Fuzzy C Means ntuk Pengelompokkan Trafik Internet Auliya Burhanuddin 1, Ema tami, Eko Pramono 3 1 Program Studi Teknik Informastika, Fakultas Teknik, niversitas Muhammadiyah
Lebih terperinciCLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS
CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS Muhammad Toha, 1), I Ketut Edy Purnama 2) dan Surya Sumpeno 3) 1) Bidang Keahlian Telematika (Konsentrasi CIO) Jurusan Teknik Elektro
Lebih terperinciPENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ
PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ SKRIPSI Diajukan untuk memenuhi salah satu syarat memperoleh Gelar Sarjana pada Program Studi Sistem
Lebih terperinciMEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP
MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP Page 87 Iin Parlina 1, Agus Perdana Windarto 2, Anjar Wanto 3, M.Ridwan Lubis
Lebih terperinciCLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)
CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing
Lebih terperinciPENERAPAN METODE ANT COLONY OPTIMIZATION PADA METODE K-HARMONIC MEANS UNTUK KLASTERISASI DATA HALAMAN JUDUL
PENERAPAN METODE ANT COLONY OPTIMIZATION PADA METODE K-HARMONIC MEANS UNTUK KLASTERISASI DATA KOMPETENSI JARINGAN KOMPUTER SKRIPSI HALAMAN JUDUL I MADE KUNTA WICAKSANA NIM : 0708605050 PROGRAM STUDI TEKNIK
Lebih terperinciBAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode
BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada
Lebih terperinciPENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA
PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA Diajeng Tyas Purwa Hapsari Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email :
Lebih terperinciPerbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia
Perbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia Praditya Kurniawan 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 STMIK AMIKOM Yogyakarta e-mail: * 1 pradityakurniawan@gmail.com, 2
Lebih terperinciPENDAHULUAN. 1.1 Latar Belakang
DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan
Lebih terperinciBAB III ANALISA DAN PERANCANGAN SISTEM
BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini menjelaskan tentang analisa data, rancangan sistem, dan skenario pengujian. Bagian analisa data meliputi data penelitian, analisis data, data preprocessing.
Lebih terperinciBAB 3 ANALISA SISTEM
BAB 3 ANALISA SISTEM Pada perancangan suatu sistem diperlakukan analisa yang tepat, sehingga proses pembuatan sistem dapat berjalan dengan lancar dan sesuai seperti yang diinginkan. Setelah dilakukan analisis
Lebih terperinciAPLIKASI SURAT MASUK DAN KELUAR DENGAN KLASTERISASI MENGGUNAKAN METODE K-MEANS DI INSTALASI FARMASI RSUD DR.SAIFUL ANWAR
APLIKASI SURAT MASUK DAN KELUAR DENGAN KLASTERISASI MENGGUNAKAN METODE K-MEANS DI INSTALASI FARMASI RSUD DR.SAIFUL ANWAR Sari Nur Sita Wibowo 1 Amak Yunus EP 1 Sistem Informasi, Universitas Kanjuruhan
Lebih terperinciPerancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra
Lebih terperinciPengenalan Pola. K-Means Clustering
Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan
Lebih terperinciARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG
ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG Oleh: BAGUS YAYANG FATKHURRAHMAN 13.1.03.02.0180 Dibimbing oleh : 1. Ahmad
Lebih terperinciK-Means Clustering. Tim Asprak Metkuan. What is Clustering?
K-Means Clustering Tim Asprak Metkuan What is Clustering? Also called unsupervised learning, sometimes called classification by statisticians and sorting by psychologists and segmentation by people in
Lebih terperinciClustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means
Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id
Lebih terperinciANALISIS KINERJA ALGORITMA CLUSTERING FUZZY TSUKAMOTO DENGAN FUZZY C-MEANS
ANALISIS KINERJA ALGORITMA CLUSTERING FUZZY TSUKAMOTO DENGAN FUZZY C-MEANS Iin Parlina1, Prof.Herman Mawengkang2, Dr.Syahril Efendi, S.Si, M.IT3 Magister Teknik Informatika, Universitas Sumatera Utara
Lebih terperinciImplementasi Algoritme Modified-Apriori Untuk Menentukan Pola Penjualan Sebagai Strategi Penempatan Barang Dan Promo
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 10, Oktober 2018, hlm. 3829-3834 http://j-ptiik.ub.ac.id Implementasi Algoritme Modified-Apriori Untuk Menentukan
Lebih terperinciANALISA DAN PEMANFAATAN ALGORITMA K-MEANS CLUSTERING PADA DATA NILAI SISWA SEBAGI PENENTUAN PENERIMA BEASISWA
ANALISA DAN PEMANFAATAN ALGORITMA K-MEANS CLUSTERING PADA DATA NILAI SISWA SEBAGI PENENTUAN PENERIMA BEASISWA Ari Muzakir Fakultas Ilmu Komputer, Universitas Bina Darma Palembang e-mail : ariemuzakir@gmail.com,
Lebih terperinciPENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA
PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA 1 Yulison Herry Chrisnanto, 2 Gunawan Abdillah 1,2 Jurusan Informatika Fakultas
Lebih terperinciBAB IV ANALISIS DAN PERANCANGAN
BAB IV ANALISIS DAN PERANCANGAN 4.1. Analisa 4.1.1 Analisis Data Pada tahap analisa data ini akan dibahas mengenai citra CT Scan yang akan dilakukan proses segmentasi atau pengelompokan data. Data citra
Lebih terperinciTAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas
TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge
Lebih terperinciPENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR
PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR SIDANG SKRIPSI Oleh Adry Rahadinata 10108069 Penguji 1 Andri Heryandi, S.T., M.T. Penguji 2 Adam Mukharil
Lebih terperinciIMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING
IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember
Lebih terperinciDATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi
DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 9 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Clustering Data Mining Penklusteran (clustering) digunakan untuk
Lebih terperinciARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL
ARTIKEL PENERAPAN METODE K-MEANS DALAM PROSES CLUSTERING PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL Oleh: IRFAN DWI NURCAHYO BUDIARTO 13.1.03.02.0117 Dibimbing oleh : 1. Hermin Istiasih, ST.,M.M.,M.T.
Lebih terperinciSKRIPSI RONNY BENEDIKTUS SIRINGORINGO
ANALISIS PERBANDINGAN PROSES CLUSTER MENGGUNAKAN K- MEANS CLUSTERING DAN K-NEAREST NEIGHBOR PADA PENYAKIT DIABETES MELLITUS SKRIPSI RONNY BENEDIKTUS SIRINGORINGO 131421021 PROGRAM STUDI S1 ILMU KOMPUTER
Lebih terperinciPENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS
Jurnal Ilmiah ILKOM Volume 8 mor (Agustus 16) ISSN: 87-1716 PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Widya Safira Azis 1 dan Dedy Atmajaya 1 safiraazis18@gmail.com dan dedy.atmajaya@umi.ac.id
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma
Lebih terperinciIMPLEMENTASI PENGENALAN POLA UNTUK MENGEVALUASI HASIL PEMBELAJARAN DENGAN METODE FUZZY C-MEANS
SYSTEMIC Vol. 02, No. 02, Desember 2016, 23-28 IMPLEMENTASI PENGENALAN POLA UNTUK MENGEVALUASI HASIL PEMBELAJARAN DENGAN METODE FUZZY C-MEANS Ilham Program Studi Sistem Informasi, Jurusan Teknologi, Fakultas
Lebih terperinciPERANCANGAN SISTEM PENENTUAN KECAKAPAN MENULIS BAHASA INGGRIS SISWA SMP MENGGUNAKAN ALGORITMA K-MODES CLUSTERING (STUDI KASUS : SMPN 6 DENPASAR)
PERANCANGAN SISTEM PENENTUAN KECAKAPAN MENULIS BAHASA INGGRIS SISWA SMP MENGGUNAKAN ALGORITMA K-MODES CLUSTERING (STUDI KASUS : SMPN 6 DENPASAR) SKRIPSI IGM SURYA A. DARMANA NIM. 1208605039 PROGRAM STUDI
Lebih terperinciSKRIPSI. Disusun Oleh: SARITA BUDIYANI PURNAMASARI NIM
PEMILIHAN CLUSTER OPTIMUM PADA FUZZY C-MEANS (Studi kasus: Pengelompokan Kabupaten/Kota di Jawa Tengah berdasarkan Indikator Indeks Pembangunan Manusia) SKRIPSI Disusun Oleh: SARITA BUDIYANI PURNAMASARI
Lebih terperinciStudent Clustering Based on Academic Using K-Means Algoritms
Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com
Lebih terperinciSISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS
SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS Sinawati ), Ummi Syafiqoh 2) ), 2) Sistem Informasi STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Penyimpanan dokumen secara digital berkembang dengan pesat seiring meningkatnya teknologi. Kondisi tersebut memunculkan masalah untuk mengakses informasi yang diinginkan
Lebih terperinciAnalisa Data Mahasiswa Baru Terhadap Program Studi Yang. Dipilih Di Universitas Pembangunan Nasional Veteran Jawa
Analisa Data Mahasiswa Baru Terhadap Program Studi Yang Dipilih Di Universitas Pembangunan Nasional Veteran Jawa Timur Menggunakan Teknik Data Mining SKRIPSI Disusun Oleh : Citra Arum Sari 1032010048 JURUSAN
Lebih terperinciKlasifikasi Penyakit Ginjal dengan Metode K-Means
Received: February 2017 Accepted: March 2017 Published: April 2017 Klasifikasi Penyakit Ginjal dengan Metode K-Means Andi Sri Irtawaty 1* 1 Teknik Elektronika. Politeknik Negeri Balikpapan * andi.sri@poltekba.ac.id
Lebih terperinciBAB I PENDAHULUAN A. Latar Belakang
BAB I PENDAHULUAN A. Latar Belakang Promosi adalah salah satu faktor yang diperlukan bagi keberhasilan bagi suatu perusahaan atau organisasi, maka promosi merupakan salah satu senjata ampuh bagi perusahaan
Lebih terperinciIMPLEMENTASI ALGORITMA K-MEANS UNTUK KLASTERISASI MAHASISWA BERDASARKAN PREDIKSI WAKTU KELULUSAN SKRIPSI
IMPLEMENTASI ALGORITMA K-MEANS UNTUK KLASTERISASI MAHASISWA BERDASARKAN PREDIKSI WAKTU KELULUSAN SKRIPSI Disusun Oleh : ALVI SYAHRIN NPM. 0934010254 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling
Lebih terperinciPENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA
Artikel Skripsi PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA SKRIPSI Diajukan Untuk Memenuhi Sebagian
Lebih terperinciPENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS
PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS Yulius Palumpun 1), Sitti Nur Alam 2) 1) Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Manajemen (FIKOM) - Universitas
Lebih terperinciSISTEM PEMBAGIAN KELOMPOK BIMBINGAN BELAJAR DENGAN METODE K-MEANS CLUSTERING
SISTEM PEMBAGIAN KELOMPOK BIMBINGAN BELAJAR DENGAN METODE K-MEANS CLUSTERING ARTIKEL SKRIPSI Diajukan Guna Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Program Studi Teknik
Lebih terperinciPERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak
PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1 Wahyu Catur Wibowo 2 1 Program Studi Sistem Informasi, Universitas Jember 2 Fakultas Ilmu Komputer, Universitas Indonesia,
Lebih terperinciBAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran
BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya
Lebih terperinciANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING
ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING Ni Putu Eka Merliana, Ernawati, Alb. Joko Santoso Program Studi Magister Teknik Informatika, Fakultas Teknik Industri, Universitas
Lebih terperinciIMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU
PROYEK TUGAS AKHIR IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU (Studi Kasus : SMK Pembangunan Nasional Purwodadi) Disusun oleh: Novian Hari Pratama 10411 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS
Lebih terperinciModel Aplikasi Penentuan Jenis Beasiswa Berbasis Algoritma K-NN Termodifikasi
ISSN: 2089-3787 1181 Model Aplikasi Penentuan Jenis Beasiswa Berbasis Algoritma K-NN Termodifikasi Soegiarto 1, Bahar 2 Program Studi Teknik Informatika, STMIK Banjarbaru Jl. A. Yani Km. 33,3 Banjarbaru
Lebih terperinciPENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE
Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster) Volume 05, No. 2 (2016), hal 97 102. PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE Nicolaus, Evy Sulistianingsih,
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering
Lebih terperinciIDENTIFIKASI INDIVIDU BERDASARKAN CITRA SILUET BERJALAN MENGGUNAKAN PENGUKURAN JARAK KONTUR TERHADAP CENTROID ABSTRAK
IDENTIFIKASI INDIVIDU BERDASARKAN CITRA SILUET BERJALAN MENGGUNAKAN PENGUKURAN JARAK KONTUR TERHADAP CENTROID Disusun Oleh : Robin Yosafat Saragih (1022076) Jurusan Teknik Elektro, Fakultas Teknik, Universitas
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Seiring dengan perkembangan jaman, komputer semakin banyak berperan di dalam kehidupan masyarakat. Hampir semua bidang kehidupan telah menggunakan komputer sebagai
Lebih terperinciPENGENALAN WAJAH DENGAN MENERAPKAN ALGORITMA ADAPTIF K MEANS
PENGENALAN WAJAH DENGAN MENERAPKAN ALGORITMA ADAPTIF K MEANS Disusun oleh: Juan Elisha Widyaya (0822014) Jurusan Teknik Elektro, Fakultas Teknik, Jl. Prof. Drg. Suria Sumantri, MPH, no. 65, Bandung, Indonesia
Lebih terperinciKLUSTERING DENGAN K-MEANS BERBASIS LVQ DAN K-MEANS BERBASIS OWA
Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. 2, No. 1, April 2015, hlm. 29-33 KLUSTERING DENGAN K-MEANS BERBASIS LVQ DAN K-MEANS BERBASIS OWA Dian Eka Ratnawati 1, Indriati 2 1,2 Program Studi
Lebih terperinciPengelompokan Data dengan Metode...(Luh Joni Erawati Dewi)
ISSN0216-3241 17 PENGELOMPOKAN DATA DENGAN METODE KLASTERISASI HIRARKI Oleh Luh Joni Erawati Dewi Jurusan Manajemen Informatika, FTK, Undiksha Abstrak Pengelompokan data sangat diperlukan untuk mengetahui
Lebih terperinciPENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET
PENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET Handi Kurniawan Sohdianata 1, Sushermanto 2 Jurusan Teknik Informatika STMIK Banjarbaru 1, Jurusan Sistem Informasi STMIK Banjarbaru 2 Jl.
Lebih terperinciImplementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan
Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Ni Made Anindya Santika Devi, I Ketut Gede Darma Putra, I Made Sukarsa Jurusan Teknologi Informasi, Universitas Udayana Bukit Jimbaran,
Lebih terperinciSISTEM PEMBAGIAN KELAS KULIAH MAHASISWA DENGAN METODE K-MEANS DAN K-NEAREST NEIGHBORS UNTUK MENINGKATKAN KUALITAS PEMBELAJARAN
Pradnyana dan Permana Sistem Pembagian Kelas Kuliah Mahasiswa dengan Metode K-means dan K-Nearest Neighbors untuk Meningkatkan Kualitas Pembelajaran SISTEM PEMBAGIAN KELAS KULIAH MAHASISWA DENGAN METODE
Lebih terperinciPENGENALAN WAJAH DENGAN CITRA MASUKAN BERUPA CITRA SKETSA WAJAH SEBAGAI HASIL SINTESIS DENGAN TEKNIK MULTISCALE MARKOV RANDOM FIELD (MRF)
PENGENALAN WAJAH DENGAN CITRA MASUKAN BERUPA CITRA SKETSA WAJAH SEBAGAI HASIL SINTESIS DENGAN TEKNIK MULTISCALE MARKOV RANDOM FIELD (MRF) Disusun oleh : Alvin Silajaya (0922018) Jurusan Teknik Elektro,
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena
Lebih terperinciAPLIKASI K-MEANS UNTUK PENGELOMPOKKAN MAHASISWA BERDASARKAN NILAI BODY MASS INDEX (BMI) & UKURAN KERANGKA
APLIKASI K-MEANS UNTUK PENGELOMPOKKAN MAHASISWA BERDASARKAN NILAI BODY MASS INDEX (BMI) & UKURAN KERANGKA Tedy Rismawan 1 dan Sri Kusumadewi 2 1 Laboratorium Komputasi dan Sistem Cerdas, Jurusan Teknik
Lebih terperinciMETODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM
METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1), Wahyu Catur Wibowo 2) 1) Program Studi Sistem Informasi, Universitas Jember 2) Fakultas Ilmu Komputer,
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan
BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Berdasarkan Peraturan Pemerintah Nomor 37 tahun 2009, dosen merupakan pendidik profesional dan ilmuwan dengan tugas utama mentransformasikan, mengembangkan,
Lebih terperinciPENERAPAN METODE CLUSTERING UNTUK MEMETAKAN POTENSI TANAMAN KEDELAI DI JAWA TENGAH DENGAN ALGORITMA FUZZY C- MEANS
1 PENERAPAN METODE CLUSTERING UNTUK MEMETAKAN POTENSI TANAMAN KEDELAI DI JAWA TENGAH DENGAN ALGORITMA FUZZY C- MEANS Indra Setiawan 1 1 Teknik Informatika Universitas Dian Nuswantoro Semarang E-mail :
Lebih terperinciANALISIS KELOMPOK DENGAN ALGORITMA FUZZY C-MEANS DAN GUSTAFSON KESSEL CLUSTERING PADA INDEKS LQ45
ANALISIS KELOMPOK DENGAN ALGORITMA FUZZY C-MEANS DAN GUSTAFSON KESSEL CLUSTERING PADA INDEKS LQ45 SKRIPSI Disusun oleh: LAILLY RAHMATIKA J2E009007 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS
Lebih terperinciIMPLEMENTASI DATA MINING PENGELOMPOKKAN MURID TAMAN KANAK-KANAK DENGAN METODE K-MEANS
JURNAL IMPLEMENTASI DATA MINING PENGELOMPOKKAN MURID TAMAN KANAK-KANAK DENGAN METODE K-MEANS Implementation Of Data Mining Grouping Kindergarten Pupils With K-Means Method Oleh: YOYOK BAGUS SAKSIKO 12.1.03.02.0132
Lebih terperinciDATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA
DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas
Lebih terperinciK-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN
1 K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN Rani Nooraeni*, Dr. Jadi Supriadi, DEA, Zulhanif, S.Si,M.Sc Jurusan statistika terapan, Fakultas MIPA UNPAD rnooraeni@gmail.com* Abstrak.Membagi suatu data
Lebih terperinciKata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,
K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan
Lebih terperinciPerbandingan K-Means dan Fuzzy C-Means untuk Pengelompokan Data User Knowledge Modeling
Perbandingan K-Means dan Fuzzy C-Means untuk Pengelompokan Data User Knowledge Modeling Aditya Ramadhan 1, Zuliar Efendi 2, Mustakim 3 1,2,3 Program Studi Sistem Informasi, Fakultas Sains dan Teknologi
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan
Lebih terperinci1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian
Penerapan Data Mining dengan Menggunakan Metode Clustering K-Mean Untuk Mengukur Tingkat Ketepatan Kelulusan Mahasiswa Program Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang
Lebih terperinciCLUSTERING KUALITAS BERAS BERDASARKAN CIRI FISIK MENGGUNAKAN METODE K-MEANS
CLUSTERING KUALITAS BERAS BERDASARKAN CIRI FISIK MENGGUNAKAN METODE K-MEANS Silvi Agustina 1), Dhimas Yhudo 2), Hadi Santoso 3), Nofiadi Marnasusanto 4), Arif Tirtana 5), Fakhris Khusnu 6*) Program Studi
Lebih terperinciAPLIKASI FUZZY -MEANS CLUSTERINGUNTUK MENGELOMPOKKAN DATA GEMPABUMI DI PROVINSI BENGKULU
Eksakta Vol. 18 No. 2, Oktober 2017 http://eksakta.ppj.unp.ac.id E-ISSN : 2549-7464 P-ISSN : 1411-3724 APLIKASI FUZZY -MEANS CLUSTERINGUNTUK MENGELOMPOKKAN DATA GEMPABUMI DI PROVINSI BENGKULU Nur Afandi,
Lebih terperinciAbidah Elcholiqi, Beta Noranita, Indra Waspada
Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah
Lebih terperinciPENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION
Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2016, pp. 590~595 PENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION 590 Indra Gunawan
Lebih terperinciSCENE COMPLETION MENGGUNAKAN TEMPLATE MATCHING DAN POISSON BLENDING
SCENE COMPLETION MENGGUNAKAN TEMPLATE MATCHING DAN POISSON BLENDING Erick Alfons Lisangan Program Studi Teknik Informatika, Fakultas Teknologi Informasi, Universitas Atma Jaya Makassar Alamat email : erick_lisangan@lecturer.uajm.ac.id
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan
Lebih terperinci