K-Means Clustering. Tim Asprak Metkuan. What is Clustering?

dokumen-dokumen yang mirip
Partitional clustering KLASTERING DENGAN METODE K-MEANS

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

PENGELOMPOKAN CITRA WAJAH DENGAN TEKNIK SUBSPACE CLUSTERING MENGGUNAKAN ALGORITMA LSA SC (LOCAL SUBSPACE AFFINITY SPECTRAL CLUSTERING)

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

DATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

BAB 3 ANALISA SISTEM

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

MODUL 6 ANALISIS CLUSTER

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING

Pengenalan Pola. K-Means Clustering

DATA MINING DAN WAREHOUSE A N D R I

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

PENERAPAN METODE GUSTAFSON-KESSEL CLUSTERING UNTUK MENENTUKAN SEGMENTASI DEBITUR PADA BANK CIMB NIAGA

ANALISIS CLUSTER PADA DOKUMEN TEKS

TIP 163. Game Engine. Topik 5 (Pert 6) Graf, Representasi Dunia, dan Algoritma Pencari Jalur (Pathfinding) Dosen: Aditya Wikan Mahastama

PERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER

Klasifikasi Penyakit Ginjal dengan Metode K-Means

BAB I PENDAHULUAN Latar Belakang

OFVSBM!OFUXPSL. Latar Belakang

KLUSTERING BERBASIS PROTOTIPE DENGAN METODE FUZZY C-MEANS

BAB IV PENGOLAHAN DATA

SKRIPSI KLASIFIKASI CALON PEGAWAI DENGAN MENGGUNAKAN METODE K-MEANS CLASSIFICATION OF PROSPECTIVE EMPLOYEES BY USING THE K-MEANS METHOD

Pengenalan Pola. Klasterisasi Data

Jl. Raya Dukuhwaluh Purwokerto )

KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI

PENDAHULUAN. 1.1 Latar Belakang

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak

BAB I PENDAHULUAN. efektivitas dan efisiensi kerja tercapai. STIKOM Surabaya merupakan salah

Review : Definisi Clustering. Metode untuk menemukan kelompok pada data berdasarkan kriteria tertentu.

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Non Linear Estimation and Maximum Likelihood Estimation

NETWORK LAYER : Routing

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

PENGENALAN WAJAH DENGAN MENERAPKAN ALGORITMA ADAPTIF K MEANS

Ahmad Mauliyadi M, Hizir Sofyan, dan Muhammad Subianto. Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Syiah Kuala

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

SISTEM REKOMENDASI PEMINJAMAN VCD DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

Adam Mukharil Bachtiar English Class Informatics Engineering Algorithms and Programming Searching

JULIO ADISANTOSO - ILKOM IPB 1

APLIKASI K-MEANS UNTUK PENGELOMPOKAN RUMAH TANGGA DI SALATIGA BERDASARKAN DATA SUSENAS

Fakultas Teknologi Informasi Universitas Kristen Maranatha

Clustering. Virginia Postrel

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

LAMPIRAN. Universitas Sumatera Utara

dengan Algoritma K Means

Convolutional Neural Networks (CNNs) dengan Keras

BAB IV ANALISIS DAN PERANCANGAN

ANALISA DAN PEMANFAATAN ALGORITMA K-MEANS CLUSTERING PADA DATA NILAI SISWA SEBAGI PENENTUAN PENERIMA BEASISWA

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH

FUNGSI ACKLEY DAN PENCARIAN NILAI OPTIMUMNYA MENGGUNAKAN ALGORITMA STROBERI. Muhamad Fadilah Universitas Jenderal Soedirman

ANALISIS KELAYAKAN PEMBERIAN BEASISWA DI POLITEKNIK NEGERI BATAM DENGAN METODE CLUSTERING

ANALISIS KELOMPOK DENGAN ALGORITMA FUZZY C-MEANS DAN GUSTAFSON KESSEL CLUSTERING PADA INDEKS LQ45

Statistik Bisnis 1. Week 4 Central Tendency Measures

BAB 1 PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

PEMANFAATAN TRANSFORMASI WAVELET SEBAGAI EKSTRAKSI CIRI PADA KLASIFIKASI BERTINGKAT SINYAL EKG

E-Commerce. Lesson 2. Nizar Rabbi Radliya PHP : Variable, Constant, Data Type, Operator. 2 SKS Semester 7 UNIKOM

PEMETAAN HASIL CLUSTERING PRODUKTIVITAS PADI DAN PALAWIJA DI PULAU JAWA MENGGUNAKAN ALGORITMA K-MEANS

BAB II DASAR TEORI. 2.1 DNA (Deoxy-Ribonucleic Acid)

PENELITIAN OPERASIONAL I (TIN 4109)

SISTEM PENDUKUNG KEPUTUSAN PEMASARAN PRODUK MENGGUNAKAN DATA MINING DENGAN K-MEANS CLUSTERING

CLUSTERING KUALITAS BERAS BERDASARKAN CIRI FISIK MENGGUNAKAN METODE K-MEANS


BAB IV PENGOLAHAN DATA

Kluster Bag-of-Word Menggunakan Weka

ADLN - Perpustakaan Universitas Airlangga ABSTRAK. viii

PENGELOMPOKAN DAN ANALISIS PELANGGAN DENGAN MENGGUNAKAN FUZZY C-MEANS CLUSTERING

BAB III ANALISIS DAN PERANCANGAN

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI REGRESI LOGISTIK MULTINOMIAL

BAB 2 TINJAUAN PUSTAKA

ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG

CLUSTERING PELANGGARAN BERKENDARAAN MENGGUNAKAN ALGORITMA K-MEANS PADA POLRES BINJAI

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. studi yang pernah dilakukan yang berkaitan dengan penelitian ini yaitu bisa dilihat

12/8/2012 MODUL -10. Apa itu SPSS? Apa yang bisa dilakukan SPSS? Apa kesamaan SPSS dengan Microsoft Office Excel?

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

PENERAPAN METODE ANT COLONY OPTIMIZATION PADA METODE K-HARMONIC MEANS UNTUK KLASTERISASI DATA HALAMAN JUDUL

Analisis Perbandingan Metode K-Means Dengan Improved Semi- Supervised K-Means Pada Data Indeks Pembangunan Manusia (IPM)

STATISTIKA TEKNIK LNK2016 CORRELATION & REGRESSION

IMPLEMENTASI ALGORITMA SELF ORGANIZING MAP UNTUK REKOMENDASI MUSIC INTEREST DALAM APLIKASI FACEBOOK KOMPETENSI KOMPUTASI SKRIPSI HALAMAN JUDUL

PENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN MENGGUNAKAN METODE KOHONEN

Nama Soal Pembagian Ring Road Batas Waktu 1 detik Nama Berkas Ringroad[1..10].out Batas Memori 32 MB Tipe [output only] Sumber Brian Marshal

PENERAPAN METODE GREEDY KNAPSACK DALAM MENENTUKAN KOMPOSISI BUAH PADA MASALAH KERANJANG. Abstract

Line VS Bezier Curve. Kurva Bezier. Other Curves. Drawing the Curve (1) Pertemuan: 06. Dosen Pembina Danang Junaedi Sriyani Violina IF-UTAMA 2

Student Clustering Based on Academic Using K-Means Algoritms

The 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

Transkripsi:

K-Means Clustering Tim Asprak Metkuan What is Clustering? Also called unsupervised learning, sometimes called classification by statisticians and sorting by psychologists and segmentation by people in marketing Mengelompokkan data-data menjadi beberapa cluster berdasarkan kesamaannya 1

What is a natural grouping among these objects? What is a natural grouping among these objects? Clustering is subjective Simpson's Family School Employees Females Males 2

Two Types of Clustering Partitional algorithms: Membuat beberapa partisi dan mengelompokkan objek berdasarkan kriteria tertentu Hierarchical algorithms: Membuat dekomposisi pengelompokan objek berdasarkan kriteria tertentu. Misal= tua-muda, tua-muda(merokok-tidak merokok) Hierarchical Partitional What is Similarity? The quality or state of being similar; likeness; resemblance; as, a similarity of features. Webster's Dictionary Similarity is hard to define, but We know it when we see it. 3

Distance : Adalah ukuran kesamaan antar objek yang dihitung berdasarkan rumusan tertentu 0 8 8 7 7 0 2 4 4 D(, ) = 8 D(, ) = 1 0 3 3 0 1 0 Partitional Clustering Nonhierarchical, setiap objek ditempatkan di salah satu cluster Nonoverlapping cluster Jumlah kluster yang akan dibentuk ditentukan sejak awal 4

Algorithm k-means 1. Tentukan jumlah kluster k. 2. Inisialisasi centroid dari tiap kluster (randomly, if necessary). 3. Hitung jarak objek ke centroid tiap kluster. Anggota kluster adalah objek dengan jarak minimum 4. Setelah kluster dan anggotanya terbentuk, hitung mean tiap cluster dan jadikan sebagai centroid baru 5. Jika centroid baru tidak sama dengan centroid lama, maka kembali ke langkah 3. Tetapi jika centroid tidak berubah, maka iterasi selesai. K-means Clustering: Step 1-2 Tentukan jumlah k. Inisialisasi centroid dari tiap kluster (randomly, if necessary). 5 4 k 1 3 2 k 2 1 0 0 1 2 3 4 5 k 3 5

K-means Clustering: Step 3 Tentukan keanggotaan objek-objek yang lain dengan mengklasifikasikannya sesuai centroid terdekat 5 4 k 1 3 2 k 2 1 0 0 1 2 3 4 5 k 3 K-means Clustering: Step 4 Setelah kluster dan anggotanya terbentuk, hitung mean tiap kluster dan jadikan sebagai centroid baru 5 4 k 1 3 2 1 k 2 k 3 0 0 1 2 3 4 5 6

k 2 k 3 11/22/2013 K-means Clustering: Step 5 Jika centroid baru tidak sama dengan centroid lama, maka perlu di-update lagi keanggotaan objek-objeknya 5 4 k 1 3 2 1 k 2 k 3 0 0 1 2 3 4 5 K-means Clustering: Finish Lakukan iterasi step 3-5 sampai tak ada lagi perubahan centroid dan tak ada lagi objek yang berpindah kelas k 1 7

Comments on the K-Means Method Strength Selalu konvergen atau mampu melakukan clustering Operasi matematika sederhana Beban komputasi relatif lebih ringan sehingga clustering bisa dilakukan dengan cepat walaupun relatif tergantung pada banyak jumlah data dan jumlah kluster yg ingin dicapai Weakness Jumlah kluster (k) harus ditentukan Nilai centroid awal dapat mempengaruhi hasil kluster Tergantung pada mean Tidak mampu mengatasi noisy data and outliers Kluster yang dihasilkan bersifat optimum lokal Source: http://id.scribd.com/doc/71509568/k-means-clustering-case-2-cluster Algoritma pengukuran distance SqEuclidean Cityblock Cosine Correlation Hamming 8

MATLAB [IDX,C] = kmeans(x,k) returns the k cluster centroid locations in the k-by-p matrix C [...] = kmeans(...,'param1',val1,'param2',val2,...) enables you to specify optional parameter name-value pairs to control the iterative algorithm used by kmeans. The parameters are : distance start replicates maxiter emptyaction display 9

'distance Distance measure, in p-dimensional space, that kmeans minimizes with respect to. kmeans computes centroid clusters differently for the different supported distance measures: 'start' Method used to choose the initial cluster centroid positions, sometimes known as "seeds". Valid starting values are: 10

'replicates' Number of times to repeat the clustering, each with a new set of initial cluster centroid positions. kmeans returns the solution with the lowest value for sumd. You can supply 'replicates' implicitly by supplying a 3-dimensional array as the value for the 'start' parameter. 'maxiter' Maximum number of iterations. Default is 100. 11

'emptyaction' Action to take if a cluster loses all its member observations. Can be one of: 'display' Controls display of output. 'off : Display no output. 'iter : Display information about each iteration during minimization, including the iteration number, the optimization phase, the number of points moved, and the total sum of distances. 'final : Display a summary of each replication. 'notify : Display only warning and error messages. (default) 12

Example Dengan menggunakan data iris ( gunakan nilai fitur saja), buat kluster data dengan k = 3 >> iris = [5,1 3,5 1,4 0,2; 4,9 3 1,4 0,2; 4,7 3,2 1,3 0,2;...]; >> [idx,ctrs] = kmeans(iris,3); Exercise Buat kluster dengan menggunakan data nilai dengan k = 2 Kerjakan secara: - manual dengan excel (hitung jarak untuk setiap iterasi) - matlab Kumpul dalam format.xlsx 13

Exercise Subjek: NRP_LKP 10 Kirim ke: P1: deanimations@gmail.com P2: haryanto.toto@gmail.com 14