ANALISIS GEROMBOL CLUSTER ANALYSIS

dokumen-dokumen yang mirip
STK511 Analisis Statistika. Pertemuan 13 Peubah Ganda

ANALISIS PEUBAH GANDA ANALISIS GEROMBOL HAZMIRA YOZZA JURUSAN MATEMATIKA UNAND LOGO

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

BAB III K-MEDIANS CLUSTERING

Analisis Cluster terhadap Tingkat Pencemaran Udara pada Sektor Industri di Sumatera Selatan

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN

BAB II TINJAUAN PUSTAKA. penelitian ini, yaitu analisis peubah ganda, analisis gerombol (cluster analysis),

BAB II LANDASAN TEORI

Dosen, Institut Pertanian Bogor. Alumni Instiitut Pertanian Bogor

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

TINJAUAN PUSTAKA Analisis Gerombol

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

KAJIAN METODE BERBASIS MODEL PADA ANALISIS CLUSTER DENGAN PERANGKAT LUNAK MCLUST

3 PEWILAYAHAN CURAH HUJAN

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang

PENGELOMPOKKAN KABUPATEN DI PROVINSI BALI BERDASARKAN PERKEMBANGAN FASILITAS PARIWISATA

Clustering. Virginia Postrel

Jurnal EKSPONENSIAL Volume 7, Nomor 1, Mei 2016 ISSN

PENERAPAN ANALISIS GEROMBOL DAN TEKNIK VALIDASI PADA PENGGEROMBOLAN KLON TEH LEMMA FIRARI BOER

DSS untuk Menganalisis ph Kesuburan Tanah Menggunakan Metode Single Linkage

*Corresponding Author:

.: Analisis Gerombol - Bagian 2 :.

METODE PAUTAN TERBAIK DALAM PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN KOMPETENSI STATISTIKA SKRIPSI

UKDW BAB I PENDAHULUAN

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

Pengenalan Pola. K-Means Clustering

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE

InfinityJurnal Ilmiah Program Studi Matematika STKIP Siliwangi Bandung, Vol 3, No.2, September 2014

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

ANALISIS CLUSTER PADA DOKUMEN TEKS

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

BAB II TINJAUAN PUSTAKA

Pengenalan Pola. Klasterisasi Data

PERBANDINGAN KINERJA METODE COMPLETE LINKAGE, METODE AVERAGE LINKAGE, DAN METODE K-MEANS DALAM MENENTUKAN HASIL ANALISIS CLUSTER

JULIO ADISANTOSO - ILKOM IPB 1

PENGGEROMBOLAN DAN PEMETAAN KABUPATEN/KOTA DI PROVINSI JAWA BARAT BERDASARKAN NILAI UJIAN NASIONAL SMA DAN AKREDITASI SEKOLAH CHARLES E.

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

CLUSTER ENSEMBLE DALAM PENGGEROMBOLAN VARIETAS PADI

STATISTIKA: UKURAN LOKASI DATA. Tujuan Pembelajaran

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

DATA DAN METODE Sumber Data

TINJAUAN PUSTAKA. bebas digunakan jarak euclidean - sedangkan bila terdapat. korelasi antar peubah digunakan jarak mahalanobis - -

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering

UKDW BAB I PENDAHULUAN Latar Belakang

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan.

Pengelompokan Sekolah Dasar Di Siau berdasarkan Indikator Mutu Sekolah dengan Menggunakan Analisis Gerombol

PENGELOMPOKAN KUALITAS UDARA AMBIEN MENURUT KABUPATEN/KOTA DI JAWA TENGAH MENGGUNAKAN ANALISIS KLASTER

Algoritma Dasar. 4.1 Naive Bayes

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

PRAKTIKUM 3 ANALISA CLUSTER

PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR

SISTEM PENDUKUNG KEPUTUSAN MINAT PEMILIHAN JURUSAN SMA DENGAN METODE K-MEANS CLUSTER ANALYSIS

.: Analisis Gerombol - Bagian 1 :.

BAB III PEMBAHASAN. Analisis cluster merupakan analisis yang bertujuan untuk. mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang

Pengenalan Pola. Hierarchical Clustering

KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia

Analisis Komponen Utama (Principal component analysis)

TINJAUAN PUSTAKA. Gambar 1 Diagram kotak garis

HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN 1.1. Latar Belakang

PENERAPAN ANALISIS GEROMBOL DALAM PENGELOMPOKAN LENGKUAS MENURUT KANDUNGAN BIOAKTIF

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

ANALISIS PENGELOMPOKAN JUMLAH PENUMPANG BUS TRANS JOGJA MENGGUNAKAN METODE CLUSTERING K-MEANS DAN AGGLOMERATIVE HIERARCHICAL CLUSTERING (AHC)

PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN PERSENTASE RUMAH TANGGA MENURUT KUALITAS FISIK AIR MINUM DENGAN MENGGUNAKAN K-MEANS CLUSTER

ANALISIS CLUSTER PADA DOKUMEN TEKS

BAB III ANALISIS III.1 Analisis Konseptual Teknik Pengolahan Data

BAB IV METODE PENELITIAN

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

CLUSTER ENSEMBLE DALAM PENGGEROMBOLAN KABUPATEN/KOTA PROVINSI JAWA BARAT BERDASARKAN INDIKATOR PENDIDIKAN SMA/SMK/MA SITI NURAIDAH

BAB IV ANALISIS DAN PERANCANGAN

ALGORITMA NEAREST NEIGHBOR

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

BAB II TINJAUAN PUSTAKA

BAB II LANDASAN TEORI. 2.1 Uji Hipotesis

PENERAPAN ANALISIS GEROMBOL DATA TIDAK LENGKAP DENGAN ALGORITMA KHUSUS PADA DATA KESEJAHTERAAN RAKYAT PROVINSI ACEH RAHMAWATI EKA HANDAYANI

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

Analisis Cluster dengan Average Linkage Method dan Ward s Method untuk Data Responden Nasabah Asuransi Jiwa Unit Link

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS)

Transkripsi:

ANALISIS GEROMBOL CLUSTER ANALYSIS

Pendahuluan Tujuan dari analisis gerombol : Menggabungkan beberapa objek ke dalam kelompok-kelompok berdasarkan sifat kemiripan atau sifat ketidakmiripan antar objek Objek dalam kelompok lebih mirip dibandingkan dengan objek antar kelompok Ketakmiripan antar objek diukur dengan jarak tertentu jarak Euclid, dll

Hal yang perlu diperhatikan dalam membuat penggerombolan : Tujuan dari penggerombolan Kemiripan atau ketakmiripan seperti apa yang diharapkan berhubungan dengan pemilihan peubah Mengkuantifikasi ukuran kemiripan antar objek

Metode Penggerombolan Metode Grafik Metode Penggerombolan Berhirarki Metode Penggerombolan tak Berhirarki

Metode Grafik Plot Profil Plot Andrew Plot Andrew termodifikasi

Plot Profil Plot profil dari setiap pengamatan Pembakuan data sangat membantu Kelemahan : tidak efektif untuk data yang terlalu banyak pengamatan. Ilustrasi : Diperoleh hasil ujian untuk 7 mata ajaran yaitu Matematika, Fisika, Biologi, Sejarah Nasional, Pendidikan kewiraan, dan Kesenian. Ada 6 mahasiswa yang terlibat.

Tabel datanya sebagai berikut :

Plot Profilnya sebagai berikut 9 8 Nilai 7 6 5 Mat Fis Bio Sej Kew Sos Seni Mata Ajaran Andi Benny Budi Ika Maya Ana

Interpretasi ANDI dan MAYA mempunyai profil yang mirip, keduanya mempunyai kemampuan yang tinggi di bidang IPA BENNY, BUDI, dan ANNA, keduanya pencinta ilmu sosial IKA mempunyai kearekteristik sendiri

Plot Andrews Fungsi Andrews didefinisikan sebagai berikut : fx(t) = x1/ 2 + x2 sin(t) + x3 cos(t) +x4 sin(2t) + x5 cos(2t) +, untuk - t 40 30 20 10 0-10 -20-4 -3-2 -1 0 1 2 3 4 Andi Benny Budi Ika Maya

Plot Andrews Termodifikasi gx(t) = (1/ 2) { x1 + x2[sin(t) + cos(t) + x3[sin(t) cos(t)] + x4[sin(2t) + cos(2t)] + x5[sin(2t) cos(2t)] + }, untuk - t 35 25 15 5-5 -15-25 -4-3 -2-1 0 1 2 3 4 Andi Benny Budi Ika Maya

Ukuran Kemiripan dan Ketakmiripan Syarat jarak yang digunakan untuk mengukur ketakmiripan antar 2 objek a dan b, dinotasikan dengan d(a,b), : d(a, b) 0 d(a, a) = 0 d(a, b) = d(b, a) d(a, b) meningkat seiring semakin tidak mirip kedua objek a dan b d(a,c) d(a,b) + d(b,c) Asumsi : semua pengukuran bersifat numerik

Beberapa konsep jarak yang digunakan :

2. Metode Penggerombolan berhirarki 1. Metode aglomeratif 2. Metode berhirarki divisif (pemisahan) Beberapa ukuran ketakmiripan antar gerombol : Pautan Tunggal Pautan Lengkap Pautan Centroid Pautan Median Pautan Rataan

Lanjutan Pautan Tunggal (Single Linkage = Nearest Neighbor) Jarak antar dua gerombol diukur dengan jarak terdekat antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain. h(br, Bs) = min { d(xi, xj); xi anggota Br, dan xj anggota Bs }

Lanjutan Pautan Lengkap (Complete Linkage = Farthest Neighbor) Jarak antar dua gerombol diukur dengan jarak terjauh antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain. h(br, Bs) = max { d(xi, xj); xi anggota Br, dan xj anggota Bs }

Lanjutan Pautan Centroid (Centroid Linkage) Jarak antara dua buah gerombol diukur sebagai jarak Euclidean antara kedua rataan (centroid) gerombol. Jika x rdan x sadalah vektor rataan (centroid) dari gerombol Br dan Bs, maka jarak kedua gerombol tersebut didefinisikan sebagai : Centroid cluster yang baru didefinisikan sebagai : n x n x r n r r n s s s

Lanjutan Pautan Median (Median Linkage) Jarak antar gerombol didefinisikan sebagai jarak antar median, dan gerombol-gerombol dengan jarak terkecil akan digabungkan. Median untuk gerombol yang baru adalah Mbaru = m r m s 2

Lanjutan Pautan Rataan (Average Linkage) Jarak antara dua buah gerombol, Br dan Bs didefinisikan sebagai rataan dari n r n s jarak yang dihitung antara x i anggota Br dan x j anggota Bs

Ilustrasi : Dari ilustrasi sampel sebelumnya, digunakan konsep jarak Euclidian dan diperoleh matriks jarak sbb :

Dengan menggunakan konsep Single lingkage diperoleh hasil dalam bentuk dendogram sebagai berikut :

3. Metode Penggerombolan tak berhirarki Metode K rataan (k-means) Algoritmanya sbb : 1. Tentukan besarnya k, yaitu banyaknya gerombol, dan tentukan juga centroid di tiap gerombol. 2. Hitung jarak antara setiap objek dengan setiap centroid. 3. Hitung kembali rataan (centroid) untuk gerombol yang baru terbentuk. 4. Ulangi langkah 2 sampai tidak ada lagi pemindahan objek antar gerombol.

Ilustrasi Misalkan ada dua variabel X 1 dan X 2 yang tiap objeknya diberi nama A, B, C dan D. Datanya sebagai berikut:

Langkah yang dilakukan : 1. Dikelompokkan ke dalam 2 kelompok. Centroid dipilih secara acak : c 1 = (2, 2) dan c 2 = (-1, -2). 2. Jarak yang digunakan jarak Euclidian. Memasukkan objek ke gerombol berpatokan pada jarak terdekat Diperoleh matriks jarak sbb :

Lanjutan 3. Hitung centroid baru, rataan dari vektor masing-masing unsur. c 1 = (5, 3) c 2 = [(-1, 1) + (1, -2) + (-3, -2)]/3 = (-1, -1) Diperoleh matriks yang sbb : Diperoleh 2 gerombol : G 1 = {A} dan G 2 = {B, C, D}.