Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

dokumen-dokumen yang mirip
BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

BAB III DIVISIVE ANALISIS. Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

BAB II TINJAUAN PUSTAKA

PENGENALAN OBJEK PADA CITRA DIGITAL MENGGUNAKAN ALGORITMA HIERARCHICAL ALGOMERATIVE CLUSSTERING

Pengenalan Pola. Hierarchical Clustering

Pengelompokan Data dengan Metode...(Luh Joni Erawati Dewi)

ANALISIS GEROMBOL CLUSTER ANALYSIS

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang

DSS untuk Menganalisis ph Kesuburan Tanah Menggunakan Metode Single Linkage

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

Pengenalan Pola. Klasterisasi Data

UKDW BAB I PENDAHULUAN

Clustering. Virginia Postrel

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

BAB I PENDAHULUAN. 1.1 Latar Belakang

DAFTAR ISI. Latar Belakang Masalah... I.1. Rumusan Masalah... I.2. Maksud dan Tujuan Penelitian... I.2. Batasan Masalah... I.2

ALGORITMA ATURAN ASOSIASI APRIORI-TID DENGAN METODE KLASTERISASI HIERARKI AGLOMERATIF. Tri Khairul I.A 1 ABSTRAK

ANALISIS CLUSTER PADA DOKUMEN TEKS

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

DATA MINING DAN WAREHOUSE A N D R I

BAB III K-MEDIANS CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

Akademik Mahasiswa Fakultas Teknik Universitas Negeri Gorontalo (Mahasiswa Teknik Universitas Negeri Gorontalo) 2

ANALISIS KLASTERING LIRIK LAGU INDONESIA

Pendekatan Algoritma Divide and Conquer pada Hierarchical Clustering

InfinityJurnal Ilmiah Program Studi Matematika STKIP Siliwangi Bandung, Vol 3, No.2, September 2014

PENGELOMPOKAN KUALITAS UDARA AMBIEN MENURUT KABUPATEN/KOTA DI JAWA TENGAH MENGGUNAKAN ANALISIS KLASTER

PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN

STK511 Analisis Statistika. Pertemuan 13 Peubah Ganda

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

ANALISIS KLUSTER UNTUK DATABINARY DAN PENERAPANNYA PADA PEMILIHAN TIPE MOBIL. Zulaekhah Pratiwi 1 ABSTRACT

PENGELOMPOKKAN KABUPATEN DI PROVINSI BALI BERDASARKAN PERKEMBANGAN FASILITAS PARIWISATA

JULIO ADISANTOSO - ILKOM IPB 1

ANALISIS PEUBAH GANDA ANALISIS GEROMBOL HAZMIRA YOZZA JURUSAN MATEMATIKA UNAND LOGO

BAB 1 PENDAHULUAN Latar Belakang

Analisis Klaster untuk Pengelompokan Kemiskinan di Jawa Barat Berdasarkan Indeks Kemiskinan 2016

BAB II II.1 LANDASAN TEORI

KLASTERING DOKUMEN MENGGUNAKAN HIERARCHICAL AGGLOMERATIVE CLUSTERING

ANALISIS CLUSTER PADA DOKUMEN TEKS

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering

ANALISIS KARAKTERISTIK POLA BELANJA KELUARGA DENGAN ANALISIS KLASTER

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE

PENGENALAN WAJAH DENGAN MENERAPKAN ALGORITMA ADAPTIF K MEANS

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan.

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521

APLIKASI PENGGUNAAN METODE KOHONEN PADA ANALISIS CLUSTER (Studi Kasus: Pendapatan Asli Daerah Jawa Tengah Dalam Menghadapi Asean Community 2015)

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN

Analisis Cluster Studi Kasus: Kabupaten Jepara Jawa Tengah

MODUL 6 ANALISIS CLUSTER

STUDI KOMPARATIF PENERAPAN METODE HIERARCHICAL, K-MEANS DAN SELF ORGANIZING MAPS (SOM) CLUSTERING PADA BASIS DATA. Abstract

BAB IV PENGOLAHAN DATA

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

BAB 2 TINJAUAN PUSTAKA

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS)

BAB II TINJAUAN PUSTAKA

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

Dosen, Institut Pertanian Bogor. Alumni Instiitut Pertanian Bogor

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

ANALISIS KLASTER KECAMATAN DI KABUPATEN SEMARANG BERDASARKAN POTENSI DESA MENGGUNAKAN METODE WARD DAN SINGLE LINKAGE

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

PENERAPAN DATA MINING PADA PENJUALAN HARDISK UNTUK OPTIMALISASI DISTRIBUSI MENGGUNAKAN METODE CLUSTERING

Jurnal EKSPONENSIAL Volume 7, Nomor 1, Mei 2016 ISSN

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

GROUP TECHNOLOGY(GT)

Fuzzy Clustering. Logika Fuzzy

BAB I PENDAHULUAN Latar Belakang

PENGELOMPOKAN CITRA KUPU-KUPU MENGGUNAKAN ALGORITMA AGGLOMERATIVE HIERARCHICAL CLUSTERING

PENGELO MPOKAN KUALITAS UDARA AMBIEN MENURUT KABUPATEN/KOTA DI JAWA TENGAH MENGGUNAKAN ANALISIS KLASTER

BAB I PENDAHULUAN Latar Belakang

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

BAB II LANDASAN TEORI. 2.1 Pengertian Industri dan Teknik Industri. sebagai suatu lokasi atau tempat dimana aktivitas produksi akan

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE

IMPLEMENTASI HIERARCHICAL CLUSTERING DAN BRANCH AND BOUND PADA SIMULASI PENDISTRIBUSIAN PAKET POS

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya

Analisis Cluster Average Linkage Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Partitional clustering KLASTERING DENGAN METODE K-MEANS

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

BAB II LANDASAN TEORI. Teori teori yang digunakan sebagai landasan dalam desain dan. implementasi dari sistem ini adalah sebagai berikut :

BAB II TINJAUAN PUSTAKA

ANALISIS KELOMPOK METODE HIRARKI UNTUK PENGELOMPOKAN KOTA/KABUPATEN DI JAWA TIMUR BERDASARKAN INDIKATOR KETENAGAKERJAAN,,

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

Analisis Cluster dengan Average Linkage Method dan Ward s Method untuk Data Responden Nasabah Asuransi Jiwa Unit Link

Irlandia Ginanjar Staf Pengajar Jurusan Statistika FMIPA, Unpad Bandung.

Transkripsi:

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

berdasar gambar berdasar warna A A A A Q Q Q Q K K K K J J J J 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 10 10 10 10

A K Q J (a). Individual Cards A K Q J (b). Individual suits A K Q J (c). Black and red suits A K Q J (d). Major and minor suits (bridge) A K Q J A K Q J (f). Like face cards (e). Hearts plus queen of spades and other suits (hearts)

HIERARCHICAL CLUSTERING METHODS (Metode Pengklusteran berhierarki) Pengklasteran adalah pengelompokan objek/kasus (responden) menjadi kelompokkelompok yang lebih kecil, dimana setiap kelompok berisi objek yang mirip satu sama lain. Objek akan sangat berbeda ketika berasal dari kelompok yang berbeda Teknik pengklasteran hierarkis dilakukan dengan penggabungan secara berurutan (successive merger) atau pembagian secara berurutan (successive divisions) Metode aglomeratif hierarkis (agglomerative hierarchical methods), mulai dengan objek/kasus secara individual. Jadi mula-mula terdapat jumlah kluster sebanyak objek/kasus. Objek yang paling mirip (most similar) atau jaraknya paling dekat, yang pertama di kelompokan, dan kelompok yang awal ini digabung sesuai dengan kemiripan objek. Pada akhirnya, jika tingkat kemiripan menurun, semua kelompok-kelompok yang kecil (sub group) digabung/disatukan menjadi satu kluster. Metode hierarkis divisif (divisive hierarchical methods), bekerja dalam arah yang bertentangan. Suatu kelompok objek tunggal dibagi ke dalam dua kelompok yang lebih kecil (sub-groups), sehingga objek yang berada di kelompok yang satu sangat berbeda dengan objek yang berada di kelompok lainnya. Kelompok-kelompok yang kecil ini kemudian dibagi menjadi kelompok yang berbeda, proses akan berlanjut sampai diperoleh kelompok sebanyak objek yang ada, artinya sampai satu objek membentuk satu kelompok.

Hasil dari kedua metode aglomeratif dan devisif mungkin bisa disajikan dalam bentuk dendogram, sebagai suatu diagram dua dimensi. Pada uraian berikut pembahasan di fokuskan pada prosedure aglomeratif hierarkis dan khususnya metode pertalian (linkage methods), untuk mengelompokkan objek atau variabel. Pembahasan dimulai dengan pertalian tunggal (single linkage) yang diwakili jarak minimum atau tetangga terdekat (minimum distance or nearest neighbour), pertalian lengkap (complete linkage), yang diwakili jarak maksimum atau tetangga terjauh (maximum distance or farthest neighbour) dan pertalian rata-rata (average linkage or average distance). a). Single linkage, diperoleh ketika kelompok disatukan sesuai dengan jarak antara objek yang berdekatan. b). Complete linkage, terjadi kalau kelompok disatukan sesuai dengan jarak antara objek yang terjauh. c). Average linkage, diperoleh jika kelompok disatukan sesuai dengan rata-rata jarak antara pasangan objek didalam set masing-masing.

3 Single linkage 1 2 4 5 a). Jarak kluster 3 Complete linkage 1 2 4 5 b). Jarak kluster 3 Average linkage 1 2 4 5 c). Jarak kluster = rata-rata jarak =

Langkah-langkah pengklasteran aglomeratif hierarkis untuk mengelompokkan N objek/variabel 1. Mulai dengan N kluster, masing-masing kelompok memuat objek tunggal dan matriks simetri N x N berjarak 2. Selidiki jarak matriks untuk pasangan kelompok (paire of clusters) yang paling mirip atau paling dekat. Misalkan jarak antara kelompok yang paling mirip (most similar clusters) yaitu U dan V 3. Gabungkan kelompok atau cluster U dan V. Kluster ini disebut kluster (UV). Perbarui entry di dalam matriks jarak dengan : a. Menghapus/menghilangkan baris dan kolom, sesuai dengan kluster (kelompok) U dan V. b. Tambah satu baris dan kolom memberikan jarak antara klaster (UV) dan sisa klaster 4. Ulangi langkah (2 dan 3) sebanyak (N-1) kali. (Seluruh objek akan berada dalam 1 klaster/kelompok setelah algoritma selesai). Catat identitas klaster yang digabung dan tingkatan (levels=distances or similarities) pada mana penggabungan terjadi.

Pertalian Tunggal (Single Linkage) Masukan (input) bagi algoritma pertalian tunggal bisa merupakan jarak atau kemiripan (distances or similarities), antara pasangan objek. Kelompok/kluster di bentuk dari individu objek dengan jelas menggabungkan tetangga terdekat di mana tetangga terdekat diartikan jarak terdekat. Pada awalnya, harus ditemukan jarak terdekat dalam dan menggabungkan objek yang bersangkutan, misalnya U dan V, untuk mendapatkan kelompok atau kluster (UV). Untuk langkah (3) dari algoritma umum (lihat urutan 1 sampai dengan 4), jarak antara kluster (UV) dengan kluster W di hitung sebagai berikut, Dalam hal ini, angka yang ditunjukkan oleh dan merupakan jarak antara tetangga terdekat dari kluster (U dan W) dan kluster (V dan W) masing-masing Hasil berupa single linkage clustering dapat disajikan dalam bentuk suatu dendogram atau diagram pohon (tree diagram). Cabang-cabang pohon menunjukkan kluster/kelompok.

Contoh 1: Pengklusteran dengan Pertalian Tunggal (dari 5 objek). Sebagai suatu ilustrasi algoritma pertalian tunggal (the single linkage algorithm) diberikan data hipotesis tentang jarak (distance) antara 5 pasang objek sbb: Tampak bahwa jarak terpendek Maka objek 5 dan 3 digabung menjadi kluster (3 5) Untuk membentuk kluster berikutnya, perlu dicari jarak kluster (3 5) dengan objek sisanya yaitu 1, 2 dan 4 sbb

maka diperoleh suatu matriks jarak yang baru sebagai berikut Sekarang jarak terdekat adalah Sehingga kluster (3 5) digabung dengan kluster (1), diperoleh kluster baru (1 3 5). Untuk membentuk kluster berikutnya, perlu dicari jarak kluster (1 3 5) dengan objek sisanya yaitu 2 dan 4 sbb Diperoleh matriks jarak untuk pengklusteran berikutnya sebagai berikut

Sekarang jarak yang terdekat adalah kluster 4 dan 2. Sekarang bentuk kluster (24), yaitu jarak pasangan Pada saat ini sudah dipunyai dua kluster yang berbeda yaitu kluster (1 3 5) dan kluster (2 4). Jarak yang paling dekat (minimum) adalah Matriks jarak yang terakhir menjadi Konsekwensinya, kluster (135) dan (24) digabung untuk membentuk kluster tunggal dari semua objek, sebanyak 5 buah yaitu (1 2 3 4 5), ketika jarak terdekat dari dua kluster sebesar (6)

Gambar dendogram hasil pengklusteran hierarkis yang dilakukan secara bertahap. Kluster pertama (3 5) berjarak (2) Kluster kedua (1 3 5) berjarak (3) Kluster ketiga (24 ) berjarak (5) Kluster keempat (1 2 3 4 5) berjarak (6) (3) dan (5) berisi 2 objek (35) dan (1) berisi 3 objek (2) dan (4) berisi 2 objek (1 3 5) dan (2 4) berisi 5 objek 6 Distances 4 2 Single linkage dendrogram for distances between five objects 0 1 3 5 2 4 o b j e c t s

Complete Linkage (Pertalian Lengkap) Pertalian lengkap dilaksanakan sama seperti prosedure single linkage, dengan suatu kekecualian (exception). Pada setiap tahap, jarak (kemiripan) antara kluster ditentukan oleh jarak antara dua objek, satu dari setiap kluster yang paling jauh (most distant). Jadi pertalian lengkap menjamin bahwa semua objek dalam suatu kluster akan berada di dalam some maximum distance (or minimum similarity) satu sama lain Pengklasteran menggunakan Pertalian lengkap (Complete Linkage) Kembali pada matriks jarak pada contoh 1.

Langkah pertama, objek 3 dan 5 di gabung (mergred) karena keduanya paling mirip (most similar). Hal ini memberikan cluster (35). Langkah kedua, hitung jarak terjauh antara kluster (35) dengan objek sisa 1, 2 dan 4 Sehingga matriks jarak menjadi penggabungan selanjutnya (the most similar group) berjarak 5, yaitu objek 2 dan 4, menghasilkan kluster (24).

Langkah ketiga, hitung jarak terjauh antara kluster (24) dengan (35) dan 1 dan matriks jarak menjadi Penggabungan selanjutnya adalah kluster (124). Langkah terakhir, penggabungan kluster (35) dan (124) menjadi single cluster (12345) pada level Gambar dendrogram complete linkage diberikan sebagai berikut

12 10 Distances 8 6 4 2 0 1 2 4 3 5 o b j e c t s Complete linkage dendrogram for distances between five objects

10 8 Distances 6 4 2 0 E N Da Fr I Sp P Du G H Fi L a n g u a g e s Single linkage dendrogram for distances between numbers in 11 languages

10 8 Distances 6 4 2 0 E N Da G Fr L a n g u a g e s I Sp P Du H Fi Complete linkage dendrogram for distances between numbers in 11 languages

10 8 Distances 6 4 2 0 E N Da G Du Fr I Sp P H Fi L a n g u a g e s Average linkage dendrogram for distances between numbers in 11 languages