BAB I PENDAHULUAN. 1.1 Latar Belakang

dokumen-dokumen yang mirip
MODUL 6 ANALISIS CLUSTER

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan

Analisis Cluster Studi Kasus: Kabupaten Jepara Jawa Tengah

BAB IV PENGOLAHAN DATA

MODUL 1 UJI DATA ( 1 ) ANALISIS MISSING VALUE & OUTLIER

BAB 14 UJI DESKRIPTIF, VALIDITAS DAN NORMALITAS DATA

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering

BAB III METODE PENELITIAN

Memulai SPSS dan Mengelola File

MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER

MODUL 3 ANALISIS FAKTOR

BAB 8 ANALISIS STUDI DESKRIPTIF DAN DATA DASAR. Bab ini menjelaskan secara lebih mendalam jenis studi deskriptif

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

BAB IV PENGOLAHAN DATA

BAB IV DESKRIPSI DAN ANALISI DATA

MODUL 5 ANALISIS DISKRIMINAN

II. MENDESKRIPSIKAN DATA 13 Desember 2005

STATISTIKA DESKRIPTIF

Perhitungan Uji Keseragaman & Keseragaman Data Menggunakan Excel Nama. Dicatat Oleh: Waktu Penyelesaian (detik)

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu

BAB IV DESKRIPSI DAN ANALISIS DATA

SPSS FOR WINDOWS BASIC. By : Syafrizal

Lampiran 1. Data Eksperimen

STATISTIK DESKRIPTIF

Rancangan Percobaan dengan SPSS 13.0 (Untuk kalangan sendiri)

KORELASI. Alat hitung koefisien korelasi Pearson (data kuantitatif dan berskala rasio) Kendall, Spearman (data kualitatif dan berskala ordinal)

BELAJAR SPSS. Langkah pertama yang harus dilakukan adalah dengan cara menginstal terlebih dahulu software SPSS

BAB IV DESKRIPSI DAN ANALISIS DATA

STATISTIK DESKRIPTIF

BAB III METODOLOGI PENELITIAN. Definisi operasional yang dimaksud yaitu untuk menghindari kesalahan

BAB IV ANALISIS DAN PEMBAHASAN. 4.1 Analisis Data Laporan Keuangan PT Mayora Indah Tbk. Tabel. 4.1 Data Laporan Keuangan PT Mayora Indah Tbk.

BAB 3 PENGOLAHAN DATA

MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER

BAB 2 TINJAUAN PUSTAKA

BAB 10 ANALISIS REGRESI LINIER SEDERHANA

Kuisioner Jawablah pertanyaan dibawah ini dengan tanda X! Keterangan : Pertanyaan Kesetiaan Merek

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

PENGELOMPOKAN KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN KARAKTERISTIK KESEJAHTERAAN RAKYAT MENGGUNAKAN METODE WARD S

Nomor Case Penunjuk Sel Heading Variable Kotak-kotak Variabel

MODUL 2 UJI DATA NORMALITAS, HOMOSEDASTISITAS, & LINIERITAS

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

UJI NORMALITAS DATA DAN VARIANS. UNIVERSITAS MUHAMMADIYAH PAREPARE Parepare, 2009

Jika terdapat k variabel bebas, x dan Y merupakan variabel tergantung, maka diperoleh model linier dari regresi berganda seperti rumus [3.1]. [3.

Aplikasi di Bidang Politik

UJI NONPARAMETRIK. Gambar 6.1 Menjalankan Prosedur Nonparametrik

Mengolah Data Bidang Industri

Statistik Deskriptif untuk Data Nominal dan Ordinal

Analisis Diskriminan

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE

HIERARCHIAL CLUSTERING ANALYSIS DALAM PEMERATAAN PEMBANGUNAN INDONESIA

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

Dua sampel independen, tidak terikat, tidak

Lampiran 1 DAFTAR KUESIONER. Petunjuk Pengisian

ANALISIS BIVARIAT DATA KATEGORIK DAN NUMERIK Uji t dan ANOVA

Nama :... Jenis Kelamin :...

POLITEKNIK KESEHATAN SURAKARTA TAHUN

statistik deskriptif

Program Studi Pendidikan Ekonomi FE UNY

Crosstab dan Chi-Square: Analisis Hubungan Antarvariabel Kategorikal

BAB III METODE PENELITIAN. Metode penelitian yang digunakan dalam penyusunan skripsi ini adalah

LAPORAN PRAKTIKUM 8 & 9 STATISTIKA TENTANG UJI HIPOTESIS (Z OR T) DAN UJI RERATA (STUDENT T)

Langkah-Langkah Perhitungan Berikut diberikan data penjualan mobil Bima selama tahun 2000:

ANALISIS REGRESI DENGAN VARIABEL MODERATING

PENGENALAN APLIKASI STATISTICAL PRODUCT AND SERVICE SOLUTIONS (SPSS)

LAMPIRAN 1. Surat Keterangan Ijin Penelitian

Lampiran 1. Hasil Karakterisasi tiap OTU's

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB IV HASIL PENELITIAN. A. Deskripsi Data Penelitian ini dilakukan terhadap siswa di MAN se Kabupaten Blitar

BAB III PEMETAAN KUALITAS PENDIDIKAN

Lampiran 1. Kuesioner Self Efficacy (I) dan Persepsi Manajemen Perusahaan (II) Pendidikan terakhir : SMA / D3 / S1 / S2 / S3 / Lainnya,.

APLIKASI ANALISIS CLUSTER DALAM MENGELOMPOKKAN KECAMATAN BERDASARKAN FAKTOR PENYEBAB PENDUDUK BUTA AKSARA DI KABUPATEN JENEPONTO

BAB III PEMBAHASAN. Analisis cluster merupakan analisis yang bertujuan untuk. mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang

Program Studi Pendidikan Ekonomi FE UNY

MATERI PERTEMUAN KE 3 SABTU, 5 APRIL 2014 EXPLORER. Buka kembali contoh soal pada pertemuan kedua minggu kemarin sbb:

MODUL V REGRESI, KORELASI, ANALISIS VARIAN, VALIDITAS DAN RELIABILITAS

BAB 11 ANALISIS REGRESI LINIER BERGANDA

PAIRED-SAMPLES T TEST

Bagian 1. Angket Uji Coba Rekapitulasi Data Uji Coba Instrumen Uji Validitas dan Reliabilitas Instrumen

ANGKET PENELITIAN ANALISIS PENGARUH STRES KERJA DAN MOTIVASI TERHADAP KINERJA KARYAWAN PT. PANCA MENARA MITRA SKRIPSI. Fika Aditya Pradipta

MODUL 1 SAMPLE t-test

Prediksi Harga Saham dengan ARIMA

Program Studi Pendidikan Ekonomi FE UNY

BAB 3 PENGUMPULAN DAN PENGOLAHAN DATA

c. Tidak Setuju d. Sangat Tidak Setuju

Hampir Tidak Pernah (2) (1)

ANOVA (analisis varians), sering disebut juga dengan uji F, mempunyai tujuan yang sama dengan uji t, yakni: o

UJI VALIDITAS KUISIONER

2 Saya tidak mendapatkan jaminan apapun di SS S TS STS

Mendesain Tabel Statistik Secara Profesional

BAB IV HASIL PENELITIAN

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

Bhina Patria

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

ANALISIS DATA EKSPLORATIF MODUL 5 ANALISIS COMPARE MEANS

LAMPIRAN 1 KUESIONER PENELITIAN

BAB IV ANALISIS DATA. bebas dan variabel terikat, kemudian data tersebut di analisis dengan

LAMPIRAN KUESIONER PENELITIAN PENGARUH AKUNTABILITAS DAN TRANSPARANSI TERHADAP PENGELOLAAN ANGGARAN DI UNIVERSITAS BINA NUSANTARA

LAMPIRAN A SKALA KEMATANGAN EMOSI DAN PENYESUAIAN AKADEMIK

LATIHAN SPSS I. A. Entri Data

UJI PERSYARATAN ANALISIS DATA

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi. Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi set vaiabel secara empiris sebaliknya menggunakan setvariabel yang ditentukan oleh peneliti itu sendiri. Fokus dari analisis cluster adalah membandingkan objek berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan set variabel sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah suatu set variabel yang mempresentasikan karakteristik yang dipakai objek-objek. Bedanya dengan analisis faktor adalah bahwa analisis cluster terfokus pada pengelompokan objek sedangkan analisis faktor terfokus pada kelompok variabel. Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi yang berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi cluster secara keseluruhan bergantung pada variabel-variaabel yang digunakan sebagai dasar untuk menilai kesamaan. Penambahan atau pengurangan variabel-variabel yang relevan dapat mempengaruhi substansi hasi analisisi cluster. 1.2 Rumusan Masalah Analisis Cluster terbagi menjadi dua, yaitu analisis cluster hierarki dan analisis cluster Nonhierarki. Pada kesempatan ini kami akan membahas tentang analisis cluster hierarki. Langkah pengelompokan dalam analisis cluster mencakup 3 hal berikut : 1. Mengukur kesamaan jarak 2. Membentuk cluster secara hirarkis 1

3. Menentukan jumlah cluster. 1.3 Tujuan Tujuan dari Analisis Cluster adalah mengelompokkan obyek berdasarkan kesamaan karakteristik di antara obyek-obyek tersebut. Dengan demikian, ciri-ciri suatu cluster yang baik yaitu mepunyai : Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalam satu cluster. Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu dengan cluster yang lain. 1.4 Sistematika Penulisan BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Rumusan Masalah 1.3 Tujuan 1.4 Sistematika Penulisan BAB II TINJAUAN PUSTAKA BAB III METODOLOGI BAB IV ANALISIS DAN PEMBAHASAN BAB V PENUTUP 5.1 Kesimpulan 5.2 Saran 2

BAB II TINJAUAN PUSTAKA 2.1 Definisi Analisis Cluster Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi. Ada lima metode aglomerasi dalam pembentukan cluster, yatiu : a. Pautan Tunggal (Single Linkage) Metode ini didasarkan pada jarak minimum. Dimulai dengan dua objek yang dipisahkan dengan jarak paling pendek maka keduanya akan ditempatkan pada cluster pertama, dan seterusnya. Metode ini dikenal pula dengan nama pendekatan tetangga terdekat. b. Pautan Lengkap (Complete Linkage) Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak maksimum. Dalam metode ini seluruh objek dalam suatu cluster dikaitkan satu sama lain pada suatu jarak maksimuma atau dengan kesamaan minimum. c. Pautan Rata-rata (Average Linkage) Dasarnya adalah jarak rata-rata antar observasi. pengelompokan dimulai dari tengan atau pasangan observasi dengan jarak paling mendekati jarak rata-rata. d. Metode Ward (Ward s Method) Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat antara dua cluster untuk seluruh variabel. Metode ini cenderung digunakan untuk mengkombinasi cluster-cluster dengan jumlah kecil. e. Metode Centroid 3

Jarak antara dua cluster adalah jarak antar centroid cluster tersebut. Centroid cluster adalah nilai tengah observasi pada variabel dalam suatu set variabel cluster. Keuntungannya adalah outlier hanya sedikit berpengaruh jika dibandingkan dengan metode lain. 2.2 Definisi Analisis Cluster Hierarki Metode Hierarki memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan seterusnya hingga cluster akan membentuk semacam p o h o n dimana terdapat tingkatan (hierarki) yang jelas antar obyek, dari yang paling mirip hingga yang paling tidak mirip. Alat yang membantu untuk memperjelas proses hierarki ini disebut dendogram. 4

BAB III METODOLOGI Metode penelitian ini adalah library research (penelitian kepustakaan), yaitu penelitian yang dilaksanakn dengan menggunakan literatur (kepustakaan), baik berupa buku, catatan, maupun laporan, hasil penelitian dari penelitian terdahulu. Untuk menyelesaikan contoh kasus pada makalah ini, kami menggunakan metode Analisis Cluster Hierarki dengan software SPSS versi 20. 5

BAB IV ANALISIS DAN PEMBAHASAN 4.1 Contoh Kasus Dari penelitian yang dilakukan terhadap 12 kota, ingin diketahui pengelompokan kotakota tersebut berdasarkan instrumen 5 variabel yaitu : jumlah pendapatan kota (trilyun Rp) jumlah pinjaman pemerintah kota (milyar Rp) jumlah dana hibah yang dimiliki kota (milyar Rp) jumlah konsumsi pemerintah kota (milyar Rp) jumlah penduduk kota (juta jiwa). Untuk itu data yang berhasil dikumpulkan sebagai berikut: Kota Pendapatan Pinjaman Dana Hibah Konsumsi Penduduk A 55 5.6 9 50 25 B 61 8 7 62 41 C 58 3.9 7 60 32 D 67 5.5 7 64 51 E 71 5.7 6 70 42 F 76 7.6 8 80 29 G 81 8.7 9 80 57 H 56 7.1 6 86 29 I 84 7.6 7 82 46 J 88 6.5 8 86 52 K 84 6.8 9 88 61 L 90 8 9 90 66 4.2 Analisis dan Pembahasan Untuk menyelesaikan contoh kasus di atas dengan menggunakan aplikasi program SPSS, perlu dilakukan beberapa langkah berikut ini. Langkah 1 : Standardisasi / Transformasi Mengingat data yang terkumpul mempunyai variabilitas satuan, maka perlu dilakukan langkah standardisasi atau transformasi terhadap variabel yang relevan ke bentuk z-score, sebagai berikut : 6

1) Setelah keseluruhan data yang dikumpulkan tersebut diatas dientry dalam program SPSS, selanjutnya klik menu analyze dan pilih submenu Descriptives Statistics lalu Descriptives hingga muncul tampilan berikut ini : 2) Masukkan ke dalam kotak VARIABLES seluruh variable instrumen penilai, yaitu variabel jumlah pendapatan, jumlah pinjaman, jumlah dana hibah, jumlah konsumsi, dan jumlah penduduk. (dalam hal ini variabel kota tidak dimasukkan karena data bertipe string). Kemudian aktifkan bagian Save standardized values as variables. Abaikan bagian yang lain lalu tekan OK untuk menampilkan output aplikasi program SPSS. Output yang didapat yaitu deskripsi dari keseluruhan variabel yang meliputi nilai maksimum, nilai minimun, rataan, dan standar deviasi dari masing-masing variabel. Descriptive Statistics N Minimum Maximum Mean Std. Deviation Pendapatan 12 55.00 90.00 72.5833 12.96470 Pinjaman 12 3.90 8.70 6.7500 1.37080 Dana_Hibah 12 6.00 9.00 7.6667 1.15470 Konsumsi 12 50.00 90.00 74.8333 13.14142 Penduduk 12 25.00 66.00 44.2500 13.57220 Valid N (listwise) 12 Namun, deskripsi tersebut diatas digunakan sebagai dasar perhitungan z-score yang diperoleh. Selanjutnya buka tampilan data view dari tabel data. Hal yang akan dijumpai sebagai berikut : 7

Untuk selanjutnya, hasil z-score inilah yang akan dipakai dasar analisis cluster. Namun apabila data yang terkumpul tidak mempunyai variabilitas satuan, maka prose analisis cluster dapat langsung dilakukan tanpa terlebih dahulu melakukan transformasi atau standardisasi. Langkah 2 : Analisis Cluster Hierarki 1) Buka menu Analyze lalu pilih submenu Classify kemudian Hierarchical Cluste r hingga muncul tampilan seperti berikut ini : 8

2) Masukkan seluruh variabel yang telah distandardkan (Z-s c o r e ) ke dalam bagian Variable(s). Untuk bagian Label Cases by isi dengan variabel kota, sedangkan untuk bagian Cluster pilih Cases, pada bagian Display pilih keduanya yaitu Statistics dan Plots. 3) Kemudian klik mouse pada kotak Statistics hingga muncul tampilan berikut ini : Selain kotak Agglomeration Schedule, aktifkan pula kotak Proximity matrix untuk menampilkan jarak antar variable. Pada bagian Cluster Membership k l i k mouse pada pilihan Range of Solutions lalu ketik 2 pada Minimum number of Clusters dan 4 pada Maximum number of clusters (berarti nantinya akan ditampilhan susunan 2, 3, dan 4 cluster). Kemudian klik mouse pada kotak Continue untuk kembali pada menu utama. 4) Selanjutnya klik mouse pada kotak Plots hingga muncul tampilan seperti berikut ini : 9

Aktifkan pilihan Dendogram ; kemudian pada bagian Icicle pilih None. Abaikan bagian yang lain lalu tekan tombol Continue untuk kembali ke menu utama. 5) Berikutnya klik mouse pada kotak M e t h o d hingga muncul tampilan : Pada bagian Cluster Method pilih Between groups linkage. Kemudian buka kotak combo Square Euclidean distance pada Measure ; dan pada Transform Values buka kotak Standardize dan pilih Z-score. Abaikan bagian yang lain lalu tekan tombol Continue untuk kembali ke menu utama. Dari tampilan menu utama, tekan tombol OK untuk menampilkan output aplikasi program SPSS seperti berikut. Case Processing Summary a Cases Valid Missing Total N Percent N Percent N Percent 12 100.0 0.0 12 100.0 a. Average Linkage (Between Groups) Tabel output di atas menunjukkan bahwa semua data sejumlah 12 obyek telah diproses tanpa ada data yang hilang. 10

Proximity Matrix Cas e Squared Euclidean Distance 1:A 2:B 3:C 4:D 5:E 6:F 7:G 8:H 9:I 10:J 11:K 12:L 1:A.000 8.503 5.437 8.667 12.163 10.801 19.906 15.545 18.456 19.122 21.167 28.744 2:B 8.503.000 9.462 4.106 4.536 4.832 8.906 5.447 5.684 10.277 12.999 15.936 3:C 5.437 9.462.000 3.897 4.602 12.328 24.118 10.186 15.174 15.788 20.603 29.525 4:D 8.667 4.106 3.897.000 1.515 7.689 11.293 8.262 6.078 6.714 9.497 14.609 5:E 12.163 4.536 4.602 1.515.000 6.566 13.935 4.782 4.597 7.085 12.235 17.156 6:F 10.801 4.832 12.328 7.689 6.566.000 5.799 5.721 2.723 4.581 7.401 10.012 7:G 19.906 8.906 24.118 11.293 13.935 5.799.000 16.295 4.378 3.961 2.432 1.761 8:H 15.545 5.447 10.186 8.262 4.782 5.721 16.295.000 7.209 12.156 17.044 21.583 9:I 18.456 5.684 15.174 6.078 4.597 2.723 4.378 7.209.000 1.777 4.771 5.841 10:J 19.122 10.277 15.788 6.714 7.085 4.581 3.961 12.156 1.777.000 1.356 3.128 11: K 21.167 12.999 20.603 9.497 12.235 7.401 2.432 17.044 4.771 1.356.000 1.139 12:L 28.744 15.936 29.525 14.609 17.156 10.012 1.761 21.583 5.841 3.128 1.139.000 This is a dissimilarity matrix Tabel diatas menujukkan matrik jarak antara variabel satu dengan variabel yang lain. Semakin kecil jarak euclidean, maka semakin mirip kedua variabel tersebut sehingga akan membentuk kelompok (cluster). Agglomeration Schedule Stage Cluster Combined Coefficients Stage Cluster First Appears Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2 1 11 12 1.139 0 0 4 2 4 5 1.515 0 0 6 3 9 10 1.777 0 0 5 4 7 11 2.097 0 1 7 5 6 9 3.652 0 3 7 6 3 4 4.249 0 2 9 7 6 7 5.183 5 4 11 8 2 8 5.447 0 0 9 9 2 3 6.889 8 6 10 10 1 2 10.063 0 9 11 11 1 6 13.662 10 7 0 11

Tabel di atas merupakan hasil proses clustering dengan metode Between Group Linkage. Setelah jarak anatar varaiebl diukur dengan jarak euclidean, maka dilakukan pengelompokan, yang dilakukan secara bertingkat. Stage 1 : terbentuk 1 cluster yang beranggotakan Kota K dan Kota L dengan jarak 1,139 (perhatikan pada kolom Coefficients). Karena proses aglomerasi dimulai dari 2 obyek yang terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 12 obyek yang ada. Selanjutnya lihat kolom terakhir (Next Stage), terlihat angka 4. Hal ini berarti clustering selanjutnya dilakukan dengan melihat stage 4, dengan penjelasan berikut. Baris ke-4 (stage 4) terlihat obyek ke-7 (Kota G) membentuk cluster dengan Kota K. Dengan demikian, sekarang cluster terdiri dari 3 obyek yaitu Kota G, K, dan L. Sedangkan jarak sebesar 2,097 merupakan jarak rata-rata obyek terakhir yang bergabing dengan 2 obyek sebelumnya, seperti tampak dalam Proximity matrix dan dapat dihitung sebagai berikut : - Jarak Kota G dan K = 2,432 - Jarak Kota G dan L = 1,761 - Jarak rata-rata = (2,432 + 1,761) / 2 = 2,0965 Stage 2 : terjadi pembentukan cluster Kota D dan Kota E berjarak 1,515), yang kemudian berlanjut ke stage 6. Demikian seterusnya dari stage 3 dilanjutkan ke stage 5, sampai ke stage terakhir. Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya akan menyatukan semua obyek menjadi satu cluster. Hanya saja dalam prosesnya dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah cluster yang dibentuk. Perincian jumlah cluster dengan anggota yang terbentuk dapat dilihat pada tabel output berikut ini : Cluster Membership Case 4 Clusters 3 Clusters 2 Clusters 1:A 1 1 1 2:B 2 2 1 3:C 3 2 1 4:D 3 2 1 5:E 3 2 1 6:F 4 3 2 7:G 4 3 2 8:H 2 2 1 12

9:I 4 3 2 10:J 4 3 2 11:K 4 3 2 12:L 4 3 2 Dari tabel diatas dapat dijabarkan bahwa : - Apabila diinginkan dibentuk 4 cluster, maka : Anggota cluster 1 adalah Kota A Anggota cluster 2 adalah Kota B dan Kota H Anggota cluster 3 adalah C, D, dan E Anggota cluster 4 adalah Kota F, G, I, J, K,dan L. - Apabila ditentukan dibentuk 3 cluster, maka : Anggota cluster 1 adalah Kota A\Anggota cluster 2 adalah Kota B, C, D, E, dan H. Anggota cluster 3 adalah Kota F, G, I, J, K, dan L. - Apabila ditentukan dibentuk 2 cluster, maka :\ Anggota cluster 1 adalah Kota A, B, C, D, E, dan H Anggota cluster 2 adalah Kota F, G, I, J, K, dan L. 13

Dendogram berguna untuk menunjukkan anggota cluster yang ada jika akan ditentukan berapa cluster yang seharusnya dibentuk. Sebagai contoh yang terlihat dalam dendogram, apabila akan dibentuk 2 cluster, maka cluster 1 beranggotakan Kota K sampai dengan Kota F (sesuai urutan dalam dendogram); dan cluster2 beranggotakan Kota D sampai dengan Kota A. Demikian seterusnya dapat dengan mudah dilihat anggota tiap cluster sesuai jumlah cluster yang diinginkan. BAB V PENUTUP 14

5.1 Kesimpulan Tujuan dari Analisis Cluster adalah mengelompokkan obyek berdasarkan kesamaan karakteristik di antara obyek-obyek tersebut. Dengan demikian, ciri-ciri suatu cluster yang baik yaitu mepunyai : Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalam satu cluster. Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu dengan cluster yang lain. Analisis cluster terbagi menjadi dua, yaitu analisis cluster hierarki dan analisis cluster non hierarki. Metode Hierarki memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan seterusnya hingga cluster akan membentuk semacam p o h o n dimana terdapat tingkatan (hierarki) yang jelas antar obyek, dari yang paling mirip hingga yang paling tidak mirip. Alat yang membantu untuk memperjelas proses hierarki ini disebut dendogram. Sedangkan Metode Non-Hirarkis dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan dengan tanpa mengikuti proses hirarki. Metode ini biasa disebut K- Means Cluster. 5.2 Saran 15