PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE

dokumen-dokumen yang mirip
PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

Universitas Negeri Malang Kata Kunci: cluster, single linkage, complete linkage, silhouette, pembangunan manusia.

ANALISIS PERTUMBUHAN EKONOMI KOTA PONTIANAK DENGAN METODE LOCATION QUOTIENT, SHIFT SHARE DAN GRAVITASI

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

Analisis Klaster untuk Pengelompokan Kemiskinan di Jawa Barat Berdasarkan Indeks Kemiskinan 2016

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015

PERKEMBANGAN KEMISKINAN KABUPATEN BENGKAYANG MARET 2014 MARET 2016

BPS PROVINSI KALIMANTAN BARAT

BPS PROVINSI KALIMANTAN BARAT

BPS PROVINSI KALIMANTAN BARAT

BAB IV GAMBARAN UMUM DAN OBYEK PENELITIAN

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

BAB I PENDAHULUAN. pembantuan yang dilaksanakan secara bersama-sama. Dengan demikian penerapan

BAB I PENDAHULUAN. perbedaan karakteristik alam, ekonomi, sosial dan budaya. Wilayah-wilayah dengan

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

KEADAAN KETENAGAKERJAAN PROVINSI KALIMANTAN BARAT AGUSTUS 2017

ANALISIS FAKTOR PENANAMAN MODAL DALAM NEGERI, EKSPOR, DAN KONSUMSI PEMERINTAH TERHADAP PDRB KALIMANTAN BARAT DENGAN MODEL DATA PANEL INTISARI

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN I.1 Latar Belakang

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

PENGELOMPOKANKINERJA DOSEN JURUSAN MATEMATIKA FMIPAUNTAN BERDASARKANPENILAIAN MAHASISWA MENGGUNAKAN METODE WARD

Pertumbuhan Ekonomi Kabupaten Sekadau 2016

BERITA RESMI STATISTIK

Angka Kemiskinan Kabupaten Sekadau 2016

BAB I PENDAHULUAN. 7). Analisis ini dikelompokkan menjadi dua, yaitu analisis dependensi dan

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

*Corresponding Author:

II. PENDAHULUAN 1.1 Latar Belakang

KONDISI KETENAGAKERJAAN SEKADAU TAHUN 2015

Hasil Pendaftaran (Listing) Usaha/Perusahaan Sensus Ekonomi 2016

BADAN PUSAT STATISTIK PROVINSI KALIMANTAN BARAT

BAB V HASIL DAN PEMBAHASAN

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

Model Regresi Multivariat untuk Menentukan Tingkat Kesejahteraan Kabupaten dan Kota di Jawa Timur

INDEKS PEMBANGUNAN MANUSIA (IPM) SEKADAU TAHUN 2014

Fuzzy C-means Clustering menggunakan Cluster Center Displacement

METODE PARTIAL LEAST SQUARES UNTUK MENGATASI MULTIKOLINEARITAS PADA MODEL REGRESI LINEAR BERGANDA

KEADAAN KETENAGAKERJAAN SEKADAU TAHUN 2014

ANALISIS KELOMPOK DENGAN MENGGUNAKAN METODE HIERARKI UNTUK PENGELOMPOKAN KABUPATEN/KOTA DI JAWA TIMUR BERDASAR INDIKATOR KESEHATAN

ANALISIS KELOMPOK METODE HIRARKI UNTUK PENGELOMPOKAN KOTA/KABUPATEN DI JAWA TIMUR BERDASARKAN INDIKATOR KETENAGAKERJAAN,,

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak

Analisis Cluster Average Linkage Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur

KATA PENGANTAR. Kepala Pusat Data dan Informasi Kementerian Kesehatan. dr. Pattiselanno Roberth Johan, MARS NIP

Disampaikan Oleh : KEPALA BIDANG PERENCANAAN SOSIAL BUDAYA BADAN PERENCANAAN PEMBANGUNAN DAERAH PROV. KALIMANTAN BARAT

PROSIDING ISSN: M-14 ANALISIS K-MEANS CLUSTER UNTUK PENGELOMPOKAN KABUPATEN /KOTA DI JAWABARAT BERDASARKAN INDIKATOR MASYARAKAT

PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN PERSENTASE RUMAH TANGGA MENURUT KUALITAS FISIK AIR MINUM DENGAN MENGGUNAKAN K-MEANS CLUSTER

METODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER

HASIL SENSUS PERTANIAN 2013 PROVINSI KALIMANTAN BARAT (ANGKA SEMENTARA)

Tipologi Wilayah Provinsi Kalimantan Barat Hasil Pendataan Potensi Desa (Podes) 2014

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

4. GAMBARAN UMUM LOKASI PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

PROVINSI KALIMANTAN BARAT PERATURAN BUPATI MEMPAWAH NOMOR 47 TAHUN 2014

Analisis Cluster terhadap Tingkat Pencemaran Udara pada Sektor Industri di Sumatera Selatan

BAB III K-MEDIANS CLUSTERING

BAB II TINJAUAN PUSTAKA. penelitian ini, yaitu analisis peubah ganda, analisis gerombol (cluster analysis),

BAB 2 LANDASAN TEORI

Dinas KUKM Provinsi Kalimantan Barat Jl. Sutan Syahrir No. 5 Pontianak

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang

APLIKASI PENGGUNAAN METODE KOHONEN PADA ANALISIS CLUSTER (Studi Kasus: Pendapatan Asli Daerah Jawa Tengah Dalam Menghadapi Asean Community 2015)

ANALISIS DATA KEPENDUDUKAN DAN KB HASIL SUSENAS

RINCIAN FORMASI PENERIMAAN PEGAWAI NEGERI SIPIL ( PNS ) DEPARTEMEN AGAMA TAHUN ANGGARAN 2009 NOMOR : B.II/1-a/KP.00.3/ 963 /2009

SAMBUTAN KEPALA PERWAKILAN BPK RI PROVINSI KALIMANTAN BARAT PADA ACARA PENYERAHAN HASIL PEMANTAUAN TLHP DAN LHP SEMESTER II TAHUN 2011

LEMBAGA PENJAMINAN MUTU PENDIDIKAN (LPMP) PROVINSI KALIMANTAN BARAT BADAN PENGEMBANGAN SUMBER DAYA MANUSIA PENDIDIKAN DAN KEBUDAYAAN DAN PENJAMINAN

PERBANDINGAN METODE BOOTSTRAP DAN JACKKNIFE DALAM MENAKSIR PARAMETER REGRESI UNTUK MENGATASI MULTIKOLINEARITAS

Pemerintah Provinsi Kalimantan Barat. Dinas Perkebunan KEGIATAN PEMBANGUNAN PERKEBUNAN DI PROVINSI KALIMANTAN BARAT

BAB IV GAMBARAN UMUM WILAYAH

V. GAMBARAN UMUM WILAYAH PENELITIAN

APLIKASI ANALISIS KLASTER PADA DATA SIMULASI INDEKS GEOMAGNET LOKAL

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

III. METODE PENELITIAN

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan

BAHAN DAN METODE Kerangka Konsep Penelitian Variabel Penelitian Pelaku kebijakan

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu

BAB III METODE PENELITIAN. satu dari 14 Kabupaten/Kota yang berada di Provinsi Kalimantan Barat. Provinsi

GENERALIZED CROSS VALIDATION DALAM REGRESI SMOOTHING SPLINE

HASIL PENCACAHAN LENGKAP SENSUS PERTANIAN 2013 DAN SURVEI PENDAPATAN RUMAH TANGGA USAHA PERTANIAN 2013

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III PEMBAHASAN. Analisis cluster merupakan analisis yang bertujuan untuk. mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang

PENDEKATAN EKONOMETRIKA PANEL SPASIAL UNTUK PEMODELAN PRODUK DOMESTIK REGIONAL BRUTO DI KALIMANTAN BARAT

K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA. Susanti, Shantika Martha, Evy Sulistianingsih INTISARI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PERHITUNGAN NILAI EKSPEKTASI RETURN DAN RISIKO DARI PORTOFOLIO DENGAN MENGGUNAKAN MEAN - VARIANCE EFFICIENT PORTFOLIO

Tabel I.1. Luas dan Tingkat Kekritisan Lahan di Wilayah Kerja BPDAS Kapuas Tahun 2007

DATA MINING DAN WAREHOUSE A N D R I

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

ANALISIS KLASTER KECAMATAN DI KABUPATEN SEMARANG BERDASARKAN POTENSI DESA MENGGUNAKAN METODE WARD DAN SINGLE LINKAGE

METODE PAUTAN TERBAIK DALAM PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN KOMPETENSI STATISTIKA SKRIPSI

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. merupakan salah satu bidang dalam akuntansi sektor publik yang menjadi

METODOLOGI PENELITIAN

ALGORITMA GENETIKA PADA PEMROGRAMAN LINEAR DAN NONLINEAR

PANWAS KABUPATEN KOTA SE-KALIMANTAN BARAT PEMBENTUKAN CALON ANGGOTA PANWAS KECAMATAN PENGUMUMAN PENDAFTARAN CALON ANGGOTA PANWAS KECAMATAN

IMPLEMENTASI ALGORITMA C4.5 PADA VARIABEL-VARIABEL YANG MEMPENGARUHI STATUS GIZI BALITA DESA KUALA DUA KABUPATEN KUBU RAYA

Transkripsi:

Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster) Volume 05, No. 2 (2016), hal 97 102. PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE Nicolaus, Evy Sulistianingsih, Hendra Perdana INTISARI Metode median linkage merupakan salah satu metode cluster hirarki yang mengelompokkan objek berdasarkan nilai mediannya. Indeks validitas silhouette merupakan suatu ukuran statistik yang digunakan untuk menyelesaikan permasalahan penentuan jumlah cluster K optimal yang dapat memberikan representasi grafis singkat seberapa baik setiap objek terletak dalam cluster tersebut. Penentuan jumlah cluster optimal dilakukan dengan melihat nilai rata-rata maksimum dari silhouette S(i). Jumlah cluster K optimal merupakan estimasi dari harga yang paling memaksimumkan nilai rata-rata indeks validitas silhouette S(i). Penelitian ini bertujuan untuk menentukan jumlah cluster optimal dengan menggunakan indeks validitas silhouette. Data yang digunakan dalam penelitian ini adalah data sekunder yang dipublikasikan oleh Badan Pusat Statistik (BPS) Kalimantan Barat yang berupa Pendapatan Asli Daerah (PAD) Kabupaten/Kota di Kalimantan Barat tahun anggaran 2013 dengan empat variabel penelitian yaitu retribusi daerah, pajak daerah, hasil pengelolaan kekayaan derah yang dipisahkan dan lain-lain pendapatan asli daerah yang sah. Berdasarkan hasil uji validitas cluster dengan indeks validitas silhouette diperoleh bahwa jumlah cluster optimal K adalah 5 pada metode median linkage dengan nilai rata-rata indeks validitas silhouette S(i) adalah 0,078. Kata Kunci: Cluster, linkage, silhouette, PAD PENDAHULUAN Menurut UU No. 33 Tahun 2004 pendapatan Asli Daerah (PAD) merupakan pendapatan yang diperoleh daerah dan dipungut berdasarkan peraturan daerah sesuai dengan peraturan perundangundangan, yang meliputi dari pajak daerah, retribusi daerah, hasil pengelolaan kekayaan daerah yang dipisahkan dan lain-lain pendapatan asli daerah yang sah. Realisasi penerimaan pemerintah Kabupaten/Kota di Kalimantan Barat dari setiap tahun anggaran selalu mengalami peningkatan. Komponen penerimaan yang mengalami peningkatan tertinggi adalah komponen PAD. Badan Pusat Statistik (BPS) mencatat bahwa komponen PAD selalu mengalami peningkatan. Pada tahun anggaran 2010 sampai tahun anggaran 2012 PAD mengalami peningkatan mencapai 34,11%, kemudian pada tahun anggaran 2013 PAD mengalami peningkatan mencapai 15,71% [1]. Komponen penerimaan PAD Kabupaten/Kota di Kalimantan Barat ini melibatkan sejumlah sumber penerimaan. Sehingga, untuk mengetahui pengelompokan PAD dapat digunakan analisis cluster. Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek yang mirip kedalam satu cluster saling meniadakan [2]. Setiap unit pengamatan dalam satu cluster akan mempunyai ciri yang homogen sedangkan antara unit pengamatan cluster memiliki ciri yang heterogen. Secara umum, analisis cluster dibagi dalam dua metode yaitu metode non-hirarki mengelompokkan objek dengan menentukan bakal cluster terlebih dahulu dan banyaknya cluster sudah ditentukan sebelumnya. Sedangkan metode hirarki banyaknya cluster tidak ditentukan sebelumnya [3]. Metode median linkage merupakan metode hirarki yang mengelompokkan objek berdasarkan nilai median. Salah satu masalah dalam analisis cluster baik metode non-hirarki maupun metode hirarki adalah penentuan jumlah cluster optimal dalam cluster yang sudah di bentuk [4]. Oleh karena itu, dalam melakukan analisis cluster perlu dilakukan uji validitas cluster untuk mendapatkan jumlah cluster yang optimal, uji yang dapat di gunakan untuk adalah uji indeks validitas silhouette. Tujuan dari penelitian ini adalah untuk mengetahui jumlah 97

98 NICOLAUS, E. SULISTIANINGSIH, H. PERDANA cluster yang optimal pada metode median linkage dengan indeks validitas silhouette. Penelitian ini hanya membahas pengelompokan data PAD Kabupaten/Kota di Kalimantan Barat pada tahun 2013 dengan metode median linkage dan hanya menentukan jumlah cluster optimal pada metode median linkage dengan indeks validitas silhouette. Langkah-langkah dalam penelitian ini meliputi tahap pengumpulan data, input data. Sebelum dilakukan analisis cluster dengan metode median linkage terlebih dahulu dilakukan uji multikolinearitas. Apabila terjadi multikolinearitas maka dilakukan transformasi data dengan menggunakan Box-Cox. Transformasi variabel dengan Box-Cox dilakukan berdasarkan nilai parameter lambda. Setelah itu dilakukan pengecekan multikolinearitas kembali. Selanjutnya dilakukan standarisasi variabel serta dilakukan penghitungan jarak antar objek dengan eucludian distance, dilanjutkan analisis cluster dengan metode median linkage, setelah itu dilakukan validitas cluster dengan indeks validitas silhouette dan profilisasi cluster. Analisis Cluster Analisis cluster bertujuan untuk mengelompokkan objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama. Berbeda dengan analisis miltivariat yang lainnya analisis cluster tidak mengestimasi himpunan variabel secara empiris sebaliknya menggunakan himpunan variabel yang ditentukan untuk mengelompokkan objek. Himpunan variabel cluster adalah suatu himpunan variabel yang merepresentasikan karakteristik yang dipakai untuk mengelompokkan objek yang diteliti. Ciri-ciri analisis cluster adalah homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (Within-cluster) dan heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang lainnya (between cluster) [3]. Solusi analisis cluster bergantung pada variabel-variabel yang digunakan sebagai dasar untuk menilai kesamaan. Analisis cluster terbagi atas dua metode yaitu metode hirarki dan non-hirarki. Metode non-hirarki mengelompokan objek dengan menentukan bakal cluster terlebih dahulu dan banyaknya cluster sudah ditentukan sebelumnya. Sedangkan metode hirarki banyaknya cluster tidak ditentukan sebelumnya. Ukuran Jarak Ukuran jarak pada umumnya di terapkan pada data berskala metrik. Konsep ketidakmiripan pada analisis cluster berdasarkan pada ukuran jarak antar objek, dimana jarak yang besar menunjukan sedikit kesamaan dan jarak yang pendek atau kecil menunjukan bahwa suatu objek semakin mirip dengan objek yang lainnya [2]. Sesuai konsep analisis cluster yaitu mengelompokkan objek yang mempunyai kemiripan kedalam satu kelompok yang relatif homogen, maka dilakukan pengukuran kemiripan antar objek satu dengan objek yang lainnya [2]. Ukuran kesamaan atau kemiripan antar objek dalam analisis cluster merupakan ukuran korespondensi diantara dua objek. Jarak objek dengan objek dapat dinotasikan dengan. Berikut ini akan dijelaskan ukuran jarak yang digunakan dalam penelitian ini: Euclidean distance adalah akar dari jumlah kuadrat perbedaan atau deviasi di dalam nilai untuk setiap variabel [2]. Adapun formula euclidean distance sebagai berikut: (1) adalah euclidean distance antara objek ke- dengan objek ke-, adalah jumlah variabel, adalah nilai atau data dari objek ke- pada variabel ke- dan adalah nilai atau data dari objek kepada variabel ke-.

Penentuan Jumlah Cluster Optimal pada median linkage... 99 Metode Hirarki Metode hirarki mulai pengelompokan dengan dua atau lebih objek yang mempunyai kesamaa yang paling mirip. Kemudian pengelompokan dilanjutkan ke objek lainnya yang mempunyai jarak yang dekat dan demikian seterusnya hingga objek tergabung dalam cluster sehingga membentuk tingkatan (hirarki) yang jelas seperti pohon (dendogram). Langkah-langkah yang perlu dilakukan untuk melakukan analisis cluster dengan cara metode hirarki adalah sebagai berikut: 1. Kelompokan setiap objek ke dalam cluster sendiri. 2. Temukan pasangan paling mirip untuk dimasukkan ke dalam cluster yang sama dengan melihat data dalam matriks jarak. 3. Kelompokan kedua objek dalam satu cluster. 4. Ulangi tahap 2 dan 3 sampai tersisa hanya satu cluster. Metode-metode yang termasuk dalam metode hirarki adalah metode single linkage, complete linkage, centroid linkage, average linkage, median linkage dan ward s method [5]. Berikut ini akan dijelaskan metode median linkage yang digunakan dalam penelitian ini: Metode median linkage adalah metode clustering hirarki yang bersifat agglomeratif yang mengelompokkan objek berdasarkan nilai median. Metode median linkage digunakan untuk menghindari bobot vektor rata-rata sesuai dengan ukuran cluster. Pada metode ini dapat digunakan median (titik tengah) dari garis yang menghubungkan antara objek A dan B sebagai titik untuk menghitung jarak baru untuk cluster yang lain sebagai berikut: (2) * + Kedua objek dengan jarak terdekat antara median digabung pada tiap langkah. Beberapa tahap untuk prosedur metode median linkage, dijelaskan sebagai berikut: 1. Menentukan matriks euclidean distance misalkan jarak objek A dan objek B dimana adalah jarak antara objek A dan objek B. 2. Menentukan nilai median pertama dengan melihat jarak terdekat, misalnya jarak terdekat antara objek A dan objek B dari matriks euclidean distance. Artinya objek A dan objek B merupakan objek-objek yang pertama tergabung dalam satu kelompok. 3. Setelah mendapatkan jarak terdekat, kemudian dicari jarak dengan objek yang lainnya berdasarkan persamaan berikut ini: dengan adalah jarak cluster AB dengan objek ke-, adalah objek yang lainnya dan adalah jarak nilai median. Indeks Validitas Silhouette Indeks validitas silhouette merupakan suatu ukuran statistik yang digunakan untuk menyeleksi permasalahan penentuan jumlah cluster optimal yang dapat merepresentasikan grafis singkat seberapa baik setiap objek terletak dalam cluster [6]. Asumsikan data sudah dikelompokan ke dalam cluster. Untuk setiap objek, misalkan adalah rata-rata jarak objek ke semua objek dalam cluster yang sama dan adalah rata-rata jarak minimum objek ke semua objek pada suatu cluster dimana bukan anggota cluster [7]. Dari penjelasan yang telah dipaparkan indeks validitas silhouette dapat ditulis dengan persamaan sebagai berikut: * + (3)

100 NICOLAUS, E. SULISTIANINGSIH, H. PERDANA Persamaan indeks validitas silhouette dapat ditulis sebagai berikut: { Rata-rata dari seluruh objek dalam suatu cluster menunjukkan seberapa dekat kemiripan objek dalam suatu cluster yang juga menunjukkan seberapa tepat objek telah dikelompokan. Semakin dekat kepada 1, maka semakin baik pengelompokan objek. Sebaliknya, semakin dekat kepada -1, maka semakin buruk pengelompokan objek. Jumlah cluster yang optimal merupakan estimasi dari harga yang paling memaksimalkan nilai rata-rata dan jika terdapat satu cluster yang anggotanya terdiri dari satu objek maka nilai rata-rata adalah 0 [6]. HASIL DAN PEMBAHASAN Berdasarkan hasil penelitian ini diperoleh jumlah cluster optimal untuk metode median linkage berdasarkan uji validitas cluster dengan indeks validitas silhouette di sajikan pada Tabel 1 sebagai berikut: Tabel 1 Jumlah cluster dan nilai indeks validitas silhouette No Jumlah Cluster Hasil Silhouette 1 2-0,090 2 3-0,077 3 4-0,059 4 5 0,078 5 6 0,070 Berdasarkan Tabel 1 dapat dilihat bahwa hasil validitas cluster dengan indeks validitas silhouette apabila jumlah cluster dibentuk sama dengan 2, 3 dan 4 cluster hasil rata-rata benilai negatif artinya struktur cluster yang dihasilkan overlapping, sehingga objek ke- lebih tepat dimasukan ke dalam cluster yang lain. Sedangkan, ketika jumlah cluster dibentuk sama dengan 5 dan 6 cluster hasil rata-rata bernilai positif artinya objek ke- sudah berada dalam cluster yang tepat. Tetapi pada saat jumlah cluster nilai validitas cluster dengan indeks validitas silhouette menurun. Sehingga dapat disimpulkan bahwa jumlah cluster yang optimal pada metode median linkage adalah dengan nilai indeks validitas silhouette adalah 0,078. Pengelompokan PAD Kabupaten/Kota di Kalimantan Barat tahun anggaran 2013 dengan metode median linkage berdasarkan jumlah cluster yang optimal. Hasil pengelompokan ini disajikan dalam bentuk dendogram yang dapat dilihat pada Gambar 1 sebagai berikut:

Penentuan Jumlah Cluster Optimal pada median linkage... 101 Gambar 1. Dendogram Metode Median Linkage Adapun rata-rata sumber penerimaan PAD Kabupaten/Kota Provinsi Kalimantan Barat tahun anggaran 2013 antar cluster disajikan pada Tabel 2 sebagai berikut: Tabel 2 Nilai Rata-rata Sumber Pendapatan Asli Daerah Tahun 2013 antar cluster dalam juta rupiah Cluster Pajak Daerah Retribusi Daerah Hasil pengelolaan kekayaan daerah yang dipisahkan Lain-lain PAD yang sah 1 39,486 7,777 3,623 30,891 2 14,134 12,494 2,668 7,668 3 2,570 0,611 1,344 6,498 4 48,514 11,576 0,117 4,021 5 179,655 53,412 8,554 23,650 Berdasarkan Gambar 1 dapat dilihat bahwa Kabupaten/Kota yang memiliki kemiripan satu dengan yang lainnya ada. Cluster pertama terdiri dari 3 Kabupaten, cluster kedua terdiri dari 7 Kabupaten dan 1 Kota, cluster ketiga dan keempat terdiri 1 Kabupaten dan cluster kelima terdiri dari 1 Kota. Berdasarkan hasil pengelompokan PAD tahun anggaran 2013 dengan metode median linkage dapat diketahui Kabupaten/Kota masuk kedalam cluster yang memiliki kategori PAD rendah maupun kategori PAD tinggi. Daerah yang masuk dalam kategori PAD rendah dapat dinamakan sebagai daerah dengan tingkat kesadaran masyarakat akan pajak sangat rendah serta rendahnya minat masyarakat untuk memanfaatkan fasilitas dan layanan yang disediakan oleh pemerintah pusat maupun pemerintah daerah setempat. Kabupaten/Kota yang termasuk kedalam anggota cluster ketiga merupakan daerah yang memiliki sumber penerimaan PAD rendah pada pajak daerah dan retribusi daerah. Pemerintah perlu memberi perhatian khusus pada daerah tersebut karena menurut UU No.29 Tahun 2009, pajak daerah dan retribusi daerah merupakan salah satu sumber PAD yang utama dan sangat penting bagi pemerintah daerah.

102 NICOLAUS, E. SULISTIANINGSIH, H. PERDANA PENUTUP Berdasarkan hasil penelitian ini dapat disimpulkan bahwa jumlah cluster optimal untuk metode median linkage berdasarkan uji validitas cluster dengan indeks validitas silhouette adalah 5 cluster dengan nilai rata-rata indeks validitas silhouette adalah. Cluster pertama terdiri dari tiga Kabupaten yaitu Sambas, Sintang dan Ketapang. Cluster kedua terdiri dari tujuh Kabupaten yaitu Bengkayang, Landak, Kapuas Hulu, Melawi, Mempawah, Sanggau, Sekadau dan satu Kota yaitu Kota singkawang. Cluster ketiga terdiri dari satu Kabupaten yaitu Kayong Utara. Cluster keempat terdiri dari satu Kabupaten Kubu Raya dan cluster kelima dengan anggota satu Kota yaitu Kota Pontianak DAFTAR PUSTAKA [1] Badan Pusat Statistik (BPS). Kalimantan Barat dalam angka. Pontianak: Kantor Badan Pusat Statistik Kalimantan Barat; 2014 [2] Supranto J. Analisis Multivariat: Arti dan Interprestasi. Jakarta: Rineka Cipta; 2010 [3] Situpu B, Irmeilyana, Gultom B. Analisis Cluster terhadap Tingkat Pencemaran Udara pada Sektor Industri di Sumatera Selatan. Jurnal penelitian sains. 2011; 14 : 11-17. [4] Indriani NY, Abadyo. Perbandingan Jumlah Kelompok Optimal Pada Metode Single Linkage dan Complete Linkage dengan Indeks Validitas Silhouette. Artikel Ilmiah. 2013; 1 : 1-7. [5] Rencher AC. Methods of Multivariate Analysis Second Edition. New York: Johan Wiley & Sons. Inc; 2002. [6] Rousseeuew PJ. Silhouettes: A Graphical Aid To The Interpretation And Validation Of Cluster Analysis. Journal of computational and Applied Mathematics. 1987; 20: 53-65. [7] Gama NS. Clustering Portal Jurnal Internasional Untuk Rekomendasi Publikasi Berdasarkan Kualitas Cluster Menggunakan Kernel K-Means. Repositori Jurnal Mahasiswa PTIIK UB. 2014; 5: 1-11. NICOLAUS EVY SULISTIANINGSIH HENDRA PERDANA : F-MIPA UNTAN, Pontianak, nicolausnico56@gmail.com : F-MIPA UNTAN, Pontianak, evysulistianingsih@math.untan. ac.id : F-MIPA UNTAN, Pontianak, hendra.perdana@math.untan.ac.id