PENGGEROMBOLAN DAERAH DI INDONESIA DENGAN K-MEDOID DAN CLARA (Studi Kasus Peubah Indeks Pembangunan Manusia Tahun 2015) RIZKY AMALIA FIRDA

dokumen-dokumen yang mirip
SKRIPSI. Disusun Oleh: SARITA BUDIYANI PURNAMASARI NIM

PERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER

PENGGEROMBOLAN DAERAH DI INDONESIA BERDASARKAN PEUBAH IPM DENGAN FUZZY K-RATAAN DAN K-MEDOID MIA SYAFRINA

BAB I PENDAHULUAN. 1.1 Latar Belakang

INDEKS PEMBANGUNAN MANUSIA PAPUA TAHUN 2016

INDEKS PEMBANGUNAN MANUSIA (IPM) PROVINSI PAPUA 2015

LAPORAN SKRIPSI ALGORITMA K-MEANS UNTUK PENGELOMPOKAN KABUPATEN/KOTA DI INDONESIA BERDASARKAN INDIKATOR INDEKS PEMBANGUNAN MANUSIA.

Indeks Pembangunan Manusia (IPM) Tahun 2015 di Kabupaten Asmat

ANALISIS HASIL INDIKATOR PEMBANGUNAN MANUSIA KOTA JAKARTA SELATAN 2014

BAB I PENDAHULUAN. membutuhkan pembangunan. Pembangunan pada dasarnya adalah suatu proses

ANALISIS KERAGAMAN GENETIK KELAPA SAWIT (Elaeis guineensis Jacq) ASAL JAWA BARAT DENGAN PENANDA RAPD (Random Amplified Polymorphic DNA)

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

ANALISIS BIPLOT UNTUK MEMETAKAN MUTU SEKOLAH YANG SESUAI DENGAN NILAI UJIAN NASIONAL SUJITA

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang

PENDUGAAN PENGELUARAN PER KAPITA DI KABUPATEN BREBES

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015

PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI


PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN PERSENTASE RUMAH TANGGA MENURUT KUALITAS FISIK AIR MINUM DENGAN MENGGUNAKAN K-MEANS CLUSTER

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015

REGRESI KEKAR SIMPANGAN MUTLAK TERKECIL DENGAN MODIFIKASI SIMPLEKS MUHAMMAD YUSUF DWIHARJANGGI

BAB III PEMBAHASAN. Pada bab ini akan dijelaskan mengenai model regresi robust dengan

SKRIPSI. Disusun Oleh : RAHMA NURFIANI PRADITA

INDEKS PEMBANGUNAN MANUSIA

HASIL DAN PEMBAHASAN

INDEKS PEMBANGUNAN MANUSIA (IPM) SEKADAU TAHUN 2014

Indeks Pembangunan Manusia (IPM) Maluku Utara Tahun 2016

Menakar Kinerja Kota Kota DiIndonesia

METODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE

BAB II JAWA BARAT DALAM KONSTELASI NASIONAL

ANALISIS FAKTOR FAKTOR YANG MEMPENGARUHI INDEKS PEMBANGUNAN MANUSIA (Studi pada Enam Kota di Provinsi Jawa Tengah Tahun )

ANALISIS DAMPAK REALISASI APBD TERHADAP PENINGKATAN INDEKS PEMBANGUNAN MANUSIA DI KOTA BINJAI SKRIPSI. Diajukan oleh :

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

ANALISIS MODEL PELUANG BERTAHAN HIDUP DAN APLIKASINYA SUNARTI FAJARIYAH

INDEKS PEMBANGUNAN MANUSIA (IPM) KABUPATEN PESISIR SELATAN 2016

MODEL PENDUGA VOLUME POHON MAHONI DAUN BESAR (Swietenia macrophylla, King) DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, JAWA BARAT WAHYU NAZRI YANDI

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

ANALISIS KUALITAS PERTUMBUHAN EKONOMI PROVINSI MALUKU UTARA TAHUN OLEH ACHMAD SOBARI H

INDEKS PEMBANGUNAN MANUSIA 2016

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016 PROVINSI KEPULAUAN RIAU SEBESAR 73,99

PERBANDINGAN UNIT CONTOH LINGKARAN DAN UNIT CONTOH N-JUMLAH POHON DALAM PENDUGAAN SIMPANAN KARBON DITO SEPTIADI MARONI SITEPU

PEMBANGUNAN MANUSIA BERBASIS GENDER TAHUN 2015

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015

PERANCANGAN PERANGKAT LUNAK SEGMENTASI CITRA DENGAN MENGGUNAKAN METODE FUZZY CLUSTERING SKRIPSI MUHAMMAD PRAYUDHA

BERITA RESMI STATISTIK BPS PROVINSI JAWA TIMUR

INDEKS PEMBANGUNAN MANUSIA (IPM) BANTEN TAHUN 2015

INDEKS PEMBANGUNAN MANUSIA (IPM) KOTA PROBOLINGGO TAHUN 2016

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)


INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

HASIL DAN PEMBAHASAN Simulasi Kinerja Metode Kondisi Shift Outlier

INDEKS PEMBANGUNAN MANUSIA (IPM) DKI JAKARTA TAHUN 2016 TERUS MENINGKAT

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

ANALISIS KETIMPANGAN DISTRIBUSI PENDAPATAN DI SULAWESI (TAHUN )

BAB I PENDAHULUAN. yang penting dilakukan suatu Negara untuk tujuan menghasilkan sumber daya

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 4, Tahun 2015, Halaman Online di:

PENGELOMPOKKAN KABUPATEN DI PROVINSI BALI BERDASARKAN PERKEMBANGAN FASILITAS PARIWISATA

HASIL DAN PEMBAHASAN. dengan hipotesis nolnya adalah antar peubah saling bebas. Statistik ujinya dihitung dengan persamaan berikut:

KARTIKA HITASARI NIM : JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

INDEKS PEMBANGUNAN MANUSIA (IPM) BANTEN TAHUN 2016

ANALISIS PERMINTAAN DAN PENAWARAN DOMESTIK DAGING SAPI INDONESIA SKRIPSI ADITYA HADIWIJOYO

SKRIPSI. Disusun Oleh: Ana Kartikawati NIM. J2E009024

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

PERSAMAAN PENDUGA VOLUME POHON PINUS DAN AGATHIS DI HUTAN PENDIDIKAN GUNUNG WALAT WIWID ARIF PAMBUDI

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2015 PROVINSI KEPULAUAN RIAU SEBESAR 73,75

PENERAPAN DAN PERBANDINGAN CARA PENGUKURAN RESPON PADA ANALISIS KONJOIN

INDEKS PEMBANGUNAN MANUSIA (IPM) PROVINSI GORONTALO 2015

Analisis Klaster Kecamatan di Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage

ANALISIS REGRESI TERPOTONG BEBERAPA NILAI AMATAN NURHAFNI

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN KELOMPOK BAHAN MAKANAN DI JAWA TENGAH

PENGARUH KARAKTERISTIK DAERAH TERHADAP PENGUNGKAPAN SUKARELA DALAM WEBSITE PEMDA DI INDONESIA. (Studi Empiris pada Kabupaten/Kota di Indonesia)

PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI

BAB I PENDAHULUAN Latar Belakang

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016 PROVINSI RIAU SEBESAR 71,20

ANALISIS PENGARUH GINI RATIO, INDEKS PEMBANGUNAN MANUSIA (IPM), DAN JUMLAH PENDUDUK TERHADAP TINGKAT KEMISKINAN DI PROVINSI JAWA BARAT TAHUN

KAJIAN METODE ROBUST LEAST TRIMMED SQUARE (LTS) DALAM MENGESTIMASI PARAMETER REGRESI LINEAR BERGANDA UNTUK DATA YANG MENGANDUNG PENCILAN SKRIPSI

BPS KABUPATEN EMPAT LAWANG. Pembangunan manusia didefinisikan sebagai proses perluasan pilihan bagi penduduk

I. PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Pendekatan pembangunan manusia telah menjadi tolak ukur pembangunan. pembangunan, yaitu United Nations Development Programme (UNDP)

ANALISIS CLUSTER PADA DOKUMEN TEKS

KAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI. Oleh : SITI NURBAITI G

PERBANDINGAN METODE INTERPOLASI ABRIDGED LIFE TABLE

ANALISIS VOLATILITAS HARGA BUAH-BUAHAN INDONESIA (KASUS PASAR INDUK KRAMAT JATI JAKARTA) OLEH BAYU SASONO AJI H

ANALISIS KELAYAKAN PEMBERIAN BEASISWA DI POLITEKNIK NEGERI BATAM DENGAN METODE CLUSTERING

INDEKS PEMBANGUNAN MANUSIA (IPM) TAHUN 2016

ANALISIS CLUSTER PADA DOKUMEN TEKS

INDEKS PEMBANGUNAN MANUSIA (IPM) D.I. Yogyakarta TAHUN 2016 TERUS MENINGKAT

INDEKS PEMBANGUNAN MANUSIA (IPM) METODE BARU

INDEKS PEMBANGUNAN MANUSIA (IPM) JAWA TIMUR TAHUN 2015

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

PENGARUH BAHAN BAKAR, NILAI INPUT, TENAGA KERJA DAN OUTPUT TERHADAP NILAI TAMBAH INDUSTRI

Transkripsi:

PENGGEROMBOLAN DAERAH DI INDONESIA DENGAN K-MEDOID DAN CLARA (Studi Kasus Peubah Indeks Pembangunan Manusia Tahun 2015) RIZKY AMALIA FIRDA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2017

PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi Penggerombolan Daerah di Indonesia dengan -Medoid dan CLARA (Studi Kasus Peubah Indeks Pembangunan Manusia Tahun 2015) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Oktober 2017 Rizky Amalia Firda NIM G14130089

ABSTRAK RIZKY AMALIA FIRDA. Penggerombolan Daerah di Indonesia dengan - Medoid dan CLARA (Studi Kasus Peubah Indeks Pembangunan Manusia Tahun 2015). Dibimbing oleh CICI SUHAENI dan UTAMI DYAH SYAFITRI. Analisis gerombol digunakan untuk mengelompokkan objek-objek dengan kesamaan karakteristik yang tinggi dalam satu gerombol sementara objek-objek dengan ketidaksamaan karakteristik berada dalam gerombol yang berbeda. Analisis gerombol terbagi menjadi metode hierarkhi dan metode tidak berhierarkhi. Metode hierarkhi menggunakan struktur seperti pohon pada keputusan penggerombolan objeknya. Metode tidak berhierarkhi menempatkan objek-objek ke pusat gerombol terdekat saat banyaknya gerombol sudah ditentukan. Pusat gerombol terbagi menjadi rataan dan median. Kelemahan dari pusat gerombol rataan yaitu tidak kekar terhadap adanya pencilan. Hal tersebut berbeda dengan pusat gerombol median -medoid yang kekar terhadap pencilan. Permasalahan data yang besar juga menjadi perhatian dalam penelitian ini, maka digunakanlah CLARA sebagai pengembangan dari metode -medoid. Penelitian ini menerapkan metode -medoid dan CLARA untuk menggerombolkan kabupaten/kota di Indonesia berdasarkan indikator penyusun IPM tahun 2015. IPM dikategorikan menjadi empat kategori. CLARA dibangun dari gerombol yang dihasilkan oleh metode -medoid dengan banyaknya gerombol terbaik (dua gerombol) dan empat gerombol. Cara ini digunakan untuk mengetahui keefektivan metode CLARA yang dibandingkan dengan penggerombolan berdasar nilai IPM. Tingkat kemiripan antara hasil dari metode pengkategorian berdasarkan nilai IPM dan metode CLARA adalah 41.44%, sedangkan dengan metode -medoid adalah 39.30%. Metode -medoid dan CLARA mempunyai kriteria penggerombolan yang lebih jelas jika dilihat pada masing-masing indikatornya sehingga dapat dijadikan sebagai alternatif memetakan kabupaten/kota di Indonesia berdasar indikator penyusun IPM. Kata kunci: analisis gerombol, CLARA, IPM, -medoid

ABSTRACT RIZKY AMALIA FIRDA. Clustering of Indonesia s Regions by -Medoid and CLARA (Applying in Variable of Human Development Index Year 2015). Supervised by CICI SUHAENI dan UTAMI DYAH SYAFITRI. Cluster analysis is grouping objects by high similarity of characteristic in a cluster but high dissimilarity in another cluster. Cluster analysis is divided into hierarchical method and non hierarchical method. Hierarchical method use structur tree-like to determine its object in a cluster. The objects are placed to a similar centroid while cluster seed was determined in non-hierarchical method. The types of centroid are mean centroid and median centroid (known as medoid). The disadvantage of mean is not robust from outlier. Otherwise, -medoid is robust with outlier data. Big data problem is concerned, so CLARA is used to be a development from -medoid method. -medoid and CLARA is applicated in this paper to clustering regions of Indonesia based on the indicator of HDI year 2015. HDI was categorized into four levels, hence CLARA was build from a cluster which resulted from -medoid for two and four clusters. This strategy was used to know the effectiveness of CLARA method and -medoid method compared to categorize the HDI value. The results show that the city/regency which belongs to the same groups of CLARA and HDI group were 41.44%. In addition, the similarity between -medoid and HDI group was 39.3%. Furthermore, the characteristic of each group of CLARA method and k-medoid were more clear than the HDI groups, hence would be an alternative to map the regions of Indonesia based on HDI indicators. Key words: CLARA, cluster analysis, HDI, -medoid

PENGGEROMBOLAN DAERAH DI INDONESIA DENGAN K-MEDOID DAN CLARA (Studi Kasus Peubah Indeks Pembangunan Manusia Tahun 2015) RIZKY AMALIA FIRDA Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2017

Judul Skripsi : Penggerombolan Daerah di Indonesia dengan - Medoid dan CLARA (Studi Kasus Peubah Indeks Pembangunan Manusia Tahun 2015) Nama : Rizky Amalia Firda NIM : G14130089 Disetujui oleh Cici Suhaeni, MSi Pembimbing I Dr Utami Dyah Syafitri, MSi Pembimbing II Diketahui oleh Dr Anang Kurnia, MSi Ketua Departemen Tanggal Lulus:

PRAKATA Puji dan syukur penulis panjatkan kehadirat Allah SWT yang berkat karunia-nya penulis berhasil menyelesaikan penulisan karya ilmiah yang berjudul Penggerombolan Daerah di Indonesia dengan -Medoid dan CLARA (Studi Kasus Peubah Indeks Pembangunan Manusia Tahun 2015). Shalawat dan salam semoga selalu tercurahkan kepada Nabi Muhammad SAW beserta keluarganya, sahabat, dan umat beliau hingga akhir zaman. Penulisan karya ilmiah ini tidak terlepas dari kesalahan dan kekurangan serta dukungan dan bantuan dari berbagai pihak. Penulis mengucapkan terima kasih kepada : 1. Ibu Cici Suhaeni, MSi dan Ibu Dr Utami Dyah Syafitri selaku dosen pembimbing skripsi yang berkenan meluangkan waktu, memberikan ilmu, saran serta pengalamannya dalam membimbing penulis menyelesaikan karya tulis ilmiah ini. 2. Keluarga penulis, terutama Ibu Karminah dan Bapak Suwito yang telah memberikan doa, kasih sayang, dan motivasi yang tiada hentinya kepada penulis. Saudara penulis Juniar Karenina dan Hardiansyah Ikhsan yang telah memberikan semangat kepada penulis 3. Ibu Yeni Angraini, MSi selaku dosen pembimbing akademik yang telah memberikan bimbingan dan semangat selama penulis berkuliah di Departemen Statistika. 4. Seluruh dosen Departemen Statistika yang telah memberikan ilmu dan nasihat yang bermanfaat serta Staf Tata Usaha yang telah membantu dalam hal administrasi selama masa perkuliahan. 5. Guru mengaji, Nurul Hasanah dan teman-teman dalam lingkaran yang selalu memberikan motivasi, nasihat dan semangat dalam menyelesaikan penulisan karya ilmiah ini. 6. Ahmad Junaedi, atas inspirasinya selama masa perkuliahan. 7. Teman-teman Statistika 50 IPB, terutama Zaidah Rifah Uswatun, Euis Aqmaliyah, Tia Restu Saputri, Sri Rahayu, Esti Setiyo Rini, Anisa Dara Putri, Novi Anggriani, Haerul Aman, Ibnu Mubtadhi Ridho dan temanteman yang berjuang bersama selama masa perkuliahan. 8. Teman-teman Ramen Seceng, Mardiyah Kartini, Siti Hajar, Nuraina Ibrahim, Siti Sarah yang telah memberikan semangat dan bantuan selama masa perkuliahan. Semoga karya tulis ilmiah ini dapat bermanfaat. Bogor, Oktober 2017 Rizky Amalia Firda

DAFTAR ISI DAFTAR TABEL xii DAFTAR GAMBAR xii DAFTAR LAMPIRAN xii PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 2 TINJAUAN PUSTAKA 2 Indeks Pembangunan Manusia (IPM) 2 Indikator Indeks Pembangunan Manusia 3 Penyusunan Nilai Indeks Pembangunan Manusia 4 Analisis Gerombol 5 -Medoid 6 Clustering Large Application (CLARA) 7 Evaluasi Gerombol 8 METODOLOGI 9 Data 9 HASIL DAN PEMBAHASAN 11 Eksplorasi Data 11 Hasil Penggerombolan 14 Penggerombolan dengan -Medoid 14 Penggerombolan dengan CLARA 16 Perbandingan dengan Metode Pengkategorian Berdasarkan Nilai IPM 19 SIMPULAN 22 DAFTAR PUSTAKA 23 LAMPIRAN 24 RIWAYAT HIDUP 51

DAFTAR TABEL 1 Nilai maksimum dan minimum indikator IPM 4 2 Kategori nilai IPM 5 3 Daftar peubah penelitian 9 4 Analisis deskriptif Indikator Pembangunan Manusia 13 5 Karakteristik penggerombolan -medoid dengan = 2 15 6 Karakteristik penggerombolan -medoid dengan = 4 16 7 Karakteristik penggerombolan CLARA dengan = 2 17 8 Karakteristik penggerombolan CLARA dengan = 4 19 9 Karakteristik pengkategorian IPM 20 10 Tabulasi silang metode penggerombolan -medoid dengan pengkategorian berdasarkan nilai IPM 22 11 Tabulasi silang metode penggerombolan CLARA dengan pengkategorian berdasarkan nilai IPM 22 DAFTAR GAMBAR 1 Ilustasi PAM 7 2 Ilustrasi CLARA 8 3 Ilustrasi metode silhouette, jarak dalam gerombol (a) dan jarak antara gerombol terdekat (b) 8 4 Tiga tertinggi dan terendah pada indikator angka harapan hidup (a) dan pengeluaran perkapita disesuaikan (b) 11 5 Tiga nilai tertinggi dan terendah pada indikator harapan lama sekolah (a) dan rata-rata lama sekolah (b) 12 6 Diagram kotak garis indikator angka harapan hidup (a) dan 12 7 Diagram kotak garis indikator harapan lama sekolah (a) dan rata-rata 13 8 Nilai koefisien silhouette pada gerombol terbentuk dengan -medoid 14 9 Peta sebaran penggerombolan metode -medoid dengan = 2 14 10 Peta sebaran penggerombolan metode -medoid dengan = 4 15 11 Peta sebaran penggerombolan metode CLARA dengan = 2 17 12 Peta sebaran penggerombolan metode CLARA dengan = 4 18 13 Peta sebaran pengkategorian berdasarkan nilai IPM 20 DAFTAR LAMPIRAN 1 Daftar anggota gerombol pada metode -medoid dengan = 2 24 2 Daftar anggota gerombol pada metode -medoid dengan = 4 31 3 Daftar anggota gerombol pada metode CLARA dengan = 2 37 4 Daftar anggota gerombol pada metode CLARA dengan = 4 44

PENDAHULUAN Latar Belakang Penggerombolan atau pengelompokkan objek merupakan suatu cara yang banyak diterapkan dalam berbagai sektor kehidupan. Salah satu manfaat dari penggerombolan adalah untuk pemetaan daerah. Pemetaan dapat dilakukan dengan mengelompokkan daerah-daerah menjadi beberapa gerombol dengan karakteristik-karakteristik tertentu. Daerah-daerah dengan karakteristik yang sama diharapkan akan berada dalam satu gerombol sedangkan daerah-daerah dengan karakteristik berbeda akan berada dalam gerombol yang berbeda. Hasil penggerombolan diharapkan dapat bermanfaat dalam pengambilan kebijakan oleh pemerintah daerah setempat tentang karakteristik yang berpotensi dan tidak berpotensi di wilayahnya. Analisis statistika yang sesuai untuk penggerombolan tersebut adalah analisis gerombol. Analisis gerombol secara umum terbagi menjadi hierarkhi dan tidak berhierarkhi. Metode hierarkhi melibatkan kumpulan keputusan penggerombolan yang mengkombinasikan observasi dalam struktur seperti pohon atau hierarkhi. Dua jenis dasar pada metode berhierarki adalah cara penggabungan (aglomerative) dan pemisahan gerombol (devisive). Metode tidak berhierarkhi tidak melibatkan struktur seperti pohon. Sebagai gantinya, metode ini menempatkan objek-objek ke dalam gerombol pada saat banyaknya gerombol sudah ditentukan. Proses dari metode ini diawali dengan penentuan pusat gerombol dan penempatan anggota-anggota ke dalam pusat gerombol terdekat (Hair et all 2010). Metode penggerombolan tak berhierarkhi diantaranya yaitu - rataan, -medoid, dan CLARA (Kaufman dan Rousseauw 1990). Metode tak berhierarki membagi objek pada gerombol, setiap pusat gerombol mewakili satu gerombol. Terdapat dua pusat gerombol yaitu rataan dan median. Metode dengan pusat gerombol rataan ( -rataan) dengan penggerombolan difokuskan pada rataan setiap gerombol. Metode ini tidak kekar terhadap pencilan (Han dan Kamber 2006). Kemudian dikembangkanlah metode pusat gerombol median ( -medoid) yang kekar terhadap pencilan. Metode yang menggunakan algoritme partitioning around medoid (PAM) ini mengambil objek secara acak menjadi objek yang mewakili gerombol sampai semua objek terpilih (jika nilai galatnya lebih besar, pusat gerombol diganti dengan titik lain sampai galat minimum). -medoid dapat menggerombolkan dengan baik pada data berskala kecil. Data dengan skala besar dapat menggunakan Clustering Large Application (CLARA). CLARA merupakan sampling yang masing-masing contohnya dilakukan metode -medoid. Hasil CLARA tergantung dari pemilihan contoh dan ukurannya. CLARA menghasilkan gerombol yang tetap pada setiap iterasi (Han dan Kamber 2006). Penerapan metode CLARA yang pertama kali digagas oleh Kauffman dan Rousseeuw (1990) menyatakan bahwa CLARA dapat menggerombolkan dengan baik pada lima contoh dengan ukuran contoh ( adalah banyaknya gerombol). Sementara itu penerapan terkini metode -medoid dan CLARA juga dilakukan oleh Syafrina (2015) dan Cahyadahrena (2015). Syafrina (2015) dalam tesisnya meneliti tentang penggerombolan daerah di Indonesia berdasarkan

2 peubah Indeks Pembangunan Manusia (IPM) menggunakan metode Fuzzy - rataan dan -medoid. Hasil yang diperoleh menyatakan bahwa metode -medoid dapat menggerombolkan dengan baik sesuai kriteria pengujian kebaikan gerombol perbandingan jarak rata-rata antar gerombol daripada hasil penggerombolan metode Fuzzy -rataan dan -rataan. Cahyadahrena (2015) dalam skripsinya meneliti tentang deteksi pencilan pada data titik panas menggunakan metode - medoid dan CLARA. Hasil kedua metode tersebut digunakan sebagai metode untuk menggerombolkan titik panas dan mendeteksi pencilan pada data titik panas. Penelitian ini menerapkan metode -medoid dan CLARA untuk menggerombolkan kabupaten/kota di Indonesia berdasarkan indikator penyusun IPM. Indikator tersebut meliputi angka harapan hidup, harapan lama sekolah, ratarata lama sekolah, dan pengeluaran perkapita disesuaikan. Hasil penggerombolan dengan kedua metode tersebut diharapkan dapat memetakan daerah di Indonesia ke dalam beberapa gerombol. Selain penggerombolan dengan kedua metode tersebut, pemetaan daerah di Indonesia juga dapat dilakukan dengan pengkategorian berdasarkan nilai IPM. Oleh karena itu penelitian ini juga melakukan penggerombolan daerah berdasarkan nilai IPM.. Tujuan Penelitian Tujuan penelitian ini adalah 1. Menggerombolkan kabupaten/kota di Indonesia berdasarkan indikator penyusun Indeks Pembangunan Manusia (IPM) menggunakan metode - medoid dan CLARA. 2. Mengelompokkan kabupaten/kota di Indonesia berdasarkan kategori nilai IPM. 3. Membandingkan hasil penggerombolan metode -medoid dan CLARA dengan hasil pengelompokkan berdasarkan kategori nilai IPM. TINJAUAN PUSTAKA Indeks Pembangunan Manusia (IPM) Perkembangan ke arah yang lebih baik disebut juga pembangunan. Menurut United National Development Programs (UNDP) tujuan utama dari pembangunan adalah menciptakan lingkungan yang memungkinkan bagi rakyatnya untuk menikmati umur panjang, sehat, dan menjalankan kehidupan yang produktif. Hal tersebut menepis konsep klasik pembangunan yang lebih memperhatikan bidang ekonomi daripada pelaku ekonominya. Merujuk pada tujuan tersebut, arti penting pembangunan ingin menjadikan manusia sebagai tujuan akhir bukan sebagai alat pembangunan (UNDP 1990). Konsep pembangunan manusia lebih luas dari konsep teori pembangunan yang menitikberatkan pada pembangunan ekonomi. Pembangunan manusia adalah suatu proses untuk memperbanyak pilihan-pilihan yang dimiliki oleh manusia. Diantara banyak pilihan tersebut, pilihan yang terpenting adalah untuk berumur

3 panjang dan sehat, untuk berilmu pengetahuan, dan untuk mempunyai akses terhadap sumber daya yang dibutuhkan agar dapat hidup secara layak. Pembangunan manusia tidak hanya memperhatikan sektor sosial saja dalam pendekatannya, melainkan gabungan dari semua sektor yang komprehensif. Sektor-sektor lain yang terkait diantaranya politik, perdagangan, pertumbuhan ekonomi, gender, budaya dan lain-lain (BPS 2015). Pendekatan pembangunan manusia yang terdiri dari sektor yang komprehensif tersebut dapat diukur dengan sebuah tolak ukur atau nilai yang dapat dijadikan sebagai acuan tinggi-rendahnya pembangunan tersebut. Maka UNDP merumuskan Indeks Pembangunan Manusia (IPM). IPM mengukur capaian pembangunan manusia berbasis sejumlah komponen dasar kualitas hidup dalam tiga dimensi yaitu umur panjang dan sehat; pengetahuan; dan kualitas hidup yang layak. Faktor-faktor pada dimensi tersebut memiliki pengertian sangat luas, oleh karena itu terdapat beberapa indikator yang digunakan untuk mengukur dimensi tersebut. Indikator tersebut adalah Angka Harapan Hidup saat lahir (dimensi kesehatan); gabungan dari indikator Rata-rata Lama Sekolah dan Harapan Lama Sekolah (dimensi pendidikan); serta indikator kemampuan daya beli (puchasing power parity) untuk mengukur dimensi kehidupan yang layak (BPS 2015). Indikator Indeks Pembangunan Manusia Definisi dari peubah Indeks Pembangunan Manusia sebagai berikut : 1. Angka Harapan Hidup saat lahir (AHH) merupakan rata-rata perkiraan banyak tahun yang dapat ditempuh oleh seseorang selama hidup. Penghitungan angka harapan hidup melalui pendekatan tak langsung (indirect estimation). Indeks harapan hidup dihitung dengan menghitung nilai maksimum dan nilai minimum harapan hidup sesuai standar UNDP, yaitu angka tertinggi sebagai batas atas untuk penghitungan indeks dipakai 85 tahun dan terendah adalah 20 tahun. 2. Harapan Lama Sekolah didefinisikan sebagai lamanya sekolah (dalam tahun) yang diharapkan akan dirasakan oleh anak pada umur tertentu di masa mendatang. Harapan lama sekolah dihitung untuk penduduk tujuh tahun ke atas. Indikator ini dapat digunakan untuk mengetahui kondisi pembangunan sistem pendidikan di berbagai jenjang yang ditunjukkan dalam bentuk lamanya pendidikan (dalam tahun) yang diharapkan dapat dicapai oleh setiap anak. Seperti halnya rata-rata lama sekolah, harapan lama sekolah juga menggunakan batasan yang dipakai sesuai kesepakatan UNDP. Batas maksimum untuk harapan lama sekolah adalah 18 tahun, sedangkan batas minimumnya 0 (nol). 3. Rata-rata Lama Sekolah menggambarkan jumlah tahun yang digunakan oleh penduduk usia 25 tahun ke atas dalam menjalani pendidikan formal. Penghitungan rata-rata lama sekolah yang dipakai menggunakan dua batasan yang dipakai sesuai kesepakatan UNDP. Rata-rata lama sekolah memiliki batas maksimumnya 15 tahun dan batas minimumnya sebesar 0 tahun. 4. Pengeluaran Perkapita Disesuaikan, penghitungan paritas daya beli dilakukan berdasarkan komoditas kebutuhan pokok. Batas maksimum

4 pengeluaran per kapita adalah sebesar Rp 26.572.352 sementara batas minimumnya adalah Rp 1.007.436 (BPS 2015). Nilai maksimum dan minimum dari uraian indikator tersebut dapat dilihat pada Tabel 1. Tabel 1 Nilai maksimum dan minimum indikator IPM Indikator IPM Satuan Minimum Maksimum Angka Harapan Hidup Tahun 20 85 Harapan Lama Sekolah Tahun 0 18 Rata-rata Lama Sekolah Tahun 0 15 Pengeluaran Perkapita Disesuaikan Rupiah 1007436* 26572352** Catatan : * Daya beli minimum merupakan garis kemiskinan terendah kabupaten tahun 2010 (data empiris) yaitu di Tolikara, Papua ** Daya beli maksimum merupakan nilai tertinggi kabupaten yang diproyeksikan hingga 2025 (akhir RPJPN) yaitu perkiraan pengeluaran perkapita Jakarta Selatan tahun 2025 Penyusunan Nilai Indeks Pembangunan Manusia Indeks dari ketiga dimensi penyusun Indeks Pembangunan Manusia yang mencakup kehidupan, pendidikan dan ekonomi harus dihitung terlebih dahulu dari empat indikator yang ada yaitu angka harapan hidup (AHH), harapan lama sekolah (HLS), rata-rata lama sekolah (RLS) dan pengeluaran perkapita disesuaikan (PPD) (BPS 2015). Formula yang digunakan untuk menentukan indeks tersebut adalah : (1) dengan : nilai indeks pada indikator ke- : nilai indikator ke- : nilai maksimum indikator ke- : nilai maksimum indikator ke- Dimensi pendidikan mempunyai dua indikator yaitu HLS dan RLS, maka dari itu penentuan indeks dimensi pendidikan merupakan rataan dari indeks indikatornya. dengan : nilai indeks pada dimensi pendidikan : nilai indeks pada indikator harapan lama sekolah : nilai indeks pada indikator rata-rata lama sekolah Perhitungan akhir dari nilai IPM adalah dengan formula sebagai berikut : (2) (3) dengan IPM : nilai indeks pembangunan manusia : nilai indeks pada dimensi kehidupan : nilai indeks pada dimensi pendidikan

5 : nilai indeks pada dimensi ekonomi Pengkategorian yang dilakukan BPS terhadap nilai IPM mencakup sangat tinggi, tinggi, sedang, dan rendah sesuai dengan Tabel 2. Kategori sangat tinggi jika nilai IPM kabupaten/kota diatas 80. Kategori tinggi jika nilai IPM kabupaten/kota berada pada rentang lebih dari 70 dan kurang dari 80. Kategori sedang jika nilai IPM kabupaten/kota berada pada rentang lebih dari 60 dan kurang dari 70. Kategori rendah jika nilai IPM kabupaten/kota berada pada rentang kurang dari 60 (BPS 2015). Tabel 2 Kategori nilai IPM Nilai IPM >=80 Sangat Tinggi 70-80 Tinggi 60-70 Sedang <=60 Rendah Kategori Analisis Gerombol Analisis gerombol mengelompokkan objek pada kumpulan karakteristikkarakteristik yang telah ditentukan. Hasil penggerombolan akan homogen dalam satu gerombol dan heterogen antar gerombol. Jadi jika pengelompokannya berhasil, maka objek yang berada dalam satu gerombol akan terlihat dekat saat ditampilkan dalam bentuk diagram plot, dan jika berbeda gerombol akan berjauhan (Hair et all 2010). Karakteristik yang terdapat pada objek digambarkan melalui jarak. Beberapa ukuran jarak yang digunakan antara lain jarak Euclid, jarak mahalanobis, jarak city-block (Manhattan), dan lain-lain. Jarak Euclid merupakan tipe jarak yang paling umum dipilih. Konsep ini mudah untuk menjelaskan lebih dari dua peubah. Jika terdapat sebuah gugus data dengan peubah sebanyak peubah maka formulanya sebagai berikut. (4) Nilai adalah jarak antara data objek ke dan objek ke (Han dan Kamber 2006). Terdapat dua metode yang umum digunakan dalam penggerombolan objek yaitu metode hierarkhi dan metode tidak hierarkhi. Metode hierarkhi melibatkan sebuah kumpulan dari keputusan penggerombolan ( adalah banyak observasi) yang mengkombinasikan observasi dalam struktur seperti pohon atau hierarkhi. Dua jenis dasar pada metode berhierarki adalah cara penggabungan (aglomerative) dan pemisahan gerombol (devisive). Pada cara penggabungan masing-masing objek adalah satu gerombol, kemudian pada saat tertentu digabungkan dengan objek lainnya menjadi satu gerombol begitu sampai tersisa satu gerombol dengan satu anggota. Sebaliknya pada cara pemisahan, satu himpunan data merupakan satu gerombol dan dibagi menjadi gerombol-gerombol baru. Metode tidak berhierarkhi tidak melibatkan struktur seperti pohon. Sebagai gantinya, metode ini menempatkan objek-objek ke dalam gerombol pada saat

6 banyaknya gerombol sudah ditentukan. Metode ini biasanya memproses ke dalam dua tahapan yaitu mengetahui perwakilan gerombol dalam setiap gerombol yang biasanya dipilih secara acak selanjutnya adalah penempatan objek-objek lainnya yang tidak menjadi perwakilan gerombol pada gerombol dengan perwakilan gerombol yang paling mirip (Hair et all 2010). Pemilihan dari metode analisis gerombol tergantung pada jenis data yang tersedia dan tujuan tertentu. Terkadang beberapa metode dapat diaplikasikan dan alasan-alasan tertentu tidak dapat menyudutkan pada satu metode saja. Maka dari itu lebih baik untuk memilih beberapa metode dan membandingkannya dengan grafik. Interpretasi dari hasilnya harus menjadi dasar pandangan pada makna data bersama dengan pengalaman terhadap data dan metode yang digunakan. Penggunaan beberapa metode dalam satu data yang sama dibolehkan karena analisis gerombol adalah analisis yang paling sering digunakan sebagai alat deskripsi dan eksplorasi yang berbeda dengan uji statistik lainnya yang bertujuan untuk inferensi. Maka dari itu tidak akan dibuktikan hipotesis dan hanya akan dilihat makna dari data (Kaufman dan Rousseuw 1990). -Medoid -medoid merupakan salah satu teknik penggerombolan tidak berhierarkhi yang mirip dengan -rataan, akan tetapi terdapat perbedaan mendasar diantara keduanya yaitu, jika pada -rataan menggunakan rataan sebagai pusat gerombolnya (centroid), sedangkan pada -medoid menggunakan median sebagai pusat gerombol (Han dan Kamber 2006). Algoritma yang sering digunakan dalam -medoid adalah Partitioning Around Medoid (PAM). Metode ini menggunakan data yang berada di tengah gerombol (median), sehingga metode ini lebih kekar terhadap pencilan dibandingkan dengan metode -rataan (Kaufman dan Rousseuw 1990). PAM meminimumkan jumlah jarak antara masing-masing objek dan menghubungkannya dengan titik medoid. Kriteria galat mutlak yang digunakan yaitu (5) dengan : jumlah galat mutlak untuk semua objek pada dataset : objek non medoid pada gerombol ke- : objek yang terpilih sebagai medoid pada gerombol ke- Iterasi dari algoritma selesai sampai semua objek pernah menjadi medoid dan nilai dari jumlah galat mutlak minimum. Inisiasi medoid awal dipilih secara acak. Proses iterasi menukar medoid dengan objek bukan medoid berlangsung selama kualitas dari hasil penggerombolan meningkat. Kualitas tersebut diduga dengan menggunakan fungsi biaya yang menghitung rataan jarak antara suatu objek dengan medoid-nya dalam satu gerombol. Untuk menentukan penukaran atau tidaknya (objek yang tidak terpilih) dengan objek yang terpilih sebagai medoid ( ), tergantung dari fungsi biaya yang dihitung saat iterasi berlangsung (Han dan

7 Kamber 2006). Algoritma dari PAM untuk menggerombolkan pada dataset dengan objek dijelaskan pada uraian berikut : 1. Tentukan nilai gerombol (inisiasi gerombol awal) 2. Pilih objek pada dataset sebagai medoid awal secara acak 3. Gabungkan objek yang tidak terpilih sebagai medoid awal dengan objek medoid yang paling terdekat dengan objek tersebut 4. Pilih objek bukan medoid secara acak, 5. Hitung biaya total (rataan jarak terkecil) dari penukaran medoid dengan 6. Jika nilai selisih antara dan, kemudian tukar dengan untuk membentuk himpunan baru dari -medoid 7. Ulangi langkah 2 hingga langkah 6 sampai tidak ada perubahan pada hasil penggerombolan Gambar 1 Ilustasi PAM Clustering Large Application (CLARA) Clustering Large Application (CLARA) merupakan metode tidak hierarkhi pengembangan dari metode PAM dirancang oleh Kaufman dan Rousseeuw (1990) untuk menangani data set berukuran besar. CLARA mengandalkan pada pengambilan contoh (sampling). Metode CLARA melengkapi PAM. CLARA mampu untuk melakukan penggerombolan pada data set yang besar (misalnya 1000 objek dalam 10 gerombol). Iterasi untuk CLARA adalah. Hal ini menjelaskan CLARA lebih efisien dari PAM untuk nilai objek yang besar. Tetapi kelemahan yang ada pada metode ini adalah sampling, CLARA baik jika titik-titik medoid yang terambil sebagai sampel merupakan medoid yang sesuai untuk merepresentasikan gerombol.(han dan Kamber 2006) Sebagai pengganti dari mencari objek yang mewakili dataset, CLARA mengambil contoh dari dataset, menerapkan PAM dalam contoh dan mencari medoid dari contoh. Titik fokusnya adalah jika contoh diambil secara acak, nilai medoid dari contoh akan mendekati nilai medoid dari dataset. Untuk pendekatan yang lebih baik, CLARA mengambil banyak contoh dan memberikan output yang terbaik. Untuk akurasinya, kualitas dari penggerombolan dihitung berdasarkan rata-rata ketidaksamaan (jarak) dari semua objek dalam data set, bukan hanya objek-objek dalam contoh. Percobaan Kaufman dan Rousseeuw (1990) menjelaskan bahwa indikasi dari 5 contoh dari ukuran memberikan hasil yang memuaskan. Algoritme CLARA dijelaskan pada uraian berikut. 1. Ambil sebuah contoh dari objek secara acak dari data set.

8 2. Tentukan objek medoid pada contoh 3. Hitung rataan jarak antara semua objek pada populasi yang tidak terpilih sebagai medoid dengan objek medoid yang paling dekat 4. Lakukan langkah 1 sampai 3 hingga banyak contoh yang ditentukan 5. Contoh dengan rataan jarak terendah adalah penggerombolan yang dipilih Gambar 2 Ilustrasi CLARA Evaluasi Gerombol Evaluasi gerombol merupakan hal yang penting dilakukan untuk melihat kerepresentativan gerombol yang terbentuk terhadap populasi, menentukan generalisasi untuk objek yang lain, dan stabil untuk waktu tertentu. Salah satu metode evaluasi gerombol adalah metode koefisien silhouette. Metode silhouette mengkombinasikan ide dari cohesion dan separation untuk masing-masing titik baik dari beberapa gerombol. Cohesion mengukur seberapa dekat jarak antar objek di dalam sebuah gerombol yang diilustrasikan pada Gambar 3a. Separation mengukur seberapa besar perbedaan gerombol dengan gerombol lain yang diilustrasikan pada Gambar 3b. Ilustrasi mengenai cohesion dan separation dijelaskan pada gambar berikut. Gambar 3 Ilustrasi metode silhouette, jarak dalam gerombol (a) dan jarak antara gerombol terdekat (b) Formula untuk menghitung silhouette dari sebuah titik adalah sebagai berikut (Kaufman dan Rousseeuw 1990) (6) dengan : nilai silhouette dari objek ke-

9 : nilai rataan jarak di antara objek ke- dengan semua objek dalam gerombol : nilai rataan jarak di antara titik ke- dengan titik gerombol lain yang terdekat : nilai terbesar himpunan dan Kemudian hasil rata-rata silhouette keseluruhan titik pada dataset digunakan untuk menemukan angka yang tepat untuk gerombol, dan memilih yang memiliki nilai yang terbesar. Silhouette coefficient (SC) didefinisikan sebagai berikut. (7) dengan : nilai koefisien silhouette keseluruhan gerombol : nilai rataan silhouette pada gerombol ke : nilai terbesar dari Nilai silhouette berkisar antara -1 dan 1. Nilai 1 dapat diartikan bahwa seluruh objek atau titik dimasukkan pada gerombol dengan tepat. Kemudian nilai 0 diartikan bahwa seluruh objek atau titik berada diantara dua gerombol sedangkan nilai -1 diartikan bahwa seluruh objek atau titik dimasukkan pada bukan gerombol yang seharusnya (Kaufman dan Rousseeuw 1990). METODOLOGI Data Penelitian ini menggunakan data sekunder penyusun Indeks Pembangunan Manusia tahun 2015 kabupaten/kota di Indonesia. Data ini bersumber dari Publikasi Indeks Pembangunan Manusia Tahun 2015 pada website Badan Pusat Statistik. Terdapat 514 kabupaten/kota dan 4 peubah. Peubah yang terdapat dalam data dicantumkan dalam Tabel 3. Peubah-peubah tersebut meliputi indikatorindikator penyusun IPM. Indikator-indikator penyusun IPM adalah angka harapan hidup (X1), harapan lama sekolah (X2), rata-rata lama sekolah (X3), dan pengeluaran perkapita disesuaikan (X4). Tabel 3 Daftar peubah IPM Peubah Keterangan Jenis Peubah Satuan X1 Angka Harapan Hidup Numerik Tahun X2 Harapan Lama Sekolah Numerik Tahun X3 Rata-rata Lama Sekolah Numerik Tahun X4 Pengeluaran Perkapita Disesuaikan Numerik Ribu rupiah Prosedur Analisis Data Tahapan analisis data yang dilakukan dalam penelitian ini adalah sebagai berikut

10 1. Melakukan analisis statistika deskriptif terhadap peubah angka harapan hidup (X1), harapan lama sekolah (X2), rata-rata lama sekolah (X3) dan pengeluaran perkapita disesuaikan (X4). Deskripsi data dilihat dari peringkat tiga terbesar dan tiga terkecil dari masing-masing peubah. 2. Mendeteksi pencilan dengan menggunakan diagram kotak garis dari masing-masing peubah. 3. Melakukan standarisasi dengan rataan galat mutlak dari masing-masing peubah karena satuan dari peubah yang tidak sama menggunakan Microsoft Excel 2013. Rataan galat mutlak digunakan sebagai standarisasi karena sifatnya yang kekar terhadap pencilan (Han dan Kamber 2006). Formula untuk rataan galat mutlak (9) dan standarisasi (10) : (8) dengan : nilai galat rataan mutlak : nilai data ke- pada peubah ke : nilai rataan peubah ke (10) dengan : nilai standarisasi : nilai galat rataan mutlak : nilai data ke- pada peubah ke : nilai rataan peubah ke 4. Melakukan penggerombolan -medoid terhadap data pada 2, 3, 4, 5, 6, 7, 8 dengan aplikasi R versi i386 3.2.1. 5. Melakukan evaluasi terhadap masing-masing banyaknya gerombol dengan koefisien silhouette dan menentukan gerombol terbaik berdasarkan nilai koefisien silhouette yang paling tinggi. 6. Melakukan pengacakan urutan data yang telah distandarisasi sebanyak 100 kali dengan menggunakan R versi i386 3.2.1 7. Melakukan penggerombolan pada gerombol terbaik berdasarkan banyaknya gerombol dan gerombol sesuai pengkategorian nilai IPM (4 gerombol) dengan metode CLARA. 8. Melakukan pemilihan pengacakan terbaik dengan kriteria nilai silhouette tertinggi dari semua pengacakan. 9. Menggerombolkan pengkategorian berdasarkan nilai IPM 10. Melakukan pemetaan dengan software Arc GIS dan menginterpretasikan hasil penggerombolan metode -medoid dan metode CLARA dari dan serta perbandingan antara metode penggerombolan -medoid, CLARA dan pengkategorian berdasarkan nilai IPM.

11 HASIL DAN PEMBAHASAN Eksplorasi Data Statistika deskriptif digunakan untuk menjelaskan tiga peringkat tertinggi dan tiga peringkat terendah dari masing-masing peubah. Gambar 4 dan Gambar 5 menunjukkan kesenjangan antara wilayah barat dan wilayah timur. Nilai angka harapan hidup (Gambar 4a) tertinggi banyak ditemukan di Pulau Jawa, sementara terendahnya banyak ditemukan di Pulau Papua. Begitu juga dengan indikatorindikator lainnya, wilayah barat lebih tinggi daripada wilayah timur. Pada indikator harapan lama sekolah (Gambar 5a), peringkat tiga tertinggi beragam dari wilayah barat dan wilayah tengah seperti Kota Banda Aceh, Kota Yogyakarta, dan Kota Kendari sementara tiga terendah berasal dari Pulau Papua yaitu Pegunungan Bintang, Puncak, dan Nduga. Hal yang berbeda terlihat pada indikator rata-rata lama sekolah (Gambar 5b) karena terdapat daerah di Indonesia timur yang menjadi peringkat tiga tertinggi yaitu Kota Ambon. Pengeluaran perkapita tertinggi diraih oleh Kota Jakarta Selatan, Kota Jakarta Barat, dan Kota Denpasar. Hal tersebut sesuai dengan karakteristik ibu kota negara dan kota wisata terbesar di Indonesia. Wilayah kabupaten Nduga menjadi wilayah yang selalu berada di bagian paling bawah pada semua indikator IPM. Perbedaan antara kabupaten dan kota juga dapat memberikan informasi bahwa nilai indikator-indikator IPM dengan nilai tinggi lebih banyak diraih kota sementara kabupaten nilai indikatorindikator IPM-nya rendah. Gambar 4 Tiga tertinggi dan terendah pada indikator angka harapan hidup (a) dan pengeluaran perkapita disesuaikan (b)

12 Gambar 5 Tiga nilai tertinggi dan terendah pada indikator harapan lama sekolah (a) dan rata-rata lama sekolah (b) Selain melihat pada peringkat tiga besar teratas dan terbawah, pemeriksaan adanya pencilan pada data diperlukan untuk pemilihan metode penggerombolan yang sesuai. Gambar 6a memperlihatkan dimensi kesehatan dari IPM yaitu indikator angka harapan hidup dengan pencilan bawah. Pencilan bawah ditempati oleh banyak wilayah timur. Daerah pencilan bawah dimaknai sebagai belum berhasilnya pemenuhan target dari indikator angka harapan hidup. Daerah-daerah tersebut adalah Teluk Bintuni, Tambrauw, Teluk Wondama, Sabu Raijua, Jaya Wijaya, Boven Digoel, Seram Bagian Timur, Memberamo Raya, Asmat, dan Nduga. (a) (b) Gambar 6 Diagram kotak garis indikator angka harapan hidup (a) dan pengeluaran perkapita disesuaikan (b) Pengeluaran perkapita disesuaikan ditunjukkan oleh Gambar 6b mempunyai pencilan atas yang mengindikasikan kesenjangan yang terjadi antar daerah dari sisi pengeluaran perkapitanya. Daerah-daerah ditempati oleh banyak kota-kota besar tempat pusat perekonomian berkembang kecuali satu kabupaten yaitu Kabupaten Badung sebagai sentra budaya di Bali. Daerah-daerah tersebut adalah

13 DKI Jakarta kecuali Kepulauan Seribu, Kota Denpasar, Kota Batam, Kota Badung, Kota Surabaya, Kota Bontang, Kota Makasar dan Kota Malang. Pada diagram kotak garis yang ditunjukkan oleh Gambar 7 dimensi pendidikan dengan indikator harapan lama sekolah (Gambar 7a) dan rata-rata lama sekolah (Gambar 7b) terdapat pencilan atas dan pencilan bawah. Pencilan bawah yang sudah dikemukakan sebelumnya adalah belum tercapainya target dari dimensi pendidikan pada daerah-daerah tersebut. Pencilan bawah banyak ditempati oleh daerah-daerah di Pulau Papua kecuali satu daerah yaitu Sampang di Pulau Madura yang menjadi salah satu pencilan bawah pada indikator rata-rata lama sekolah. Pencilan atas terjadi karena kesenjangan yang tinggi dari masingmasing daerah. Pencilan atas tidak banyak ditempati oleh wilayah barat maupun wilayah timur. Namun jika dibedakan atas kota dan kabupaten, pencilan atas ditempati oleh banyak daerah perkotaan. (a) (b) Gambar 7 Diagram kotak garis indikator harapan lama sekolah (a) dan rata-rata lama sekolah (b) Tabel 4 menjelaskan beberapa perangkat statistika deskriptif mengenai indikator Indeks Pembangunan Manusia. Perbedaan nilai maksimum dan nilai minimum pada semua indikator menyebabkan banyak daerah yang mempunyai indikator dibawah rata-rata. Tabel 4 Analisis deskriptif indikator IPM Peubah Rata-rata Simpangan baku Nilai Maksimum Nilai Minimum X1 68.72 3.68 77.46 53.60 X2 12.42 1.43 17.01 2.17 X3 7.78 1.70 12.38 0.64 X4 9400.09 2566.16 22425 3625

Nilai silhouette 14 Hasil Penggerombolan Penggerombolan dengan -Medoid Banyaknya gerombol dalam penggerombolan menggunakan -medoid dapat diinisiasi secara subjektif oleh peneliti. Banyaknya gerombol yang digunakan adalah 2, 3, 4, 5, 6, 7, dan 8. Hasil penggerombolan pada metode ini tetap meskipun dilakukan pengacakan terhadap data. Hasil penggerombolan tersebut akan dievaluasi menggunakan koefisien silhouette. Penggerombolan terbaik adalah penggerombolan dengan nilai koefisien silhouette terbesar. Analisis grafik besarnya koefisien silhouette pada Gambar 8 menunjukkan penggerombolan dengan nilai koefisien silhouette terbesar adalah penggerombolan dengan = 2 ( adalah banyak gerombol). Nilai koefisien silhouette pada = 2 adalah 0.35. 0.4 0.35 0.3 0.2 0.27 0.27 0.24 0.2 0.2 0.19 0.1 0 2 3 4 5 6 7 8 Gerombol ke- Gambar 8 Nilai koefisien silhouette pada gerombol terbentuk dengan -medoid Gambar 9 Peta sebaran penggerombolan metode -medoid dengan = 2

15 Karakteristik penggerombolan dengan banyak gerombol dua dapat dilihat pada Tabel 6. Indikator-indikator pada Tabel 6 dapat diurutkan sesuai dengan urutan gerombol yang dikategorikan dengan gerombol rendah dan gerombol tinggi. Gerombol rendah mempunyai nilai-nilai indikator AHH, HLS, RLS, dan PPD yang rendah pula, begitupun dengan gerombol tinggi. Banyaknya daerah yang terbagi menjadi gerombol rendah dan tinggi adalah 365 dan 149. Hal ini menunjukkan bahwa masih banyak daerah-daerah di Indonesia yang mempunyai nilai IPM rendah. Sementara jika rataan penggerombolan didekati dengan nilai rataan pada pengkategorian berdasarkan nilai IPM, gerombol satu masuk ke dalam kategori tinggi 74.19 dan gerombol dua masuk ke dalam kategori sedang 65.51. Analisis gerombol merupakan analisis eksploratif yang tidak hanya berpatokan pada metode tetapi juga pada rasionalisasi hasil gerombol. Rasionalisasi hasil gerombol pada metode -medoid dengan = 2 belum dapat dilakukan sepenuhnya karena keterbatasan hanya terdapat dua gerombol. Perbedaan antara kota dan kabupaten saja yang dapat dijadikan alasan rasional keputusan pada gerombol satu dan gerombol dua. Gambar 9 menunjukkan masih banyak daerah di Indonesia yang mempunyai indikator IPM rendah yang ditandai dengan warna merah pada peta. Sementara warna hijau yang menunjukkan daerah dengan indikator IPM tinggi tersebar di sebagian Pulau Sumatera, utara Pulau Kalimantan, sebagian Pulau Jawa, Sulawesi Tenggara, beberapa di Kepulauan Maluku, dan Pulau Papua. Kalimantan Utara sebagai provinsi yang baru berdiri memiliki nilai indikator IPM yang tinggi. Tabel 5 Karakteristik penggerombolan -medoid dengan = 2 Rataan AHH Rataan HLS Rataan RLS Rataan PPD Banyaknya daerah Rataan Nilai IPM Kategori IPM 1 71.43 13.62 9.64 11989.46 149 74.19 Tinggi 2 67.62 11.93 7.03 8353.02 365 65.51 Sedang Ket : = nomor gerombol Gambar 10 Peta sebaran penggerombolan metode -medoid dengan = 4

16 -medoid merupakan metode yang cukup stabil dengan beberapa kali ulangan pengacakan urutan observasi kabupaten/kota hasilnya tetap sama pada semua. Rasionalisasi gerombol pada metode ini didasarkan pada anggota hasil gerombol yang tidak lagi hanya terbatas antara kabupaten dan kota saja melainkan pada wilayah barat dan wilayah timur juga daerah pedalaman yang masih sulit untuk dijangkau. Sebaran empat gerombol dengan metode -medoid yang diperlihatkan oleh Gambar 10 yang menjelaskan banyak daerah di Indonesia yang masuk kedalam gerombol tinggi yang ditandai dengan warna hijau, gerombol sedang ditandai warna kuning, gerombol rendah ditandai warna merah, dan gerombol sangat tinggi ditandai warna biru. Daerah dengan gerombol tinggi menyebar dari Sabang sampai Merauke sementara daerah dengan gerombol rendah hanya berada di Papua. Daerah dengan gerombol sedang juga menyebar rata walaupun terlihat banyak terdapat di daerah Sumatera, Sulawesi, dan Papua. Analisis gerombol menggunakan -medoid dengan = 4 dilakukan sesuai dengan pengkategorian nilai IPM. Karakteristik penggerombolan dengan = 4 dapat dilihat pada Tabel 7. Gerombol diurutkan dengan rataan per indikator memperlihatkan hubungan yang sesuai, dimulai dengan nilai yang tertinggi sampai nilai yang terendah. Banyaknya kabupaten/kota yang terdapat pada gerombol tengah (gerombol dua dan gerombol tiga) dimaknai sebagai banyaknya daerah-daerah di Indonesia yang berada pada kisaran rata-rata. Daerah-daerah pada gerombol ketiga cenderung mempunyai nilai indikator-indikator IPM yang rendah. Gerombol keempat memperlihatkan bahwa daerah-daerah tersebut memiliki nilai IPM yang sangat rendah dari gerombol lainnya. Gerombol keempat merupakan gerombol yang beranggotakan beberapa kabupaten/kota pencilan bawah. Kabupaten/kota pada gerombol tersebut adalah beberapa daerah di Pulau Papua. Jika dilakukan pendekatan antara nilai rataan indikator dalam gerombol dengan nilai rataan indikator pengkategorian berdasarkan nilai IPM, kategori yang terbentuk untuk empat gerombol sama. Kategori tersebut adalah sangat tinggi, tinggi, sedang, dan rendah. Tabel 6 Karakteristik penggerombolan -medoid dengan = 4 Rataan AHH Rataan HLS Rataan RLS Rataan PPD Banyaknya daerah Rataan Nilai IPM Kategori IPM Sangat tinggi 1 71.99 14.06 10.29 13040.73 91 81.54 2 70.07 12.35 7.71 9323.29 258 74.19 Tinggi 3 64.96 12.03 6.84 7784.99 152 65.51 Sedang 4 62.98 6.82 2.81 4603.85 13 52.69 Rendah Ket : = nomor gerombol Penggerombolan dengan CLARA Hasil gerombol terbaik menggunakan metode -medoid adalah penggerombolan dengan = 2. Penggerombolan CLARA sebagai metode pengembangan -medoid dilakukan dengan inisiasi banyaknya gerombol terbaik dan banyaknya gerombol berdasarkan pengkategorian nilai IPM. Pengacakan

17 urutan kabupaten/kota dilakukan sebanyak 100 kali pada masing-masing banyaknya gerombol. Ulangan terbaik pada banyak gerombol dua terdapat pada ulangan ke-78 dengan nilai silhouette sebesar 0.36 sedangkan pada banyak gerombol empat terdapat pada ulangan ke-46 dengan nilai silhouette sebesar 0.51. Gambar 11 Peta sebaran penggerombolan metode CLARA dengan = 2 Karakteristik penggerombolan dengan banyaknya gerombol dua dapat dilihat pada Tabel 8 dan Gambar 11. Nilai susunan urutan rataan per indikator dengan urutan gerombol sudah sesuai. Penggerombolan dengan metode CLARA menggerombolkan kabupaten/kota dengan gerombol rendah sebanyak 400 kabupaten/kota dan 114 kabupaten kota berada pada gerombol tinggi. Sama halnya dengan metode -medoid, jika dilakukan pendekatan antara nilai rataan indikator penggerombolan CLARA dengan nilai rataan indikator pengkategorian berdasarkan nilai IPM, gerombol satu berkategori tinggi dan gerombol dua berkategori sedang. Pemetaan dengan metode CLARA secara eksplorasi pada Gambar 11 terlihat bahwa masih banyak daerah di Indonesia yang memiliki indikator IPM rendah yang ditandai dengan warna merah. Hal tersebut merata dari wilayah barat hingga wilayah timur. Tabel 7 Karakteristik penggerombolan CLARA dengan = 2 Rataan AHH Rataan HLS Rataan RLS Rataan PPD Banyaknya daerah Nilai IPM Kategori IPM 1 71.78 13.85 10.00 12584.27 114 74.19 Tinggi 2 67.85 12.01 7.15 8501.69 400 65.51 Sedang Ket : = nomor gerombol

18 Gambar 12 Peta sebaran penggerombolan metode CLARA dengan = 4 Selain dengan banyaknya gerombol terbaik, penggerombolan menggunakan CLARA digunakan untuk mengetahui penggerombolan berdasarkan nilai IPM. Penggerombolan CLARA dengan inisiasi = 4 sebagai perbandingan pengkategorian berdasarkan nilai IPM. Sama halnya seperti penggerombolan dengan banyaknya gerombol dua, pada penggerombolan ini dilakukan pengacakan urutan kabupaten/kota. Ulangan terbaik dengan nilai silhouette 0.51 terdapat pada ulangan ke-46. Karakteristik penggerombolan dengan banyak gerombol empat dapat dilihat pada Tabel 9. Nilai harapan lama sekolah pada gerombol dua lebih kecil daripada nilai harapan lama sekolah pada gerombol tiga yaitu sebesar 12.18 dan 12.30. Keputusan untuk menentukan urutan gerombol adalah dengan mempertimbangkan nilai indikator lainnya yang sesuai dengan urutannya masingmasing. Hampir sama seperti metode -medoid, pada metode ini banyaknya kabupaten/kota berkumpul pada gerombol tengah (gerombol dua dan gerombol tiga). Gerombol tinggi yaitu gerombol dua mempunyai paling banyak anggota yaitu 239 kabupaten/kota sedangkan gerombol empat (rendah) mempunyai anggota sebanyak 14. Sama halnya dengan metode -medoid, anggota-anggota dari gerombol empat adalah kabupaten/kota yang menjadi pencilan bawah pada beberapa indikator IPM. Kabupaten/kota tersebut adalah beberapa daerah di Pulau Papua. Pendekatan antara nilai rataan indikator pengkategorian berdasarkan nilai IPM dengan nilai rataan indikator pada penggerombolan didapatkan empat kategori yaitu sangat tinggi, tinggi, sedang, dan rendah. Tidak berbeda jauh dengan -medoid, pemetaan empat gerombol dengan metode CLARA yang ditunjukkan oleh Gambar 12 dipenuhi oleh sebagian besar warna hijau (tinggi) yang tersebar di wilayah Indonesia barat dan tengah. Sementara di wilayah Indonesia timur, warna kuning (sedang) memenuhi sebagian besar area dan warna merah yang mengindikasikan daerah dengan indikator IPM rendah berada di Pulau Papua. Hasil penggerombolan pada metode CLARA dengan = 2 dan = 4 merupakan hasil penggerombolan yang terbatas pada 100 kali ulangan pengacakan urutan observasi. Hal tersebut menunjukkan ketidakstabilan metode

19 CLARA untuk beberapa pengacakan urutan observasi yang ditentukan berbeda. Namun jika dilihat dari waktu komputasi penggerombolannya, CLARA akan lebih efisien dalam melakukan penggerombolan. Dua indikator untuk memilih metode yang lebih efektif digunakan untuk penelitian ini adalah waktu komputasi penggerombolan dan kestabilan anggota gerombol. Walaupun waktu komputasi penggerombolan menggunakan metode CLARA lebih cepat, akan tetapi selisih waktu komputasi antara metode -medoid dan metode CLARA tidak begitu besar. Sementara kestabilan anggota gerombol dari metode -medoid adalah tetap pada setiap ulangan pengacakan observasi. Maka dari itu untuk menggerombolkan daerah di Indonesia berdasarkan indikator penyusun IPM, metode -medoid lebih efektif daripada metode CLARA. Tabel 8 Karakteristik penggerombolan CLARA dengan = 4 Rataan AHH Rataan HLS Rataan RLS Rataan PPD Banyak -nya daerah Rataan Nilai IPM Kategori IPM Sangat tinggi 1 72.06 14.02 1 10.23 12900.05 95 81.54 2 70.28 12.18 3 7.50 9389.10 239 74.19 Tinggi 3 65.03 12.30 2 7.21 7829.95 166 65.51 Sedang 4 63.16 7.07 4 2.88 4715.07 14 52.69 Rendah Ket : 1234 = urutan yang seharusnya = nomor gerombol Perbandingan dengan Metode Pengkategorian Berdasarkan Nilai IPM BPS mengkategorikan nilai IPM ke dalam empat kategori yaitu sangat tinggi, tinggi, sedang, dan rendah (BPS 2015). Hal itu berdasarkan nilai IPM dengan rentang seperti pada Tabel 2. Kategori tersebut membagi kabupaten/kota di Indonesia dalam beberapa kategori IPM. Karakteristik dalam pengkategorian berdasarkan nilai IPM dengan nilai indikator-indikatornya dapat dilihat pada Tabel 10 dan Gambar 13.

20 Gambar 13 Peta sebaran pengkategorian berdasarkan nilai IPM Tabel 9 Karakteristik pengkategorian IPM Kategori Gerombol diurutkan AHH HLS RLS PPD Banyaknya daerah Sangat Tinggi 1 71.92 1 12.57 2 7.40 4 9406.67 2 12 Tinggi 2 70.72 2 12.61 1 7.76 2 9940.39 1 132 Sedang 3 67.91 3 12.38 3 7.83 1 9242.99 3 327 Rendah 4 67.85 4 12.02 4 7.54 3 8919.24 4 41 Ket : 1234 urutan yang seharusnya Gambar 13 memperlihatkan bahwa warna yang banyak muncul pada keseluruhan wilayah Indonesia adalah warna kuning yang diartikan sebagai daerah yang mempunyai indikator IPM sedang, selanjutnya warna hijau (tinggi), warna merah (rendah), dan warna biru (sangat tinggi) yang tidak terlihat tampak jelas pada peta karena jumlahnya yang tidak banyak. Kategori rendah merata menyebar di wilayah barat dan wilayah timur. Wilayah provinsi Kalimantan Utara tidak berbeda jauh dengan metode -medoid dan CLARA mempunyai kategori nilai IPM yang tinggi. Hal tersebut dimungkinkan karena provinsi tersebut adalah provinsi baru di Indonesia. Tabel 10 menunjukkan bahwa untuk kategori sangat tinggi belum tentu nilai indikator pembentuk nilai IPM juga merupakan yang paling tinggi dalam kategorinya. Hal tersebut menyebabkan ketidaksesuaian urutan antara indikatorindikator IPM dengan kategori yang terbentuk. Hanya indikator angka harapan hidup saja yang sesuai dengan pengkategorian yang diurutkan. Selain itu, harapan lama sekolah, rata-rata lama sekolah dan pengeluaran perkapita disesuaikan mempunyai ketidaksesuaian urutan dalam menentukan kategori. Hal ini menyebabkan tidak berbanding lurusnya hasil dari nilai IPM dengan indikator penyusunnya. Banyaknya daerah pada pengkategorian berdasarkan nilai IPM sama seperti metode -medoid dan CLARA yaitu banyak ditemukan pada kategori dua dan

kategori tiga. Hal ini menunjukkan bahwa banyak kabupaten/kota di Indonesia memiliki nilai IPM pada kategori sedang sebanyak 327 kabupaten/kota. Banyaknya daerah pada gerombol satu merupakan daerah yang menjadi pencilan atas pada beberapa indikator IPM. Namun pada gerombol empat, pencilan bawah tidak berkumpul menjadi anggota sendiri melainkan bercampur dengan anggota lain. Jika dibandingkan dengan metode -medoid dan CLARA dengan banyaknya gerombol empat, ketidaksesuaian indikator penyusun IPM rendah. Tabulasi silang antara metode -medoid dan CLARA dengan pengkategorian berdasarkan nilai IPM dapat dilihat pada Tabel 12 dan Tabel 13. 21