PERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS, DAN TWO STEP CLUSTER LATHIFATURRAHMAH SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2010
PERNYATAAN MENGENAI TUGAS AKHIR DAN SUMBER INFORMASI Dengan ini saya menyatakan bahwa tesis dengan judul Perbandingan Hasil Penggerombolan Metode k-means, Fuzzy k-means, dan Two Step Cluster adalah karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Bogor, Januari 2010 Lathifaturrahmah NIM G551070081
ABSTRACT LATHIFATURRAHMAH. Comparison of k-means, fuzzy k-means, and two step clustering methods. Under supervision of BUDI SUHARJO and I GUSTI PUTU PURNABA. The main principle of cluster analysis is to classify objects into clusters based on similarity measures. K-means and fuzzy k-means can be classified as popular clustering methods, which are suitable for large data with continuous variables. However, a new method has been developed to be used for large data, that is the two step cluster method. This method allows processing data with different types of variables, which in this case are continuous and categorical. The aim of this research is to compare the clustering results of k-means, fuzzy k- means, and two step cluster method, in order to determine the ideal number of clusters for each method. This research uses hypotetical data taken from SPSS software, which fit the purpose to compare several methods. The results of this study show that in the case of two clusters, k-means and fuzzy k-means methods have more similarities with respect to the number objects in clusters, whereas the two step method gives unequal number of objects in clusters. All methods show that 2 clusters is an ideal number. It is influenced by the ratio between mean squares within clusters, which is smaller than the ratio in the case of 3 and 4 clusters. Keyword : clustering method, k-means, fuzzy k-means, two step cluster.
RINGKASAN LATHIFATURRAHMAH. Perbandingan Hasil Penggerombolan Metode k- means, Fuzzy k-means, dan Two step cluster. Dibimbing oleh BUDI SUHARJO dan I GUSTI PUTU PURNABA. Masalah penggerombolan seringkali ditemui di kehidupan sehari-hari, baik itu terkait dengan bidang sosial, bidang kesehatan, bidang marketing maupun bidang akademik. Analisis gerombol adalah salah satu analisis peubah ganda yang digunakan untuk mengelompokkan objek-objek menjadi beberapa gerombol berdasarkan kemiripan peubah-peubah yang diamati, sehingga diperoleh kemiripan objek dalam gerombol yang sama dibandingkan antar objek dari gerombol yang berbeda. Salah satu metode analisis gerombol adalah metode tak berhierarki (non hierarchical clustering methods). Contoh dari metode tak berhierarki yang sering digunakan adalah k-means dan fuzzy k-means, kedua metode ini cocok digunakan untuk data berukuran besar dan memiliki tipe peubah kontinu. Namun dewasa ini telah dikembangkan suatu metode untuk jenis data yang berukuran besar, yaitu metode two step cluster. Metode ini dikembangkan oleh Chiu et al. (2001) yang memungkinkan untuk mengolah data yang memiliki tipe peubah berbeda, yaitu kontinu dan kategorik. Penelitian ini bertujuan untuk membandingkan hasil penggerombolan metode k-means, fuzzy k-means, dan two step cluster, sehingga dapat menentukan jumlah cluster yang ideal untuk masing-masing metode pada data Afifi. Penelitian ini menggunakan data Afifi. Dari data yang sama ingin dibandingkan hasil penggerombolan dengan metode k-means, metode fuzzy k- means, dan metode two step cluster yang akan memberikan penggerombolan yang terbaik, yaitu yang mempunyai variansi di dalam yang lebih homogen dan variansi antar gerombol yang lebih heterogen. Langkah-langkah yang digunakan dalam penelitian ini yaitu melakukan standarisasi data, menggerombolkan data dengan mencobakan berbagai nilai k untuk metode k-means, fuzzy k-means, dan two step cluster, membandingkan hasil penggerombolan yang terbentuk. Hal yang dibandingkan meliputi distribusi jumlah gerombol, jumlah anggota identik, misclustering, variansi gerombol (variansi within cluster dan variansi between cluster), dan menyimpulkan cluster ideal pada masing-masing metode. Hasil penelitian menunjukkan bahwa untuk masing-masing metode jika semakin bertambahnya jumlah gerombol maka keragaman dalam gerombolnya (variance within cluster) semakin menurun, sebaliknya keragaman antar kelompoknya (variance between cluster) semakin meningkat. Pada masingmasing penggerombolan dengan jumlah 2, 3 dan 4 gerombol, dengan metode k- means, fuzzy k-means, dan two step cluster hasil perbandingan keragaman dalam gerombol dengan keragaman antar gerombol menunjukkan bahwa, pada penggerombolan dengan 2 gerombol memiliki nilai yang jauh lebih kecil dibandingkan dengan 3 atau 4 gerombol. Ini berarti bahwa gerombol yang ideal adalah penggerombolan dengan 2 gerombol.
Hasil dari masing-masing gerombol metode k-means dan fuzzy k-means lebih mirip pada penggerombolan 2 gerombol. Sedangkan metode two step cluster dari awal penggerombolan jumlah anggota gerombol yang agak jauh berbeda dengan kedua metode lainnya. Kata kunci : metode gerombol, k-means, fuzzy k-means, two step cluster.
Hak Cipta milik IPB, tahun 2010 Hak Cipta dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tidak merugikan kepentingan yang wajar IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh Karya Tulis dalam bentuk apapun tanpa izin IPB.
PERBANDINGAN HASIL PENGGEROMBOLAN METODE K-MEANS, FUZZY K-MEANS DAN TWO STEP CLUSTER LATHIFATURRAHMAH Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Departemen Matematika SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2010
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. Hadi Sumarno, MS.
Judul Tesis Nama NIM : Perbandingan Hasil Penggerombolan Metode K-Means, Fuzzy K-Means, dan Two Step Cluster : Lathifaturrahmah : G551070081 Disetujui Komisi Pembimbing Dr. Ir. Budi Suharjo, MS Ketua Dr. Ir. I Gusti Putu Purnaba, DEA Anggota Diketahui Ketua Progam Studi Matematika Terapan Dekan Sekolah Pascasarjana Dr. Ir. Endar H. Nugrahani, MS Prof. Dr. Ir. Khairil A. Notodiputro, MS Tanggal Ujian : 13 Januari 2010 Tanggal Lulus :
PRAKATA Puji dan syukur penulis panjatkan ke hadirat Allah SWT atas segala rahmat dan karunianya tugas akhir yang berjudul Perbandingan Hasil Penggerombolan Metode k-means, Fuzzy k-means, dan Two Step Cluster ini bisa terselesaikan sebagai salah satu syarat untuk menyelesaikan pendidikan pada Program Studi Matematika, Sekolah Pascasarjana Institut Pertanian Bogor. Terimakasih yang mendalam penulis sampaikan kepada Bapa dan Mama atas segala doa dan kasih sayangnya. Terimakasih juga penulis sampaikan kepada Dr. Ir. Budi Suharjo, MS dan Dr. Ir. I Gusti Putu Purnaba, DEA selaku pembimbing yang telah membantu dan mengarahkan penulis selama penyusunan tugas akhir ini, serta Dr. Ir. Hadi Sumarno, selaku dosen penguji. Ucapan terima kasih juga juga penulis sampaikan kepada adik, kakak, sahabat dan teman-teman yang tidak dapat dituliskan namanya satu persatu atas segala do a, dukungan, serta kasih sayangnya. Juga kepada semua pihak yang telah turut membantu dalam penulisan tesis ini, penulis berdo a semoga Allah SWT membalas mereka dengan kebaikan. Akhirnya penulis menyadari bahwa tugas akhir ini masih begitu banyak kekurangan. Dengan segala keterbatasan yang ada, semoga tugas akhir ini bermanfaat. Bogor, Januari 2010 Lathifaturrahmah