BAB I PENDAHULUAN. Sekarang ini penelitian sering kali melibatkan beberapa variabel

dokumen-dokumen yang mirip
BAB III K-MEDIANS CLUSTERING

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN Latar Belakang

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS)

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

BAB III PEREDUKSIAN RUANG INDIVIDU DENGAN ANALISIS KOMPONEN UTAMA. Analisis komponen utama adalah metode statistika multivariat yang

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN Latar Belakang

PENGELOMPOKKAN DESA DI KABUPATEN SORONG PROVINSI PAPUA BARAT TAHUN 2016 BERDASARKAN STATUS KETERTINGGALAN

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

1.1 LATAR BELAKANG MASALAH

BAB I PENDAHULUAN. 1.1 Latar Belakang

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak

DAFTAR ISI. ABSTRAK... i. KATA PENGANTAR... ii. UCAPAN TERIMA KASIH... iii. DAFTAR ISI... vi. DAFTAR TABEL... x. DAFTAR GAMBAR...

DAFTAR ISI... HALAMAN JUDUL... HALAMAN PENGESAHAN... HALAMAN PERNYATAAN... HALAMAN PERSEMBAHAN... PRAKATA... DAFTAR LAMBANG... DAFTAR GAMBAR...

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

PENERAPAN ALGORITMA FUZZY C-MEANS (FCM) PADA PENENTUAN LOKASI PENDIRIAN LOKET PEMBAYARAN AIR PDAM SALATIGA

DAFTAR ISI. LEMBAR PERNYATAAN. ABSTRAK KATA PENGANTAR. UCAPAN TERIMAKASIH. DAFTAR TABEL. DAFTAR GAMBAR DAFTAR LAMPIRAN

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

KOEFISIEN DETERMINASI REGRESI FUZZY SIMETRIS UNTUK PEMILIHAN MODEL TERBAIK. Iqbal Kharisudin. Jurusan Matematika FMIPA Universitas Negeri Semarang

CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN

PERBANDINGAN HASIL PENGGEROMBOLAN K-MEANS, FUZZY K- MEANS, DAN TWO STEP CLUSTERING. Lathifaturrahmah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN A. Latar Belakang

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini

BAB III DIVISIVE ANALISIS. Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. Statistika adalah salah satu cabang ilmu yang mempelajari prosedur-prosedur

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

BAB V KESIMPULAN DAN SARAN Kesimpulan Saran DAFTAR PUSTAKA LAMPIRAN... 99

BAB I PENDAHULUAN. Ruang lingkup analisis multivariat adalah terdiri dari analisis statistika

DATA MINING DAN WAREHOUSE A N D R I

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. Masalah kesehatan di Indonesia masih menjadi perhatian khusus bagi

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENERAPAN ALGORITMA FUZZY C-MEANS (FCM) PADA PENENTUAN LOKASI PENDIRIAN LOKET PEMBAYARAN AIR PDAM SALATIGA

BAB II LANDASAN TEORI

Bab 7 Analisa Kinerja Multi Parameter dengan Teknik Karakterisasi Beban kerja (Workload)

BAB 2 LANDASAN TEORI. bebas X yang dihubungkan dengan satu peubah tak bebas Y.

(M.6) FUZZY C-MEANS CLUSTERING DENGAN ANALISIS ROBUST

BAB I PENDAHULUAN. Universitas Pendidikan Indonesia repository.upi.edu

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

APLIKASI ALGORITMA FUZZY C-MEANS CLUSTERING UNTUK PENGELOMPOKKAN LULUSAN

BAB I PENDAHULUAN. 7). Analisis ini dikelompokkan menjadi dua, yaitu analisis dependensi dan

BAB I PENDAHULUAN. suatu metode yang disebut metode kuadrat terkecil (Ordinary Least Square OLS).

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. Logika fuzzy memberikan solusi praktis dan ekonomis untuk mengendalikan

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN Latar Belakang

STATISTIKA DESKRIPTIF. Wenny Maulina, S.Si., M.Si

BAB 2 LANDASAN TEORI

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

BAB III METODE PENELITIAN

BAB III PEMBAHASAN. Analisis cluster merupakan analisis yang bertujuan untuk. mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang

BAB I PENDAHULUAN. Peramalan keadaan pada suatu waktu merupakan hal penting. Hal itu

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

dengan Algoritma K Means

BAB II: TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA. Dalam bab ini akan dipaparkan beberapa teori pendukung yang digunakan dalam

Fuzzy C-means Clustering menggunakan Cluster Center Displacement

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN Latar Belakang

InfinityJurnal Ilmiah Program Studi Matematika STKIP Siliwangi Bandung, Vol 3, No.2, September 2014

BAB 2 TINJAUAN PUSTAKA

Anisa Bella Fathia, Dewi Rachmatin, Jarnawi Afgani Dahlan, Departemen Pendidikan Matematika FPMIPA Universitas Pendidikan Indonesia

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 TINJAUAN PUSTAKA

FUZZY MULTI-CRITERIA DECISION MAKING

PENGGEROMBOLAN DAERAH DI INDONESIA BERDASARKAN PEUBAH IPM DENGAN FUZZY K-RATAAN DAN K-MEDOID MIA SYAFRINA

Partitional clustering KLASTERING DENGAN METODE K-MEANS

PEMODELAN PADA PERCOBAAN MIXTURE DENGAN MELAKUKAN TRANSFORMASI CLARINGBOLD TERHADAP PROPORSI KOMPONEN- KOMPONENNYA. PT Jasa Marga ro) C

BAB I PENDAHULUAN. bantu dalam pengembangan ilmu lain. Matematika seolah-olah menjadi penjawab

FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS)

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

BAB 1 PENDAHULUAN. Siklus kehidupan adalah suatu rangkaian aktivitas secara alami yang dialami oleh

BAB II LANDASAN TEORI. Data merupakan bentuk jamak dari datum. Data merupakan sekumpulan

BAB I PENDAHULUAN. 1.1 Latar Belakang

ANALISIS CLUSTER PADA DOKUMEN TEKS

BAB I PENDAHULUAN. semakin meningkat. Menurut Khisma (2016: 9) kemacetan kendaraan bermotor

BAB II LANDASAN TEORI. Pada bab ini akan dibahas mengenai teori-teori yang akan digunakan untuk menunjang dalam proses pembuatan tugas akhir ini.

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. informasi yang berbeda-beda. Berita yang dipublikasi di internet dari hari ke hari

BAB 2 TINJAUAN PUSTAKA

Penggunaan Kernel PCA Gaussian dalam Penyelesaian Plot Multivariat Non Linier. The Use of Gaussian PCA Kernel in Solving Non Linier Multivariate Plot

BAB II LANDASAN TEORI. Dalam bab ini dibahas beberapa definisi dan konsep-konsep yang

BAB I PENDAHULUAN. dibidang industri dihadapkan suatu masalah yaitu adanya tingkat persaingan yang

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

BAB I PENDAHULUAN. yang dikemukakan oleh George Dantzig pada tahun Linear Programming (LP) adalah perencanaan aktivitas-aktivitas untuk

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Sekarang ini penelitian sering kali melibatkan beberapa variabel pengamatan. Data yang diperoleh dengan mengukur lebih dari satu variabel pengamatan pada setiap individu anggota sampel disebut data multivariat. Pada data multivariat, seringkali terdapat suatu hubungan atau korelasi antar variabelvariabel yang diamati. Teknik yang memperlakukan sekelompok variabel pengamatan yang saling berhubungan sebagai satu sistem, dengan memperhitungkan hubungan antar variabel disebut Analisis Multivariat. Analisis multivariat memungkinkan peneliti untuk mencari pemecahan atas masalahmasalah yang lebih kompleks sehingga mencerminkan keadaan yang sebenarnya. Dalam analisis multivariat, terdapat berbagai macam metode yang digunakan untuk menganalisis data, tergantung pada jenis masalah yang ingin dipecahkan dan pada skala pengukuran yang terlibat. Jika di antara variabel yang diukur tidak dibedakan antara variabel bebas dan tak bebas, sehingga persoalan pokoknya adalah tentang saling ketergantungan, maka metode analisisnya disebut metode saling ketergantungan. Salah satu metode saling ketergantungan yang sering digunakan yaitu analisis klaster (Suryanto, 1988). Analisis klaster banyak digunakan di berbagai bidang. Tujuannya adalah mengklasifikasikan objek-objek ke dalam jumlah kelompok yang lebih kecil yang berbeda dengan tujuan untuk meyakinkan bahwa akan terdapat kesamaan yang 1

2 besar dalam kelompok-kelompok tersebut dan perbedaan antar suatu kelompok dengan kelompok yang lain sehingga sangat membantu dalam pembuatan suatu keputusan (Sarwono, 2002). Seperti halnya melakukan analisis lain, analisis klaster juga menetapkan adanya suatu asumsi. Asumsi yang diperhatikan dalam melakukan analisis klaster adalah data yang akan digunakan tidak terdapat pencilan (outlier). Pencilan merupakan suatu pengamatan yang menyimpang cukup jauh dari pengamatan lainnya. Adanya pencilan dapat mengubah struktur sebenarnya dari populasi sehingga klaster-klaster yang terbentuk tidak sesuai dengan struktur yang sebenarnya. Selain itu, multikolinearitas pada data yang akan digunakan sebaiknya tidak terlalu tinggi karena multikolinearitas menunjukkan adanya hubungan dalam dua variabel atau lebih, sehingga variabel-variabel yang bersifat multikolinearitas harus dipertimbangkan secara seksama. Terdapat dua jenis data klastering yang digunakan dalam analisis klaster, yaitu hirarki dan non-hirarki. Pada hirarki klastering, pembentukan klaster diilustrasikan dengan bentuk pohon atau biasa disebut dendogram, yaitu dengan menempatkan objek-objek ke dalam klaster sekaligus kemudian terbentuk sejumlah klaster tertentu sehingga banyaknya klaster yang terbentuk pada awalnya tidak dapat ditentukan. Sedangkan non-hirarki klastering digunakan jika banyaknya kelompok sudah diketahui. Dalam non-hiraki klastering terdapat beberapa algoritma yang dapat digunakan, contohnya yaitu K-Means, Fuzzy C- Means, Gaussian Mixture Models, dan lain-lain. Pemilihan penggunaan dari salah satu jenis data klastering ini tidak dapat ditentukan karena dua alasan. Pertama,

3 penelitian yang sedang diamati dimungkinkan dapat diselesaikan dengan kedua metode (hirarki atau non-hirarki). Kedua, pengamatan yang diamati mungkin sebaiknya diselesaikan dengan suatu metode yang selanjutnya dengan metode lainnya. Penentuan metode mana yang akan dipakai tergantung kepada peneliti dan konteks penelitian dengan tidak mengabaikan substansi, teori dan konsep yang berlaku. Hasil dari klastering, yaitu pengklasifikasian objek-objek, dan interpretasinya tersebut sangat berpengaruh dari jenis data klastering yang digunakan dalam pengelompokan objek-objek ke dalam klaster-klaster. Pada metode K-Means klastering dalam jenis non-hirarki klastering, suatu data secara tegas atau pasti dinyatakan sebagai anggota satu klaster tertentu dan tidak menjadi anggota klaster yang lain. Sedangkan Fuzzy C-Means diartikan masing-masing data mempunyai nilai kemungkinan untuk dapat bergabung ke setiap klaster yang ada. Pada metode K-Means klastering, fungsi ketaksamaan (dissimilarity) diminimumkan sehingga mampu mengelompokkan data yang terpisah jauh. Hasil dari algoritma K-Means klastering, yang berupa pengklasifikasian objek-objek, bergantung pada inisial dari posisi centroid. Sehingga algoritma tersebut tidak memberikan jaminan solusi yang jelas untuk batas-batas antar kelompok. Pada kenyataannya terkadang ditemukan suatu objek yang bukan hanya tergolong dalam satu kelompok, objek tersebut bisa saja memiliki sifat-sifat dari kelompok lain. Sehingga harus ada batasan yang jelas agar tidak terjadi tumpang tindih (overlap) terhadap data tersebut.

4 Perkembangan terakhir dari analisis klaster dengan mempertimbangkan tingkat keanggotaan yang mencakup himpunan fuzzy sebagai dasar pembobotan bagi pengelompokan disebut fuzzy klastering (Bezdek, 1981). Keunggulan utama fuzzy klastering adalah dapat memberikan hasil pengelompokkan bagi objek-objek yang tersebar tidak teratur. Himpunan fuzzy dapat mengubah suatu data yang tumpang tindih (overlap) ke dalam model matematis sehingga dapat diproses lebih lanjut untuk dapat diterapkan dalam proses penalaran. Dengan menggunakan teori himpunan fuzzy, logika bahasa dapat diwakili oleh sebuah daerah yang mempunyai jangkauan tertentu yang menunjukkan derajat keanggotaannya. Sehingga lebih fleksibel dan memiliki toleransi terhadap suatu data. Fuzzy C-Means merupakan salah satu metode fuzzy klastering yang mengadopsi himpunan fuzzy sebagai logika pengambilan keputusan. Secara umum metode Fuzzy C-Means meminimumkan fungsi objektif c n m t = ( µ ik ) k i i= 1 k = 1 P x v 2, yaitu fungsi yang menggambarkan jarak dari suatu titik data ke pusat klaster yang terboboti oleh derajat keanggotaan titik data tersebut sehingga dapat mengatasi masalah overlap yang terjadi dalam analisis klaster. Berdasarkan uraian di atas penulis tertarik untuk mengkaji suatu metode klastering yang dapat mengatasi masalah overlap dengan menjelaskan keanggotaan tiap-tiap data, selanjutnya tugas akhir ini penulis beri judul METODE FUZZY C-MEANS PADA ANALISIS KLASTER.

5 1.2 Rumusan Masalah Berdasarkan latar belakang yang telah dijelaskan, permasalahan dalam penulisan tugas akhir ini dirumuskan sebagai berikut: 1.2.1 Bagaimanakah pembentukan klaster dengan algoritma Fuzzy C- Means? 1.2.2 Bagaimanakah penerapan pembentukan klaster dengan algoritma Fuzzy C-Means pada data industri susu dan makanan dari susu di kota Bandung berdasarkan rata-rata biaya yang harus dikeluarkan perbulan? 1.3 Batasan Masalah Euclid. Pada penulisan tugas akhir ini jarak yang digunakan adalah jarak kuadrat 1.4 Tujuan Penulisan Tujuan penulisan tugas akhir ini adalah: 1.4.1 Untuk membentuk klaster dengan algoritma Fuzzy C-Means. 1.4.2 Untuk menerapkan pembentukan klaster dengan algoritma Fuzzy C- Means pada data industri susu dan makanan dari susu di kota Bandung berdasarkan rata-rata biaya yang harus dikeluarkan perbulan.

6 1.5 Manfaat Penulisan Manfaat penulisan yang penulis harapkan pada tugas akhir ini adalah : 1.5.1 Bagi keilmuan : Memperkaya wacana dalam bidang statistika, khususnya pada metode analisis klaster. 1.5.2 Bagi peneliti : Mengembangkan konsep statistika dalam analisis klaster yaitu dengan algoritma Fuzzy C-Means. 1.6 Sistematika Penulisan Adapun sistematika penulisan yang digunakan pada penulisan tugas akhir ini adalah sebagai berikut: BAB I Pendahuluan Mengemukakan latar belakang, rumusan masalah, batasan masalah, tujuan penulisan, manfaat penulisan dan sistematika penulisan. BAB II Landasan Teori Mengemukakan landasan teori yang mendukung Bab III di antaranya menjelaskan analisis klaster dan himpunan fuzzy. BAB III Fuzzy C-Means Membahas tentang metode pengklasteran menggunakan algoritma Fuzzy C-Means. BAB IV Studi Kasus Pembahasan studi kasus penggunaan dari bahasan dalam Bab III, studi kasus yang diambil oleh penulis adalah data yang berasal dari industri susu dan makanan dari susu di kota Bandung.

7 BAB V Kesimpulan dan Saran Mencoba merangkum keseluruhan hasil pembahasan dalam bentuk kesimpulan dan saran.