BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB III K-MEDIANS CLUSTERING

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

BAB I PENDAHULUAN. Sekarang ini penelitian sering kali melibatkan beberapa variabel

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. 7). Analisis ini dikelompokkan menjadi dua, yaitu analisis dependensi dan

1.1 LATAR BELAKANG MASALAH

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak

BAB I PENDAHULUAN. 1.1 Latar Belakang

Analisis Cluster Average Linkage Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur

BAB IV METODE PENELITIAN

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE

DAFTAR ISI. ABSTRAK... i. KATA PENGANTAR... ii. UCAPAN TERIMA KASIH... iii. DAFTAR ISI... vi. DAFTAR TABEL... x. DAFTAR GAMBAR...

InfinityJurnal Ilmiah Program Studi Matematika STKIP Siliwangi Bandung, Vol 3, No.2, September 2014

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

ANALISIS KARAKTERISTIK POLA BELANJA KELUARGA DENGAN ANALISIS KLASTER

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

BAB I PENDAHULUAN Latar Belakang

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS)

Pengenalan Pola. Klasterisasi Data

ANALISIS KLUSTER UNTUK DATABINARY DAN PENERAPANNYA PADA PEMILIHAN TIPE MOBIL. Zulaekhah Pratiwi 1 ABSTRACT

Tugas akhir disajikan sebagai salah satu syarat untuk memperoleh gelar Ahli Madya Program Studi Statistika Terapan dan Komputasi

BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB I PENDAHULUAN

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN I.1 Latar Belakang

PENGELO MPOKAN KUALITAS UDARA AMBIEN MENURUT KABUPATEN/KOTA DI JAWA TENGAH MENGGUNAKAN ANALISIS KLASTER

PERANAN STATISTIKA DALAM PENELITIAN

Analisis Cluster terhadap Tingkat Pencemaran Udara pada Sektor Industri di Sumatera Selatan

BAB I PENDAHULUAN Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

LANGKAH-LANGKAH PENGOLAHAN DATA PENELITIAN. Oleh: Bambang Avip Priatna Martadiputra

Partitional clustering KLASTERING DENGAN METODE K-MEANS

BAB II LANDASAN TEORI

ANALISIS GEROMBOL CLUSTER ANALYSIS

MK. PERENCANAAN LINGKUNGAN ANALISIS PEUBAH GANDA MULTIVARIATE ANALYSIS

BAB 2 LANDASAN TEORI

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

Analisis Cluster dengan Average Linkage Method dan Ward s Method untuk Data Responden Nasabah Asuransi Jiwa Unit Link

STK511 Analisis Statistika. Pertemuan 13 Peubah Ganda

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

Bab 2 Tinjauan Pustaka

BAB 2 TINJAUAN PUSTAKA

PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR

Analisis Cluster Studi Kasus: Kabupaten Jepara Jawa Tengah

BAB II TINJAUAN PUSTAKA

SEGMENTASI CITRA. thresholding

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

ANALISIS KELOMPOK METODE HIRARKI UNTUK PENGELOMPOKAN KOTA/KABUPATEN DI JAWA TIMUR BERDASARKAN INDIKATOR KETENAGAKERJAAN,,

Anisa Bella Fathia, Dewi Rachmatin, Jarnawi Afgani Dahlan, Departemen Pendidikan Matematika FPMIPA Universitas Pendidikan Indonesia

PENGELOMPOKAN KELAS KEKUATAN PADA BEBERAPA JENIS KAYU BERDASARKAN SIFAT MEKANIK DENGAN MENGGUNAKAN ANALISIS GEROMBOL

BAB I PENDAHULUAN A. Latar Belakang

BAB I PENDAHULUAN. efektivitas dan efisiensi kerja tercapai. STIKOM Surabaya merupakan salah

Jurnal EKSPONENSIAL Volume 7, Nomor 1, Mei 2016 ISSN

INDEPT, Vol. 1, Februari 2011 ISSN

BAB I PENDAHULUAN. 1.1 Latar Belakang

ESTIMASI PARAMETER PADA SISTEM PERSAMAAN SIMULTAN DENGAN METODE LIMITED INFORMATION MAXIMUM LIKELIHOOD (LIML) SKRIPSI

APLIKASI ANALISIS KLASTER PADA DATA SIMULASI INDEKS GEOMAGNET LOKAL

DATA MINING DAN WAREHOUSE A N D R I

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering

BAB III DIVISIVE ANALISIS. Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu

BAB II LANDASAN TEORI

PENGELOMPOKAN KABUPATEN/KOTA BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHI KEMISKINAN DI JAWA TENGAH MENGGUNAKAN METODE WARD DAN AVERAGE LINKAGE

BAB II TINJAUAN PUSTAKA. dari variabel-variabel yang saling berkorelasi. Analisis peubah ganda dapat

ANALISIS MULTIVARIAT PADA DATA INDEKS GEOMAGNET GLOBAL

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

BAB II LANDASAN TEORI

JULIO ADISANTOSO - ILKOM IPB 1

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN PERSENTASE RUMAH TANGGA MENURUT KUALITAS FISIK AIR MINUM DENGAN MENGGUNAKAN K-MEANS CLUSTER

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

FAKTOR-FAKTOR YANG MEMPENGARUHI PENJURUSAN SISWA MELALUI ANALISIS DISKRIMINAN. Nerli Khairani Lia Anggriani Siregar. Abstrak

BAB I PENDAHULUAN 1.1. Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Analisis Klaster Hierarki Untuk Pengelompokkan Kabupaten/Kota Di Jawa Tengah Berdsarkan Indikator Indeks Pembangunan Manusia (IPM) Tahun 2015

HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA PENGELOMPOKKAN KECAMATAN DI PULAU MADURA BERDASARKAN INDIKATOR PEMERATAAN PENDIDIKAN

PENGELOMPOKAN KABUPATEN/KOTA DI JAWA TENGAH MENGGUNAKAN METODE K-MEANS DAN FUZZY C-MEANS

BAB I PENDAHULUAN. Tabel 1.1 Data Jumlah Nasabah 4 Bank BUMN pada Tahun No Nama Bank Jumlah Nasabah 1. BRI BNI

BAB I PENDAHULUAN 1.1 Latar Belakang

PERBANDINGAN KINERJA METODE COMPLETE LINKAGE, METODE AVERAGE LINKAGE, DAN METODE K-MEANS DALAM MENENTUKAN HASIL ANALISIS CLUSTER

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

BAB I PENDAHULUAN. 1.1 Latar Belakang

PROSIDING ISSN: M-14 ANALISIS K-MEANS CLUSTER UNTUK PENGELOMPOKAN KABUPATEN /KOTA DI JAWABARAT BERDASARKAN INDIKATOR MASYARAKAT

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. variabel. Salah satu metode dalam analisis multivariat adalah analisis faktor.

BAB 1 PENDAHULUAN. banyak diterapkan pada berbagai bidang sebagai dasar bagi pengambilan


Bab 1 PENDAHULUAN. 1.1 Latar Belakang

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada hubungan satu variabel atau dua variabel saja, akan tetapi cenderung melibatkan banyak variabel. Analisis tentang banyak variabel dikaji secara mendalam dalam analisis multivariat. Analisis multivariat adalah metode-metode statistik yang mengolah beberapa pengukuran menyangkut individu atau objek sekaligus (Simamora, 2005:2). Teknik analisis multivariat diklasifikasikan menjadi dua yaitu analisis dependensi/ketergantungan (dependence methods) dan analisis interdependensi/saling ketergantungan (interdependence methods). Analisis dependensi bertujuan untuk menjelaskan atau memprediksi variabel terikat dengan menggunakan dua atau lebih variabel bebas, sedangkan analisis interdependensi bertujuan untuk mereduksi atau mengelompokkan seperangkat variabel menjadi variabel baru yang lebih sedikit jumlahnya. Analisis dependensi terdiri dari analisis regresi multivariat, analisis diskriminan, analisis varians multivariat (MANOVA) dan analisis korelasi kanonik. Analisis interdependensi terdiri dari analisis faktor, analisis klaster, dan lain-lain. Dalam perkembangannya analisis klaster telah dipergunakan dalam berbagai displin ilmu seperti biologi, ekonomi, psikologi, pemasaran dan lain-lain. Sebagai contoh dalam bidang pemasaran, analisis klaster bertujuan untuk 1

2 membuat segmen pasar (segmenting the market) dalam mengelompokkan jumlah pembeli berdasarkan keuntungan pembelian barang, memahami perilaku pembeli (undestanding bayer behaviours) dalam mengelompokkan tempat belanja, mengenali peluang produk baru (identifiying new product opporunities) dalam mengelompokkan merek suatu produk, memilih uji pasar (selecting test market) dalam mengelompokkan jenis kota. Dillon dan Goldstein (Nurhandayani, 2003:1) mengatakan bahwa Analisis klaster adalah statistik variabel ganda yang digunakan apabila ada buah individu atau objek yang mempunyai variabel dan ingin dikelompokkan ke dalam klaster berdasarkan sifat-sifat yang diamati sehingga individu atau objek yang terletak dalam satu klaster memiliki kemiripan yang lebih besar dibandingkan dengan objek yang terletak dalam klaster lain. Prinsip dasar dalam analisis klaster adalah mengelompokkan objek (observasi) pada suatu klaster yang memiliki kemiripan sangat besar dengan objek lain dalam klaster yang sama (similarity), tetapi sangat tidak mirip dengan objek lain pada klaster yang berbeda (dissimilarity). Hal ini berarti bahwa klaster yang baik akan mempunyai homogenitas (kesamaan) yang tinggi antar anggota dalam satu klaster (within-cluster) dan heterogenitas (perbedaan) yang tinggi antar klaster yang satu dengan yang lainnya (between- cluster). Sebelum melakukan proses analisis klaster, hendaknya dilakukan pengujian asumsi terlebih dahulu. Asumsi-asumsi dalam analisis klaster yaitu data bebas dari outliers (pencilan) dan multikolinieritas. Pencilan merupakan suatu data observasi yang menyimpang dari sekumpulan data yang lain. Adanya

3 pencilan dapat mengubah struktur sebenarnya dari populasi sehingga klasterklaster yang terbentuk tidak reprensentatif. Ini berarti bahwa klaster tersebut tidak mencerminkan karakteristik populasi yang sebenarnya. Sedangkan multikolinieritas berarti terdapat hubungan linear di antara beberapa atau semua variabel. Oleh karena itu, variabel-variabel yang bersifat multikolinieritas dalam analisis klaster perlu dipertimbangkan secara seksama. Analisis klaster terdiri dari metode hirarki (Hierarchical Clustering method) dan non-hirarki (Non-Hierarchical Clustering method). Metode hirarki digunakan apabila belum ada informasi jumlah klaster yang akan dipilih. Metode ini secara umum dibedakan menjadi dua yaitu metode aglomeratif (penggabungan) dan metode divisif (pemecahan). Metode agglomeratif antara lain Single Linkage, Complete Linkage, Average Linkage, Ward s Method, Centroid Method, Median Method dan Equal Variance Maximum Likelihood Method. Sedangkan metode divisif antara lain monotothic dan politothic. Metode nonhirarki bertujuan untuk mengelompokkan n objek ke dalam k klaster ( ), di mana nilai k telah ditentukan sebelumnya. Metode ini antara lain K-Means, dan Fuzzy C-Means. K-Means merupakan metode klastering sederhana dan mudah diimplementasikan karena memiliki kelebihan dalam mengelompokkan data yang berukuran besar serta menghasilkan klaster dengan cepat. Kelemahan metode ini yaitu pada K-means, jumlah klaster awal ( ) harus ditentukan sebelumnya dan tidak menjamin solusi klaster yang unik karena metode ini sulit mencapai global optimum (Hartigan, 1975:84).

4 K-Means termasuk dalam teknik partitioning. Secara umum teknik ini dimulai oleh penentuan k titik di ruang berdimensi p untuk menentukan estimasi awal pusat klaster (Everitt, 1974:25). Dengan demikian dalam teknik partitioning ini, metode K-Means memungkinkan setiap data harus termasuk ke klaster tertentu pada suatu tahapan proses, pada tahapan proses berikutnya berpindah ke klaster yang lain. Metode K-Means bertujuan untuk mengelompokkan objek sedemikian hingga jarak tiap-tiap objek ke pusat klaster di dalam suatu klaster minimum. Berdasarkan uraian di atas, penulis tertarik untuk mengkaji analisis klaster melalui metode K-Means secara mendalam yang disebabkan oleh algoritma K-Means sederhana. Oleh karena itu tugas akhir ini berjudul K-Means Clustering (Studi Kasus pada Data Pengujian Kualitas Susu di Koperasi Peternakan Bandung Selatan). 1.2 Rumusan Masalah Berdasarkan latar belakang di atas, rumusan permasalahan dalam penulisan ini sebagai berikut: 1. Bagaimana kajian teoritis metode K-Means dalam pembentukan klaster? 2. Bagaimana penerapan metode K-Means dalam pembentukan klaster pada data pengujian kualitas susu di KPBS?

5 1.3 Tujuan Penulisan Berdasarkan rumusan masalah di atas, maka penulisan ini memiliki tujuan sebagai berikut: 1. Membahas kajian teoritis metode K-Means dalam pembentukan klaster 2. Menerapkan metode K-Means dalam pembentukan klaster pada data pengujian kualitas susu di KPBS 1.4 Manfaat Penulisan Adapun manfaat penulisan tugas akhir ini sebagai berikut: 1. Teoritis Secara teoritis manfaat penulisan tugas akhir ini adalah untuk memperkaya dan memperluas pengetahuan tentang analisis klaster, khususnya metode K-Means sebagai salah satu teknik dalam analisis multivariat. Di samping itu tugas akhir ini sebagai bahan evaluasi terhadap kemampuan penulis dalam menerapkan teori-teori tentang analisis multivariat yang telah disampaikan semasa perkulihan. 2. Praktis Secara praktis manfaat tugas akhir ini adalah sebagai bahan pertimbangan dan masukan bagi pihak yang berkepentingan serta dapat dijadikan sebagai bahan salah satu informasi yang dapat mendukung tujuan dari pihak yang berkepentingan tersebut.

6 1.5 Sistematika Penulisan Adapun sistematika penulisan tugas akhir ini sebagai berikut BAB I : PENDAHULUAN Bab ini membahas tentang latar belakang, rumusan masalah, tujuan penulisan, manfaat penulisan dan sistematika penulisan. BAB II : TINJAUAN PUSTAKA Bab ini membahas tentang teori-teori pendukung yang akan digunakan dalam pembahasan bab selanjutnya. BAB III : K-Means Clustering Bab ini membahas tentang analisis klaster, metode pengelompokan, metode K- Means, dan validasi klaster. BAB IV : STUDI KASUS Bab ini membahas tentang penerapan metode K-Means dalam pembentukan klaster pada data pengujian kualitas susu dari KPBS. BAB V : KESIMPULAN DAN SARAN Bab ini membahas kesimpulan dan saran-saran. Kesimpulan mengenai keseluruhan isi tugas akhir dan saran-saran untuk kajian selanjutnya.