BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

DAFTAR ISI. ABSTRAK... i. KATA PENGANTAR... ii. UCAPAN TERIMA KASIH... iii. DAFTAR ISI... vi. DAFTAR TABEL... x. DAFTAR GAMBAR...

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

InfinityJurnal Ilmiah Program Studi Matematika STKIP Siliwangi Bandung, Vol 3, No.2, September 2014

BAB III K-MEDIANS CLUSTERING

BAB II TINJAUAN PUSTAKA. Dalam bab ini akan dipaparkan beberapa teori pendukung yang digunakan dalam

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

BAB I PENDAHULUAN. Sekarang ini penelitian sering kali melibatkan beberapa variabel

BAB I PENDAHULUAN. 7). Analisis ini dikelompokkan menjadi dua, yaitu analisis dependensi dan

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak

TINJAUAN PUSTAKA Analisis Gerombol

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

BAB I PENDAHULUAN. Ruang lingkup analisis multivariat adalah terdiri dari analisis statistika

BAB I PENDAHULUAN. yang berhubungan dengan cara mengumpulkan atau memperoleh data, berdasarkan kumpulan data tersebut (Sudjana, 1992).

BAB III PEMBAHASAN. Analisis cluster merupakan analisis yang bertujuan untuk. mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang

Analisis Cluster Average Linkage Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur

PROSIDING ISSN: M-22 ANALISIS PERUBAHAN KELOMPOK BERDASARKAN INDIKATOR KESEJAHTERAAN RAKYAT TAHUN DI PROVINSI JAWA TENGAH

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Probability and Random Process

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Bab 1 PENDAHULUAN. 1.1 Latar Belakang

satu dan pengukurannya bersifat non-metrik, maka teknik analisisnya digunakan analisis regresi berganda. Jika variable tergantung

PERANAN STATISTIKA DALAM PENELITIAN

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

ESTIMASI PARAMETER PADA SISTEM PERSAMAAN SIMULTAN DENGAN METODE LIMITED INFORMATION MAXIMUM LIKELIHOOD (LIML) SKRIPSI

ANALISIS KELOMPOK METODE HIRARKI UNTUK PENGELOMPOKAN KOTA/KABUPATEN DI JAWA TIMUR BERDASARKAN INDIKATOR KETENAGAKERJAAN,,

Minggu II STATISTIKA MULTIVARIATE TERAPAN

STK511 Analisis Statistika. Pertemuan 13 Peubah Ganda

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS)

BAB V PENUTUP. Dari hasil studi kasus untuk empat puluh satu data tingkat polusi udara di kota

BAB II LANDASAN TEORI

DATA MINING DAN WAREHOUSE A N D R I

3 PEWILAYAHAN CURAH HUJAN

BAB II TINJAUAN PUSTAKA. penelitian ini, yaitu analisis peubah ganda, analisis gerombol (cluster analysis),

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang. Tanpa memperhatikan bidang penelitian yang dikaji, mengumpulkan data

BAB III PEREDUKSIAN RUANG INDIVIDU DENGAN ANALISIS KOMPONEN UTAMA. Analisis komponen utama adalah metode statistika multivariat yang

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENGELOMPOKAN KABUPATEN/KOTA BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHI KEMISKINAN DI JAWA TENGAH MENGGUNAKAN METODE WARD DAN AVERAGE LINKAGE

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE

ANALISIS KLASTER KECAMATAN DI KABUPATEN SEMARANG BERDASARKAN POTENSI DESA MENGGUNAKAN METODE WARD DAN SINGLE LINKAGE

BAB II LANDASAN TEORI

1.1 LATAR BELAKANG MASALAH

BAB III METODE PENELITIAN. A. Waktu dan Tempat Penelitian

BAB 1 PENDAHULUAN Latar Belakang

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 2 TINJAUAN PUSTAKA

aljabar geo g metr me i

LANGKAH-LANGKAH PENGOLAHAN DATA PENELITIAN. Oleh: Bambang Avip Priatna Martadiputra

MK. PERENCANAAN LINGKUNGAN ANALISIS PEUBAH GANDA MULTIVARIATE ANALYSIS

BAB III METODE PENELITIAN

BAB III ANALISIS KONJOIN. Dalam upaya untuk memprediksi preferensi warga mengenai sistem

BAB 2 LANDASAN TEORI

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. Analisis regresi merupakan suatu metode yang digunakan untuk

Uji statistik multivariat digunakan untuk menguji

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan.

BAB III MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST. Pada bab ini akan dikaji bahasan utama yaitu pencilan dan analisis

Pengenalan Pola. Klasterisasi Data

KAJIAN METODE BERBASIS MODEL PADA ANALISIS CLUSTER DENGAN PERANGKAT LUNAK MCLUST

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENGELOMPOKAN KABUPATEN/KOTA BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHI KEMISKINAN DI JAWA TENGAH MENGGUNAKAN METODE WARD DAN AVERAGE LINKAGE SKRIPSI

STATISTIK DESKRIPTIF. Abdul Rohman, S.E

SILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE :

BAB III METODE PENELITIAN

SEGMENTASI CITRA. thresholding

BAB 2 TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

ANALISIS PEUBAH GANDA ANALISIS GEROMBOL HAZMIRA YOZZA JURUSAN MATEMATIKA UNAND LOGO

BAB II TINJAUAN PUSTAKA. dari variabel-variabel yang saling berkorelasi. Analisis peubah ganda dapat

BAB I PENDAHULUAN. Dalam suatu penelitian, hubungan suatu variabel dependent atau

BAB 2 LANDASAN TEORI

BAB IV HASIL PENELITIAN. Data yang dikumpulkan dalam penelitian ini terdiri dari tiga variabel yaitu

BAB 2 TINJAUAN PUSTAKA

MULT L IV I ARIA I T METODE RISET BISNIS

TINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan

BAB 2 LANDASAN TEORI

K-Means Clustering dan Average Linkage dalam Pembentukan Portfolio Saham

Analisis Klaster Hierarki Untuk Pengelompokkan Kabupaten/Kota Di Jawa Tengah Berdsarkan Indikator Indeks Pembangunan Manusia (IPM) Tahun 2015

BAB 2 LANDASAN TEORI

Analisis Cluster terhadap Tingkat Pencemaran Udara pada Sektor Industri di Sumatera Selatan

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

UKDW BAB I PENDAHULUAN

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

DSS untuk Menganalisis ph Kesuburan Tanah Menggunakan Metode Single Linkage

STATISTIK DESKRIPTIF DAN STATISTIK INFERENSIAL

Minggu XI ANALISIS KOMPONEN UTAMA. Utami, H

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang

III. METODE PENELITIAN

Transkripsi:

BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Analisis statistik multivariat adalah metode statistik di mana masalah yang diteliti bersifat multidimensional dengan menggunakan tiga atau lebih variabel secara bersamaan. Dengan menggunakan teknik analisis ini, dapat dianalisis pengaruh beberapa variabel terhadap variabel lainnya dalam waktu yang bersamaan. Analisis multivariat digunakan karena pada kenyataannya masalah yang terjadi tidak dapat diselesaikan dengan hanya menghubung-hubungkan dua variabel atau melihat pengaruh satu variabel terhadap variabel lainnya. Teknik analisis multivariat diklasifikasikan menjadi dua, yaitu 1. Analisis dependensi (analisis ketergantungan) Analisis dependensi berfungsi untuk menerangkan atau memprediksi variabel terikat dengan menggunakan dua atau lebih variabel bebas. Metode ini diklasifikasikan berdasarkan pada jumlah variabel terikatnya. Yang termasuk dalam analisis ini adalah Analisis Regresi Linear Berganda, Analisis Diskriminan, Analisis Varians Multivariat (MANOVA) dan lain-lain. 2. Analisis interdependensi (analisis saling ketergantungan) Analisis interdependensi berfungsi untuk memberikan makna terhadap seperangkat variabel atau membuat kelompok-kelompok secara bersamaan. 1

2 Metode ini diklasifikasikan berdasarkan pada jenis masukan variabel dengan skala pengukuran bersifat metrik dan non metrik. Yang termasuk dalam analisis ini adalah Analisis Faktor, Analisis klaster dan Multidimensional Scaling (Supranto, 2004:19). Dari sekian banyak metode statistika, analisis multivariat merupakan analisis yang cocok untuk meringkas data dengan peubah yang banyak. Beberapa analisis dalam analisis multivariat yang dapat digunakan untuk memahami dan mempermudah interpretasi data multivariat di antaranya adalah analisis klaster. Istilah analisis klaster pertama kali digunakan oleh Tryon pada tahun 1939, analisis klaster meliputi sejumlah algoritma dan metode yang berbeda untuk mengelompokkan objek serupa ke dalam masing-masing kategori. Analisis klaster bertujuan untuk mengalokasikan sekelompok individu pada suatu kelompokkelompok yang saling bebas sehingga individu-individu di dalam kelompok itu mirip satu dengan yang lain, sementara itu individu-individu di dalam kelompok yang berbeda tidak mirip. Dalam pengelompokan dibutuhkan suatu ukuran yang dapat menerangkan keserupaan atau kedekatan antar data yaitu ukuran kemiripan atau similaritas. Ukuran similaritas yang sering digunakan adalah ukuran jarak yaitu jarak Euclid. Dalam teknik-teknik multivariat, yang sangat diperhatikan adalah syarat normalitas, linearitas dan homoskedastisitas tetapi tidak dalam analisis klaster. Dalam analisis klaster, yang lebih diperhatikan adalah data bebas dari outliers (pencilan) dan ada tidaknya kolinearitas.

3 Dalam melakukan pemilihan objek ke dalam klaster-klaster, analisis tidak hanya peka terhadap variabel-variabel yang tidak sesuai dengan kasus yang diteliti, tetapi juga peka terhadap outliers yaitu objek-objek yang berbeda dengan objek yang lainnya. Outliers dapat mengubah struktur sebenarnya dari populasi sehingga akan memperoleh klaster-klaster yang tidak sesuai dengan struktur sebenarnya dari populasi tersebut. Karena itu, pembuangan outliers sangat penting dalam analisis ini. Kolinearitas terjadi disebabkan karena adanya korelasi antar variabel. Untuk mengatasi variabel-variabel yang berkorelasi dalam data, salah satu variabel harus dibuang. Pembuangan variabel dalam analisis ini tentunya akan mengurangi jumlah variabel. Maka dari itu, diperlukan suatu analisis lain yang dapat menganalisa suatu data, di mana variabel-variabel yang dianalisis dari data tersebut berkorelasi analisis ini disebut analisis komponen utama. Analisis komponen utama merupakan teknik multivariat yang bertujuan untuk mencari kombinasi linear variabel-variabel asal sehingga data dapat diringkas tanpa kehilangan informasi sekecil mungkin. Variabel-variabel tersebut akan ditransformasi menjadi lebih sedikit atau sama dengan jumlah variabel awal. Proses analisis klaster atau pengelompokan data bisa dilakukan dengan dua metode yaitu: 1. Metode Hirarki. Dalam metode ini jumlah kelompok yang akan diperoleh belum diketahui. Metode ini dibagi menjadi dua yaitu metode agglomerative (pemusatan) dan

4 metode divisive (penyebaran). Beberapa metode klaster hirarki yang sering digunakan dibedakan berdasarkan kemiripan (similarity). Ada yang menggunakan Single Linkage Method, Complete Linkage Method, Average Linkage Method, Ward s Method, Centroid Method, Median Method dan Equal-Variance Maximum Likelihood Method. Hasil dari metode agglomerative dan metode divisive bisa ditampilkan dalam bentuk diagram yang disebut dendogram (Jhonson, 1982:543). Dendogram menggambarkan proses pembentukan klaster yang dinyatakan dalam bentuk gambar. Garis mendatar di atas dendogram menunjukkan skala yang menggambarkan tingkat kemiripan, semakin kecil nilai skala menunjukkan semakin mirip individu/objek tersebut. Demikian juga sebaliknya. 2. Metode Non-Hirarki. Metode ini dimulai dengan mengasumsikan ada k kelompok terlebih dahulu. Metode yang digunakan adalah k-means dan fuzzy. Metode k-means merupakan metode pengelompokan yang bertujuan mengelompokkan objek sedemikian sehingga jarak tiap-tiap objek ke pusat kelompok di dalam satu kelompok adalah minimum.

5 Pembahasan dalam tugas akhir akan dititikberatkan pada metode-metode berikut, yaitu: 1) Single Linkage Method Single Linkage adalah proses pengklasteran yang didasarkan pada jarak terdekat antar objeknya. Jika dua objek terpisah oleh jarak yang pendek, maka kedua objek tersebut akan digabung menjadi satu klaster dan demikian seterusnya. 2) Complete Linkage Method Complete Linkage adalah proses pengklasteran yang didasarkan pada jarak terjauh antar objeknya. 3) Average Linkage Method Average Linkage adalah proses pengklasteran yang didasarkan pada jarak rata-rata antar objeknya. 4) Ward s Method Metode ini berbeda dengan metode lainnya karena menggunakan pendekatan analisis varians untuk menghitung jarak antar klaster. Dengan kata lain, metode ini berusaha untuk memperkecil jumlah kuadrat Sum Square dari setiap dua kelompok yang dapat dibentuk. Keuntungan metode ini, lebih efisien dan cenderung menciptakan klaster berukuran kecil.

6 Ada beberapa kelebihan dan kelemahan dari analisis klaster. Kelebihan analisis klaster antara lain: 1) Dapat mengelompokkan data observasi dalam jumlah besar dan variabel yang relatif banyak, sedemikian sehingga data yang direduksi dengan kelompok akan mudah dianalisis. 2) Dapat dipakai dalam skala data ordinal, interval dan rasio. Kelemahan analisis klaster antara lain: 1) Pengelompokan bersifat subjektifitas peneliti karena hanya melihat dari gambar dendogram; 2) Untuk data yang terlalu heterogen antara objek penelitian yang satu dengan yang lain akan sulit bagi peneliti untuk menentukan jumlah kelompok yang akan dibentuk; 3) Metode-metode yang dipakai memberikan perbedaan yang signifikan, sehingga dalam perhitungan biasanya masing-masing metode dibandingkan; 4) Semakin besar observasi, biasanya tingkat kesalahan pengelompokan akan semakin besar (hasil penelitian) (Raharto, 2008:3). Dari beberapa kelebihan dan kelemahan analisis klaster di atas, penulis sangat ingin mengetahui metode-metode yang digunakan untuk membentuk klaster. Meskipun metode-metode yang digunakan berbeda dan akan memberikan perbedaan yang signifikan, namun semua itu tidak menjadi masalah karena tujuan dari metode-metode adalah membentuk klaster dari objek-objek.

7 1.2. RUMUSAN MASALAH Berdasarkan latar belakang tersebut, dapat dirumuskan beberapa masalah antara lain: 1. Bagaimanakah proses analisis klaster? 2. Bagaimanakah membentuk klaster dari beberapa objek berdasarkan karakteristiknya dengan menggunakan Single Linkage Method, Complete Linkage Method, Average Linkage Method dan Ward s Method? 3. Bagaimanakah penerapan Single Linkage Method, Complete Linkage Method, Average Linkage Method dan Ward s Method pada data tingkat polusi udara di kota Amerika Serikat? 1.3. BATASAN MASALAH Dalam penulisan tugas akhir ini akan dibatasi pada masalah ukuran similaritas yang digunakan yaitu jarak Euclid. 1.4. TUJUAN PENULISAN Berdasarkan rumusan masalah di atas, maka tujuan penulisan ini adalah sebagai berikut: 1. Menentukan proses analisis klaster. 2. Membentuk klaster dari beberapa objek berdasarkan karakteristiknya dengan menggunakan Single Linkage Method, Complete Linkage Method, Average Linkage Method dan Ward s Method.

8 3. Menerapkan Single Linkage Method, Complete Linkage Method, Average Linkage Method dan Ward s Method pada data tingkat polusi udara di kota Amerika Serikat. 1.5. MANFAAT PENULISAN Adapun manfaat dari penulisan tugas akhir ini adalah sebagai berikut: 1. Untuk menerapkan prinsip-prinsip pengelompokan dengan lebih konsisten dari suatu permasalahan yang cukup besar. 2. Untuk mengembangkan suatu metode generalisasi secara induktif, yaitu pengambilan kesimpulan secara umum berdasarkan fakta-fakta yang lebih spesifik, 3. Mendeskripsikan sifat-sifat atau karakteristik dari klaster. 1.6. SISTEMATIKA PENULISAN Sistematika penulisan dalam tugas akhir ini adalah sebagai berikut: BAB I : PENDAHULUAN Bab ini menjelaskan tentang latar belakang masalah, perumusan masalah, batasan masalah, tujuan penulisan, manfaat penulisan dan sistematika penulisan. BAB II : LANDASAN TEORI Bab ini menjelaskan tentang teori pendukung dalam penulisan tugas akhir yang di dalamnya terdapat data multivariat, analisis

9 komponen utama z-score, vektor mean, matrik kovariansi, matrik korelasi populasi dan sampel, matriks sum of square dan cross product (SSCP), ukuran jarak Euclid, outliers dan multikolinearitas. BAB III : METODE SINGLE LINKAGE, COMPLETE LINKAGE, AVERAGE LINKAGE DAN WARD S METHOD PADA ANALISIS KLASTER Bab ini menjelaskan inti dari permasalahan dari tugas akhir ini yaitu Single Linkage Method, Complete Linkage Method, Average Linkage Method dan Ward s Method Pada Analisis klaster. BAB IV : STUDI KASUS Bab ini membahas contoh kasus. BAB V : PENUTUP Bab ini berisi kesimpulan dan saran.