BAB 1 PENDAHULUAN 1.1. Latar Belakang

dokumen-dokumen yang mirip
BAB 3 METODOLOGI PENELITIAN

BAB 2 TINJAUAN PUSTAKA

Bab 2 Tinjauan Pustaka

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami


Pengenalan Pola. K-Means Clustering

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

BAB I PENDAHULUAN I.1 Latar Belakang

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

BAB I PENDAHULUAN Latar Belakang

BAB 3 METODE PENELITIAN

BAB 2 TINJAUAN PUSTAKA

PERANCANGAN APLIKASI MENENTUKAN BERAT BADAN IDEAL DENGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING

ARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL

BAB I PENDAHULUAN. efektivitas dan efisiensi kerja tercapai. STIKOM Surabaya merupakan salah

BAB V PENUTUP. Menggunakan Metode Fuzzy C-Means Clustering, dapat diambil kesimpulan

dengan Algoritma K Means

BAB II LANDASAN TEORI. Teori teori yang digunakan sebagai landasan dalam desain dan. implementasi dari sistem ini adalah sebagai berikut :

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

APLIKASI K-MEANS UNTUK PENGELOMPOKKAN MAHASISWA BERDASARKAN NILAI BODY MASS INDEX (BMI) & UKURAN KERANGKA

BAHAN DAN METODE. Bahan

BAB I PENDAHULUAN. Batasan masalah yang timbul dari ruang lingkup yang ada pada praktikum

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB II LANDASAN TEORI

IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMBAGIAN KELAS SISWA

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

UKDW BAB I PENDAHULUAN Latar Belakang

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek

BAB II TINJAUAN PUSTAKA

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Perumusan Masalah

BAB 3 METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR

ANALISIS KLASTERING LIRIK LAGU INDONESIA

BAB I PENDAHULUAN. komponen penting dalam hal memajukan kualitas PT tersebut. Apabila sistem

BAB III METODOLOGI PENELITIAN

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

UKDW BAB I PENDAHULUAN

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB III K-MEDIANS CLUSTERING

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

APLIKASI ALGORITMA FUZZY C-MEANS CLUSTERING UNTUK PENGELOMPOKKAN LULUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

KLASTERISASI KOMPETENSI GURU MENGGUNAKAN HASIL PENILAIAN PORTOFOLIO SERTIFIKASI GURU DENGAN METODE DATA MINING

BAB I PENDAHULUAN. 1.1 Latar Belakang

DAFTAR ISI... HALAMAN JUDUL... HALAMAN PENGESAHAN... HALAMAN PERNYATAAN... HALAMAN PERSEMBAHAN... PRAKATA... DAFTAR LAMBANG... DAFTAR GAMBAR...

Sri Indra Maiyanti, Endro Setyo Cahyono, Weni Winata. Universitas Sriwijaya

PERBANDINGAN HASIL PENGGEROMBOLAN K-MEANS, FUZZY K- MEANS, DAN TWO STEP CLUSTERING. Lathifaturrahmah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB IV PEMBAHASAN. Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Penerapan Metode Clustering K- Means Untuk Mengukur Tingkat Kedisplinan Siswa Di SMK Perikanan Nusantara Demak

BAB I PENDAHULUAN 1.1. Latar Belakang

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu

BAB I PENDAHULUAN. 1.1 Latar Belakang

Penggunaan Analisis Two Step Clustering untuk Data Campuran. Two Step Clustering Analysis for Combination Data

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2011/2012

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

BAB I PENDAHULUAN Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. memungkinkan setiap anak dapat menikmati pendidikan, diantaranya

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

BAB III ANALISIS DAN PERANCANGAN SISTEM

Siklus Pengambilan Keputusan

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan

SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

MARKET POTENTIAL RESEARCH PASAR TRADISIONAL PD PASAR SURYA DI CABANG SURABAYA SELATAN. M. Jamal Muttaqin ( )

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

BAB 2 TINJAUAN PUSTAKA

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan.

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang

BAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI

BAB II LANDASAN TEORI 2.1. Sistem Pendukung keputusan Pengertian keputusan Keputusan adalah suatu reaksi terhadap beberapa solusi alternative

PENDAHULUAN TINJAUAN PUSTAKA

Statistika Dasar. Hansiswany Kamarga

BAB III ANALISIS III.1 Analisis Konseptual Teknik Pengolahan Data

BAB I PENDAHULUAN 1.1 Latar belakang

BAB III ANALISA DAN PERANCANGAN SISTEM

RANCANG BANGUN MODUL PENGKATEGORIAN TOPIK DAN PENGELOMPOKKAN TOPIK DENGAN KLUSTER DARI APLIKASI FORUM phpbb3 SECARA OTOMATIS.

Transkripsi:

BAB 1 PENDAHULUAN 1.1. Latar Belakang Analisis cluster merupakan salah satu alat yang penting dalam pengolahan data statistik untuk melakukan analisis data. Analisis cluster merupakan seperangkat metodologi yang secara otomatis mengelompokkan pola/objek ke dalam sebuah cluster berdasarkan kemiripannya. Secara intuitif, pola/objek yang berada pada satu cluster lebih memiliki kemiripan antar satu sama lain dibandingkan pola/objek cluster lain. Analisis cluster memiliki aplikasi yang luas seperti data mining (penambangan data), pencarian informasi, biologi, kesehatan, marketing dan segmentasi gambar (Pande dkk, 2012). Ahuja dan Bal (2014) mengungkapkan bahwa analisis cluster dapat digunakan sebagai sebuah alat untuk mendapatkan pengetahuan mengenai penyebaran/pola data atau dapat digunakan sebagai langkah pra process untuk algoritma lain. Analisis cluster juga dapat digunakan untuk menyimpulkan data sehingga menemukan kelompok yang natural atau real. Secara umum terdapat dua jenis data dalam analisis cluster yang digunakan yakni data metric dan non metric atau kombinasi dari kedua jenis data tersebut sehingga akan menambah kerumitan data dalam analisis cluster. Analisis cluster dapat diaplikasikan pada berbagai masalah, salah satu diantaranya adalah riset pasar. Dalam riset pasar, analisis cluster dapat membantu bagian marketing untuk menemukan perbedaan antar konsumen berdasarkan kebiasaan membeli. Informasi perbedaan ini dapat digunakan sebagai bahan pertimbangan dalam membuat sistem rekomendasi untuk melakukan kegiatan promosi. Selain itu, analisis cluster juga dapat digunakan untuk mendeteksi adanya penyimpangan data yang ekstrim dari sekelompok data. Seperti telah diungkapkan sebelumnya, dalam analisis cluster dapat menggunakan jenis data metric, non metric atau bahkan keduanya. Data metric merupakan data yang berupa angka. Sedangkan data non metric merupakan data yang tidak berupa angka. Dalam skala pengukuran, data metric terdiri dari interval dan rasio. Sedangkan data non metric terdiri dari nominal dan ordinal. Untuk mengolah data non metric, data tersebut harus diubah terlebih dahulu menjadi angka. Sebagai contoh, dalam sebuah kuisioner terdapat pertanyaan mengenai jenis kelamin. Jenis kelamin terdiri dari laki-laki atau perempuan. 1

Ketika akan diolah datanya secara statistik, maka data ini harus diubah terlebih dahulu. Perubahan dilakukan dengan menggunakan angka sebagai simbol pembeda. Misal untuk menunjukkan jenis kelamin laki-laki disimbolkan dengan angka 1 dan untuk menunjukkan jenis kelamin perempuan disimbolkan angka 0. Ketika diaplikasikan dalam analisis cluster, data non metric yang digunakan sudah diubah menjadi bentuk angka. Akan tetapi sebenarnya, angka-angka ini hanyalah simbol yang tidak terukur. Perubahan ke dalam bentuk angka ini dilakukan agar dapat dilakukan perhitungan sesuai dengan metode analisis cluster yang digunakan. Dalam melakukan analisis cluster juga terdapat teknik iterasi saat mengaplikasikan algoritma metode clustering. Teknik iterasi merupakan sebuah prosedur yang dilakukan secara berulang-ulang. Teknik iterasi dalam analisis cluster digunakan untuk mengumpulkan objek ke dalam sebuah kelompok yang sama. Jika analisis cluster diaplikasikan secara manual terutama dalam jumlah data yang banyak, tentunya akan membutuhkan waktu yang lama. Saat ini terdapat sebuah software yang digunakan sebagai alat bantu dalam melakukan analisis cluster. Software SPSS merupakan salah satu tools analisis cluster yang sangat terkenal. Kelemahan dari software ini adalah hanya dapat melakukan analisis cluster dengan data yag bersifat metric atau merupakan data hasil kombinasi antara metric dan non metric. Hal ini dikarenakan hanya terdapat tiga metode yang dapat digunakan pada software ini. Secara garis besar, metode dalam analisis cluster terbagi menjadi dua yakni metode hirarki dan metode non hirarki. Diantara kedua metode tersebut, metode yang paling terkenal dan sering digunakan adalah metode non hirarki yakni K-Means. Pada software SPSS, hanya terdapat tiga metode analisis cluster yang dapat digunakan yakni K- Means, Two-Step Cluster dan metode hirarki. Menurut Agusta (2007), K-Means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Sedangkan Mongi (2015) mengungkapkan bahwa metode Two-Step Cluster merupakan suatu metode penggerombolan yang dapat mengatasi masalah skala pengukuran, data berukuran besar dengan peubah yang memiliki tipe data kategorik dan kontinyu serta mengetahui gerombol optimal yang terbentuk. Dapat disimpulkan metode Two-Step Cluster merupakan metode analisis cluster yang digunakan untuk menangani data yang bersifat campuran. 2

Permasalahan dari penggunaan software SPSS ini adalah adanya keterbatasan metode analisis cluster yang dapat digunakan. Ketiga metode analisis cluster yang ada pada software hanya dapat diaplikasikan pada data yang bersifat metric. Sebagai contoh, metode K-Means hanya dapat digunakan untuk mengelompokkan data yang bersifat metric. Hal ini dikarenakan pengukuran jarak yang digunakan adalah Euclidean Distance dimana merupakan pengukuran jarak untuk data metric. Bagaimana jika metode K-Means digunakan untuk mengelompokkan data yang bersifat non metric. Metode ini dapat digunakan akan tetapi akan memunculkan keraguan pada interpretasi cluster. Hal ini dikarenakan, data non metric yang telah diubah menjadi angka merupakan data yang menjadi simbol atau urutan dari sebuah atribut. Ketika dilakukan pengukuran jarak dengan menggunakan Euclidean Distance, angka-angka yang digunakan belum tentu menggambarkan jarak antar objek secara kuantitatif karena data non metric hanya menggambarkan sebuah objek. Dyan (2010) melakukan pengelompokkan handphone dengan menggunakan Basic Sequential Algorithmic Scheme (BSAS). Pengelompokkan handphone ini dilakukan sebagai usulan perbaikan untuk menentukan tata letak handphone pada toko tersebut. Selain itu, dengan penyimpanan handphone yang sudah berada dalam satu kelompok membuat penjual mudah untuk merekomendasikan jenis handphone yang berbeda-beda pada konsumen. Data atribut dalam penelitian ini merupakan data hasil pengkategorisasian (non metric). Karena data yang digunakan bersifat non metric maka dikembangkan metode untuk melakukan pengelompokkan data tersebut dengan menggunakan proximity matriks sebagai pengukuran jarak antar vektor dan metode BSAS sebagai metode clustering yang digunakan. Dikarenakan belum terdapat software analisis cluster yang menggunakan metode BSAS, maka perhitungan dalam penelitian ini dilakukan secara manual. Kelemahan dari perhitungan secara manual ini adalah dari segi waktu dan ketelitian. Semakin banyak data yang dikelompokkan tentunya semakin lama pula waktu yang dibutuhkan untuk melakukan perhitungan. Ketelitian juga penting dalam perhitungan karena akan mempengaruhi hasil dari cluster yang terbentuk. Basic Sequential Algorithmic Scheme (BSAS) merupakan salah satu metode analisis cluster yang paling dasar dan mudah digunakan. Theodoridis dkk (2003) mengungkapkan bahwa metode ini merupakan metode yang cepat dan mudah. Sequential clustering algorithms sendiri terbagi menjadi tiga jenis yakni Basic 3

Sequential Algorithmic Scheme (BSAS), Modified Basic Sequential Algorithmic Scheme (MBSAS) dan A Two Threshold Sequential Scheme. Dari ketiga jenis algoritma ini, yang paling dasar adalah BSAS. Dalam BSAS juga dapat mengatasi kelemahan dari metode hirarki dan non hirarki. Metode BSAS tidak memerlukan parameter jumlah cluster yang diinginkan. Parameter yang dibutuhkan dalam metode ini hanyalah batas nilai pengukuran jarak yang diizinkan. Berdasarkan latar belakang diatas maka dapat dilihat bahwa saat ini software SPSS hanya dapat digunakan untuk menganalisis data yang bersifat metric. Selain itu, untuk data non metric belum terdapat software yang dapat digunakan untuk membantu mempercepat proses perhitungan. Karena itu, penelitian yang akan dilakukan sekarang ini adalah mengembangkan sebuah perangkat lunak untuk melakukan analisis cluster dengan data yang bersifat non metric. Pengembangan perangkat lunak ini dilakukan untuk membantu dilakukannya analisis cluster dengan data yang murni bersifat non metric. Adanya pengembangan perangkat lunak inipun tentunya dapat membantu pengguna sehingga tidak perlu mengkhawatirkan jika data yang digunakan merupakan data non metric. Untuk memudahkan analisis cluster ini maka dipilih metode BSAS. Metode ini dipilih karena merupakan metode analisis cluster yang berurutan dan mudah untuk digunakan serta merupakan metode analisis cluster yang paling dasar. 1.2. Perumusan Masalah Berdasarkan latar belakang di atas, rumusan masalah dalam penelitian ini adalah bagaimana mempermudah perhitungan analisis cluster untuk data non metric sehingga tidak perlu dilakukan perhitungan secara manual. 1.3. Tujuan Penelitian Adapun tujuan dari dilakukannya penelitian ini adalah sebagai berikut. a. Membuat perangkat lunak untuk mempermudah perhitungan analisis cluster data non metric dengan menggunakan BSAS. b. Mengetahui kelemahan dan kelebihan dari perangkat lunak yang dibuat. 4

1.4. Batasan Masalah Dalam setiap penelitian, tentunya dibutuhkan batasan masalah untuk memfokuskan penelitian dan menghindari hal-hal yang tidak berkaitan dengan penelitian yang akan dilakukan. Adapun batasan masalah dalam penelitian yang akan dilakukan adalah sebagai berikut : a. Perangkat lunak dapat melakukan perhitungan dengan jumlah variabel pembeda maksimal 655 kolom dan jumlah case maksimal 24.844 baris. b. Data non metric yang akan dikelompokkan telah dikategorikan dalam bentuk angka. c. Khusus untuk file excel yang dibuka, pada kolom paling pertama merupakan nama dari variabel pembeda. 5