BAB I PENDAHULUAN Latar Belakang

dokumen-dokumen yang mirip
BAB 2 TINJAUAN PUSTAKA

Vukovich dinamis yang digabungkan dengan model PRoFIGA didalamnya.

TESIS ADYA ZIZWAN PUTRA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB V PENUTUP. Menggunakan Metode Fuzzy C-Means Clustering, dapat diambil kesimpulan

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

Genetic Algorithme. Perbedaan GA

Pengenalan Pola. K-Means Clustering

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

1. Pendahuluan 1.1. Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN BAB I. PENDAHULUAN

BAB I PENDAHULUAN. sejumlah aktivitas kuliah dan batasan mata kuliah ke dalam slot ruang dan waktu

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS

BAB II KAJIAN TEORI 2.1 Kajian Penelitian Sebelumnya

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. kehidupan sehari-hari dan juga merupakan disiplin ilmu yang berdiri sendiri serta

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

BAB 2 LANDASAN TEORI

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN

Bab IV Simulasi dan Pembahasan

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

BAB V IMPLEMENTASI DAN PENGUJIAN

BAB I PENDAHULUAN. berjalan sesuai dengan yang telah di rencanakan. penjadwalan ini merupakan proses yang menyulitkan karena proses ini

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

Peramalan Kebutuhan Beban Sistem Tenaga Listrik Menggunakan Algoritma Genetika

PENERAPAN ALGORITMA GENETIKA UNTUK MENYELESAIKAN PERMASALAHAN PENJADWALAN DOSEN DENGAN FUZZY

ARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL

CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN

Penerapan Adaptive Genetic Algorithm dengan Fuzzy Logic Controller pada Capacitated Vehicle Routing Problem

OPTIMASI PENJADWALAN CERDAS MENGGUNAKAN ALGORITMA MEMETIKA

RANCANG BANGUN SISTEM PENENTUAN KOMPOSISI BAHAN PANGAN HARIAN MENGGUNAKAN ALGORITMA GENETIKA

PENENTUAN KOMPETENSI MAHASISWA DENGAN ALGORITMA GENETIK DAN METODE FUZZY C- MEANS

BAB III PEMBAHASAN. harga minyak mentah di Indonesia dari bulan Januari 2007 sampai Juni 2017.

PERANCANGAN KONFIGURASI JARINGAN DISTRIBUSI PRODUK BISKUIT MENGGUNAKAN METODE ALGORITMA GENETIKA (Studi Kasus: PT. EP)

Optimasi Cluster Pada Fuzzy C-Means Menggunakan Algoritma Genetika Untuk Menentukan Nilai Akhir

BAB I PENDAHULUAN. efektivitas dan efisiensi kerja tercapai. STIKOM Surabaya merupakan salah

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

A. ADHA. Program Studi Teknik Sipil, Fakultas Teknik,Universitas Islam Riau, Pekanbaru, Indonesia Corresponding author:

Bab II Konsep Algoritma Genetik

PELATIHAN FEED FORWARD NEURAL NETWORK MENGGUNAKAN ALGORITMA GENETIKA DENGAN METODE SELEKSI TURNAMEN UNTUK DATA TIME SERIES

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV ANALISIS MASALAH

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB 3 ANALISA SISTEM

Partitional clustering KLASTERING DENGAN METODE K-MEANS

PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak

DINAMISASI PARAMETER ALGORITMA GENETIKA MENGGUNAKAN POPULATION RESIZING ON FITNESS IMPROVEMENT FUZZY EVOLUTIONARY ALGORITHM (PROFIFEA)

BAB I PENDAHULUAN A. Latar Belakang

BAB IV HASIL DAN UJICOBA

BAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek

1BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION

Bab 2 Tinjauan Pustaka

BAB III. Metode Penelitian

SISTEM PAKAR DIAGNOSIS JENIS JERAWAT PADA WAJAH MENGGUNAKAN METODE K-MEANS CLUSTERING

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi... Volume..., Bulan 20.. ISSN :

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

BAB I PENDAHULUAN. telah diadopsi untuk mengurangi getaran pada gedung-gedung tinggi dan struktur

BAB III ANALISIS DAN PERANCANGAN

Keywords Algoritma, Genetika, Penjadwalan I. PENDAHULUAN

2.16. Keaslian Penelitian BAB III ANALISIS DAN PERANCANGAN Analisa sistem Observasi Wawancara

IMPLEMENTASI FUZZY EVOLUTIONARY ALGORITHMS UNTUK PENENTUAN POSISI BASE TRANSCEIVER STATION (BTS)

METODOLOGI PENELITIAN

PERANCANGAN DAN IMPLEMENTASI PERANGKAT LUNAK VISUALISASI DUA DIMENSI WELL PRODUCTION FORECASTING DENGAN GENETIC ALGORITHM

Lingkup Metode Optimasi

KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH

T E S I S I Wayan Budi Sentana Nrp DOSEN PEMBIMBING Prof. Dr.Ir. Joko Lianto Buliali, M.Sc.

Rancang Bangun Aplikasi Prediksi Jumlah Penumpang Kereta Api Menggunakan Algoritma Genetika

3.2.3 Resiko, Keuntungan dan Kerugian Forex Metode Prediksi dalam Forex MetaTrader 4 sebagai Platform Trading dalam Forex...

ALGORITMA GENETIKA PADA PEMROGRAMAN LINEAR DAN NONLINEAR

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Jaringan Syaraf Tiruan dengan Pembelajaran Algoritma Genetika dan Diversitas untuk Deteksi Kelas Penyakit

BAB I PENDAHULUAN. 1.1 Latar Belakang

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

MEMBANGUN TOOLBOX ALGORITMA EVOLUSI FUZZY UNTUK MATLAB

BAB III PEMBAHASAN. menggunakan model Fuzzy Mean Absolute Deviation (FMAD) dan penyelesaian

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN:

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

Implementasi Algoritma Genetika dalam Pembuatan Jadwal Kuliah

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. teliti. Sehingga tidak terjadi bentrok baik antar mata pelajaran, guru, kelas

PENERAPAN ALGORITMA GENETIKA PADA PENYELESAIAN TRAVELLING SALESMAN PROBLEM (TSP)

1. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV PERCOBAAN DAN ANALISIS. Percobaan metode kompresi citra fraktal menggunakan algoritma

1. Pendahuluan 1.1 Latar Belakang

BAB III PEMBAHASAN. diperoleh menggunakan algoritma genetika dengan variasi seleksi. A. Model Matematika CVRPTW pada Pendistribusian Raskin di Kota

BAB II LANDASAN TEORI

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA

APLIKASI ALGORITMA GENETIKA UNTUK PENENTUAN KOMPOSISI BAHAN PANGAN HARIAN

Gambar 5.1 Form Master Pegawai

T I N J A U A N P U S T A K A Algoritma Genetika [5]

BAB 2 LANDASAN TEORI. 2.1 Clustering

Transkripsi:

1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering digunakan secara luas di dalam berbagai bidang seperti social network analysis, software engineering, dan crime detection. Terdapat beberapa algoritma clustering yang dapat digunakan, tetapi algoritma K-Means dan Fuzzy C-Means adalah algoritma yang umum digunakan karena cukup sederhana (Bai et al., 2011). Clustering adalah merupakan salah satu kelompok dari data mining (Larose, 2006). Pada algoritma K-Means, penentuan jumlah cluster dan penentuan centroid (pusat) merupakan hal yang cukup sulit untuk dilakukan. Penentuan jumlah cluster dan penentuan centroid (pusat) mempengaruhi secara langsung kualitas dari proses clustering (Maitra, et al., 2010). Algoritma K-Means klasik secara umum memerlukan inputan dari user untuk menentukan jumlah dari cluster, kemudian akan secara random menentukan posisi centroid untuk tiap cluster yang ada dan kemudian akan menempatkan suatu data ke dalam suatu cluster berdasarkan kedekatan jarak yang ada. Penelitian yang dilakukan oleh Li et al. (2015) mengenai metode K-Means Global Optimal membahas mengenai proses partisi cluster yang ada menjadi beberapa bagian untuk mencegah agar K-Means terjebak ke dalam kondisi local optima. Penelitian mengenai penentuan centroid sendiri juga sangat menarik perhatian sejumlah peneliti. Proses penentuan centroid merupakan proses yang melibatkan sejumlah iterasi hingga diperoleh hasil yang maksimal. Posisi centroid yang baru untuk tiap cluster akan

2 berubah sepanjang iterasi dan diperoleh berdasarkan rata-rata koordinat dari data-data yang dikelompokkan ke dalam cluster tersebut (Rahman dan Islam, 2014). Sejumlah peneliti telah melakukan penelitian mengenai penentuan centroid pada algoritma K-Means. Ahmad dan Dey (2007) menggunakan konsep fuzzy di dalam penentuan centroid. Proses penentuan centroid akan dilakukan dengan cara membangkitkan bilangan acak untuk centroid tiap cluster. Nilai acak tersebut kemudian akan masuk ke dalam tahapan inferensi dan kemudian hasil defuzzifikasi akan menjadi nilai centroid tiap cluster. Cara penentuan centroid ini hampir sama dengan penentuan centroid dengan cara random dan tingkat keakuratannya belum teruji untuk dataset berukuran besar. Cara penentuan centroid yang sama pernah dilakukan oleh Rahman dan Islam (2012) di dalam penentuan centroid untuk fuzzy clustering. Cao et al. (2009) melakukan penentuan centroid berdasarkan nilai frekuensi dari data. Nilai frekuensi dari data menggambarkan nilai rata-rata dari posisi nilai atribut dari tiap data yang ada pada suatu cluster. Kelemahan dari metode ini adalah data-data di dalam suatu cluster harus memiliki nilai atribut yang tidak memiliki perbedaan terlalu besar. Apabila terdapat perbedaan nilai atribut yang terlalu besar, tentu hasil clustering tidak memberikan hasil yang baik. Rahman dan Islam (2014) mengemukakan metode Hybrid Clustering yang dikenal sebagai GenClust yang menggabungkan pemakaian algoritma K-Means dengan Algoritma Genetika. Algoritma Genetika digunakan untuk menentukan jumlah cluster dan juga centroid dari tiap cluster. Penggunaan metode GenClust dapat menghindarkan algoritma K-Means di dalam terjebak di dalam kondisi local optima. Algoritma genetika merupakan salah satu model soft computing yang sering digunakan dalam menyelesaikan permasalahan optimasi. Dalam algoritma genetika terdapat tiga parameter penting yang harus didefinisikan yaitu ukuran populasi, probabilitas pindah silang dan probabilitas mutasi. Ketiga parameter ini harus didefinisikan secara hati-hati agar tidak terjadi konvergensi dini atau lokal optimum yaitu dimana individuindividu dalam populasi konvergen pada suatu solusi optimum lokal sehingga hasil paling optimum tidak dapat ditemukan (Muzid, 2014). Metode GenClust dipandang cukup baik untuk menentukan jumlah cluster dan juga centroid dari tiap cluster karena memungkinkan terjadinya peningkatan performa clustering untuk tiap generasi. Namun, yang perlu menjadi pertimbangan adalah percobaan yang dilakukan oleh Rahman dan Islam (2014) menggunakan 50%

3 kromosom diperoleh melalui perhitungan deterministic dan 50% kromosom diperoleh melalui bilangan acak. Rahman dan Islam (2014) pada bagian akhir penelitian menyatakan bahwa metode GenClust akan mengalami kendala komputasi ketika diterapkan pada dataset berukuran besar. Oleh karena itu, Rahman dan Islam (2014) pada akhir penelitiannya menyarankan untuk mengambil sample data pada dataset dan mengimplementasikan GenClust untuk mendapatkan best chromosome dan kemudian mengimplementasikannya sebagai initial centroid pada K-Means. Namun, belum ada penelitian lanjutan yang membahas mengenai perbandingan performance dari metode GenClust dan metode GenClust yang telah dimodifikasi sesuai dengan saran dari Rahman dan Islam (2014). Penelitian ini akan membahas mengenai perbandingan antara metode GenClust, metode GenClust yang dimodifikasi dan juga K-Means klasik di dalam penentuan centroid khususnya di dalam perbandingan untuk mengukur nilai performance yang diukur dari Mean Square Error yang terjadi untuk suatu dataset. 1.2. Rumusan Masalah Penempatan suatu data di dalam suatu dataset pada algoritma K-Means didasarkan pada kedekatan data tersebut dengan centroid dari tiap cluster, sehingga nilai centroid sangat berpengaruh terhadap hasil clustering dengan menggunakan algoritma K-Means. Permasalahannya adalah pada algoritma K-Means penentuan centroid dilakukan dengan membangkitkan bilangan acak, sehingga hasil clustering dapat menunjukkan hasil yang kurang baik. Penelitian ini akan menggunakan metode GenClust yang telah dimodifikasi, di mana kromosom yang digunakan seluruhnya diperoleh melalui perhitungan deterministik. Melalui penelitian ini akan diperoleh perbandingan kinerja yang dinyatakan di dalam nilai Mean Square Error (MSE) antara algoritma K-Means klasik, metode GenClust, dan juga metode GenClust yang telah dimodifikasi. Semakin kecil nilai Mean Square Error (MSE) berarti semakin baik kinerja dari algoritma K- Means yang diperoleh.

4 1.3. Batasan Masalah Sehubungan dengan luasnya permasalahan dan adanya keterbatasan waktu dan pengetahuan peneliti, maka peneliti membatasi masalah yang akan dibahas di dalam penelitian ini sebagai berikut. 1. Penelitian ini akan membahas pengaruh dari penentuan jumlah cluster dan juga centroid pada suatu dataset berukuran besar dengan melakukan perbandingan antara metode GenClust dengan algoritma K-Means klasik. 2. Perbandingan kinerja di dalam penelitian ini didasarkan pada nilai Mean Square Error yang diperoleh pada setiap generasi (iterasi). 1.4. Tujuan Penelitian Tujuan dari penelitian ini adalah menghasilkan perbandingan kinerja yang dinyatakan dalam Mean Square Error yang dipengaruhi oleh penentuan centroid pada metode K- Means dengan menggunakan metode GenClust, metode GenClust yang dimodifikasi dan juga K-Means klasik. 1.5. Manfaat Penelitian Adapun manfaat dari penelitian adalah sebagai berikut. 1. Melalui penelitian ini peneliti akan memperoleh hasil analisis mengenai keterkaitan antara jumlah cluster dan penentuan centroid terhadap hasil clustering. 2. Mengetahui pencapaian kinerja yang diperoleh dengan menggunakan metode GenClust bila dibandingkan dengan menggunakan algoritma K-Means klasik. 1.6. Sistematika Penulisan Penyusunan tesis ini menggunakan kerangka pembahasan yang terbentuk dalam susunan bab yang dapat dijelaskan sebagai berikut. BAB I : PENDAHULUAN Bab ini berisikan tentang latar belakang masalah, rumusan masalah, batasan masalah, tujuan dan manfaat penelitian serta sistematika penulisan.

5 BAB II : TINJAUAN PUSTAKA Bab ini berisikan tentang landasan teori yang mendukung penelitian yang akan dilakukan. BAB III : METODOLOGI PENELITIAN Bab ini berisikan tentang data yang digunakan dan metode yang digunakan di dalam pelaksanaan penelitian. BAB IV : HASIL DAN PEMBAHASAN Bab ini berisi tentang pemaparan mengenai hasil penelitian dan pembahasan mengenai hasil yang diperoleh. BAB V : KESIMPULAN DAN SARAN Bab ini berisi tentang kesimpulan yang diperoleh dari hasil penelitian dan saran yang dapat diberikan kepada pembaca maupun peneliti yang akan melanjutkan penelitian sejenis.