1BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

dokumen-dokumen yang mirip
BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN BAB I. PENDAHULUAN

PERANCANGAN ALGORITMA BELAJAR JARINGAN SYARAF TIRUAN MENGGUNAKAN PARTICLE SWARM OPTIMIZATION (PSO)

1 BAB I PENDAHULUAN. 1.1 Latar Belakang dan Permasalahan

SWARM GENETIC ALGORITHM, SUATU HIBRIDA DARI ALGORITMA GENETIKA DAN PARTICLE SWARM OPTIMIZATION. Taufan Mahardhika 1

BAB I PENDAHULUAN Latar Belakang

PERBANDINGAN KINERJA METODE K-HARMONIC MEANS DAN PARTICLE SWARM OPTIMIZATION UNTUK KLASTERISASI DATA

KOMPUTASI PARALEL UNTUK SEGMENTASI CITRA DIGITAL DENGAN PARTICLE SWARM OPTIMIZATION

BAB I PENDAHULUAN. teliti. Sehingga tidak terjadi bentrok baik antar mata pelajaran, guru, kelas

Implementasi automatic clustering menggunakan particle swarm optimization dan genetic algorithm pada data kemahasiswaan

Gambar 1.1 Contoh Ilustrasi Kasus CVRP 13

BAB I PENDAHULUAN. dan terkadang juga tidak mengikuti jam mata kuliah. Salah satu faktor

Optimisasi Injeksi Daya Aktif dan Reaktif Dalam Penempatan Distributed Generator (DG) Menggunakan Fuzzy - Particle Swarm Optimization (FPSO)

PENGOPTIMALAN UMPAN BALIK LINEAR QUADRATIC REGULATOR PADA LOAD FREQUENCY CONTROL MENGGUNAKAN PARTICLE SWARM OPTIMIZATION

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

1.PENDAHULUAN 1.1 Latar Belakang

BAB 2 TINJAUAN PUSTAKA

PERBANDINGAN ALGORITMA PARTICLE SWARM OPTIMIZATION DAN REGRESI PADA PERAMALAN WAKTU BEBAN PUNCAK

BAB 1 PENDAHULUAN. Perkembangan pengetahuan dibidang kecerdasan buatan sedemikian

BAB IV PERANCANGAN DAN IMPLEMENTASI PERANGKAT LUNAK

BAB II TINJAUAN PUSTAKA. 2.1 Optimasi Berbasis Particle Swarm

ANALISIS PEMBANGKITAN JADWAL PERKULIAHAN DENGAN DISCRETE PARTICLE SWARM OPTIMIZATION

BAB I PENDAHULUAN A. Latar Belakang

OPTIMASI NAÏVE BAYES CLASSIFIER DENGAN MENGGUNAKAN PARTICLE SWARM OPTIMIZATION PADA DATA IRIS

K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

5. Struktur Penulisan Tesis

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. merupakan jaringan komputer yang terdiri dari beberapa intercommunicating

Rekonfigurasi jaring distribusi untuk meningkatkan indeks keandalan dengan mengurangi rugi daya nyata pada sistem distribusi Surabaya.

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN Latar Belakang

PEMBELAJARAN BERTINGKAT PADA ARSITEKTUR JARINGAN SARAF FUNGSI RADIAL BASIS

1. Pendahuluan 1.1 Latar Belakang

IMPLEMENTASI THRESHOLDING CITRA MENGGUNAKAN ALGORITMA HYBRID OPTIMAL ESTIMATION

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI

BAB III METODOLOGI PENELITIAN. Jaringan pipa air terdiri dari pipa-pipa yang saling terhubung yang

Optimasi Kernel K-Means dalam Pengelompokan Kabupaten/Kota Berdasarkan Indeks Pembangunan Manusia di Indonesia

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

RENCANA PEMBELAJARAN SEMESTER (RPS)

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan Abstract

Klasifikasi Data Cardiotocography dengan Integrasi Metode Neural Network dan Particle Swarm Optimization

OPTIMISASI PARTICLE SWARM PADA PEMASANGAN JARINGAN PIPA AIR PDAM"

Clustering Nasabah Bank Berdasarkan Tingkat Likuiditas Menggunakan Hybrid Particle Swarm Optimization dengan K-Means

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO)

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. bit serta kualitas warna yang berbeda-beda. Semakin besar pesat pencuplikan data

Implementasi Algoritma Fuzzy C Means Dan Statistical Region Merging Pada Segmentasi Citra

PENERAPAN METODE PARTICLE SWARM OPTIMIZATION PADA OPTIMASI DISTRIBUSI LPG DARI AGEN KE TOKO KOMPETENSI KOMPUTASI SKRIPSI

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Jaringan Syaraf Tiruan dengan Pembelajaran Algoritma Genetika dan Diversitas untuk Deteksi Kelas Penyakit

SEGMENTASI CITRA AKSARA JAWA MENGGUNAKAN ALGORITMA PARTICLE SWARM OPTIMIZATION

PERBANDINGAN RAPID CENTROID ESTIMATION (RCE) K NEAREST NEIGHBOR (K-NN) DENGAN K MEANS K NEAREST NEIGHBOR (K-NN)

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. secara manual dari suatu kumpulan data. Defenisi lain data mining adalah sebagai

Bab 1 Pendahuluan. 1.1 Latar Belakang

Y Y V (1) max (3) Sementara di dalam persamaan untuk menghitung posisi partikel terdapat variabel Yi. merupakan nilai posisi partikel

Vukovich dinamis yang digabungkan dengan model PRoFIGA didalamnya.

BAB I PENDAHULUAN. 1.1 Pendahuluan

Optimasi Parameter Kontroler PID Berbasis Particle Swarm Optimization untuk Pengendalian Kecepatan Motor Induksi Tiga Fase

Dynamic Optimal Power Flow Mempertimbangkan Carbon Capture And Storage Plants Menggunakan Metode Multi-Objective Particle Swarm Optimization

OPTIMASI PEMBANGKITAN EKONOMIS PADA UNIT-UNIT PEMBANGKIT LISTRIK TENAGA DIESEL TELAGA MENGGUNAKAN MODIFIKASI PARTICLE SWARM OPTIMIZATION (MPSO).

ANALISIS PERBANDINGAN METODE JARINGAN SYARAF TIRUAN DAN REGRESI LINEAR BERGANDA PADA PRAKIRAAN CUACA

BAB II TINJAUAN PUSTAKA. Job shop scheduling problem (JSSP) adalah permasalahan optimasi

1 BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Algoritma Evolusi Topik Lanjut Pada GA

Generated by Foxit PDF Creator Foxit Software For evaluation only. BAB I PENDAHULUAN

BAB I PENDAHULUAN. berdasarkan rencana pengaturan urutan kerja. Daftar atau tabel kegiatan atau

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 3 ANALISA SISTEM

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. yang dikerjakan pada beberapa buah mesin (Rosnani Ginting, 2009). Pekerjaan

BAB I PENDAHULUAN. Penjadwalan produksi flow shop merupakan kegiatan perencanaan

BAB IV HASIL DAN UJICOBA

BAB I PENDAHULUAN 1.1. Latar Belakang

TINJAUAN PUSTAKA. terbentuklah suatu sistem tenaga listrik. Setiap GI sesungguhnya merupakan pusat

BAB I PENDAHULUAN. digunakan untuk identitas citra adalah nama file, tanggal pengambilan,

Dynamic Optimal Power Flow dengan kurva biaya pembangkitan tidak mulus menggunakan Particle Swarm Optimization

OPTIMASI PUSAT KLASTER MENGGUNAKAN ALGORITMA FAST GENETIC KMEAN PADA DATA BERDISTRIBUSI NORMAL

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

FRAGILE IMAGE WATERMARKING BERBASIS DCT DENGAN OPERATOR EVOLUSI HYBRID OF PARTICLE SWARM OPTIMIZATION

SEGMENTASI CITRA. thresholding

BAB I PENDAHULUAN. kepada pengguna tentang sebuah barang sesuai dengan karakteristik pengguna.

OPTIMASI PENJADWALAN PRAKTIKUM MENGGUNAKAN MODIFIED REAL CODE PARTICLE SWARM OPTIMIZATION (STUDI KASUS FAKULTAS IMU KOMPUTER UNIVERSITAS BRAWIJAYA)

BAB I PENDAHULUAN I.1. Latar Belakang [1] [2] [3] [4] [5]

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Pengenalan pola adalah komponen esensial dalam kecerdasan buatan dan computer

Transkripsi:

1BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Clustering merupakan sebuah teknik pemrosesan data yang digunakan untuk menemukan pola-pola tersembunyi pada kumpulan data (Žalik, 2008). Clustering telah banyak diaplikasikan dalam berbagai bidang antara lain penambangan data, pengenalan pola, pengambilan keputusan, machine learning, dan segmentasi citra (Yi dan Yang, 2010). Proses penemuan pola data dilakukan dengan mengelompokkan data ke dalam klaster-klaster sehingga data-data yang memiliki kemiripan berada pada klaster yang sama dan data-data yang tidak memiliki kemiripan terletak pada klaster yang berbeda (Hasan dan Ramakrishnan, 2011). Salah satu cara untuk mengetahui tingkat kemiripan data adalah melalui perhitungan jarak antara data. Semakin kecil jarak antar data maka semakin tinggi tingkat kemiripan data tersebut dan sebaliknya semakin besar jarak antar data maka semakin rendah tingkat kemiripannya. K-means dan variannya merupakan jenis algoritma clustering partitionbased yang telah banyak digunakan dalam clustering data (Jain dan Lansing, 2010). K-means mengelompokkan kumpulan data ke dalam k klaster berdasarkan jarak terdekat antara data dengan pusat klaster (Žalik, 2008). Kelebihan dari algoritma K-means terletak pada kecepatan untuk mencapai konvergen serta kemudahan dalam pengimplementasian (Kao dan Lee, 2009). Pada sisi lain, algoritma K-means memiliki beberapa kelemahan seperti: (i) kecenderungan mengalami konvergensi prematur pada quantization error yang besar (van der Merwe dan Engelbrecht, 2003); (ii) hasil clustering yang sangat bergantung pada penentuan pusat klaster awal (Kao et al., 2008;Ye dan Chen, 2005); serta (iii) mengalami masalah dead-unit (Žalik, 2008). 12

13 Particle Swarm Optimization (PSO) merupakan jenis algoritma evolusi yang terinspirasi dari kawanan burung dan kawanan ikan (Eberhart dan Kennedy, 1995). Walaupun pada awalnya metode PSO dibuat untuk penyelesaian masalah optimasi, beberapa tahun terakhir metode PSO telah banyak diaplikasikan untuk memecahkan berbagai masalah yang berkaitan dengan clustering (Shen et al., 2010). Hal ini disebabkan karena PSO mampu memberikan hasil clustering yang lebih stabil karena tidak adanya ketergantungan pada inisialisai pusat klaster awal (Hasan dan Ramakrishnan, 2011). Tetapi PSO juga memiliki kelemahan pada kecepatan konvergensinya yang cenderung lambat saat mendekati solusi optimum (Ahmadyfard dan Modares, 2008). Penerapan PSO pada clustering data pertama kali dilakukan oleh Van der Merwe dan Engelbrecht (2003). Proses clustering mula-mula dilakukan dengan K-means yang kemudian dilanjutkan oleh PSO. Hasil clustering dari metode K- means digunakan sebagai salah satu partikel awal pada metode PSO. Penggunaan hasil clustering K-means sebagai salah satu partikel awal PSO ternyata mampu meningkatkan performansi dari PSO clustering. Variasi lain dari Particle Swarm Optimization untuk melakukan clustering data adalah Particle Swarm Clustering (PSC) (Cohen dan Castro, 2006). Berbeda dari metode PSO yang merepresentasikan setiap partikel sebagai satu himpunan pusat klaster, pada PSC setiap partikelnya cukup merepresentasikan satu pusat klaster saja. Sehingga solusi akhir klaster-klaster dari pendekatan PSC diperoleh dengan menggabungkan keseluruhan partikel yang ada. Hasil penelitian ini menunjukkan bahwa performansi metode PSC lebih unggul dibandingkan dengan K-means karena PSC dapat terhindar dari stagnasi. Modified PSC (mpsc) merupakan metode yang diusulkan oleh Szabo et al. (2010) yang bertujuan untuk mempercepat kecepatan komputasi metode PSC. Metode mpsc mengusulkan ide mengganti velocity (V) dengan Δx, untuk mengeliminasi kebutuhan akan bobot inersia (ω). Dengan demikian, metode mpsc terbukti memiliki waktu komputasi yang sedikit lebih cepat dibandingkan

14 dengan PSC. Yuwono et al. (2012) mengusulkan metode yang dapat meningkatkan kinerja PSC dan mpsc bernama Rapid Centroid Estimation (RCE). RCE memodifikasi metode mpsc pada bagian frekuensi pembaruan posisi partikel, frekuensi pembaruan matriks jarak (partikel dan titik data) dan partikel terbaik, dan menambahkan global minimum computation untuk penyimpanan kombinasi posisi partikel terbaik. Metode RCE melakukan clustering dengan waktu komputasi yang jauh lebih cepat dibandingkan dengan kedua metode sebelumnya tanpa mempengaruhi kualitas skema clustering. Namun demikian, dibandingkan dengan PSC dan mpsc, standar deviasi kualitas skema clustering yang dihasilkan dari RCE lebih tinggi walaupun rata-rata hasil clustering RCE lebih unggul. Yuwono et al. (2012) menduga bahwa hal tersebut terjadi karena penentuan kriteria berhenti yang didasarkan pada tercapainya equilibrium state adalah kriteria berhenti yang kurang tepat. Equilibrium state merupakan keadaan dimana partikel sudah mencapai posisi terbaik yang diketahui melalui nilai fungsi fitness partikel. Pada penilitian ini digunakan metode clustering RCE-Kmeans. K-means akan dijadikan metode yang mendefinisikan kembali equilibrium state dari metode clustering RCE. Oleh karena itu, posisi partikel akhir yang merepresentasikan pusat klaster diperoleh setelah penerapan metode K-means. K- means dipilih karena memiliki kemampuan local search (Naik et al., 2012), yaitu kemampuan menemukan solusi optimum yang berada di sekitar nilai solusi awal yang didefinisikan. Kemampuan local search yang dimiliki K-means dibutuhkan karena kemampuan local search menjamin penemuan solusi optimum (posisi partikel optimum) di sekitar nilai solusi awal (posisi partikel berdasarkan equilibrium state RCE) bukan mencari ruang solusi baru yang memungkinkan diperoleh hasil clustering yang tidak lebih baik dari yang dihasilkan oleh RCE. K- means juga memiliki kelebihan pada kecepatan konvergensinya sehingga diharapkan penggunaan metode K-means untuk menemukan posisi partikel

15 optimum dari metode RCE tidak menambah waktu komputasi secara signifikan. Dengan demikian, penggunaan metode K-means dalam penentuan posisi partikel akhir metode RCE mampu menghasilkan posisi partikel yang dapat meningkatkan kualitas skema hasil clustering dan mampu memperkecil pengaruh equlibrium state terhadap kualitas skema clustering yang dilihat dari nilai standar deviasi kualitas skema clustering. 1.2 Rumusan Masalah Berdasarkan uraian latar belakang yang telah dipaparkan sebelumnya maka rumusan masalah yang akan diteliti adalah 1. Bagaimana meningkatkan kualitas hasil clustering dengan memperbaiki pusat klaster untuk mencari klaster yang padat? 2. Bagaimana pengaruh penerapan K-means untuk menentukan pusat klaster akhir dari RCE dilihat dari variansi hasil clustering? 1.3 Batasan Masalah Batasan masalah dari penelitian ini adalah 1. Jumlah partikel dan jumlah klaster yang akan dibangkitkan disesuaikan dengan jumlah kelas dataset. 2. Bobot inersia yang digunakan pada RCE sebasar 0.9 dengan decay rate sebesar 0.95. 3. Dataset diambil dari UCI Machine Learning Repository. Dataset tersebut adalah Iris, Wine, Glass, Dermatology, WDBC, CMC, Yeast, Texture, Optical Digits, Thyroid.

16 1.4 Keaslian Penelitian Berdasarkan beberapa studi pustaka yang telah dibaca dan ditinjau, penelitian mengenai clustering masih memiliki banyak pertanyaan yang dapat dikembangkan solusinya, diantaranya dengan melakukan penggabungan metode optimasi dan metode clustering seperti PSO dan K-means. Penggabungan metode Rapid Centroid Estimation (RCE) dan K-means belum pernah dilakukan. Beberapa penelitian lainnya yang telah melakukan penggabungan metode varian Particle Swarm Optimization (PSO) dengan K-means akan dipaparkan pada tinjauan pustaka. 1.5 Tujuan Penelitian Adapun tujuan penelitian yang ingin dicapai adalah sebagai berikut 1. Meningkatkan kualitas hasil clustering dengan memperbaiki pusat klaster untuk mencari klaster yang padat. 2. Mengevaluasi pengaruh penerapan metode K-means untuk menentukan pusat klaster akhir metode RCE dengan melihat variansi hasil clustering. 1.6 Manfaat Penelitian Penelitian ini diharapkan memberikan manfaat sebagai berikut 1. Dapat menjadi salah satu alternatif metode clustering data. 2. Dapat memberikan kontribusi pada bidang clustering khususnya yang memanfaatkan algoritma dari bidang swarm intelligence. 1.7 Metodologi Penelitian Tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut : 1. Studi Literatur Pada tahapan ini dilakukan pembacaan paper dan buku yang terkait dengan topik penelitian dan masalah yang diangkat dan juga dilakukan penulisan resensi untuk paper yang mengangkat kasus serupa. Paper-paper dan buku yang dibaca adalah yang membahas mengenai metode Particle Swarm Optimization serta pemanfaatan algoritma yang tergolong dalam

17 swarm intelligence khususnya Particle Swarm Optimization untuk memecahkan masalah clustering. 2. Perancangan Metode Clustering Pada tahap ini dilakukan perancang metode clustering RCE-Kmeans untuk melakukan clustering data. 3. Implementasi Metode Clustering Pada tahap ini dilakukan pengimplementasian rancangan metode clustering yang diusulkan ke dalam baris program. Program hasil pengimplementasian metode yang diusulkan tersebut kemudian digunakan untuk melakukan clustering pada pada dataset yang diperoleh dari UCI Machine Learning Dataset. Proses clustering akan dilakukan sebanyak 50 kali untuk masing-masing dataset dan masing-masing metode clustering yang berbeda. 4. Pengujian Metode Clustering Pada tahap pengujian, setiap algoritma clustering yaitu RCE, K-means, dan algoritma clustering yang diusulkan dibandingkan kualitas skema clusteringnya menggunakan alat ukur Overall Entropy, Overall Purity, Overall Percentage Misclassification, serta waktu eksekusinya. Overall Entropy, Overall Purity, Overall Percentage Misclassification dihitung sebanyak jumlah percobaan clustering yang dilakukan untuk setiap dataset yaitu sebanyak 50 kali percobaan. 5. Analisa hasil Clustering Pada tahap ini dilakukan perbandingan kualitas skema clustering dari metode yang diajukan dengan metode K-means dan RCE. Kemudian akan dilakukan analisa terhadap hasil pengukuran kualitas skema clustering untuk masing-masing dataset.

18 6. Penarikan Kesimpulan Pada tahap ini dilakukan penarikan kesimpulan untuk menjawab rumusan masalah penelitian dan memenuhi tujuan penelitian yang telah dijabarkan. Kesimpulan diperoleh dari analisa kualitas skema clustering yang dilakukan. 1.8 Sistematika Penulisan Tesis ini berisi 7 (tujuh) bab dengan rincian masing-masing bab sebagai berikut : Bab I Pendahuluan Bab ini berisikan uraian singkat tentang latar belakang penelitian, rumusan masalah, batasan masalah, keaslian penelitian, tujuan penelitian, manfaat penelitian, metodologi penelitian, dan sistematika penulisan. Bab II Tinjauan Pustaka Bab ini berisi uraian penelitian-penelitian serupa yang sudah pernah dilakukan dan dijadikan referensi dalam penelitian ini. Bab III Landasan Teori Bab ini berisi uraian teori-teori dasar yang berkaitan dengan metodemetode yang digunakan dalam penelitian ini. Metode-metode tersebut antara lain : K-means, PSO, PSC, mpsc, dan RCE. Bab IV Analisis dan Perancangan Bab ini berisi analisa terhadap metode clustering RCE yang merupakan varian dari Particle Swarm Optimization yang dikhususkan untuk memecahkan masalah clustering dimana metode K-means akan digunakan dalam penentuan posisi partikel akhir dari RCE untuk mendapatkan hasil clustering yang lebih stabil. Perancangan yang diuraikan adalah perancangan metode clustering, antarmuka sistem, dan perancangan pengujian sistem.

19 Bab V Implementasi Bab ini berisi implementasi metode clustering dari hasil analisis dan hasil perancangan yang telah dilakukan. Bab VI Hasil dan Pembahasan Bab ini berisi hasil clustering yang diperoleh, analisis hasil clustering, dan analisis perbandingan kualitas hasil clustering dari metode K-means, RCE, dan RCE-Kmeans. Bab VII Penutup Bab ini berisi Kesimpulan hasil penelitian dan saran untuk penelitian lebih lanjut.