PENDAHULUAN TINJAUAN PUSTAKA

dokumen-dokumen yang mirip
SEGMENTASI PELANGGAN PLN UPJ BOGOR TIMUR DAERAH BOGOR MENGGUNAKAN FUZZY C-MEANS KAMAL AFIAT

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA

PE DAHULUA. Latar Belakang

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN

DATA MINING DAN WAREHOUSE A N D R I

BAB II LANDASAN TEORI. papernya yang monumental Fuzzy Set (Nasution, 2012). Dengan

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

BAB II TINJAUAN PUSTAKA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

BAB II LANDASAN TEORI

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

ANALISIS CLUSTER PADA DOKUMEN TEKS

BAB II TINJAUAN PUSTAKA

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

penyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN

(M.6) FUZZY C-MEANS CLUSTERING DENGAN ANALISIS ROBUST

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

BAB II TINJAUAN PUSTAKA

BAB III LANDASAN TEORI. 3.1 Metode GLCM ( Gray Level Co-Occurrence Matrix)

BAB II LANDASAN TEORI. 2.1 Penelusuran Minat dan Kemampuan (PMDK) diselenggarakan oleh suatu perguruan tinggi secara mandiri.

MENENTUKAN NILAI AKHIR KULIAH DENGAN FUZZY C-MEANS

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

PEMBENTUKAN SISTEM INFERENSI FUZZY MAMDANI DENGAN FUZZY C-MEANS UNTUK DATA MAHASISWA BARU IPB TAHUN Oleh: INU WISNUJATI G

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

BAB II LANDASAN TEORI

dengan Algoritma K Means

Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata

KLASIFIKASI USAHA KECIL DAN MENENGAH (UKM) SEKTOR INDUSTRI DENGAN METODE FUZZY C-MEANS CLUSTERING WILAYAH KOTA CILEGON

ANALISIS CLUSTER PADA DOKUMEN TEKS

BAB II LANDASAN TEORI. Pada bab ini akan dibahas mengenai teori-teori yang akan digunakan untuk menunjang dalam proses pembuatan tugas akhir ini.

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia

PENGELOMPOKKAN ANGKA PARTISIPASI PENDIDIKAN WAJIB BELAJAR SE-INDONESIA MENGGUNAKAN METODE FUZZY C-MEANS. Abstrak

Erwien Tjipta Wijaya, ST.,M.Kom

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

PENERAPAN ALGORITMA FUZZY C-MEANS (FCM) PADA PENENTUAN LOKASI PENDIRIAN LOKET PEMBAYARAN AIR PDAM SALATIGA

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

II. TINJAUAN PUSTAKA

BAB II KAJIAN TEORI. masalah fuzzy linear programming untuk optimasi hasil produksi pada bab

PENGKLASIFIKASIAN MAHASISWA JURUSAN TEKNIK ELEKTRO YANG MENGIKUTI MATA KULIAH RANGKAIAN LISTRIK DENGAN METODE FUZZY CLUSTERING. M.

BAB 2 LANDASAN TEORI

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

BAB II LANDASAN TEORI

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

IMPLEMENTASI FUZZY C-MEANS DALAM MENGANALISA KEMISKINAN DESA

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

Himpunan Fuzzy. Sistem Pakar Program Studi : S1 sistem Informasi

BAB II LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA

PENGKLASIFIKASIAN LULUSAN JURUSAN TEKNIK ELEKTRO BERDASARKAN NILAI IPK DENGAN METODE FUZZY CLUSTERING. M. Rodhi Faiz

BAB 2 LANDASAN TEORI

PENDAHULUAN. Latar Belakang

PENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION

BAB 3 ANALISIS DAN PENGEMBANGAN ALGORITMA. ketidakpastian. Citra tersebut terkadang belum tentu dapat diketahui objeknya,

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

Penerapan FuzzyTsukamotodalam Menentukan Jumlah Produksi

Algoritma Kohonen dalam Mengubah Citra Graylevel Menjadi Citra Biner

DATA PREPROCESSING. Budi Susanto (versi 1.2)

Metode Fuzzy. Analisis Keputusan TIP FTP UB

KOEFISIEN DETERMINASI REGRESI FUZZY SIMETRIS UNTUK PEMILIHAN MODEL TERBAIK. Iqbal Kharisudin. Jurusan Matematika FMIPA Universitas Negeri Semarang

BAB II LANDASAN TEORI. Dalam kondisi yang nyata, beberapa aspek dalam dunia nyata selalu atau biasanya

HASIL DA PEMBAHASA. Pengadaan Data

FUZZY MULTI-CRITERIA DECISION MAKING

LOGIKA FUZZY. Kelompok Rhio Bagus P Ishak Yusuf Martinus N Cendra Rossa Rahmat Adhi Chipty Zaimima

BAB I PENDAHULUAN Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA

STUDI TENTANG PERSAMAAN FUZZY

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

dan kesatuan nyata yang dapat digunakan dalam pengambilan keputusan. [JOG99]

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. 2.1 Ekonomi dan Produk Domestik Regional Bruto. Istilah ekonomi berasal dari bahasa Yunani, terdiri atas kata oikos dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak

BAB 2 LANDASAN TEORI

Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means

PEMBANGKITAN ATURAN FUZZY MENGGUNAKAN FUZZY C-MEANS (FCM) CLUSTERING UNTUK DIAGNOSA RISIKO PENYAKIT JANTUNG KORONER (PJK)

PENDAHULUAN. 1.1 Latar Belakang

Ahmad Mauliyadi M, Hizir Sofyan, dan Muhammad Subianto. Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Syiah Kuala

FUZZY LOGIC CONTROL 1. LOGIKA FUZZY

METODOLOGI PENELITIAN

PENERAPAN ALGORITMA FUZZY C-MEANS (FCM) PADA PENENTUAN LOKASI PENDIRIAN LOKET PEMBAYARAN AIR PDAM SALATIGA

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

BAB III METODOLOGI PENELITIAN

BAB 2 LANDASAN TEORI

BAB IV IMPLEMENTASI DAN EVALUASI

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

II. TINJAUAN PUSTAKA

BAB III PEMBAHASAN. harga minyak mentah di Indonesia dari bulan Januari 2007 sampai Juni 2017.

Bab 2 Tinjauan Pustaka

BAB 2 LANDASAN TEORI

CLUSTERING LULUSAN MAHASISWA MATEMATIKA FMIPA UNTAN PONTIANAK MENGGUNAKAN ALGORITMA FUZZY C-MEANS

PENERAPAN METODE CLUSTERING UNTUK MEMETAKAN POTENSI TANAMAN KEDELAI DI JAWA TENGAH DENGAN ALGORITMA FUZZY C- MEANS

Transkripsi:

Latar Belakang PENDHULUN Listrik merupakan sumber daya yang sangat dibutuhkan saat ini. Penggunaan listrik setiap tahun, bahkan setiap bulan terus meningkat. Hal ini dibuktikan dengan selalu bertambahnya jumlah pelanggan PLN pada setiap bulannya. Peningkatan jumlah pelanggan dan penggunaan listrik, tentunya harus didukung oleh pihak PLN dengan meningkatkan pelayanannya. Pihak PLN dapat melakukan pengambilan keputusan yang lebih baik untuk meningkatkan pelayanannya dengan mengetahui segmentasi pelanggannya. PLN menyimpan data penggunaan listrik dari pelanggannya secara berkala. Data penggunaan listrik yang ada dapat dimanfaatkan untuk analisis segmentasi pelanggan. Segmentasi pelanggan, dapat dilakukan dengan teknik clustering. Setelah segmentasi dilakukan, pesebaran setiap segmen dapat divisualisasikan pada peta untuk mempermudah melihat persebaran setiap segmen dari aspek spasialnya. Pada penelitan sebelumnya, Daulay (2006) telah melakukan segmentasi pasar mie instant dengan menggunakan algoritme clustering Fuzzy C-Means. lgoritme Fuzzy C-Means dapat memberikan hasil segmentasi yang lebih alami dibandingkan Hard C-Means (K- Means) karena hasil clustering dipengaruhi oleh kecenderungan masing-masing data terhadap cluster-nya. Suatu data tidak hanya tepat milik satu cluster, tetapi juga dapat memiliki nilai derajat keanggotaan pada cluster lainnya. Ukuran rendah, sedang, tinggi, dan sangat tinggi bersifat alami, sehingga metode Fuzzy C-Means lebih cocok digunakan untuk melakukan segmentasi dibandingkan dengan menggunakan Hard C- Means. Perbedaan penelitian ini dengan penelitian yang dilakukan oleh Daulay (2006) adalah dari segi pemilihan jumlah cluster atau segmen yang dihasilkan. Penelitian Daulay (2006) ditujukan untuk mencari jumlah cluster yang tepat untuk digunakan dalam clustering (segmentasi), sedangkan pada penelitian ini jumlah cluster yang digunakan sudah ditentukan, yaitu sebanyak empat cluster, di mana keempat cluster tersebut akan menjadi empat kelas pengguna listrik, yaitu: kelas rendah, kelas sedang, kelas tinggi, dan kelas sangat tinggi. Tujuan Tujuan dari penelitian ini adalah: 1. Melakukan segmentasi penggunaan listrik dengan menerapkan metode clustering Fuzzy C-Means pada data pelanggan PLN UPJ Bogor Timur berdasarkan pelanggan dan daerah. 2. Mendapatkan karakteristik kelas penggunaan listrik setiap segmen yang terbentuk dari hasil clustering. 3. Menampilkan persebaran cluster yang terbentuk pada peta Ruang Lingkup Segmentasi pelanggan PLN yang dilakukan menggunakan data pelanggan PLN UPJ Bogor Timur pada bulan Desember tahun 2009 dengan algoritme clustering Fuzzy C- Means. Manfaat Penelitian Penerapan algoritme clustering Fuzzy C- Means pada data penggunaan listrik dapat memperlihatkan segmentasi dan karakteristik dari setiap segmen penggunaan listrik di daerah Bogor Timur berdasarkan pelanggan dan daerah. Penelitian ini diharapkan dapat membantu pihak PLN UPJ Bogor Timur dalam melakukan pengambilan keputusan yang lebih baik untuk meningkatkan pelayanan PLN UPJ Bogor Timur dengan mengevaluasi persebaran segmen penggunaan listrik. TINJUN PUSTK Knowledge Discovery in Databases (KDD) Knowledge discovery in databases (KDD) adalah keseluruhan proses untuk mengubah data mentah menjadi informasi yang berguna (Tan et al. 2006). KDD merupakan sebuah proses iteratif yang terurut, dan data mining merupakan salah satu langkah dalam KDD (Han & Kamber 2006). Tahapan proses KDD menurut Han & Kamber (2006), yaitu: 1. Pembersihan data Pembersihan terhadap data dilakukan untuk menghilangkan data yang tidak konsisten dan data yang mengandung noise. 2. Integrasi data Proses integrasi data dilakukan untuk menggabungkan data dari berbagai sumber. 1

3. Seleksi data Proses seleksi data mengambil data yang relevan digunakan untuk proses analisis. 4. Transformasi data Proses menransformasikan atau menggabungkan data ke dalam bentuk yang sesuai dengan teknik data mining yang akan digunakan. 5. Data mining Data mining merupakan proses yang penting dimana metode-metode cerdas diaplikasikan untuk mengekstrak pola-pola dalam data. 6. Evaluasi pola Evaluasi pola diperlukan untuk mengidentifikasi beberapa pola yang menarik yang merepresentasikan pengetahuan. 7. Representasi pengetahuan Penggunaan visualisasi dan teknik representasi untuk menunjukkan hasil penggalian pengetahuan dari data kepada pengguna. Normalisasi z-score Normalisasi merupakan bagian dari transformasi data, yaitu atribut diskalakan ke dalam rentang nilai tertentu yang lebih kecil seperti -1,0 1,0 atau 0,0 1,0. Salah satu teknik normalisasi yang dapat digunakan adalah z-score. Normalisasi z-score (zero-mean normalization) merupakan normalisasi berdasarkan nilai rata-rata dan standar deviasi dari suatu atribut (Han & Kamber 2006). Misalkan nilai v merupakan elemen dari, Ᾱ adalah rata-rata, dan adalah nilai standar deviasi dari atribut, maka nilai v akan ditransformasikan menjadi v dengan fungsi... (1) Normalisasi z-score berguna ketika nilai aktual dari maksimum dan minimum suatu atribut tidak diketahui atau ketika outlier mendominasi pada normalisasi min-max. Data Mining Data mining merupakan proses ekstraksi informasi data berukuran besar (Han & Kamber 2006). Teknik data mining digunakan untuk memeriksa database berukuran besar sebagai cara untuk menemukan pola yang baru dan berguna, sehingga bisa didapatkan informasi berguna yang mungkin sebelumnya belum diketahui. Tugas data mining dari sudut pandang analisis data dapat diklasifikasi menjadi dua kategori, yaitu descriptive data mining dan predictive data mining. Descriptive data mining menjelaskan sekumpulan data dalam cara yang lebih ringkas. Ringkasan tersebut menjelaskan sifat-sifat yang menarik dari data. Predictive data mining menganalisis data dengan tujuan mengonstruksi satu atau sekumpulan model dan melakukan prediksi perilaku dari kumpulan data baru. Beberapa tugas dari data mining adalah: nalisis asosiasi Klasifikasi dan prediksi nalisis cluster nalisis outlier nalisis trend dan evolusi Clustering nalisis cluster atau yang biasa disebut clustering berbeda dengan classification dimana tidak terdapat variabel target untuk clustering. lgoritme clustering membagibagi dari keseluruhan himpunan data menjadi subkelompok atau cluster yang relatif homogen, dimana kesamaan record-record di dalam cluster diperbesar, dan kesamaan record-record di luar cluster diperkecil. Clustering seringkali diterapkan dalam langkah persiapan pada proses data mining dengan menghasilkan cluster-cluster yang digunakan sebagai input untuk berbagai teknik, seperti jaringan syaraf tiruan. Struktur data yang digunakan dalam clustering adalah data matriks sedangkan tipe data yang digunakan adalah (Han & Kamber 2006): Interval-scaled variable merupakan ukuran kontinu pada penskalaan linear. Contoh variabel yang termasuk pada tipe data ini yaitu tinggi, berat, temperatur cuaca, dan koordinat bujur-lintang. tribut biner hanya mempunyai dua nilai yaitu 0 dan 1. tribut nominal memiliki lebih dari dua nilai, misalkan merah, biru, kuning, hijau. tribut ordinal dapat berupa data diskret atau data kontinu. Tipe data ini dapat diperlakukan seperti tipe data intervalscaled variable yang sangat mempertimbangkan urutan. tribut rasio menggunakan skala eksponensial, misalkan e Bt atau e -Bt. Kesamaan dan ketidaksamaan antara dua objek diukur menggunakan pengukuran jarak. 2

Beberapa pengukuran jarak yang populer digunakan antara lain: Jarak Euclidean: Jarak Manhattan Jarak Minkowski... (2)... (3)... (4) Jarak Euclidean biasa digunakan untuk mengevaluasi kedekatan objek dalam ruang dua atau tiga dimensi. (bonyi & Feil 2007). Jarak Minkowski, merupakan generalisasi dari jarak Euclidean dan jarak Manhattan, dimana p merupakan nilai integer positif. Jarak Minkowski akan merepresentasikan jarak Manhattan jika p = 1, dan akan merepresentasikan jarak Euclidean jika p = 2 (Han & Kamber 2006). Menurut Han & Kamber (2006), beberapa pendekatan yang sering digunakan dalam clustering, yaitu: 1. Partitional method, yaitu membangun sebuah partisi dari sebuah database D dengan n objek ke dalam himpunan k cluster. Kemudian diberikan sebuah k, temukan partisi dari k cluster yang mengoptimisasi pilihan kriteria partisi, yaitu: Global optimal: menyelesaikan dengan menjumlahkan semua partisi. Heuristic methods: K-means: tiap cluster diwakilkan oleh titik tengah cluster. K-medoids atau PM (Partition around medoids): tiap cluster diwakilkan oleh satu objek di dalam cluster. Fuzzy C-Means (FCM): sebagian data menjadi anggota dari dua atau lebih cluster. 2. Hierarchical method, yaitu membuat sebuah dekomposisi berhirarki dari himpunan data (atau objek) menggunakan beberapa kriteria. Metode ini memiliki dua jenis pendekatan yaitu: gglomerative, dimulai dengan titiktitik sebagai cluster individu. Pada setiap tahap dilakukan penggabungan setiap pasangan titik pada cluster sampai hanya satu titik (atau cluster) yang tertinggal. Divisive, dimulai dengan satu cluster besar yang berisi semua titik data (all inclusive cluster). Pada setiap langkah, dilakukan pemecahan sebuah cluster sampai setiap cluster berisi sebuah titik (atau terdapat k cluster). 3. Density-based, merupakan pendekatan yang berdasarkan konektivitas dan fungsi kepadatan. 4. Grid-based, merupakan pendekatan yang berdasarkan pada struktur multiple-level granularity. 5. Model-based, sebuah model yang dihipotesis untuk tiap cluster dan ide dasarnya adalah untuk menemukan model yang pantas untuk tiap cluster. Kualitas hasil clustering bergantung pada metode ukuran kesamaan yang digunakan dan implementasinya. Selain itu, kualitas dari metode clustering yang digunakan juga diukur dari kemampuannya untuk menemukan beberapa atau semua pola yang tersembunyi. Himpunan Fuzzy Teori himpunan fuzzy dan logika fuzzy adalah suatu cara yang dapat digunakan untuk mengatasi ketidaktepatan dan ketidakpastian. Secara singkat, teori himpunan fuzzy memungkinkan suatu objek adalah milik suatu himpunan dengan nilai derajat keanggotaan di antara 0 dan 1, sedangkan logika fuzzy memungkinkan pernyataan untuk membenarkan dengan tingkat kepastian antara 0 dan 1. Teori ini diperkenalkan oleh Lotfi Zadeh pada tahun 1965 (Tan et al. 2006). Nilai derajat keanggotaan menunjukkan bahwa suatu objek tidak hanya memiliki kondisi benar (bernilai 1) atau salah (bernilai 0), tetapi juga ada kondisi yang terletak di antara keduanya. Kondisi tersebut direpresentasikan dengan nilai derajat keanggotaan yang berada pada selang nilai 0 dan 1. Fungsi Keanggotaan Fungsi keanggotaan (membership function) adalah suatu kurva yang menunjukkan pemetaan titik-titik input data ke dalam nilai keanggotaannya (sering disebut dengan derajat keanggotaan) yang memiliki interval antara 0 sampai 1. Fungsi keanggotaan dari himpunan fuzzy dapat dinotasikan dengan: X [0,1]. Gambar 1 merupakan contoh kurva fungsi keanggotaan. Pada gambar tersebut, titik yang ditunjukkan 3

oleh huruf X memiliki derajat keanggotaan sebesar 0,5. Gambar 1 Kurva fungsi keanggotaan Fungsi Keanggotaan pada Fuzzy Cluster Pada pendekatan fuzzy clustering, setiap data diberikan sebagian derajat keanggotaan dari beberapa cluster yang terdekat. Setiap data akan memiliki derajat keanggotaan yang diasosiasikan untuk setiap pusat cluster pada selang nilai 0 sampai 1, yang menunjukkan kekuatan penempatannya dalam cluster. pembicaraan U dengan fungsi keangotaan μ dan μ B, maka operasi-operasi dasar himpunan fuzzy berikut dapat didefinisikan: a. Union (Penggabungan) Gabungan dua himpunan samar dan B adalah himpunan samar C. C = B atau C = TU B Dengan derajat keanggotaan C adalah: μ (x) = max (μ (x), μ (x)) c B b. Intersection (Irisan) = (μ (x) μ B (x)) Irisan dua himpunan samar dan B adalah himpunan samar C. C = B atau C = DN B Dengan derajat keanggotaan C adalah: μ (x) = min (μ (x), μ (x)) c B = (μ (x) μ B (x)) c. Complement (Ingkaran) Komplemen himpunan samar diberi tanda Ā (NOT ) dan didefinisikan sebagai berikut: μ Ā (x) = 1 - μ (x) Gambar 2 Fungsi keanggotaan pada fuzzy cluster (Cox 2005) Sebagai gambaran, fungsi keanggotan pada fuzzy cluster dapat dibayangkan diameter ruang cluster sebagai dasar dari suatu himpunan fuzzy berbentuk lonceng. Kurva keanggotaan mendefinisikan sejauh mana sebuah titik berada pada cluster. Ilustrasi dari fungsi keanggotaan pada fuzzy cluster dapat dilihat pada Gambar 2 (Cox 2005). Pada gambar tersebut pusat cluster ditunjukkan oleh titik dengan huruf C yang memiliki nilai derajat keanggotaan 1, sedangkan titik dengan huruf merupakan anggota dari cluster dengan pusat cluster C memiliki derajat keanggotaan sebesar 0,5 pada cluster tersebut. Operasi Himpunan Fuzzy Misalkan himpunan dan B adalah dua nilai dari himpunan fuzzy pada semesta Fuzzy C-Means (FCM) Fuzzy C-Means merupakan salah satu teknik clustering yang menggunakan model pengelompokan fuzzy, sehingga data dapat menjadi semua anggota kelas atau cluster yang terbentuk dengan derajat atau tingkat keanggotaan yang berbeda pada selang nilai 0 sampai 1. Keberadaan suatu data pada cluster ditentukan oleh derajat keanggotaannya. Teknik FCM ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981. Perbedaan derajat keanggotaan antara Hard C-Means (atau yang lebih dikenal sebagai K-Means) dibandingkan dengan Fuzzy C-Means dapat dilihat pada Gambar 3 dan Gambar 4. Kedua gambar tersebut merupakan kurva derajat keanggotaan untuk cluster. Pada Gambar 3 terlihat titik-titik yang berada pada cluster memiliki nilai derajat keanggotaan bernilai 1, selainnya nilai derajat keanggotannya bernilai 0, sedangkan pada Gambar 4, titik yang ditandai dengan huruf X merupakan titik milik cluster B, tetapi memiliki derajat keanggotaan pada cluster sebesar 0,25. Perbandingan matriks derajat keanggotaan dari Hard C-Means (HCM) dan Fuzzy C-Means (FCM) dapat dilihat pada 4

Tabel 1 (Diasumsikan jumlah cluster yang terbentuk sebanyak dua). objektif yang digunakan pada algoritme FCM adalah sebagai berikut (Ross 2005):... (5) dengan:... (6) Gambar 3 Derajat keanggotaan pada Hard C- Means (K-Means)... (7)... (8) Gambar 4 Derajat Keanggotaan pada Fuzzy C-Means Tabel 1 Perbedaan matriks derajat keanggotaan HCM dengan FCM Matriks derajat keanggotaan pada HCM Matriks derajat keanggotaan pada FCM dimana: w adalah pembobot (parameter fuzzy), dengan w, c adalah jumlah cluster, dengan c 2 dan c < n, n adalah banyaknya data, ik adalah fungsi untuk nilai derajat keanggotaan data ke-k ke cluster ke-i (matriks partisi), d ik adalah fungsi ukuran jarak untuk jarak Euclidean antara pusat cluster ke-i dengan data ke-k, d jk adalah fungsi ukuran jarak untuk jarak Euclidean antara pusat cluster ke-j dengan data ke-k, v ij adalah pusat cluster dari variabel ke-i, dan cluster ke-j, X adalah data yang di-cluster: Konsep dasar dari FCM, pertama kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata setiap cluster. Setiap data memiliki derajat keanggotaan untuk setiap cluster. Pada kondisi awal, pusat cluster masih belum akurat. Pusat cluster akan menuju ke lokasi yang tepat dengan cara memperbaiki pusat cluster dan derajat keanggotaan untuk setiap cluster secara berulang. Perulangan yang dilakukan didasarkan pada fungsi objektif (Gulley & Jang 2000). lgoritme FCM lgoritme FCM bertujuan untuk mencari partisi cluster fuzzy yang optimal dengan meminimalkan nilai fungsi objektif. Fungsi U adalah matriks partisi (matriks derajat keanggotaan cluster): V adalah matriks pusat cluster: Nilai J w terkecil adalah yang terbaik, sehingga: 5

lgoritme FCM secara lengkap diberikan sebagai berikut (Ross 2005): 1. Menentukan: a. Matriks X berukuran n m, dengan n = jumlah data yang akan di-cluster dan m = jumlah variabel (kriteria). b. Jumlah cluster yang akan dibentuk (n > c 2). c. pembobot (w > 1) d. Maksimum iterasi (i) e. Kriteria penghentian/treshold (ɛ = nilai positif yang sangat kecil). 2. Membentuk matriks partisi awal U (derajat keanggotaan dalam cluster) dengan ukuran n c; matriks partisi biasanya dibuat acak. 3. Menghitung pusat cluster V untuk setiap cluster dengan menggunakan persamaan nomor 8. 4. Memperbaiki derajat keanggotaan setiap data pada setiap cluster (perbaiki matriks partisi) menggunakan persamaan nomor 6. 5. Menghentikan iterasi jika pusat cluster V tidak berubah. lternatif kriteria penghentian adalah jika perubahan nilai error (selisih nilai fungsi objektif) < nilai treshold atau jika nilai absolut perubahan matriks U di bawah nilai treshold (Höppner et al. 1999). Nilai perubahan matriks partisi pada iterasi sekarang dengan iterasi sebelumnya menggunakan fungsi nomor 9.... (9) pabila Δ ε maka iterasi dihentikan. Pencarian nilai Δ dilakukan dengan mengambil elemen terbesar dari nilai mutlak antara ik (t) dengan ik (t-1). Jika tidak memenuhi kriteria penghentian, kembali ke langkah nomor 3. lgoritme FCM diterapkan pada data contoh yang terdapat pada Tabel 2. Tabel 2 Data contoh X Y 12 150 25 155 17 126 20 132 18 145 15 135 26 122 15 127 10 130 16 135 Nilai awal yang ditentukan untuk clustering FCM pada data contoh adalah sebagai berikut: 1. Matriks partisi awal (U 0 ): U = 2. Jumlah cluster yang akan dibentuk c = 3 3. Pangkat pembobot w = 2 4. Maksimum iterasi i = 100 5. Kriteria penghentian ɛ = 10-5 Melalui proses FCM, clustering optimal terbentuk pada iterasi ke-22, dengan hasil: i = 22 (iterasi terakhir) Matriks pusat vektor (V): V = Matriks U ter-update (U 22 ): U = Fungsi objektif selama 22 iterasi dapat dilihat pada Tabel 3. Tabel 3 Fungsi objektif dalam 22 iterasi pada data contoh Iterasi ke- Fungsi Objektif 1 495,452485 2 281,352702 3 250,286133 4 244,005737 5 241,037645 6 239,401459 7 238,411739 8 237,605360 9 236,676011 10 235,393906 6

Iterasi ke- Fungsi Objektif 11 233,635708 12 231,262171 13 230,004460 14 229,165714 15 228,876866 16 288,800946 17 288,783573 18 288,779830 19 288,779041 20 288,778876 21 288,778842 22 288,778835 Hasil clustering dengan FCM untuk data contoh dapat dilihat pada Gambar 5. Cluster 1 ditunjukkan oleh warna cyan, cluster 2 ditunjukkan oleh warna magenta, dan cluster 3 ditunjukkan oleh warna biru. Pusat cluster ditunjukkan oleh titik berbentuk kotak dengan warna yang sejenis dengan cluster-nya. Gambar 5 Plot 2 dimensi pada program FCM untuk data contoh METODE PENELITIN Langkah-langkah yang dilakukan pada penelitian ini adalah sebagai berikut: Studi Pustaka Pada tahap ini dilakukan pengumpulan informasi dan bahan pustaka yang berkaitan dengan data mining dan logika fuzzy khususnya Fuzzy C-Means. Proses Knowledge Discovery in Databases Pada penelitian ini, proses Knowledge Discovery in Databases (KDD) dilakukan sesuai dengan tahap KDD menurut Han & Kamber (2006). Tahap-tahap KDD yang dilakukan pada penelitian ini adalah: 1. Pembersihan data Pembersihan data dilakukan dengan cara menghapus data yang tidak valid seperti data yang kurang lengkap nilai atributnya. Selain dari data yang kurang nilai atributnya, pembersihan data juga dilakukan dengan tidak mengikutsertakan data yang memiliki atribut daerah yang tidak terdapat pada peta. Daerah-daerah yang dianggap tidak valid karena tidak terdapat pada peta adalah: Babakan Fakultas, Bojong Enyod, Ceger, Desa Tengah, Graha Indah, Kalibata, Karang sem, Komplek LPTI, Panggugah, Pulo rmin, dan Sampora. 2. Integrasi data Proses integrasi data yang dilakukan adalah dengan menambahkan titik koordinat dummy (X dan Y) untuk setiap data, karena data sumber yang didapatkan tidak memiliki titik koordinat. Integrasi titik koordinat pada data diperlukan untuk visualisasi persebaran cluster penggunaan listrik pada peta. Titik koordinat yang diberikan bersifat random pada satu daerah. Sebagai contoh, dalam satu daerah terdapat 100 data yang memiliki atribut lingkungan Babakan, maka disebar sebanyak 100 titik koordinat pada daerah Babakan. Kemudian 100 titik koordinat tersebut diintegrasikan pada 100 data yang memiliki atribut daerah Babakan. 3. Seleksi data Tahap seleksi data pada penelitian ini terdapat dua tahap seleksi, yaitu seleksi berdasarkan daerah dan seleksi berdasarkan jam penggunaan listrik. Sebelum melakukan seleksi berdasarkan daerah, dilakukan pengelompokan daerah terlebih dahulu. Proses pengelompokan daerah dilakukan dengan menggabungkan beberapa daerah ke dalam satu kelurahan. Sebagai contoh, data yang memiliki atribut daerah Kedung Halang, Nanggrak Indah, Nanggrak Mekar, dan Pasir Jambu dijadikan satu daerah, yaitu daerah kelurahan Kedung Halang. Tahap seleksi data pertama adalah seleksi berdasarkan daerah. Pada tahap ini, data yang dipilih adalah data pelanggan PLN UPJ Bogor Timur yang dikategorikan sebagai daerah PLN UPJ Bogor Timur. Hal ini dilakukan karena PLN UPJ Bogor Timur tidak hanya melayani pelanggan di daerah Bogor Timur saja, melainkan juga 7