DETEKSI OUTLIER BERBASIS KLASTER PADA DATA SET DENGAN ATRIBUT CAMPURAN NUMERIK DAN KATEGORIKAL TESIS DWI MARYONO

Ukuran: px
Mulai penontonan dengan halaman:

Download "DETEKSI OUTLIER BERBASIS KLASTER PADA DATA SET DENGAN ATRIBUT CAMPURAN NUMERIK DAN KATEGORIKAL TESIS DWI MARYONO"

Transkripsi

1 DETEKSI OUTLIER BERBASIS KLASTER PADA DATA SET DENGAN ATRIBUT CAMPURAN NUMERIK DAN KATEGORIKAL TESIS DWI MARYONO

2 LATAR BELAKANG MASALAH Deteksi Outlier Data Set Numerik : distance-based, density-based, clustering-based, subspace-based, dan lain-lain Data Set Kategorikal :CBLOF, FPOF dan LSA Bagaimana jika data set terdiri dari aribut campuran numerik dan kategorikal? Alternatif way : Transformasi dari satu tipe data menjadi tipe data lain. Contoh : He et al (2005b) melakukan diskritisasi tipe data numerik menjadi kategorikal untuk kemudian diterapkan algoritma FPOF.

3 LATAR BELAKANG MASALAH He et al (2005a): Klasterisasi data set campuran dengan membagi data set menjadi numerik dan kategorikal Assent et al (2007), Agrawal dan Yu (2005): deteksi outlier pada sub data set IDE : Partisi data set menjadi numerik dan kategorikal, deteksi outlier pada sub data set pemanfaatan klasterisasi untuk untuk deteksi outlier Hong et al (2008) : Menerapkan cluster ensemble untuk deteksi outlier Definisi Outlier seperti apa yang memungkinkan?

4 LATAR BELAKANG MASALAH Outlier berbasis klaster: sebarang obyek yang tidak berada pada klaster yang cukup besar Outlier bisa berupa obyek data tunggal atau dapat juga keseluruhan obyek dari klaster yang kecil. Penghitungan derajat outlier: Jika ia berada pada klaster besar, maka dilihat seberapa jauh ia menyimpang dari obyek lain dalam klaster tersebut. Jika obyek tersebut terdapat dalam klaster kecil maka dihitung kedudukannya terhadap klaster besar

5 LATAR BELAKANG MASALAH Ide : penggabungan partisi data set, klastering sub dataset dan deteksi outlier berbasis klaster Partisi data set Numerik dan kategorikal Klasterisasi dan deteksi outlier secara bersilang pada kedua sub data set Penggabungan derajat outlier dengan multi-atribut decision making (MADM)

6 PERUMUSAN MASALAH Rumusan masalah Bagaimana menerapkan teknik gabungan klasterisasi dan deteksi outlier lokal berbasis klaster untuk menemukan outlier pada data set campuran numerik dan kategorikal Bagaimana performa algoritma yang dihasilkan

7 TUJUAN DAN MANFAAT Tujuan : menyelesaikan masalah deteksi outlier pada data set campuran numerik dan kategorikal dengan menggunakan teknik gabungan klasterisasi dan deteksi outlier secara bersilang pada sub data set numerik dan kategorikal Manfaat : memberikan penyelesaian masalah deteksi outlier pada data set campuran numerik dan kategorikan sehingga dapat diaplikasikan pada masalah nyata

8 CLUSTER BASED LOCAL OUTLIER (CBLOF) Outlier: observasi menyimpang dari sebagian besar observasi lain, hingga muncul dugaan bahwa ia dibangkitkan oleh mekanisme yang salah. Macam-macam deteksi outlier: statistic-based, distance-based, density-based, cluster-based, dsb. Dari sudut pandang klaster, pada C 1 dan C 3 dapat dianggap sebagai outlier karena tidak terdapat pada klaster yang besar yaitu C 2 dan C 4 CBLOF diukur berdasar ukuran klaster di mana ia berada dan kemiripannya terhadap klaster terdekat

9 Metode CBLOF untuk deteksi outlier data kategorikal Konsep klaster besar dan klaster Kecil: Misalkan C= {C1, C2,, Ck} dengan C1 C2 Ck. Untuk parameter α dan β, didefinsikan b sebagai batas antara klaster besar dan kecil jika memenuhi formula ( C1 + C Cb ) D *α Cb / Cb+1 β Klaster besar didefinsikan LC = {Ci, / i b} Klaster kecil didefinisikan SC = {Ci, / i >b}. Penghitungan derajat outlier dari obyek t: CBLOF( t) = C Ci i *max(sim ( C *(sim( C i, t)) j, t) untuk t C untuk t C i i, C i, C i SC LC dan C j LC

10 Deteksi outlier berbasis klaster pada data numerik Pendekatan: Menganggap klaster-klaster kecil yang jauh dari klaster yang lain sebagai outlier menentukan derajat di mana sebuah obyek berada pada sebarang klaster Penentuan derajat outlier Mengukur jarak obyek terhadap centroid klaster terdekat Mengukur jarak relatif obyek terhadap klaster terdekat

11 Numerical CBLOF Penentuan derajat outlier berdasarkan konsep CBLOF Menggunakan konsep klaster besar dan klaster kecil Derajat outlier dihitung berdasarkan ukuran klaster terdekat dan jaraknya terhadap klaster terdekat NCBLOF( t) = C j C i 1 relatif distance( t, C C 1 relatif distance( t, C )) j i ) j untuk t C = arg min( t, centroid( C untuk t C i, C i i, C SC i LC dan C j )) j LC,

12 MCDM (Multicriteria Decision Making) Berkaitan dengan pengambilan keputusan di bawah keberadaan sejumah criteria keputusan Dibagi menjadi Multi-objective Decision making (MODM) dan Multi-attribute decision making (MADM). Dalam masalah penggabungan derajat outlier digunakan MADM MADM menggunakan MAVT dengan operator agregat Operator product (a 1 w1, a 2 w2,..., a m wm ) = a 1 w1 a 2 w2... a m wm = a i wi Operator tambah + (a 1 w1, a 2 w2,..., a m wm ) = a 1 w1 + a 2 w a m wm = Σa i wi Operator S. S (w 1 a 1, w 2 a 2,..., w m a m ) = max { w i a i }

13 Penentuan Bobot dalam MADM Penentuan bobot :Subyektif, Default (bobot sama), otomatis (Konsep Entropy) Misalkan diberikan matriks keputusan a a A= M an a a a M n2 L L M L a a a 1m 2 m M nm Normalisasi x x X = M xn Hitung Nilai entropi e j dan derajat divergensi f n j e j = k ( xij ln xij) f j = 1- e j i= 1 f j Hitung bobot tiap kolom/atribut w j = m f x x x M 2m L L M L k= 1 k x x x 1m 2 m M nm

14 ALGORITMA MIXCBLOF Gambar Diagram Alir ALgoritma MixCBLOF

15 Uji Coba dan Analisis Hasil Data Set Uji Coba: UCI Machine Learning Real dataset Data set Cleveland (Heart Disease) Dataset Hypothyroid Dataset Hepatitis Dataset Annealing Karakteristik data : data set terdiri dari beberapa klaster di mana di antaranya terdapat klaster dengan ukuran ralatif kecil Pengukuran kinerja berdasarkan top ratio dan coverage

16 Skenario Menentukan parameter yang tepat utuk algoritma MixCBLOF, meliputi penentuan α, β, operator agregat dan pembobotan yang tepat untuk masing-masing dataset Membandingkan MixCBLOF dibandingkan dengan algoritma lain, dalam hal ini adalah algoritma CBLOF yang diterapkan pada dataset yang sudah didiskritisasi

17 HASIL UJI COBA Sub Dataset Cleveland I Tabel 4.3 Hasil MixCBLOF pada subdata Cleveland I dengan parameter s=2.3, k=4, wi=1, α=80%, dan β=10

18 Sub Dataset Cleveland II (wi=1 dan entropy)

19 Hasil Uji Coba Dataset Hypothyroid (entropy weight)

20 Hasil Uji Coba Dataset Hepatitis (equal weigth)

21 Hasil Uji Coba Dataset Annealing (equal weigth)

22 EVALUASI Operator dan Pembobotan terbaik Tabel 4.29 Pencapaian coverage untuk n=jumlah outlier eksak pada keseluruhan dataset berdasarkan operator dan pembobotan

23 EVALUASI Penetapan α dan β: terpenuhinya konsep klaster besar dan kecil Tabel 4.28 Pengaruh pemenuhan konsep klaster besar dan kecil terhadap kinerja algoritma MixCBLOF

24 DAFTAR PUSTAKA Aggarwal, C., Yu, P. (2005) An effective and efficient algorithm for high-dimensional outlier detection. VLDB Journal 14(2), hal Assent, I., Krieger,R., Muller,E., Seidl, T. (2007) "Subspace outlier mining in large multimedia databases", Dagstuhl Seminar Proceedings :Parallel Universes and Local Patterns Breunig, M. M.., Kriegel, H. P., Ng, R. T., Sander, J. (2000). LOF: identifying density-based local outliers. Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data, hal Climaco, J. (1997), Multicriteria analysis, Springer-Verlag, New York. Karpys, G., Han, H, Kumar, V. (1999), CHAMELEON: A Hierarchical Clustering Algorithm Using Dynamic Modelling. IEEE Computer, Vol 32, No He, Z., Xu, X., Deng, S. (2002), Squeezer: An Efficient Algorithm for Clustering Categorical Data. Journal of Computer Science and Technology, 17(5): He, Z., Deng, X., Xu, X. (2005a), Clustering Mixed Numeric and Categorical Data: A Cluster Ensemble Approach, eprint arxiv:cs/ He, Z, X. Xu, J. Huang, S. Deng (2005b). FP-Outlier: Frequent Pattern Based Outlier Detection. Computer Science and Information Systems, 2(1), Hong, Y, Kwong, S., Chang, Y., Ren, Q. (2008), Unsupervised Data Pruning for Clustering of Noisy Data, Elvesier : Knowledge-Based System 21 hal Huang, Z (1998), Extension to the k-means Algorithm for Clustering Large dataset with Categorical Values, Data Mining and Knowledge Discovery, 2, hal Knorr, E.. Ng, R., Tucakov, T.(2000). Distance-based outliers: algorithms and applications. VLDB Journal 8(3-4), hal Sedl, T., Miller, E., Assent, I., Sfenhausen, U. (2009). "Outlier Detection and Ranking Based on Subspace Clustering". Daghtul Seminar Procedings Tan, Pan. N, Steinbach, M., Kumar, V. (2006), Introduction to Data mining. Perason, Addison Weisley. Boston.

25

DETEKSI OUTLIER BERBASIS KLASTER PADA SET DATA DENGAN ATRIBUT CAMPURAN NUMERIK DAN KATEGORIKAL

DETEKSI OUTLIER BERBASIS KLASTER PADA SET DATA DENGAN ATRIBUT CAMPURAN NUMERIK DAN KATEGORIKAL Vol. 5, No. 3, Januari 2010 ISSN 0216-0544 DETEKSI OUTLIER BERBASIS KLASTER PADA SET DATA DENGAN ATRIBUT CAMPURAN NUMERIK DAN KATEGORIKAL * Dwi Maryono, ** Arif Dunaidy Program Magister Teknik Informatika,

Lebih terperinci

DETEKSI DATA PENCILAN MENGGUNAKAN K_MEANS CLUSTERING

DETEKSI DATA PENCILAN MENGGUNAKAN K_MEANS CLUSTERING DETEKSI DATA PENCILAN MENGGUNAKAN K_MEANS CLUSTERING Naniek Widyastuti Teknik Informatika, Fakultas Teknologi Industri Institut Sains & Teknologi AKPRIND Yogyakarta e_mail: naniek_wid@yahoo.com ABSTRACT

Lebih terperinci

CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE

CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE Lutfi Hidayat Ramdhani¹, Hetti Hidayati², Mahmud Dwi Suliiyo³ ¹Teknik Informatika,, Universitas Telkom Abstrak K-Modes

Lebih terperinci

SKRIPSI. Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika. Oleh :

SKRIPSI. Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika. Oleh : PENERAPAN ALGORITMA MIXCBLOF BERBASIS KLASTER UNTUK IDENTIFIKASI OUTLIER PADA DATA HASIL UJIAN NASIONAL, INDEKS INTEGRITAS, DAN AKREDITASI SMA DI DAERAH ISTIMEWA YOGYAKARTA SKRIPSI Diajukan untuk Memenuhi

Lebih terperinci

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN 1 K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN Rani Nooraeni*, Dr. Jadi Supriadi, DEA, Zulhanif, S.Si,M.Sc Jurusan statistika terapan, Fakultas MIPA UNPAD rnooraeni@gmail.com* Abstrak.Membagi suatu data

Lebih terperinci

ALGORITMA SHARED NEAREST NEIGHBOR BERBASIS DATA SHRINKING

ALGORITMA SHARED NEAREST NEIGHBOR BERBASIS DATA SHRINKING Zainal, Algoritma Shared Nearest Neighbor berbasis Data Shrinking ALGORITMA SHARED NEAREST NEIGHBOR BERBASIS DATA SHRINKING Rifki Fahrial Zainal 1 Arif Djunaidy 2 1 Jurusan Teknik Informatika, Fakultas

Lebih terperinci

ALGORITMA SHARED NEAREST NEIGHBOR BERBASIS DATA SHRINKING

ALGORITMA SHARED NEAREST NEIGHBOR BERBASIS DATA SHRINKING Zainal, Algoritma Shared Nearest Neighbor berbasis Data Shrinking ALGORITMA SHARED NEAREST NEIGHBOR BERBASIS DATA SHRINKING Rifki Fahrial Zainal 1 Arif Djunaidy 2 1 Jurusan Teknik Informatika, Fakultas

Lebih terperinci

Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan

Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Ni Made Anindya Santika Devi, I Ketut Gede Darma Putra, I Made Sukarsa Jurusan Teknologi Informasi, Universitas Udayana Bukit Jimbaran,

Lebih terperinci

KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI

KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI TUGAS AKHIR CI1599 KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI AHMAD DENI DWI PRANOTO NRP 5103 100 015 Dosen Pembimbing I Rully Soelaiman,

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini adalah era dimana perkembangan teknologi semakin pesat dan cepat. Seiring dengan perkembangan teknologi yang ada, maka ukuran data yang diolah juga akan semakin

Lebih terperinci

Deteksi Outlier Menggunakan Algoritma Block-based Nested Loop (Studi Kasus: Data Akademik Mahasiswa Prodi PS Universitas XYZ)

Deteksi Outlier Menggunakan Algoritma Block-based Nested Loop (Studi Kasus: Data Akademik Mahasiswa Prodi PS Universitas XYZ) Deteksi Outlier Menggunakan Algoritma Block-based Nested Loop (Studi Kasus: Data Akademik Mahasiswa Prodi PS Universitas XYZ) Fiona Endah Kwa 1, Paulina H. Prima Rosa 2 1, 2 Jurusan Teknik Informatika,

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak

PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1 Wahyu Catur Wibowo 2 1 Program Studi Sistem Informasi, Universitas Jember 2 Fakultas Ilmu Komputer, Universitas Indonesia,

Lebih terperinci

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Siti Mutrofin 1, Arrie Kurniawardhani 2, Abidatul Izzah 3, Mukhamad Masrur 4 Universitas Pesantren Tinggi Darul Ulum

Lebih terperinci

Klasterisasi Wilayah Pemasaran berdasarkan Preferensi Konsumen terhadap PT. X

Klasterisasi Wilayah Pemasaran berdasarkan Preferensi Konsumen terhadap PT. X Klasterisasi berdasarkan Konsumen terhadap PT. X Prasetyo, Andhika Eko Program Studi Manajemen Rekayasa Universitas Internasional Semen Indonesia Jl. Veteran Gresik, Jawa Timur 61122 E-mail: andhika.prasetyo@uisi.ac.id

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing

Lebih terperinci

ALGORITMA ATURAN ASOSIASI APRIORI-TID DENGAN METODE KLASTERISASI HIERARKI AGLOMERATIF. Tri Khairul I.A 1 ABSTRAK

ALGORITMA ATURAN ASOSIASI APRIORI-TID DENGAN METODE KLASTERISASI HIERARKI AGLOMERATIF. Tri Khairul I.A 1 ABSTRAK ALGORITMA ATURAN ASOSIASI APRIORI-TID DENGAN METODE KLASTERISASI HIERARKI AGLOMERATIF. Pendahuluan Tri Khairul I.A. Jurusan Matematika FMIPA Universitas Hasanuddin Makassar 905 e-mail: narutolik@linuxmail.org

Lebih terperinci

PRESENTASI TUGAS AKHIR KI091391

PRESENTASI TUGAS AKHIR KI091391 PRESENTASI TUGAS AKHIR KI091391 IMPLEMENTASI KD-TREE K-MEANS CLUSTERING PADA KLASTERISASI DOKUMEN (Kata kunci: KD-Tree K-Means Clustering, Klasterisasi Dokumen, K- Dimensional Tree, K-Means Clustering)

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

ALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK

ALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK ALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK Wiwit Agus Triyanto Fakultas Teknik, Program Studi Sistem Informasi Universitas Muria Kudus Email: at.wiwit@yahoo.co.id ABSTRAK Strategi pemasaran

Lebih terperinci

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id

Lebih terperinci

METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM

METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1), Wahyu Catur Wibowo 2) 1) Program Studi Sistem Informasi, Universitas Jember 2) Fakultas Ilmu Komputer,

Lebih terperinci

PENGELOMPOKANPENERIMA BANTUAN KESEJAHTERAAN MASYARAKAT DENGAN PENDEKATAN DATA MINING TERINTEGRASI SISTEM PENDUKUNG KEPUTUSAN. STUDI KASUS: DESA TARAI BANGUN, KABUPATEN KAMPAR 1,2,3 Fakultas Ilmu Komputer,

Lebih terperinci

KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola)

KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) PRESENTASI TUGAS AKHIR KI091391 KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) Penyusun Tugas Akhir : Kartika Wijayati

Lebih terperinci

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP Page 87 Iin Parlina 1, Agus Perdana Windarto 2, Anjar Wanto 3, M.Ridwan Lubis

Lebih terperinci

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Jurnal Ilmiah ILKOM Volume 8 mor (Agustus 16) ISSN: 87-1716 PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Widya Safira Azis 1 dan Dedy Atmajaya 1 safiraazis18@gmail.com dan dedy.atmajaya@umi.ac.id

Lebih terperinci

PENGGUNAAN CLUSTER-BASED SAMPLING UNTUK PENGGALIAN KAIDAH ASOSIASI MULTI OBYEKTIF

PENGGUNAAN CLUSTER-BASED SAMPLING UNTUK PENGGALIAN KAIDAH ASOSIASI MULTI OBYEKTIF Vol. 5, No. 1, Januari 2009 ISSN 0216-0544 PENGGUNAAN CLUSTER-BASED SAMPLING UNTUK PENGGALIAN KAIDAH ASOSIASI MULTI OBYEKTIF * Febriana Santi Wahyuni, Daniel O Siahaan dan Chastine Fatichah Jurusan Teknik

Lebih terperinci

REKOMENDASI PEMBELIAN PERSONAL KOMPUTER DENGAN METODE RANKED CLUSTERING

REKOMENDASI PEMBELIAN PERSONAL KOMPUTER DENGAN METODE RANKED CLUSTERING REKOMENDASI PEMBELIAN PERSONAL KOMPUTER DENGAN METODE RANKED CLUSTERING Fadly Shabir 1 dan Abdul Rachman M 2 1 kyofadly@gmail.com, 2 emanrstc@yahoo.co.id 1 Stimik Handayani, 2 Universitas Muslim Indonesia

Lebih terperinci

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM) ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM) Nurani 1, Hamdan Gani 2 1 nurani_nanni@yahoo.com, 2 hamdan.gani.inbox@gmail.com

Lebih terperinci

ANALISIS DAN IMPLEMENTASI DATA CLUSTERING DENGAN MENGGUNAKAN ALGORITMA INCREMENTAL GENETIK K-MEANS

ANALISIS DAN IMPLEMENTASI DATA CLUSTERING DENGAN MENGGUNAKAN ALGORITMA INCREMENTAL GENETIK K-MEANS ANALISIS DAN IMPLEMENTASI DATA CLUSTERING DENGAN MENGGUNAKAN ALGORITMA INCREMENTAL GENETIK K-MEANS Tyas Ayu Landiastuti¹, Arie Ardiyanti Suryani², Intan Nurma Yulita³ ¹Teknik Informatika,, Universitas

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN Latar Belakang Kredit merupakan salah satu usaha sekunder yang dapat dilakukan untuk pemenuhan kebutuhan sehari-hari. Pada umumnya, proses kredit dapat dilayani melalui lembaga keuangan

Lebih terperinci

Pembuatan Aplikasi Pendeteksi Anomali Pada Pola Konsumsi Listrik Pelanggan Kota Surabaya Menggunakan Algoritma Klasterisasi Berbasis Densitas

Pembuatan Aplikasi Pendeteksi Anomali Pada Pola Konsumsi Listrik Pelanggan Kota Surabaya Menggunakan Algoritma Klasterisasi Berbasis Densitas 1 Pembuatan Aplikasi Pendeteksi Anomali Pada Pola Konsumsi Listrik Pelanggan Kota Surabaya Menggunakan Algoritma Klasterisasi Berbasis Densitas Achmad Zainuddin Zakariya, Arif Djunaidy, Renny Pradina Kusumawardani

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS UNTUK MENENTUKAN TINGKAT KESEHATAN BAYI DAN BALITA PADA KABUPATEN DAN KOTA DI JAWA TENGAH

PENERAPAN ALGORITMA K-MEANS UNTUK MENENTUKAN TINGKAT KESEHATAN BAYI DAN BALITA PADA KABUPATEN DAN KOTA DI JAWA TENGAH PENERAPAN ALGORITMA K-MEANS UNTUK MENENTUKAN TINGKAT KESEHATAN BAYI DAN BALITA PADA KABUPATEN DAN KOTA DI JAWA TENGAH Erga Aprina Sari Jurusan Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian

Lebih terperinci

dapat memperoleh gambaran yang cukup lengkap dan komprehensif mengenai penerapan support vector machine pada sistem pendeteksian intrusi.

dapat memperoleh gambaran yang cukup lengkap dan komprehensif mengenai penerapan support vector machine pada sistem pendeteksian intrusi. Abstrak Perkembangan yang luar biasa pesat dari konektivitas dan aksesibilitas terhadap Internet telah menjadikan keamanan informasi sebagai sebuah isu yang sangat penting. Salah satu hal yang perlu dipikirkan

Lebih terperinci

ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE

ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE Dyah Paminta Rahayu(dyahp@ut.ac.id) Jurusan Matematika FMIPA Universitas Terbuka ABSTRAK Pengelompokkan merupakan salah satu

Lebih terperinci

PREDIKSI NILAI DENGAN METODE SPECTRAL CLUSTERING DAN CLUSTERWISE REGRESSION

PREDIKSI NILAI DENGAN METODE SPECTRAL CLUSTERING DAN CLUSTERWISE REGRESSION PREDIKSI NILAI DENGAN METODE SPECTRAL CLUSTERING DAN CLUSTERWISE REGRESSION Ahmad Yusuf 1*), Handayani Tandrasa 1) 1) Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

PREDIKSI OUTLIER MENGGUNAKAN DATA TEPI CLUSTER UNTUK MENINGKATKAN KUALITAS PENGETAHUAN HASIL DATA MINING

PREDIKSI OUTLIER MENGGUNAKAN DATA TEPI CLUSTER UNTUK MENINGKATKAN KUALITAS PENGETAHUAN HASIL DATA MINING PREDIKSI OUTLIER MENGGUNAKAN DATA TEPI CLUSTER UNTUK MENINGKATKAN KUALITAS PENGETAHUAN HASIL DATA MINING Barry Nuqoba, Arif Djunaidy Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi

Lebih terperinci

Enigma Journal of Infotmatic (ENJOI 2016) ISSN :

Enigma Journal of Infotmatic (ENJOI 2016) ISSN : b 1 Kombinasi Fuzzy C-Means Clustering dan MADM Model Yager Untuk Menentukan Kelompok UKT (Studi Kasus Universitas Sembilanbelas November Kolaka) Muhammad Nurtanzis Sutoyo 1 dan Andi Tenri Sumpala 2 12

Lebih terperinci

dengan Algoritma K Means

dengan Algoritma K Means K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

ALGORITMA PREDIKSI OUTLIER MENGGUNAKAN BORDER SOLVING SET

ALGORITMA PREDIKSI OUTLIER MENGGUNAKAN BORDER SOLVING SET Jurnal Informatika Mulawarman Vol. 9 No. 3 Oktober 2014 5 ALGORITMA PREDIKSI OUTLIER MENGGUNAKAN BORDER SOLVING SET Barry Nuqoba 1), Arif Djunaidy 2) 1) Program Studi Sistem Informasi FST Universitas Airlangga

Lebih terperinci

Sistem Pendukung Keputusan Mahasiswa Berprestasi Menggunakan Metode TOPSIS

Sistem Pendukung Keputusan Mahasiswa Berprestasi Menggunakan Metode TOPSIS Sistem Pendukung Keputusan Mahasiswa Berprestasi Menggunakan Metode TOPSIS Sri Rahmawati Fitriatien Universitas PGRI Adi Buana Surabaya (Fakultas Keguruan dan Ilmu Pendidikan, Program Studi Pendidikan

Lebih terperinci

Pengenalan Pola. Klasterisasi Data

Pengenalan Pola. Klasterisasi Data Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering

Lebih terperinci

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-445

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-445 JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: 2301-9271 A-445 Pengembangan Sistem Rekomendasi Penelusuran Buku dengan Penggalian Association Rule Menggunakan Algoritma Apriori (Studi Kasus Badan Perpustakaan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching

Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching Analisis dan Implementasi Graph Indexing Pada Graph Database Menggunakan Algoritma GIndex Analysis and Implementation of Graph Indexing for Graph Database Using GIndex Algorithm Hadyan Arif 1, Kemas Rahmat

Lebih terperinci

ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING

ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING Ni Putu Eka Merliana, Ernawati, Alb. Joko Santoso Program Studi Magister Teknik Informatika, Fakultas Teknik Industri, Universitas

Lebih terperinci

Penerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis

Penerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis Scientific Journal of Informatics Vol., No., November 015 p-issn 407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 460-0040 Penerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis

Lebih terperinci

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI Aulia Essra (1), Rahmadani (2), Safriadi (3) Magister Teknik Informatika, Universitas Sumatera Utara Jl. Universitas No.24A

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

Metode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN Methods of Density-Based Clustering Algorithm using DBSCAN

Metode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN Methods of Density-Based Clustering Algorithm using DBSCAN Prosiding Statistika ISSN: 2460-6456 Metode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN Methods of Density-Based Clustering Algorithm using DBSCAN 1 Nur Arsih, 2 Nusar Hajarisman, 3 Sutawanir

Lebih terperinci

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI PENGGUNAAN PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI Entin Martiana S.Kom,M.Kom, Nur Rosyid Mubtada i S. Kom, Edi Purnomo Jurusan Teknik Informatika

Lebih terperinci

KLUSTERING DENGAN K-MEANS BERBASIS LVQ DAN K-MEANS BERBASIS OWA

KLUSTERING DENGAN K-MEANS BERBASIS LVQ DAN K-MEANS BERBASIS OWA Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) Vol. 2, No. 1, April 2015, hlm. 29-33 KLUSTERING DENGAN K-MEANS BERBASIS LVQ DAN K-MEANS BERBASIS OWA Dian Eka Ratnawati 1, Indriati 2 1,2 Program Studi

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

DETEKSI OUTLIER BERBASIS KLASTER DENGAN ALGORITMA SHARED NEAREST NEIGHBOR

DETEKSI OUTLIER BERBASIS KLASTER DENGAN ALGORITMA SHARED NEAREST NEIGHBOR DETEKSI OUTLIER BERBASIS KLASTER DENGAN ALGORITMA SHARED NEAREST NEIGHBOR Alvida Mustika Rukmi 1 1 Jurusan Matematika ITS Surabaya alvida@matematika.its.ac.id T-18 Abstrak Deteksi outlier merupakan salah

Lebih terperinci

ANALISA PEMILIHAN ALTERNATIF PROYEK MANAJEMEN AIR DI PT X DENGAN METODE MULTI CRITERIA DECISION MAKING (MCDM)

ANALISA PEMILIHAN ALTERNATIF PROYEK MANAJEMEN AIR DI PT X DENGAN METODE MULTI CRITERIA DECISION MAKING (MCDM) ANALISA PEMILIHAN ALTERNATIF PROYEK MANAJEMEN AIR DI PT X DENGAN METODE MULTI CRITERIA DECISION MAKING (MCDM) Ema Dwi Saputri 1) dan Putu Artama Wiguna 2) 1,2) Program Studi Magister Manajemen Teknologi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Teoritis 2.1.1 Analisis Berbasis Cluster Analisis berbasis cluster merupakan suatu teknik untuk membagi data ke dalam beberapa kelompok (cluster) yang memiliki arti

Lebih terperinci

Implementasi Algoritma Squeezer dan Term Frequency Ranking dalam Pembangunan Sistem Rekomendasi Tempat Makan

Implementasi Algoritma Squeezer dan Term Frequency Ranking dalam Pembangunan Sistem Rekomendasi Tempat Makan Implementasi Algoritma Squeezer dan Term Frequency Ranking dalam Pembangunan Sistem Rekomendasi Tempat Makan Vincentius Wirawan 1, Seng Hansun 1, Hargyo Tri Nugroho I. 2 1 Program Studi Teknik Informatika,

Lebih terperinci

Identifikasi Spasial Calon Walikota Manado Tahun 2015 Menggunakan Algoritma Fuzzy C-Means

Identifikasi Spasial Calon Walikota Manado Tahun 2015 Menggunakan Algoritma Fuzzy C-Means Identifikasi Spasial Calon Walikota Manado Tahun 2015 Menggunakan Algoritma Fuzzy C-Means Winsy Weku 1, Charitas Fibriani 2 1 Program Studi Matematika, FMIPA, UNSRAT Manado, winsy_weku@unsrat.ac.id 2 Program

Lebih terperinci

PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS TANPA BATASAN MINIMUM SUPPORT PADA BASIS DATA RETAIL

PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS TANPA BATASAN MINIMUM SUPPORT PADA BASIS DATA RETAIL PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS TANPA BATASAN MINIMUM SUPPORT PADA BASIS DATA RETAIL Dhiani Tresna Absari 1), Arif Djunaidy 2) Fakultas Teknologi Informasi Institut Teknologi

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Beras merupakan makanan pokok sebagian besar penduduk dunia, termasuk penduduk Indonesia. Bangsa Indonesia telah menjadi bangsa yang terbesar mengkonsumsi beras di

Lebih terperinci

PENGGALIAN TOP-K CLOSED FREQUENT ITEMSETS BERBASIS ALGORITMA PEMETAAN TRANSAKSI

PENGGALIAN TOP-K CLOSED FREQUENT ITEMSETS BERBASIS ALGORITMA PEMETAAN TRANSAKSI Program Studi MMT-ITS, Surabaya 2 Agustus 28 PENGGALIAN TOP-K CLOSED FREQUENT ITEMSETS BERBASIS ALGORITMA PEMETAAN TRANSAKSI Ngurah Agus Sanjaya ER dan Arif Djunaidy Program Magister Bidang Keahlian Teknik

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

OPTIMASI PUSAT KLASTER MENGGUNAKAN ALGORITMA FAST GENETIC KMEAN PADA DATA BERDISTRIBUSI NORMAL

OPTIMASI PUSAT KLASTER MENGGUNAKAN ALGORITMA FAST GENETIC KMEAN PADA DATA BERDISTRIBUSI NORMAL OPTIMASI PUSAT KLASTER MENGGUNAKAN ALGORITMA FAST GENETIC KMEAN PADA DATA BERDISTRIBUSI NORMAL Budi Nur Iman, Entin Martiana K, Umi Sa adah Politeknik Elektronika Negeri Surabaya (PENS), ITS Surabaya,

Lebih terperinci

WEIGHT K-SUPPORT VECTOR NEAREST NEIGHBOR

WEIGHT K-SUPPORT VECTOR NEAREST NEIGHBOR WEIGHT K-SUPPORT VECTOR NEAREST NEIGHBOR Eko Prasetyo 1), Rifki Fahrial Zainal 2), Harunur Rosyid 3) 1), 2) Teknik Informatika Universitas Bhayangkara Surabaya Jl. A. Yani 114, Surabaya, 60231 3) Teknik

Lebih terperinci

Partitional clustering KLASTERING DENGAN METODE K-MEANS

Partitional clustering KLASTERING DENGAN METODE K-MEANS Partitional clustering KLASTERING DENGAN METODE K-MEANS PENDAHULUAN K-mean merupakan teknik klastering yang paling umum dan sederhana. Tujuan klastering ini adalah mengelompokkan obyek ke dalam k klaster/kelompok.

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering

Lebih terperinci

RENCANA PEMBELAJARAN SEMESTER (RPS)

RENCANA PEMBELAJARAN SEMESTER (RPS) RENCANA PEMBELAJARAN SEMESTER (RPS) KKKF53106 DATA MINING PROGRAM STUDI S1 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER (FILKOM) UNIVERSITAS PUTRA INDONESIA YPTK 1 LEMBAR PENGESAHAN Rencana Pembelajaran Semester

Lebih terperinci

(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M

(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M (M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M 1Toza Sathia Utiayarsih, 2 Yadi Suprijadi, 3 Bernik Maskun 1Mahasiswa Magister Statistika

Lebih terperinci

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT Ismail Setiawan 1) 1) Magister Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

Perbandingan Silhouette Coeficient untuk Fitur Tfidf dan Perhitungan Kesamaan Pada Clustering Teks Bahasa Indonesia

Perbandingan Silhouette Coeficient untuk Fitur Tfidf dan Perhitungan Kesamaan Pada Clustering Teks Bahasa Indonesia Perbandingan Silhouette Coeficient untuk Fitur Tfidf dan Perhitungan Kesamaan Pada Clustering Teks Bahasa Indonesia Zahratul fikrina 1), Teguh Bharata Adji 2),Hanung Adi Nugroho 3) Magister Teknologi Informasi

Lebih terperinci

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 2, No. 1, Tahun

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 2, No. 1, Tahun Vol. 2, No. 1, Tahun 2013 65 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : https://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Analisa Penjualan Barang Menggunakan

Lebih terperinci

METODE NON HIERARCHY ALGORITMA K-MEANS DALAM MENGELOMPOKKAN TINGKAT KELARISAN BARANG (STUDI KASUS : KOPERASI KELUARGA BESAR SEMEN PADANG)

METODE NON HIERARCHY ALGORITMA K-MEANS DALAM MENGELOMPOKKAN TINGKAT KELARISAN BARANG (STUDI KASUS : KOPERASI KELUARGA BESAR SEMEN PADANG) METODE NON HIERARCHY ALGORITMA K-MEANS DALAM MENGELOMPOKKAN TINGKAT KELARISAN BARANG (STUDI KASUS : KOPERASI KELUARGA BESAR SEMEN PADANG) Fakultas Ilmu Komputer, Universitas Putra Indonesia YPTK Padang

Lebih terperinci

IMPLEMENTASI ALGORITMA FUZZY K-MEANS PADA DATA REKAM MEDIS BERDASARKAN KODE PENYAKIT INTERNASIONAL (ICD10)

IMPLEMENTASI ALGORITMA FUZZY K-MEANS PADA DATA REKAM MEDIS BERDASARKAN KODE PENYAKIT INTERNASIONAL (ICD10) IMPLEMENTASI ALGORITMA FUZZY K-MEANS PADA DATA REKAM MEDIS BERDASARKAN KODE PENYAKIT INTERNASIONAL (ICD10) Mulya Negara Bachtiar 1, Haryanto Hanny 2 1 Mahasiswa, 2 Dosen Pembimbing Program Studi Teknik

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bencana kebakaran dapat terjadi dimana saja dan kapan saja, misalkan terjadi di area tempat tinggal, di tambang atau di hutan. Untuk kebakaran hutan, kerugian yang

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ SKRIPSI Diajukan untuk memenuhi salah satu syarat memperoleh Gelar Sarjana pada Program Studi Sistem

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

Klasterisasi Data Kategorikal Berbasis Fuzzy K-Modes Dan Artificial Bee Colony

Klasterisasi Data Kategorikal Berbasis Fuzzy K-Modes Dan Artificial Bee Colony Klasterisasi Data Kategorikal Berbasis K-Modes Dan Artificial Bee Colony Khalid 1, Handayani Tjandrasa 2 1,2 Jurusan Teknik Informatika, ITS, Surabaya, Indonesia phillette@gmail.com Abstrak K-Modes (FKMO)

Lebih terperinci

Pendiskritan Kelas Kontinyu dengan Algoritma K-Mean Cluster. Kusrini Dosen STMIK AMIKOM YOGYAKARTA Abstract

Pendiskritan Kelas Kontinyu dengan Algoritma K-Mean Cluster. Kusrini Dosen STMIK AMIKOM YOGYAKARTA Abstract Pendiskritan Kelas Kontinyu dengan Algoritma K-Mean Cluster Kusrini Dosen STMIK AMIKOM YOGYAKARTA kusrini@amikom.ac.id Abstract Dalam proses pembentukan pengetahuan sering ditemui algoritma yang menyaratkan

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

Descriptor Clustering SURF for Bag of Visual Words Representation in Fingerprint Images Using K-MEANS and Hierarchical Agglomerative Clustering

Descriptor Clustering SURF for Bag of Visual Words Representation in Fingerprint Images Using K-MEANS and Hierarchical Agglomerative Clustering 2015 International Conference on Information, Communication Technology and System Descriptor Clustering SURF for Bag of Visual Words Representation in Fingerprint Images Using K-MEANS and Hierarchical

Lebih terperinci

APLIKASI ALGORITMA CLASSIFY-BY-SEQUENCE UNTUK PENILAIAN KREDIT PADA BANK Y. Mohammad Iqbal 1. Abstrak

APLIKASI ALGORITMA CLASSIFY-BY-SEQUENCE UNTUK PENILAIAN KREDIT PADA BANK Y. Mohammad Iqbal 1. Abstrak APLIKASI ALGORITMA CLASSIFY-BY-SEQUENCE UNTUK PENILAIAN KREDIT PADA BANK Y Mohammad Iqbal Jurusan Matematika, FMIPA-Institut Teknologi Sepuluh Nopember iqbalmohammad.math@gmail.com Abstrak Dalam penilaian,

Lebih terperinci

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia Prosiding Statistika ISSN: 2460-6456 Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia Supiyah, 2 Aceng Komarudin Mutaqin, 3 Teti

Lebih terperinci

PENGKOMBINASIAN POHON KEPUTUSAN DATA PENCILAN KELAS DAN POHON KEPUTUSAN DATA NORMAL UNTUK PENINGKATAN AKURASI PREDIKSI CACAT PERANGKAT LUNAK

PENGKOMBINASIAN POHON KEPUTUSAN DATA PENCILAN KELAS DAN POHON KEPUTUSAN DATA NORMAL UNTUK PENINGKATAN AKURASI PREDIKSI CACAT PERANGKAT LUNAK PENGKOMBINASIAN POHON KEPUTUSAN DATA PENCILAN KELAS DAN POHON KEPUTUSAN DATA NORMAL UNTUK PENINGKATAN AKURASI PREDIKSI CACAT PERANGKAT LUNAK Utomo Pujianto 1, Daniel Oranova Siahaan 2 1 Jurusan Teknik

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Penyimpanan dokumen secara digital berkembang dengan pesat seiring meningkatnya teknologi. Kondisi tersebut memunculkan masalah untuk mengakses informasi yang diinginkan

Lebih terperinci

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Chandra Purnamaningsih Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami No 36 A Surakarta cpurnamaningsih@gmail.com

Lebih terperinci

LAPORAN KEGIATAN PENELITIAN

LAPORAN KEGIATAN PENELITIAN LAPORAN KEGIATAN PENELITIAN Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik Dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang Oleh : Asroni,

Lebih terperinci

2. Data & Proses Datamining

2. Data & Proses Datamining 2. Data & Proses Datamining Data 1. Input (Dataset) 2. Pengolahan Data Awal 3. Metode Learning Tahapan Utama Proses Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/ Knowledge)

Lebih terperinci

BAB II KAJIAN PUSTAKA

BAB II KAJIAN PUSTAKA BAB II KAJIAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah alat dan teknik perangkat lunak yang bisa memberikan saransaran untuk item yang sekiranya bermanfaat bagi pengguna (Ricci, et al.,

Lebih terperinci

BAB I PENDAHULUAN. untuk menemukan pengetahuan atau informasi berharga yang tersembunyi di

BAB I PENDAHULUAN. untuk menemukan pengetahuan atau informasi berharga yang tersembunyi di BAB I PENDAHULUAN A. Latar Belakang Data mining merupakan salah satu cabang ilmu komputer yang cukup baru yang banyak digunakan dan dipelajari oleh para ahli ilmu komputer dan programmer. Data mining merupakan

Lebih terperinci

PE DAHULUA. Latar Belakang

PE DAHULUA. Latar Belakang Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di

Lebih terperinci

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DETEKSI OUTLIER MENGGUNAKAN ALGORITMA LOCAL OUTLIER PROBABILITY (LoOP) (STUDI KASUS DATA AKADEMIK MAHASISWA PROGRAM STUDI TEKNIK INFORMATIKA UNIVERSITAS SANATA DHARMA) Skripsi Diajukan Untuk Memenuhi Salah

Lebih terperinci

Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni

Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni 1 Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni Femi Dwi Astuti Program Studi Teknik Informatika STMIK AKAKOM femi@akakom.ac.id Abstrak -

Lebih terperinci

SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING

SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING Ati Suci Dian Martha, S.Kom., M.T. 1, Dena Jatnika Kusumah 1, Program Studi Sistem Informasi, STMIK LPKIA, Bandung Jln. Soekarno Hatta No.

Lebih terperinci

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA Artikel Skripsi PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA SKRIPSI Diajukan Untuk Memenuhi Sebagian

Lebih terperinci