TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

dokumen-dokumen yang mirip
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

baris data atau rekaman data

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB II LANDASAN TEORI

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI

BAB IV PEMBAHASAN. Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni

BAB II TINJAUAN PUSTAKA

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

BAB II LANDASAN TEORI

PROPOSAL PENERAPAN DATA MINING UNTUK MENENTUKAN STRATEGI PENJUALAN PADA TOKO BUKU GRAMEDIA PALEMBANG MENGGUNAKAN METODE CLUSTERING

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

TAKARIR. Peringatan Bug Suatu kesalahan desain pada perangkat lunak Browser. Tombol Container Wadah Drag

DAFTAR ISI. LEMBAR PENGESAHAN PEMBIMBING... ii. LEMBAR PERNYATAAN KEASLIAN... iii. LEMBAR PENGESAHAN PENGUJI... iv. HALAMAN PERSEMBAHAN...

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

TAKARIR. algorithm algoritma/ kumpulan perintah untuk menyelesaikan suatu masalah. kesalahan program

DAFTAR ISI HALAMAN JUDUL HALAMAN PENGESAHAN HALAMAN PERNYATAAN KATA PENGANTAR PERSEMBAHAN DAFTAR TABEL DAFTAR GAMBAR ARTI LAMBANG DAN SINGKATAN

PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

BAB V KESIMPULAN DAN SARAN Kesimpulan Saran DAFTAR PUSTAKA LAMPIRAN... 99

LEMBAR PENGESAHAN PEMBIMBING...

DATA MINING DAN WAREHOUSE A N D R I

DATA PREPROCESSING. Budi Susanto (versi 1.2)

APLIKASI K-MEANS UNTUK PENGELOMPOKKAN MAHASISWA BERDASARKAN NILAI BODY MASS INDEX (BMI) & UKURAN KERANGKA

BAB II LANDASAN TEORI...

BAB 1 PENDAHULUAN Latar Belakang

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

TAKARIR. Kombinasi dari beberapa media seperti suara gambar dan animasi

IMPLEMENTASI METODE KLASTERING K-MEANS UNTUK MENGELOMPOKAN HASIL EVALUASI MAHASISWA. FEBRIZAL ALFARASY SYAM Dosen STMIK Dharmapala Riau ABSTRAK

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

Pengenalan Pola. K-Means Clustering

DAFTAR ISI. HALAMAN JUDUL... i LEMBAR PENGESAHAN PEMBIMBING... ii. LEMBAR PERNYATAAN KEASLIAN HASIL TUGAS AKHIR... iii

PENERAPAN DATA MINING UNTUK MENENTUKAN STRATEGI PENJUALAN PADA TOKO BUKU GRAMEDIA MENGGUNAKAN METODE CLUSTERING

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

PENERAPAN DATA MINING UNTUK PENGELOMPOKAN MINAT KONSUMEN TERHADAP PRODUK LG MOBILE PALEMBANG

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

HALAMAN PENGESAHAN DOSEN PEMBIMBING... HALAMAN PENGESAHAN DOSEN PENGUJI...

Tahapan Proses KDD (Peter Cabena)

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

BAB 2 LANDASAN TEORI

DATA MINING DENGAN TEKNIK CLUSTERING UNTUK MENGGALI INFORMASI TENTANG BIMBINGAN KONSELING SISWA (STUDI KASUS : SMA NEGERI 1 X KOTO SINGKARAK)

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

ABSTRAK. Kata kunci: sistem rekomendasi, clustering, ekstraksi fitur musik, normalisasi data, attribute selection. Universitas Kristen Maranatha

3.2.3 Resiko, Keuntungan dan Kerugian Forex Metode Prediksi dalam Forex MetaTrader 4 sebagai Platform Trading dalam Forex...

BAB III METODOLOGI PENELITIAN

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

DAFTAR ISI... HALAMAN JUDUL... HALAMAN PENGESAHAN... HALAMAN PERNYATAAN... HALAMAN PERSEMBAHAN... PRAKATA... DAFTAR LAMBANG... DAFTAR GAMBAR...

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

DAFTAR ISI. Halaman Judul. Lembar Pengesahan Pembimbing. Lembar Pengesahan Penguji. Halaman Persembahan. Halaman Motto. Kata Pengantar.

Penerapan Metode KMeans dan Cobweb Terhadap Analisis Prestasi Akademik Mahasiswa yang Mengikuti Kegiatan Kemahasiswaan

DAFTAR ISI. DAFTAR ISI xi DAFTAR TABEL xiv DAFTAR GAMBAR xv. 1.5 Manfaat Penelitian Metodologi Penelitian... 3

PERTEMUAN 14 DATA WAREHOUSE

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

Kluster Bag-of-Word Menggunakan Weka

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

CLUSTERING UNTUK DATA KOMPETENSI WIDYAISWARA MENGGUNAKAN ALGORITMA KMEANS

TAKARIR. data atau informasi dan transformasi data yang bergerak dari pemasukan data hingga ke keluaran. Database

Analisis Perilaku Pengguna E-Learning BESMART Melalui Teknik Clustering dengan Algoritma K-Means

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

2. Data & Proses Datamining

PENGELOMPOKAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

Student Clustering Based on Academic Using K-Means Algoritms

Surmayanti 1, Hari Marfalino 2, Ade Rahmi 3 Fakultas Limu Komputer Universitas Putra Indonesia YPTK Padang

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU

SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE

LEMBAR PENGESAHAN PEMBIMBING...

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika. Skripsi Sarjana Komputer. Semester Ganjil tahun 2007/2008 OTOMATISASI SEGMENTASI DOKUMEN

TAKARIR. : penomoran naik secara otomatis

DAFTAR ISI. LAPORAN TUGAS AKHIR... ii. HALAMAN PERNYATAAN KEASLIAN... iii. LEMBAR PENGESAHAN PEMBIMBING... iv. LEMBAR PENGESAHAN PENGUJI...

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

BAB I PENDAHULUAN Latar Belakang

DAFTAR ISI... LEMBAR PENGESAHAN PEMBIMBING... LEMBAR PENGESAHAN PENGUJI... HALAMAN PERSEMBAHAN... HALAMAN MOTTO... KATA PENGANTAR...

BAB II LANDASAN TEORI

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

DATA MINING UNTUK MENGETAHUI LAMA STUDI MAHASISWA DI UNIVERSITAS MUHAMMADIYAH PONOROGO

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

TAKARIR. Aedes aegypti : nyamuk yang menularkan penyakit demam. Database : kumpulan file atau tabel yang saling

Data Preprocessing. oleh: Entin Martiana

DAFTAR ISI. HALAMAN JUDUL... i. HALAMAN PENGESAHAN PEMBIMBING... ii. LEMBAR PERNYATAAN KEASLIAN HASIL TUGAS AKHIR... iii

LAPORAN TUGAS AKHIR... ii. LEMBAR PENGESAHAN PEMBIMBING... iii. LEMBAR PENGESAHAN PENGUJI... iv. SURAT PERNYATAAN... v. MOTTO DAN PERSEMBAHAN...

DAFTAR ISI. KATA PENGANTAR... vii. DAFTAR ISI... ix. DAFTAR TABEL... xii. DAFTAR GAMBAR... xiii. DAFTAR LAMPIRAN... xx BAB I PENDAHULUAN...

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

Bag of Words Clustering Using Weka

BAB III ANALISIS DAN PERANCANGAN

Transkripsi:

TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge Discovery in Databases) : Penemuan pengetahuan dalam basis data Database Artificial intelligent Machine learning Data selection Pre-processing Cleaning Missing value Interpretation BMI ( Body Mass Index ) : Basis data : Kecerdasan buatan : Mesin pembelajaran : Pemilihan data : Sebelum pengolahan : Pembersihan : Informasi yang hilang : Interpretasi : Adalah ukuran yang digunakan untuk menilai proporsionalitas perbandingan antara tinggi dan berat seseorang. x

HAC (Hierarchical Agglomerative Clustering) Valid Inconsistent Task relevan data Knowledge Unsupervised Hierarchical Non hierarchical clustering Algoritma Partitional clustering Mean Open source dapat Data sampling Tools Explorer Knowledge flow Experimenter Simple Command line : Adalah sebuah metode hierarkis yang menciptakan komposisi hierarkis yang diterapkan pada objek data. : Sah : Tidak konsisten : Data tugas yang relevan : Pengetahuan : Tanpa arahan : Hirarki : Bukan pengelompokan hirarki : Algoritma pengelompokan partisi : Rata rata : Perangkat lunak yang kodenya dimodifikasi dengan bebas : Contoh data : Alat : Penjelajah : Arus pengetahuan : Orang yang melakukan percobaan : Mudah : Garis perintah xi

Data set Euclidean objek Euclidean distance Soft data Hard Normalization Score Standard deviation Decimal scaling New data Data selection CSV ( Comma Separated Values) Classification Visualization Association rules Regresi Download : Kumpulan data : Besarnya jarak suatu garis lurus yang menghubungkan antar : Jarak Euclidean : Data lunak : Keras : Normalisasi : Nilai : Deviasi standar : Penilaian decimal : Data baru : Pemilihan data : Adalah suatu format data dalam basis data di mana setiap record dipisahkan dengan tanda koma (,) atau titik koma(;). : Klasifikasi : Visualisasi :Aturan asosiasi : Suatu metode analisis statistik yang digunakan untuk melihat pengaruh antara dua atau lebih variabel : Unduh xii

Remove Choose Unsupervised Attribute Apply Start Distance Function Result list Visualize cluster assignment Save Clusterer visualize Arff viewer Drop out Square error Hard disk : Dihapus : Pilih : Tanpa pengawasan : Atribut : Terapkan : Mulai : Fungsi jarak : Daftar hasil : Memvisualisasikan tugas klaster : Simpan : Visualisasi hasil klaster : Tampilan arff : Dikeluarkan : Kuadrat kesalahan : Perangkat keras SSE ( Sum Of Squared Errors ) : Adalah ukuran perbedaan antara data dan model estimasi. ARFF (Attribute-Relation File Format ) : Adalah file yang digunakan Weka yang berisi satu atau lebih instances dari atribut xiii

DAFTAR ISI Halaman HALAMAN JUDUL... LEMBAR PENGESAHAN PEMBIMBING... LEMBAR PENGESAHAN PENGUJI... LEMBAR PERNYATAAN KEASLIAN... HALAMAN PERSEMBAHAN... HALAMAN MOTTO... KATA PENGANTAR... SARI... TAKARIR... DAFTAR ISI... DAFTAR TABEL... DAFTAR GAMBAR... DAFTAR LAMPIRAN... i ii iii iv v vi vii ix x xiv xvi xvii xix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 2 1.3 Batasan Masalah... 3 1.4 Tujuan Penelitian... 3 1.5 Manfaat Penelitian... 3 1.6 Metodologi Penelitian... 4 1.7 Sistematika Penulisan... 5 xiv

BAB II TINJAUAN PUSTAKA... 7 2.1 Penelitian Terdahulu... 7 2.2 Data Mining... 8 2.3 Clustering... 11 2.4 Algoritma K-Means... 11 2.5 Weka... 12 BAB III PEMODELAN... 14 3.1 Identifikasi Masalah... 14 3.2 Model Keputusan... 20 3.2.1 Pseudocode... 21 3.2.2 Diagram Alir... 23 BAB IV HASIL DAN PEMBAHASAN... 29 4.1 Metodologi Penelitian... 29 4.1.1 Metode Pengumpulan Data... 29 4.1.2 Studi Pustaka... 29 4.1.3 Metode Analisis Data... 29 4.2 Implementasi dengan Weka... 32 4.2.1 Normalisasi... 36 4.2.2 Clustering... 38 4.3 Hasil Implementasi... 46 4.4 Analisis Hasil Implementasi... 48 4.5 Hitung Nilai SSE... 55 4.6 Komputasi... 57 4.7 Pengguna... 57 BAB V PENUTUP... 59 5.1 Kesimpulan... 59 5.2 Saran... 59 DAFTAR PUSTAKA... 60 LAMPIRAN... 62 xv

DAFTAR TABEL Halaman Tabel 3.1 Tabel Data Mahasiswa... 16 Tabel 3.2 Tabel Perubahan Tahun Akademik... 17 Tabel 3.3 Tabel Normalisasi... 19 Tabel 3.4 Tabel Data Awal... 24 Tabel 3.5 Tabel Centroid Pada Iterasi Ke 0... 24 Tabel 3.6 Tabel Hitung Jarak... 26 Tabel 3.7 Tabel Hasil Perhitungan Jarak dan Pengelompokan Data... 26 Tabel 3.8 Tabel Centroid Pada Iterasi Ke 1... 26 Tabel 3.9 Tabel Hasil Perhitungan Jarak dan Pengelompokan Data iterasi 1... 27 Tabel 3.10 Tabel Centroid Pada Iterasi Ke 2... 27 Tabel 3.11 Tabel Hasil Perhitungan Jarak dan Pengelompokan Data iterasi 2... 27 Tabel 3.12 Tabel Centroid Pada Iterasi Ke 3... 28 Tabel 4.1 Tabel Contoh Data Mahasiswa... 30 Tabel 4.2 Tabel Data Setelah Dibersihkan... 31 Tabel 4.3 Tabel Data Mahasiswa... 33 Tabel 4.4 Tabel Cluster 0 Pengelompokan 4 cluster... 56 xvi

DAFTAR GAMBAR Halaman Gambar 2.1 Gambar Proses Data Mining... 9 Gambar 3.1 Gambar Diagram Alir Algoritma K-Means... 23 Gambar 4.1 Gambar Tampilan Weka... 32 Gambar 4.2 Gambar Tampilan Open File Weka... 34 Gambar 4.3 Gambar Tampilan Statistik Atribut... 35 Gambar 4.4 Gambar Tabel Sumber Data pada Weka... 36 Gambar 4.5 Gambar Menu Filter Untuk Normalisasi... 37 Gambar 4.6 Gambar Statistik Data Setelah Normalisasi... 37 Gambar 4.7 Gambar Tabel Hasil Normalisasi... 38 Gambar 4.8 Gambar Memilih Metode Clustering... 39 Gambar 4.9 Gambar Masukkan Jumlah Cluster... 40 Gambar 4.10 Gambar Menu Clustering Pada Weka... 40 Gambar 4.11 Gambar Pilihan Distance Function... 41 Gambar 4.12 Gambar Menentukan Jumlah Iterasi... 42 Gambar 4.13 Gambar Hasil Clustering... 43 Gambar 4.14 Gambar Tampilan Untuk Menyimpan File Hasil Cluster... 43 Gambar 4.15 Gambar Weka Clusterer Visualize... 44 Gambar 4.16 Gambar ArffViewer... 44 Gambar 4.17 Gambar Hasil Clustering 3 Cluster Dengan ARFF Viewer... 45 xvii

Gambar 4.18 Gambar Data Hasil Clustering 3 Cluster Sebelum Dan Setelah Normalisasi... 45 Gambar 4.19 Gambar Hasil Clustering 3 Cluster... 46 Gambar 4.20 Gambar Pengelompokan 4 cluster... 47 Gambar 4.21 Gambar Pengelompokan 5 cluster... 48 xviii

DAFTAR LAMPIRAN Halaman Lampiran 1 Tabel Hasil Clustering Dengan 3 Cluster... 62 Lampiran 2 Tabel Hasil Clustering Dengan 4 Cluster... 69 Lampiran 3 Tabel Hasil Clustering Dengan 5 Cluster... 75 xix