JULIO ADISANTOSO - ILKOM IPB 1
|
|
|
- Indra Hermanto
- 9 tahun lalu
- Tontonan:
Transkripsi
1 KOM341 Temu Kembali Informasi KULIAH #9 Text Clustering (Ch.16 & 17) Clustering Pengelompokan, penggerombolan Proses pengelompokan sekumpulan obyek ke dalam kelas-kelas obyek yang memiliki sifat sama. Unsupervised learning JAS - DEPT. ILMU KOMPUTER IPB 2 Yahoo! Hierarchy Scatter/Gather: Cutting, Karger, and Pedersen (30) agriculture biology physics CS space dairy crops botany cell AI courses magnetism forestry agronomy evolution HCI relativity craft missions JAS - DEPT. ILMU KOMPUTER IPB 3 JAS - DEPT. ILMU KOMPUTER IPB 4 Vivisimo ( Menggunakan cluster Hipotesis : dokumen dengan teks yang mirip memiliki keterkaitan. Oleh karena itu, untuk meningkatkan recall: Kelompokkan dokumen pada korpus. Jika query q cocok dengan dokumen d, maka berikan juga dokumen lain yang sekelompok dengan d. Contoh: query car juga akan memberikan dokumen tentang automobile (karena satu kelas). JAS - DEPT. ILMU KOMPUTER IPB 5 JAS - DEPT. ILMU KOMPUTER IPB 6 JULIO ADISANTOSO - ILKOM IPB 1
2 Isu pada Clustering Representasi dokumen: Ruang vektor? Normalisasi? Ukuran kesamaan/jarak Banyaknya kelas: Tetap Tergantung pada data Harus dihindari jumlah kelas yang terlalu sedikit atau terlalu banyak. Mengapa? Apa yang membuat dokumen berhubungan? Ideal : kesamaan semantik Praktis : kesamaan statistik Menggunakan ukuran kesamaan Cosine Dokumen sebagai vektor Untuk beberapa algoritme, lebih mudah memperhatikan jarak antar dokumen, dibanding kesamaannya. JAS - DEPT. ILMU KOMPUTER IPB 7 JAS - DEPT. ILMU KOMPUTER IPB 8 Algoritme Clustering Partitional algorithms Dimulai dengan sebagian secara acak Dilakukan iterasi: K means clustering Model based clustering Hierarchical algorithms Bottom-up, agglomerative Top-down, divisive Partitioning Algorithms Metode partisi: susun partisi n dokumen ke dalam K kelompok Formulasi masalah: Diketahui koleksi dokumen dan nilai K Dapatkan partisi K kelompok dokumen yang mengoptimumkan partisi dengan kriteria tertentu: Globally optimal: exhaustively enumerate all partitions Effective heuristic methods: K-means and K-medoids algorithms JAS - DEPT. ILMU KOMPUTER IPB 9 JAS - DEPT. ILMU KOMPUTER IPB 10 K-means Asumsikan tiap dokumen sebagai vektor bernilai bilangan riil Kelompokkan dokumen berdasarkan centroid pada suatu cluster c : Penempatan elemen pada clusters berdasarkan jarak terhadap centroid dari cluster yang ada (similarities) Algoritme K-means Pilih K dokumen secara acak {s 1, s 2, s K } sebagai seed. Lakukan iterasi: Untuk setiap dokumen d i, masukkan di ke cluster c j sehingga jarak(x i, s j ) adalah minimum. Perbaiki centroid tiap cluster c j s j = (c j ) JAS - DEPT. ILMU KOMPUTER IPB 11 JAS - DEPT. ILMU KOMPUTER IPB 12 JULIO ADISANTOSO - ILKOM IPB 2
3 Contoh K-means (K=2) Kapan Iterasi Berhenti? Jumlah iterasi ditentukan Partisi dokumen tidak berubah Posisi centroid tidak berubah x x JAS - DEPT. ILMU KOMPUTER IPB 13 JAS - DEPT. ILMU KOMPUTER IPB 14 Memilih Seed Cluster yang dihasilkan tergantung pada pemilihan seed di awal (secara acak). Contoh Hierarchical Clustering Membangun hirarki taksonomi berbasis denah pohon (dendogram) dari sekumpulan dokumen. Jika mulai dengan B dan E sebagai centroid, maka akan konvergen ke {A,B,C} dan {D,E,F} Jika mulai dengan D dan F sebagai centroid, maka akan konvergen ke {A,B,D,E} dan {C,F} animal vertebrate invertebrate fish reptile amphib. mammal worm insect crustacean JAS - DEPT. ILMU KOMPUTER IPB 15 JAS - DEPT. ILMU KOMPUTER IPB 16 Dendogram Cluster diperoleh dengan memotong dendogram pada level tertentu. Hierarchical Agglomerative Clustering (HAC) Mulai dengan setiap dokumen sebagai suatu obyek tersendiri Gabungkan setiap obyek yang memiliki sifat sama (ukuran kesamaan paling tinggi, atau ukuran jarak paling kecil) Lakukan langkah kedua di atas seterusnya, dan berhenti jika semua obyek berada pada satu kelompok JAS - DEPT. ILMU KOMPUTER IPB 17 JAS - DEPT. ILMU KOMPUTER IPB 18 JULIO ADISANTOSO - ILKOM IPB 3
4 Menggabungkan Cluster Single-link Menggunakan obyek yang paling dekat atau paling sama Complete-link Menggunakan obyek yang paling jauh atau paling tidak sama Average-link Menggunakan nilai rata-rata dari setiap anggota tiap cluster Single Link Menggunakan ukuran kesamaan yang terbesar dari tiap pasangan. Setelah c i dan c j digabung, maka ukuran kesamaan dari cluster yang dihasilkan dengan cluster lainnya, c k, adalah: JAS - DEPT. ILMU KOMPUTER IPB 19 JAS - DEPT. ILMU KOMPUTER IPB 20 Single Link Complete Link Menggunakan ukuran kesamaan yang terkecil dari tiap pasangan. Setelah c i dan c j digabung, maka ukuran kesamaan dari cluster yang dihasilkan dengan cluster lainnya, c k, adalah: JAS - DEPT. ILMU KOMPUTER IPB 21 JAS - DEPT. ILMU KOMPUTER IPB 22 Complete Link Average Link Menggunakan rata-rata dari pasangan ukuran kesamaan. Merupakan kompromi dari pendekatan single link dan complete link. JAS - DEPT. ILMU KOMPUTER IPB 23 JAS - DEPT. ILMU KOMPUTER IPB 24 JULIO ADISANTOSO - ILKOM IPB 4
5 Bagaimana Cluster yang Baik? Kriteria internal: menghasilkan cluster yang baik dimana: Kesamaan antar anggota dalam suatu cluster (intracluster) adalah tinggi Kesamaan antar anggota dari cluster yang berbeda (inter-cluster) adalah rendah Kualitas ukuran tergantung pada representasi dokumen dan ukuran kesamaan yang digunakan Beberapa Ukuran Kesamaan Inner Product Dice Coefficient Cosine Coefficient Jaccard Coefficient JAS - DEPT. ILMU KOMPUTER IPB 25 JAS - DEPT. ILMU KOMPUTER IPB 26 Bagaimana Cluster yang Baik? Kriteria eksternal: diukur dengan menggunakan data kelas yang baik yang sudah diketahui (gold standard). Asumsikan ada C kelas-kelas yang baik (gold standard), sedangkan algoritma cluster kita menghasilkan k clusters, π 1, π 2,, π k dengan n i anggota. Purity, rasio antara kelas yang dominan pada cluster π i dan ukuran cluster π i JAS - DEPT. ILMU KOMPUTER IPB 27 Contoh Purity JAS - DEPT. ILMU KOMPUTER IPB 28 Cluster I Cluster II Cluster III Cluster I: Purity = 1/6 (max(5, 1, 0)) = 5/6 Cluster II: Purity = 1/6 (max(1, 4, 1)) = 4/6 Cluster III: Purity = 1/5 (max(2, 0, 3)) = 3/5 Rand Index (RI) #anggota Cluster yang sama Cluster yang berbeda Benar Sama A C Contoh : Single Link Dokumen A, B, C, D, dan E mempunyai ukuran kesamaan sebagai berikut Benar Berbeda B D JAS - DEPT. ILMU KOMPUTER IPB 29 JAS - DEPT. ILMU KOMPUTER IPB 30 JULIO ADISANTOSO - ILKOM IPB 5
6 LATIHAN Diketahui matrik term-document sbb: Dengan ukuran kesamaan Cosine dan Complete Link, lakukan clustering terhadap dokumen. JULIO ADISANTOSO - ILKOM IPB JULIO ADISANTOSO - ILKOM IPB 6
JULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembal Informas KULIAH #9 Text Clusterng Clusterng Pengelompokan, penggerombolan Proses pengelompokan sekumpulan obyek ke dalam kelas-kelas obyek yang memlk sfat sama. Unsupervsed learnng JAS
Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning
CLUSTERING DEFINISI Clustering : Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis Bentuk yang paling umum digunakan adalah unsupervised learning # Unsupervised learning
ANALISIS CLUSTER PADA DOKUMEN TEKS
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami
Clustering. Virginia Postrel
8 Clustering Most of us cluster somewhere in the middle of most statistical distributions. But there are lots of bell curves, and pretty much everyone is on a tail of at least one of them. We may collect
ANALISIS CLUSTER PADA DOKUMEN TEKS
Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma
Tipe Clustering. Partitional Clustering. Hirerarchical Clustering
Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan
Pendekatan Algoritma Divide and Conquer pada Hierarchical Clustering
Pendekatan Algoritma Divide and Conquer pada Hierarchical Clustering Agnes Theresia Damanik / 13510100 1 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,
PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN
PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem
DSS untuk Menganalisis ph Kesuburan Tanah Menggunakan Metode Single Linkage
61 DSS untuk Menganalisis ph Kesuburan Tanah Menggunakan Metode Single Linkage Abdi Pandu Kusuma, Rini Nur Hasanah, dan Harry Soekotjo Dachlan Abstrak - ph tanah merupakan ukuran jumlah ion hidrogen dalam
DATA MINING DAN WAREHOUSE A N D R I
DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun
LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING
LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam
Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,
K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: [email protected] Abstrak Pembentukan cluster merupakan
BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode
BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada
Pengenalan Pola. Klasterisasi Data
Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering
TEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 MODEL IR Konsep IR Model IR Konsep Boolean Model Pemodelan IR Model IR Konsep Boolean Model Model IR didefinisikan sebagai empat komponen, yaitu:
BAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling
ANALISIS KLASTERING LIRIK LAGU INDONESIA
ANALISIS KLASTERING LIRIK LAGU INDONESIA Afdilah Marjuki 1, Herny Februariyanti 2 1,2 Program Studi Sistem Informasi, Fakultas Teknologi Informasi, Universitas Stikubank e-mail: 1 [email protected],
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Clustering Analysis Clustering analysis merupakan metode pengelompokkan setiap objek ke dalam satu atau lebih dari satu kelompok,sehingga tiap objek yang berada dalam satu kelompok
dengan Algoritma K Means
K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: [email protected] Abstrak Pembentukan cluster merupakan
METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami
METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering
BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang
BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Analisis statistik multivariat adalah metode statistik di mana masalah yang diteliti bersifat multidimensional dengan menggunakan tiga atau lebih variabel
BAB II KAJIAN PUSTAKA
BAB II KAJIAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah alat dan teknik perangkat lunak yang bisa memberikan saransaran untuk item yang sekiranya bermanfaat bagi pengguna (Ricci, et al.,
BAB 2 LANDASAN TEORI
7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.
BAB IV ANALISIS DAN PERANCANGAN
BAB IV ANALISIS DAN PERANCANGAN 4.1. Analisa 4.1.1 Analisis Data Pada tahap analisa data ini akan dibahas mengenai citra CT Scan yang akan dilakukan proses segmentasi atau pengelompokan data. Data citra
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko
Pengenalan Pola. K-Means Clustering
Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan
KLASTERING DOKUMEN MENGGUNAKAN HIERARCHICAL AGGLOMERATIVE CLUSTERING
KLASTERING DOKUMEN MENGGUNAKAN HIERARCHICAL AGGLOMERATIVE CLUSTERING Herny Februariyanti 1 Edi Winarko 2 1) Sistem Informasi, Universitas Stikubank Semarang, email: [email protected] 2) Ilmu Komputer,
BAB 3 ANALISA SISTEM
BAB 3 ANALISA SISTEM Pada perancangan suatu sistem diperlakukan analisa yang tepat, sehingga proses pembuatan sistem dapat berjalan dengan lancar dan sesuai seperti yang diinginkan. Setelah dilakukan analisis
Pertemuan 14 HIERARCHICAL CLUSTERING METHODS
Pertemuan 14 HIERARCHICAL CLUSTERING METHODS berdasar gambar berdasar warna A A A A Q Q Q Q K K K K J J J J 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 10 10 10 10 A K Q J (a). Individual
commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari
BAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI Bab ini berisi penjelasan mengenai image clustering, pengukuran kemiripan dan pengukuran jarak, representasi citra, ruang warna, algoritma clustering, dan penelitian yang berhubungan.
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Mobilitas adalah hal yang tidak dapat dipisahkan dalam gaya hidup masyarakat sekarang ini. Serangkaian aktifitas menuntut seseorang untuk berada di suatu tempat bahkan
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Sistem Pendukung Keputusan II.1.1 Definisi Sistem Pendukung Keputusan Berdasarkan Efraim Turban dkk, Sistem Pendukung Keputusan (SPK) / Decision Support System (DSS) adalah sebuah
JULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #8 Text Classification (Manning, Ch.13, p.288/253) Ad Hoc Retrieval vs Standing Query User mencari informasi dengan memberikan satu atau lebih query terhadap koleksi
BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai
BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di
SEGMENTASI CITRA. thresholding
SEGMENTASI CITRA Dalam visi komputer, Segmentasi adalah proses mempartisi citra digital menjadi beberapa segmen (set piksel, juga dikenal sebagai superpixels). Tujuan dari segmentasi adalah untuk menyederhanakan
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Text Mining Text mining, yang juga disebut text data mining (TDM) atau knowledge discovery in text( KDT), secara umum mengacu pada proses ekstraksi informasi dari dokumen-dokumen
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster
Analisis Cluster Analisis Cluster adalah suatu analisis statistik yang bertujuan memisahkan kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain.
BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk
BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.
Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra
UKDW BAB I PENDAHULUAN
BAB I PENDAHULUAN 1.1 Latar Belakang Dalam dunia bisnis pada jaman sekarang, para pelaku bisnis senantiasa selalu berusaha mengembangkan cara-cara untuk dapat mengembangkan usaha mereka dan memperhatikan
CLUSTERING KONSEP DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN BISECTING K-MEANS HIZRY RAMDANI
CLUSTERING KONSEP DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN BISECTING K-MEANS HIZRY RAMDANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2011 CLUSTERING
BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada hubungan satu variabel atau dua variabel saja, akan tetapi cenderung melibatkan banyak variabel. Analisis
PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE
Jurnal Matematika UNAND Vol. 3 No. 4 Hal. 13 23 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER
PENDAHULUAN. 1.1 Latar Belakang
DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan
Gambar 3.1 Contoh Citra yang digunakan
BAB III DATASET DAN RANCANGAN PENELITIAN Pada bab ini dijelaskan tentang dataset citra yang digunakan dalam penelitian ini serta rancangan untuk melakukan penelitian. 3.1 DATASET PENELITIAN Penelitian
CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS
CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS Muhammad Toha, 1), I Ketut Edy Purnama 2) dan Surya Sumpeno 3) 1) Bidang Keahlian Telematika (Konsentrasi CIO) Jurusan Teknik Elektro
QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK
QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut
BAB III K-MEDIANS CLUSTERING
BAB III 3.1 ANALISIS KLASTER Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Metode interdependensi berfungsi untuk memberikan makna terhadap seperangkat
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Data menjadi sesuatu yang sangat berharga saat ini. Tidak hanya badan pemerintah saja, perusahaan-perusahaan saat ini pun sangat membutuhkan informasi dari data yang
IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING
IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember
PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak
PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1 Wahyu Catur Wibowo 2 1 Program Studi Sistem Informasi, Universitas Jember 2 Fakultas Ilmu Komputer, Universitas Indonesia,
TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas
TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means
Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.
BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari
BAB I PENDAHULUAN 1.1 Latar Belakang Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari internet ataupun milik pribadi juga semakin berkembang. Permasalahan utama adalah bagaimana memperoleh
UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi komputer khususnya di jaringan Internet telah berkembang dengan sangat cepat. Semua orang dapat saling bertukar dan mendapatkan informasi
Pengenalan Pola. Hierarchical Clustering
Pengenalan Pola Hierarchical Clustering PTIIK - 2014 Course Contents 1 Agglomerative Hierarchical Clustering (AHC) 2 Stui Kasus 3 Latihan an Diskusi 4 Progress Final Project Hierarchical Clustering Hierarchical
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Traveling Salesmen Problem (TSP) Travelling Salesman Problem (TSP) merupakan sebuah permasalahan optimasi yang dapat diterapkan pada berbagai kegiatan seperti routing. Masalah
BAB 2 TINJAUAN PUSTAKA
4 BAB 2 TINJAUAN PUSTAKA 2.1 Metode Clustering Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai salah satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data
BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan
BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Berdasarkan Peraturan Pemerintah Nomor 37 tahun 2009, dosen merupakan pendidik profesional dan ilmuwan dengan tugas utama mentransformasikan, mengembangkan,
Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan
Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan ciri/sifat daripada pola-pola dalam
Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering
SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2016 Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering Viga Apriliana Sari, Nur Insani Jurusan Pendidikan
KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS
1 KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS (Study Kasus : Tim Hockey Kabupaten Kendal) Alith Fajar Muhammad Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula No. 5-11 Semarang-50131
BAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Tinjauan Pustaka Hosseini dan Gholaiman (2010) dan Pradono dkk (2011) melakukan pengelompokkan konsumen dengan data yang bersifat metric dan menggunakan metode K-Means. Hosseini
PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA
PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo
PENERAPAN DATA MINING PADA PENJUALAN HARDISK UNTUK OPTIMALISASI DISTRIBUSI MENGGUNAKAN METODE CLUSTERING
PENERAPAN DATA MINING PADA PENJUALAN HARDISK UNTUK OPTIMALISASI DISTRIBUSI MENGGUNAKAN METODE CLUSTERING Artikel Skripsi Universitas Nusantara PGRI Kediri PENERAPAN DATA MINING PADA PENJUALAN HARDISK
KOM341 Temu Kembali Informasi
KOM341 Temu Kembali Informasi KULIAH #4 Pemodelan IR Boolean model Vector space model Proses Temu-Kembali 1 Konsep IR Pemodelan IR o Model IR didefinisikan sebagai empat komponen [D, F, Q, R(q, d j )]
PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS
Jurnal Ilmiah ILKOM Volume 8 mor (Agustus 16) ISSN: 87-1716 PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Widya Safira Azis 1 dan Dedy Atmajaya 1 [email protected] dan [email protected]
Partitional clustering KLASTERING DENGAN METODE K-MEANS
Partitional clustering KLASTERING DENGAN METODE K-MEANS PENDAHULUAN K-mean merupakan teknik klastering yang paling umum dan sederhana. Tujuan klastering ini adalah mengelompokkan obyek ke dalam k klaster/kelompok.
1. PENDAHULUAN. Perkembangan teknologi informasi, khususnya teknologi Internet. mudah dan gratis, mengakibatkan informasi berlimpah.
1. PENDAHULUAN A. Latar Belakang Perkembangan teknologi informasi, khususnya teknologi Internet sebagai wadah untuk dapat dengan mudah menyebarkan informasi secara mudah dan gratis, mengakibatkan informasi
BAB I PENDAHULUAN Latar Belakang
1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering
Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means
Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK [email protected]
STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011
STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan mahasiswa berdasarkan status gizi Body Mass Index (BMI) dan ukuran kerangka.
BAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang
Klasterisasi Wilayah Pemasaran berdasarkan Preferensi Konsumen terhadap PT. X
Klasterisasi berdasarkan Konsumen terhadap PT. X Prasetyo, Andhika Eko Program Studi Manajemen Rekayasa Universitas Internasional Semen Indonesia Jl. Veteran Gresik, Jawa Timur 61122 E-mail: [email protected]
SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS
SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS Sinawati ), Ummi Syafiqoh 2) ), 2) Sistem Informasi STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos
KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE
KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE Yudha Agung Wirawan, Dra.Indwiarti,M.Si, Yuliant Sibaroni,S.SI., M,T Program Studi Ilmu Komputasi Fakultas Informatika
ANALISIS GEROMBOL CLUSTER ANALYSIS
ANALISIS GEROMBOL CLUSTER ANALYSIS Pendahuluan Tujuan dari analisis gerombol : Menggabungkan beberapa objek ke dalam kelompok-kelompok berdasarkan sifat kemiripan atau sifat ketidakmiripan antar objek
BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks
BAB II KAJIAN TEORI Pada bab II akan dibahas tentang materi-materi dasar yang digunakan untuk mendukung pembahasan pada bab selanjutnya, yaitu matriks, kombinasi linier, varian dan simpangan baku, standarisasi
BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen
BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi
PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI
PENGGUNAAN PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI Entin Martiana S.Kom,M.Kom, Nur Rosyid Mubtada i S. Kom, Edi Purnomo Jurusan Teknik Informatika
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Salah satu faktor penting penunjang globalisasi ialah internet. Semakin majunya teknologi internet menyebabkan banyaknya pengembang perangkat lunak membuat berbagai
KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431
KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :
Perbandingan Metode Single Linkage dan Fuzzy C Means Untuk Pengelompokkan Trafik Internet
Perbandingan Metode Single dan Fuzzy C Means ntuk Pengelompokkan Trafik Internet Auliya Burhanuddin 1, Ema tami, Eko Pramono 3 1 Program Studi Teknik Informastika, Fakultas Teknik, niversitas Muhammadiyah
K-Means Clustering. Tim Asprak Metkuan. What is Clustering?
K-Means Clustering Tim Asprak Metkuan What is Clustering? Also called unsupervised learning, sometimes called classification by statisticians and sorting by psychologists and segmentation by people in
Data Mining. Clustering. Oleh : Suprayogi
Data Mining Clustering Oleh : Suprayogi Pendahuluan Saat ini terjadi fenomena yaitu berupa data yang melimpah, setiap hari banyak orang yang berurusan dengan data yang bersumber dari berbagai jenis observasi
CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)
CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing
BAB 6 ANALISIS CLUSTER
BAB 6 ANALISIS CLUSTER Pendahuluan Analisis cluster membagi data ke dalam grup (cluster) yang bermakna, berguna, atau keduanya. Jika tujuannya mencari grup yang memiliki makna, maka cluster seharusnya
PENERAPAN DATA MINING PADA PENJUALAN HARDISK UNTUK OPTIMALISASI DISTRIBUSI MENGGUNAKAN METODE CLUSTERING
PENERAPAN DATA MINING PADA PENJUALAN HARDISK UNTUK OPTIMALISASI DISTRIBUSI MENGGUNAKAN METODE CLUSTERING SKRIPSI Diajukan Untuk Penulisan Skripsi Guna Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster
