LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

Ukuran: px
Mulai penontonan dengan halaman:

Download "LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING"

Transkripsi

1 LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam melakukan penelitian pasar. 2. Mahasiswa dapat mengetahui dan memahami arti dan garis besar dari Analisis Cluster dalam Data Mining, mulai dari pengambilan data, pengolahan data sampai dengan tahap pengelompokan, serta mengaplikasikannya dalam kasus-kasus yang dihadapinya. LA DASA TEORI 2.1 Clustering Concept Analisis cluster merupakan salah satu teknik data mining yang bertujuan untuk mengidentifikasi sekelompok obyek yang mempunyai kemiripan karakteristik tertentu yang dapat dipisahkan dengan kelompok obyek lainnya, sehingga obyek yang berada dalam kelompok yang sama relatif lebih homogen daripada obyek yang berada pada kelompok yang berbeda. Jumlah kelompok yang dapat diidentifikasi tergantung pada banyak dan variasi data obyek. Tujuan dari pengelompokan sekumpulan data obyek ke dalam beberapa kelompok yang mempunyai karakteristik tertentu dan dapat dibedakan satu sama lainnya adalah untuk analisis dan interpretasi lebih lanjut sesuai dengan tujuan penelitian yang dilakukan. Model yang diambil diasumsikan bahwa data yang dapat digunakan adalah data yang berupa data interval, frekuensi dan biner. Set data obyek harus mempunyai peubah dengan tipe yang sejenis tidak campur antara tipe yang satu dengan lainnya. 2.2 Tujuan Analisis Cluster Analisis cluster dapat diterapkan pada bidang apa saja. Namun pemakaian teknik ini lebih familiar pada bidang pemasaran karena memang salah satu kegiatan yang

2 dilakukan dalam pemasaran adalah pengelompokan, yang disebut segmentasi pasar. Tujuan analisis cluster di dalam pemasaran adalah sebagai berikut : 1. Membuat segmen pasar (segmenting the market) Pelanggan atau pembeli sering diklasterkan berdasarkan manfaat atau keuntungan yang diperoleh dari pembelian barang. Setiap cluster akan terdiri dari pelanggan/pembeli yang relatif homogen, dinyatakan dalam manfaat yang dicari. 2. Memahami perilaku pembeli Analisis cluster digunakan untuk mengenali/mengidentifikasi kelompok pembeli yang homogen/relatif homogen. Kemudian perilaku dalam untuk setiap kelompok perlu dikaji secara terpisah. Responden (pembeli) dikelompokkan didasarkan pada self-reported importance yang terkait pada setiap faktor pilihan yang digunakan untuk memilih toko atau mall di mana para pembeli membeli barang yang dibutuhkan. 3. Mengenali peluang produk baru Dengan mengklasterkan merk dan produk, competitive set di dalam pasar bisa ditentukan. Merek di dalam klaster yang sama bersaing sengit satu sama lain, daripada merek dari klaster lain. 4. Mereduksi data. Analisis cluster digunakan sebagai suatu alat mereduksi data secara umum, untuk mengembangkan klaster atau sub-group dari data yang mudah dikelola dari kumpulan data asli, secara individual. 2.3 Prosedur Analisis Cluster Rumuskan Masalah Pilih Ukuran Jarak Pilih Prosedur Peng-cluster-an Penentuan Banyaknya Cluster Profilisasi Customer Menentukan segmentasi Pasar

3 Secara umum proses dimulai dengan merumuskan masalah pengklasteran dengan mendefinisikan variabel-variabel yang dipergunakan untuk dasar pengklasteran/pembentukan klaster. Kemudian pengambilan p pengukuran peubah pada n obyek pengamatan. Data tersebut dijadikan matriks data mentah berukuran m x p. Matrik tersebut ditransformasikan ke dalam bentuk matriks similaritas (kemiripan) berupa n x n yang dihitung berdasarkan pasangan-pasangan obyek p peubah. Konsep dasar pengukuran analisis cluster adalah konsep pengukuran jarak (distance) dan kesamaan (similarity). Distance adalah ukuran tentang jarak pisah antar obyek sedangkan similarity adalah ukuran kedekatan. Konsep ini penting karena pengelompokan pada analisis cluster didasarkan pada kedekatan. Pengukuran jarak (distance type measure) digunakan untuk data-data yang bersifat matriks, sedangkan pengukuran kesesuaian (matching type measure) digunakan untuk data-data yang bersifat kualitatif. 2.4 Teknik Pengukuran Jarak 1) Euclidean Distance Merupakan ukuran jarak antara dua item X dan Y. D(X, Y) = 2) Squared Euclidean Distance 2 (Xi Yi) Merupakan ukuran jarak antara dua item X dan Y. 3) Pearson Correlation 2 D(X, Y) = (Xi Yi) Korelasi antara vektor nilai : ZxiZ S(X, Y) = (N 1) yi di mana Z xi adalah nilai x yang telah distandarkan untuk item ke-i dan N adalah jumlah itemnya. 4) Chebychev 5) Block D(X,Y) = max X Y i i i D (X,Y) X i Y = i

4 6) Minkowski D(X,Y) p = 1 (absolute metric) = p = 2 (euclidian metric) 7) Chi-Square p [ X ] 1 p i Y i D(X, Y) = (Xi E(Xi)) E(Xi) 2 (Yi + E(Yi)) E(Yi) 2 8) Phi-Square 9) Hamming D(X, Y) (Xi E(Xi)) (Yi E(Yi)) = + n E(Xi) E(Yi) k D(P,Q) = δ ( X pk. X qk ) k= 1 Dimana : δ ( X, X ) pk qk 1, = 0, if X pk lainnya X qk 2.5 Teknik Teknik dalam Analisis Cluster

5 METODE HIRARKI Teknik hirarki (hierarchical methods) adalah teknik clustering membentuk kontruksi hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon (struktur pertandingan). Dengan demikian proses pengelompokkannya dilakukan secara bertingkat atau bertahap. Hasil dari pengelompokan ini dapat disajikan dalam bentuk dendogram. Metode-metode yang digunakan dalam teknik hirarki: 1) Agglomerative Methods Metode ini dimulai dengan kenyatan bahwa setiap obyek membentuk clusternya masing-masing. Kemudian dua obyek dengan jarak terdekat bergabung. Selanjutnya obyek ketiga akan bergabung dengan cluster yang ada atau bersama obyek lain dan membentuk cluster baru. Hal ini tetap memperhitungkan jarak kedekatan antar obyek. Proses akan berlanjut hingga akhirnya terbentuk satu cluster yang terdiri dari keseluruhan obyek. Ada beberapa teknik dalam Agglomerative methods yaitu: a) Single linkage (nearest neighbor methods) Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua obyek terdekat dan keduanya membentuk cluster yang pertama. Pada langkah selanjutnya terdapat dua kemungkinan, yaitu : obyek ketiga akan bergabung dengan cluster yang telah terbentuk, atau dua obyek lainnya akan membentu cluster baru. Proses ini akan berlanjut sampai akhirnya terbentuk cluster tunggal. Pada metode ini jarak antar cluster didefinisikan sebagai jarak terdekat antar anggotanya. Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu : A B C D E A B C D E Langkah penyelesaiannya : 1. Mencari obyek dengan jarak minimum A dan B mempunyai jarak terdekat, yaitu 1.0 maka obyek A dan A bergabung menjadi satu cluster.

6 2. Menghitung jarak antara cluster AB dengan obyek lainnya. D (AB)C = min {d AC, d BC }= d BC = 3.0 D (AB)D = min {d AD, d BD }= d AD = 6.0 D (AB)E = min {d AE, d BE }= d BE = 7.0 Dengan demikian terbentu matriks jarak yang baru AB C D E AB C D E Mencari obyek dengan jarak terdekat D dan E mempunyai jarak yang terdekat yaitu 2.0 maka obyek D dan E bergabung menjadi satu cluster. 4. menghitung jarak antara cluster dengan obyek lainnya. D (AB)C = 3.0 D (AB)(DE) = min {d AD, d AE, d BD, d BE } = d AD = 6.0 D (DE)C = min {d CD, d CE } = d CD = Mencari jarak terdekat antara cluster dengan obyek dan diperoleh obyek C bergabung dengan cluster AB 6. Pada langkah yang terakhir, cluster ABC bergabung dengan DE sehingga terbentuk cluster tunggal. b) Complete linkage (furthest neighbor methods) Metode ini merupakan kebalikan dari pendekatan yang digunakan pada single linkage. Prinsip jarak yang digunakan adalah jarak terjauh antar obyek. Contoh : Terdapat matriks jarak antara lima buah obyek yaitu : A B C D E A B C D E

7 Langkah penyelesaiannya : 1. Mencari obyek dengan jarak minimum A dan B mempunyai jarak terdekat yaitu 1.0 maka obyek A dan B bergabung menjadi satu cluster. 2. Menghitung jarak antara cluster AB dengan obyek lainnya. D (AB)C = max {d AC, d BC }= d AC = 5.0 D (AB)D = max {d AD, d BD }= d BD = 8.0 D (AB)E = max {d AE, d BE }= d AE = 8.0 Dengan demikian terbentuk matriks jarak yang baru AB C D E AB C D E Mencari obyek dengan jarak terdekat. D dan E mempunyai jarak terdekat yaitu 2.0 maka obyek D dan E bergabung menjadi satu cluster 4. Menghitung jarak antar cluster dengan obyek lainnya. D (AB)C = 5.0 D (AB)(DE) = max {d AD, d AE, d BD, d BE } = d AE = d BD = 8.0 D (DE)C = max {d CD, d CE } = d CE = Maka terbentuklah matriks jarak yang baru, yaitu : AB C DE AB C DE Mencari jarak terdekat antara cluster dengan obyek dan diperoleh obyek C bergabung dengan cluster AB

8 7. Pada langkah yang terakhir cluster ABC bergabung dengan DE sehingga terbentuk cluster tunggal. c) Average linkage methods ( between groups methods) Metode ini mengikuti prosedur yang sama dengan kedua metode sebelumnya. Prinsip ukuran jarak yang digunakan adalah jarak rata-rata antar tiap pasangan obyek yang mungkin. Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu : A B C D E A B C D E Langkah penyelesaiannya : 1. Mencari obyek dengan jarak minimum A dan B mempunyai jarak terdekat, yaitu 1,0 maka obyek A dan B bergabung menjadi satu cluster. 2. Menghitung jarak antara cluster AB dengan obyek lainnya d (AB)C = max {d AC, d BC } = d AC = 5,0 d (AB)D = max {d AD, d BD } = d BD = 8,0 d (AB)E = max {d AE, d BE } = d AE = 8,0 Dengan demikian terbentuk matriks jarak yang baru : AB C D E AB C D E

9 3. Mencari obyek dengan jarak terdekat. D dan E mempunyai jarak terdekat, yaitu 2,0 maka obyek D dan E bergabung menjadi satu cluster. 4. Menghitung jarak antara cluster dengan obyek lainnya. d (AB)C = 4,0 d (AB)(DE) = 1/2{d AD, d AE, d BD, d BE } = 7,25 d (DE)C = 1/2{d CD, d CE, } = d CE = 5,00 Maka terbentuklah matrik jarak yang baru, yaitu : AB C DE AB C DE Mencari jarak terdekat antara cluster dengan obyek dan diperoleh obyek C bergabung dengan clster AB. 6. Pada langkah yang terakhir, cluster ABC bergabung dengan DE sehingga terbentuk cluster tunggal. d) Ward s error sum of squares methods Ward mengajukan suatu metode pembentukan cluster yang didasari oleh hilangnya informasi akibat penggabungan obyek menjadi cluster. Hal ini diukur dengan jumlah total dari deviasi kuadrat pada mean cluster untuk tiap observasi. Error sum of squares (ESS) digunakan sebagai fungsi obyektif. Dua obyek akan digabungkan apabila mempunyai fungsi obyektif terkecil diantara kemungkinan yang ada. ESS = 2 X 1 ( ij nj Xij) Dengan X ij adalah nilai untuk obyek ke-i pada cluster ke-j. 2 e) Within groups methods f) Median methods g) Centroid methods

10 2) Divisive Methods Metode divisive berlawanan dengan metode agglomerative. Metode ini pertamatama diawali dengan satu cluster besar yang mencakup semua observasi (obyek). Selanjutnya obyek yang mempunyai ketidakmiripan yang cukup besar akan dipisahkan sehingga membentuk cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga mencapai sejumlah cluster yang diinginkan. a) Splinter average distance methods Metode ini didasarkan pada perhitungan jarak rata-rata masing-masing obyek dengan obyek pada grup splinter dan jarak rata-rata obyek tersebut dengan obyek lain pada grupnya. Proses tersebut dimulai dengan memisahkan obyek dengan jarak terjauh sehingga terbentuklan dua group. Kemudian dibandingkan dengan jarak rata-rata masing-masing obyek dengan group splinter dengan groupnya sendiri. Apabila suatu obyek mempunyai jarak yang lebih dekat ke group splinter daripada ke groupnya sendiri, maka obyek tersebut haruslah dikeluarkan dari groupnya dan dipisahkan ke group splinter. Apabila komposisinya sudah stabil, yaitu jarak suatu obyek ke groupnya selalu lebih kecil daripada jarak obyek itu ke group splinter, maka proses berhenti dan dilanjutkan dengan tahap pemisahan dalam group. Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu : A B C D E A B C D E Perhitungan : 1. Menghitung jarak rata-rata antar obyek A = ¼ ( ) = 21 D = ¼ ( ) = B = ¼ ( ) = E = ¼ ( ) = C = ¼ ( ) = Terlihat bahwa E mempunyai nilai jarak terjauh, yaitu 22.75, maka E dipisahkan dari group utama dan membentuk group splinter.

11 2. Menghitung jarak rata-rata obyek dengan group utama dengan group splinter Obyek Jarak Rata-rata dengan Group Splinter (x) Jarak Rata-rata dengan Group Utama (y) x - y A B C D Pada D, jarak rata-rata dengan group splinter lebih dekat daripada dengan group utama. Dengan demikian D harus dikeluarkan dari group utama dan masuk ke group splinter. 3. Perhitungan jarak rata-rata Obyek Jarak Rata-rata dengan Group Splinter (x) Jarak Rata-rata dengan Group Utama (y) x - y A B C Karena jarak semua obyek ke group utama sudah lebih besar daripada jaraknya ke group splinter, maka komposisinya sudah stabil. METODE O -HIRARKI Berbeda dengan metode hirarkikal, prosedur non hirarkikal (K-means Clustering) dimulai dengan memilih sejumlah nilai cluster awal sesuai dengan jumlah yang diinginkan dan kemudian obyek digabungkan ke dalam cluster-cluster tersebut. 1) Sequential Threshold Procedure Metode ini melakukan pengelompokan dengan terlebih dahulu memilih satu obyek dasar yang akan dijadikan nilai awal cluster, kemudian semua obyek yang ada didalam jarak terdekat dengan cluster ini akan bergabung lalu dipilih cluster kedua dan semua obyek yang mempunyai kemiripan dimasukkan dalam cluster ini. Demikian seterusnya hingga terbentuk beberapa cluster dengan keseluruhan obyek didalamnya.

12 2) Parallel Threshold Prosedure Secara prinsip sama dengan prosedur sequential threshold, hanya saja dilakukan pemilihan terhadap beberapa obyek awal cluster sekaligus dan kemudian melakukan penggabungan obyek ke dalamnya secara bersamaan. 3) Optimizing Merupakan pengembangan dari kedua metode diatas dengan melakukan optimasi pada penempatan obyek yang ditukar untuk cluster lainnya dengan pertimbangan krteria optimasi. Teknik partisi (Partitioning Methods) mencakup : K-Means Clustering Methods based on the trace Prosedur analisis cluster K-means digunakan untuk mengelompokkan sejumlah kasus besar yang lebih dari 200 dengan lebih efisien. Metode ini berdasarkan nearest centroid sorting, yaitu pengelompokan berdasarkan jarak terkecil antara kasus dengan pusat dari cluster. Teknik ini membutuhkan jumlah cluster yang ditentukan terlebih dahulu oleh pemakai. Untuk tujuan tersebut dapat menggunakan analisis hierarkikal dalam menentukan jumlah cluster. Teknik ini juga dapat digunakan untuk menempatkan data baru untuk dikelompokkan ke dalam cluster terdekat. Agar hasil cluster dapat digunakan dengan baik, maka sebaiknya dilakukan tahapan interpretasi dan validasi. Yang perlu diperhatikan pada tahapan interpretasi adalah karakteristik yang membedakan masing-masing cluster sehingga kita dapat memberikan label pada masing-masing cluster tersebut. Dengan demikian perlu kiranya dispesifikasikan kriteria-kriteria yang mendasari kelompok-kelompok yang telah terbentuk. Pada tahap validasi dilakukan pengujian terhadap cluster yang telah terbentuk. Uji yang dapat dilakukan antara lain dengan membandingkan hasil yang telah diperoleh dengan algoritma yang berbeda. Sebagai contoh, apabila pertama kali kita menggunakan algoritma hierarkikal, maka kemudian dicoba dengan menggunakan algoritma nonhierarkikal dan kemudian dilihat apakah hasilnya mirip atau tidak. Dengan demikian kita sudah melakukan pengujian terhadap cluster yang kita bentuk.

DATA MINING DAN WAREHOUSE A N D R I

DATA MINING DAN WAREHOUSE A N D R I DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung

Lebih terperinci

PRAKTIKUM 3 ANALISA CLUSTER

PRAKTIKUM 3 ANALISA CLUSTER PRAKTIKUM 3 ANALISA CLUSTER Definisi Cluster Analisis cluster merupakan suatu teknik data mining yang digunakan untuk mengklasifikasikan obyek atau kasus (responden) ke dalam kelompok yang relatif homogen

Lebih terperinci

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster Analisis Cluster Analisis Cluster adalah suatu analisis statistik yang bertujuan memisahkan kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain.

Lebih terperinci

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks BAB II KAJIAN TEORI Pada bab II akan dibahas tentang materi-materi dasar yang digunakan untuk mendukung pembahasan pada bab selanjutnya, yaitu matriks, kombinasi linier, varian dan simpangan baku, standarisasi

Lebih terperinci

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan.

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan. BAB 2 TINJAUAN PUSTAKA 2.1 Metode Pengelompokan ABC Pada abad ke-18, Villfredo Pareto, dalam penelitiannya mengenai distribusi kekayaan penduduk di Milan Italia, menemukan bahwa 20% dari total populasi

Lebih terperinci

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan

Lebih terperinci

MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER

MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER PRAKTIKUM 3 ANALISA CLUSTER Definisi Analisis cluster merupakan pengelompokan objek berdasarkan informasi yang diperoleh dari suatu data yang menjelaskan hubungan antar objek satu dengan objek lainnya.

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Analisis statistik multivariat adalah metode statistik di mana masalah yang diteliti bersifat multidimensional dengan menggunakan tiga atau lebih variabel

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Sistem Pendukung Keputusan II.1.1 Definisi Sistem Pendukung Keputusan Berdasarkan Efraim Turban dkk, Sistem Pendukung Keputusan (SPK) / Decision Support System (DSS) adalah sebuah

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Clustering Analysis Clustering analysis merupakan metode pengelompokkan setiap objek ke dalam satu atau lebih dari satu kelompok,sehingga tiap objek yang berada dalam satu kelompok

Lebih terperinci

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada BAB I PENDAHULUAN 1.1 Latar Belakang Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada hubungan satu variabel atau dua variabel saja, akan tetapi cenderung melibatkan banyak variabel. Analisis

Lebih terperinci

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS Pertemuan 14 HIERARCHICAL CLUSTERING METHODS berdasar gambar berdasar warna A A A A Q Q Q Q K K K K J J J J 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 10 10 10 10 A K Q J (a). Individual

Lebih terperinci

ANALISIS PEUBAH GANDA ANALISIS GEROMBOL HAZMIRA YOZZA JURUSAN MATEMATIKA UNAND LOGO

ANALISIS PEUBAH GANDA ANALISIS GEROMBOL HAZMIRA YOZZA JURUSAN MATEMATIKA UNAND LOGO ANALISIS PEUBAH GANDA ANALISIS GEROMBOL HAZMIRA YOZZA JURUSAN MATEMATIKA UNAND Kompetensi menghitung jarak antar individu Membentuk gerombol dengan menggunakan metode gerombol berhierarkhi Membentuk gerombol

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB 2 TINJAUAN PUSTAKA DAN LANDASAN TEORI Pada bab ini akan membahas 2 hal yaitu tinjauan pustaka dan landasan teori yang digunakan dalam penelitian ini. 2.1. Tinjauan Pustaka Klasifikasi ABC jarang digunakan

Lebih terperinci

Pengenalan Pola. Klasterisasi Data

Pengenalan Pola. Klasterisasi Data Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering

Lebih terperinci

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak

Cluster Analysis. Hery Tri Sutanto. Jurusan Matematika MIPA UNESA. Abstrak S-17 Cluster Analysis Hery Tri Sutanto Jurusan Matematika MIPA UNESA Abstrak Dalam analisis cluster mempelajari hubungan interdependensi antara seluruh set variabel perlu diteliti. Tujuan utama analisis

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Traveling Salesmen Problem (TSP) Travelling Salesman Problem (TSP) merupakan sebuah permasalahan optimasi yang dapat diterapkan pada berbagai kegiatan seperti routing. Masalah

Lebih terperinci

MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER

MATERI PRAKTIKUM PRAKTIKUM 3 ANALISA CLUSTER PRAKTIKUM 3 ANALISA CLUSTER Definisi Cluster Analisis cluster merupakan pengelompokan objek berdasarkan informasi yang diperoleh dari suatu data yang menjelaskan hubungan antar objek satu dengan objek

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

BAB III DIVISIVE ANALISIS. Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta

BAB III DIVISIVE ANALISIS. Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta 13 BAB III DIVISIVE ANALISIS Pada bab ini akan dipaparkan bagaimana konsep dari divisive analisis serta algoritma dari metode tersebut. 3.1 DEFINISI METODE DIVISIVE Teknik divisive klastering termasuk

Lebih terperinci

BAB IV METODE PENELITIAN

BAB IV METODE PENELITIAN 44 BAB IV METODE PENELITIAN 4.1. Lokasi Penelitian Penelitian ini dilakukan pada industri kecil dan menengah di Kawasan Sarbagita, Bali yang terdiri dari empat wilayah, yaitu : Kota Denpasar, Kabupaten

Lebih terperinci

ANALISIS GEROMBOL CLUSTER ANALYSIS

ANALISIS GEROMBOL CLUSTER ANALYSIS ANALISIS GEROMBOL CLUSTER ANALYSIS Pendahuluan Tujuan dari analisis gerombol : Menggabungkan beberapa objek ke dalam kelompok-kelompok berdasarkan sifat kemiripan atau sifat ketidakmiripan antar objek

Lebih terperinci

Analisis Cluster dengan Average Linkage Method dan Ward s Method untuk Data Responden Nasabah Asuransi Jiwa Unit Link

Analisis Cluster dengan Average Linkage Method dan Ward s Method untuk Data Responden Nasabah Asuransi Jiwa Unit Link Analisis Cluster dengan Average Linkage Method dan Ward s Method untuk Data Responden Nasabah Asuransi Jiwa Unit Link SKRIPSI Diajukan Kepada Fakultas Matematikan dan Ilmu Pengetahuan Alam Universitas

Lebih terperinci

BAB III K-MEDIANS CLUSTERING

BAB III K-MEDIANS CLUSTERING BAB III 3.1 ANALISIS KLASTER Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Metode interdependensi berfungsi untuk memberikan makna terhadap seperangkat

Lebih terperinci

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS)

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS) ANALISIS MULTIVARIAT ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS) Oleh : Rizka Fauzia 1311 100 126 Dosen Pengampu: Santi Wulan Purnami S.Si., M.Si. PROGRAM STUDI SARJANA JURUSAN

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering

Lebih terperinci

DSS untuk Menganalisis ph Kesuburan Tanah Menggunakan Metode Single Linkage

DSS untuk Menganalisis ph Kesuburan Tanah Menggunakan Metode Single Linkage 61 DSS untuk Menganalisis ph Kesuburan Tanah Menggunakan Metode Single Linkage Abdi Pandu Kusuma, Rini Nur Hasanah, dan Harry Soekotjo Dachlan Abstrak - ph tanah merupakan ukuran jumlah ion hidrogen dalam

Lebih terperinci

ANALISIS KARAKTERISTIK POLA BELANJA KELUARGA DENGAN ANALISIS KLASTER

ANALISIS KARAKTERISTIK POLA BELANJA KELUARGA DENGAN ANALISIS KLASTER ISSN: 2088-687X 73 ANALISIS KARAKTERISTIK POLA BELANJA KELUARGA DENGAN ANALISIS KLASTER Nur Arina Hidayati Program Studi Pendidikan Matematika FKIP UAD Jl. Prof. Dr. Soepomo, SH. Janturan Yogyakarta nurarinahidayati@gmail.com

Lebih terperinci

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu

BAB III METODE PENELITIAN. Alasan memilih Ciputra Taman Dayu Pandaan dikarenakan Ciputra Taman Dayu BAB III METODE PENELITIAN 1.1 Lokasi Penelitian Lokasi penelitian ini di Ciputra Taman Dayu Property Pandaan Pasuruan yang terletak di Jl. Raya Surabaya Km. 48 Pandaan 67156 Pasuruan Jawa Timur. Alasan

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning CLUSTERING DEFINISI Clustering : Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis Bentuk yang paling umum digunakan adalah unsupervised learning # Unsupervised learning

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Pada penelitian yang dilakukan oleh (Chen, Sain, & Guo, 2012) berfokus untuk mengetahui pola penjualan, pelanggan mana yang paling berharga, pelanggan mana yang

Lebih terperinci

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster) Volume 05, No. 2 (2016), hal 97 102. PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE Nicolaus, Evy Sulistianingsih,

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #9 Text Clustering (Ch.16 & 17) Clustering Pengelompokan, penggerombolan Proses pengelompokan sekumpulan obyek ke dalam kelas-kelas obyek yang memiliki sifat sama.

Lebih terperinci

III. METODE PENELITIAN

III. METODE PENELITIAN III. METODE PENELITIAN 3.1. Tahapan Penelitian Ada empat tahap utama yang dilakukan dalam penelitian ini. Tahap-tahap tersebut antara lain analisa masalah, persiapan data, pengumpulan data, pengembangan

Lebih terperinci

*Corresponding Author:

*Corresponding Author: PERBANDINGAN KINERJA METODE COMPLETE LINKAGE DAN AVERAGE LINKAGE DALAM MENENTUKAN HASIL ANALISIS CLUSTER (Studi Kasus: Produksi Palawija Provinsi Kalimantan Timur 2014/2015) Silvia Ningsih 1, Sri Wahyuningsih

Lebih terperinci

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya Penelitian sebelumnya tentang Pengelompokkan Kabupaten/Kota di Provinsi Jawa Timur Berdasarkan Indikator Kemiskinan Dengan Metode Cluster Analysis. Peneliti

Lebih terperinci

IV. PERANCANGAN DAN IMPLEMENTASI

IV. PERANCANGAN DAN IMPLEMENTASI IV. PERANCANGAN DAN IMPLEMENTASI 4.1. Desain Masukan Data pelanggan yang akan disegmentasi dalam penelitian ini adalah (1) data pelanggan golongan rumah tangga, (2) golongan bisnis dan (3) golongan industri.

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian ini, yaitu analisis peubah ganda, analisis gerombol (cluster analysis),

BAB II TINJAUAN PUSTAKA. penelitian ini, yaitu analisis peubah ganda, analisis gerombol (cluster analysis), BAB II TINJAUAN PUSTAKA Pada bab ini akan dibahas beberapa konsep yang menjadi dasar dalam penelitian ini, yaitu analisis peubah ganda, analisis gerombol (cluster analysis), metode penggerombolan hirarki

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN 1.1. Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Analisis cluster merupakan salah satu alat yang penting dalam pengolahan data statistik untuk melakukan analisis data. Analisis cluster merupakan seperangkat metodologi

Lebih terperinci

BAB 2 LANDASAN TEORI. setelah membandingkan kinerja atau hasil yang dirasakannya dengan. diharapkan konsumen dengan apa yang dirasakan konsumen ketika

BAB 2 LANDASAN TEORI. setelah membandingkan kinerja atau hasil yang dirasakannya dengan. diharapkan konsumen dengan apa yang dirasakan konsumen ketika BAB 2 LANDASAN TEORI 2.1. Kepuasan Pelanggan Menurut Gerson (2004, p3), kepuasan pelanggan adalah persepsi pelanggan bahwa harapannya telah terpenuhi atau terlampaui. Sedangkan menurut Supranto (2001,

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA 4 BAB 2 TINJAUAN PUSTAKA 2.1 Metode Clustering Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai salah satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Konsep Clustering dalam Data Mining Konsep dasar data mining adalah menemukan informasi tersembunyi dalam sebuah basis data dan merupakan bagian dari Knowledge Discovery in

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan

Lebih terperinci

DATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 9 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Clustering Data Mining Penklusteran (clustering) digunakan untuk

Lebih terperinci

InfinityJurnal Ilmiah Program Studi Matematika STKIP Siliwangi Bandung, Vol 3, No.2, September 2014

InfinityJurnal Ilmiah Program Studi Matematika STKIP Siliwangi Bandung, Vol 3, No.2, September 2014 APLIKASI METODE-METODE AGGLOMERATIVE DALAM ANALISIS KLASTER PADA DATA TINGKAT POLUSI UDARA Oleh: Dewi Rachmatin Jurusan Pendidikan Matematika, UniversitasPendidikan Indonesia dewirachmatin@upi.edu ABSTRAK

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Data menjadi sesuatu yang sangat berharga saat ini. Tidak hanya badan pemerintah saja, perusahaan-perusahaan saat ini pun sangat membutuhkan informasi dari data yang

Lebih terperinci

Pengelompokan Data dengan Metode...(Luh Joni Erawati Dewi)

Pengelompokan Data dengan Metode...(Luh Joni Erawati Dewi) ISSN0216-3241 17 PENGELOMPOKAN DATA DENGAN METODE KLASTERISASI HIRARKI Oleh Luh Joni Erawati Dewi Jurusan Manajemen Informatika, FTK, Undiksha Abstrak Pengelompokan data sangat diperlukan untuk mengetahui

Lebih terperinci

UKDW BAB I PENDAHULUAN

UKDW BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Dalam dunia bisnis pada jaman sekarang, para pelaku bisnis senantiasa selalu berusaha mengembangkan cara-cara untuk dapat mengembangkan usaha mereka dan memperhatikan

Lebih terperinci

STK511 Analisis Statistika. Pertemuan 13 Peubah Ganda

STK511 Analisis Statistika. Pertemuan 13 Peubah Ganda STK511 Analisis Statistika Pertemuan 13 Peubah Ganda 13. Peubah Ganda: Pengantar Pengamatan Peubah Ganda Menggambarkan suatu objek tidak cukup menggunakan satu peubah saja Kasus pengamatan peubah ganda

Lebih terperinci

CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH

CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH Darlis Heru Murti, Nanik Suciati, Daru Jani Nanjaya Jurusan Teknik Informatika, Fakultas Teknologi

Lebih terperinci

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE

PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN METODE MINIMAX LINKAGE Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 05, No. 02 (2016), hal 253-260 PENGELOMPOKAN KABUPATEN/KOTA DI KALIMANTAN BARAT BERDASARKAN INDIKATOR DALAM PEMERATAAN PENDIDIKAN MENGGUNAKAN

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada BAB I PENDAHULUAN 1.1 Latar Belakang Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada hubungan satu variabel atau dua variabel saja, akan tetapi cenderung melibatkan banyak variabel. Analisis

Lebih terperinci

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada

Lebih terperinci

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang BAB III PEMBAHASAN Data yang digunakan dalam skripsi ini merupakan data sekunder yang diperoleh dari buku saku Ikhtisar Data Pendidikan Tahun 2016/2017. Data tersebut dapat dilihat pada Lampiran 1. Data

Lebih terperinci

Clustering. Virginia Postrel

Clustering. Virginia Postrel 8 Clustering Most of us cluster somewhere in the middle of most statistical distributions. But there are lots of bell curves, and pretty much everyone is on a tail of at least one of them. We may collect

Lebih terperinci

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan ciri/sifat daripada pola-pola dalam

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN

PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN E-Jurnal Matematika Vol. (), Mei, pp. - ISSN: - PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN Ni Wayan Aris Aprilia A.P, I Gusti Ayu Made Srinadi, Kartika Sari Jurusan Matematika,

Lebih terperinci

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE

PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER ENSEMBLE Jurnal Matematika UNAND Vol. 3 No. 4 Hal. 13 23 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PENGGEROMBOLAN SMA/MA DI KOTA PADANG BERDASARKAN INDIKATOR MUTU PENDIDIKAN DENGAN MENGGUNAKAN METODE CLUSTER

Lebih terperinci

Penggerombolan Sekolah Menengah Atas Berdasarkan Nilai Ujian Nasional Di Kota Manado

Penggerombolan Sekolah Menengah Atas Berdasarkan Nilai Ujian Nasional Di Kota Manado Penggerombolan Sekolah Menengah Atas Berdasarkan Nilai Ujian Nasional Di Kota Manado Charles E. Mongi 1*, Chriestie E.J.C. Montolalu 2 1,2 Program Studi Matematika, Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

Bab 2 Tinjauan Pustaka

Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Adapun penelitian terdahulu yang berkaitan dalam penelitian ini berjudul Penentuan Wilayah Usaha Pertambangan Menggunakan Metode Fuzzy K-Mean Clustering

Lebih terperinci

DATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 4 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Similaritas dan Dissimilaritas Kemiripan (similarity) adalah

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Tinjauan Pustaka Hosseini dan Gholaiman (2010) dan Pradono dkk (2011) melakukan pengelompokkan konsumen dengan data yang bersifat metric dan menggunakan metode K-Means. Hosseini

Lebih terperinci

DAFTAR ISI. ABSTRAK... i. KATA PENGANTAR... ii. UCAPAN TERIMA KASIH... iii. DAFTAR ISI... vi. DAFTAR TABEL... x. DAFTAR GAMBAR...

DAFTAR ISI. ABSTRAK... i. KATA PENGANTAR... ii. UCAPAN TERIMA KASIH... iii. DAFTAR ISI... vi. DAFTAR TABEL... x. DAFTAR GAMBAR... DAFTAR ISI Halaman LEMBAR PENGESAHAN PERNYATAAN ABSTRAK... i KATA PENGANTAR... ii UCAPAN TERIMA KASIH... iii DAFTAR ISI... vi DAFTAR TABEL... x DAFTAR GAMBAR... xii DAFTAR LAMPIRAN... xiv BAB I PENDAHULUAN...

Lebih terperinci

ANALISIS KELOMPOK DENGAN MENGGUNAKAN METODE HIERARKI UNTUK PENGELOMPOKAN KABUPATEN/KOTA DI JAWA TIMUR BERDASAR INDIKATOR KESEHATAN

ANALISIS KELOMPOK DENGAN MENGGUNAKAN METODE HIERARKI UNTUK PENGELOMPOKAN KABUPATEN/KOTA DI JAWA TIMUR BERDASAR INDIKATOR KESEHATAN 1 ANALISIS KELOMPOK DENGAN MENGGUNAKAN METODE HIERARKI UNTUK PENGELOMPOKAN KABUPATEN/KOTA DI JAWA TIMUR BERDASAR INDIKATOR KESEHATAN, dan, Universitas Negeri Malang Email: lina_ninos26@yahoo.com ABSTRAK:

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Berdasarkan Peraturan Pemerintah Nomor 37 tahun 2009, dosen merupakan pendidik profesional dan ilmuwan dengan tugas utama mentransformasikan, mengembangkan,

Lebih terperinci

HI. KERANGKA TEORI. kelompok tersebut menimbulkan pengurangan dimensionalitas suatu tabel data,

HI. KERANGKA TEORI. kelompok tersebut menimbulkan pengurangan dimensionalitas suatu tabel data, HI. KERANGKA TEORI 3.1. Cluster Analysis Cluster analyszs adalah suatu analisis untuk menyusun objek-objek menjadi kelompok-kelompok (cluster-cluster) dan pembentukan kelompok- kelompok tersebut menimbulkan

Lebih terperinci

Pengenalan Pola. K-Means Clustering

Pengenalan Pola. K-Means Clustering Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan

Lebih terperinci

MODUL 6 ANALISIS CLUSTER

MODUL 6 ANALISIS CLUSTER MODUL 6 ANALISIS CLUSTER Tujuan Praktikum Pada modul 6 ini, tujuan yang hendak dicapai dalam pelaksanaan praktikum antara lain : Mahasiswa mampu mengenali karakteristik analisis cluster. Mahasiswa memahami

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

ANALISIS KELOMPOK METODE HIRARKI UNTUK PENGELOMPOKAN KOTA/KABUPATEN DI JAWA TIMUR BERDASARKAN INDIKATOR KETENAGAKERJAAN,,

ANALISIS KELOMPOK METODE HIRARKI UNTUK PENGELOMPOKAN KOTA/KABUPATEN DI JAWA TIMUR BERDASARKAN INDIKATOR KETENAGAKERJAAN,, 1 ANALISIS KELOMPOK METODE HIRARKI UNTUK PENGELOMPOKAN KOTA/KABUPATEN DI JAWA TIMUR BERDASARKAN INDIKATOR KETENAGAKERJAAN,, Universitas Negeri Malang E-mail: desypurwaningyas@ymail.com Abstrak: Dengan

Lebih terperinci

KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE

KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE Yudha Agung Wirawan, Dra.Indwiarti,M.Si, Yuliant Sibaroni,S.SI., M,T Program Studi Ilmu Komputasi Fakultas Informatika

Lebih terperinci

Pengenalan Pola. Hierarchical Clustering

Pengenalan Pola. Hierarchical Clustering Pengenalan Pola Hierarchical Clustering PTIIK - 2014 Course Contents 1 Agglomerative Hierarchical Clustering (AHC) 2 Stui Kasus 3 Latihan an Diskusi 4 Progress Final Project Hierarchical Clustering Hierarchical

Lebih terperinci

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Jurnal Ilmiah ILKOM Volume 8 mor (Agustus 16) ISSN: 87-1716 PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Widya Safira Azis 1 dan Dedy Atmajaya 1 safiraazis18@gmail.com dan dedy.atmajaya@umi.ac.id

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA II.1 BAB II TINJAUAN PUSTAKA 2.1 Travelling Salesman Problem (TSP) Permasalahan tentang Traveling Salesman Problem dikemukakan pada tahun 1800 oleh matematikawan Irlandia William Rowan Hamilton dan matematikawan

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan BAB III METODOLOGI PENELITIAN A. Jenis Penelitian Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan metode deskriptif. Menurut Sugiono dalam bukunya Metodologi Penelitian Bisnis (2009)

Lebih terperinci

PENGELO MPOKAN KUALITAS UDARA AMBIEN MENURUT KABUPATEN/KOTA DI JAWA TENGAH MENGGUNAKAN ANALISIS KLASTER

PENGELO MPOKAN KUALITAS UDARA AMBIEN MENURUT KABUPATEN/KOTA DI JAWA TENGAH MENGGUNAKAN ANALISIS KLASTER ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman 393-402 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PENGELO MPOKAN KUALITAS UDARA AMBIEN MENURUT KABUPATEN/KOTA

Lebih terperinci

BAB III ANALISIS III.1 Analisis Konseptual Teknik Pengolahan Data

BAB III ANALISIS III.1 Analisis Konseptual Teknik Pengolahan Data BAB III ANALISIS III.1 Analisis Konseptual Teknik Pengolahan Data Data sudah menjadi bagian penting dalam pengambilan keputusan. Data telah banyak terkumpul baik itu data transaksi perbankan, data kependudukan,

Lebih terperinci

Data Mining. Clustering. Oleh : Suprayogi

Data Mining. Clustering. Oleh : Suprayogi Data Mining Clustering Oleh : Suprayogi Pendahuluan Saat ini terjadi fenomena yaitu berupa data yang melimpah, setiap hari banyak orang yang berurusan dengan data yang bersumber dari berbagai jenis observasi

Lebih terperinci

STUDI KOMPARATIF PENERAPAN METODE HIERARCHICAL, K-MEANS DAN SELF ORGANIZING MAPS (SOM) CLUSTERING PADA BASIS DATA. Abstract

STUDI KOMPARATIF PENERAPAN METODE HIERARCHICAL, K-MEANS DAN SELF ORGANIZING MAPS (SOM) CLUSTERING PADA BASIS DATA. Abstract STUDI KOMPARATIF PENERAPAN METODE HIERARCHICAL, K-MEANS DAN SELF ORGANIZING MAPS (SOM) CLUSTERING PADA BASIS DATA Undang Syaripudin 1, Ijang Badruzaman 2, Erwan Yani 3, Dede K 4, M. Ramdhani 5 1, 2 Teknik

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

HIERARCHICAL CLUSTER ANALYSIS TERHADAP PELANGGAN PASAR BERINGHARJO YOGYAKARTA

HIERARCHICAL CLUSTER ANALYSIS TERHADAP PELANGGAN PASAR BERINGHARJO YOGYAKARTA HIERARCHICAL CLUSTER ANALYSIS TERHADAP PELANGGAN PASAR BERINGHARJO YOGYAKARTA Ade Ihsan Hidayatullah 1), Denisha Intan Perihatini 2) 1),2) Departemen of Statistics, Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

Aplikasi Multidimensional Scalling

Aplikasi Multidimensional Scalling S-10 Aplikasi Multidimensional Scalling (Studi Kasus : Analisis Segmentasi dan Peta Posisi UIN Sunan Kalijaga terhadap Perguruan Tinggi di Yogyakarta) Epha Diana Supandi, S.Si., M.Sc. Dra. Khurul Wardati,

Lebih terperinci

TINJAUAN PUSTAKA Analisis Gerombol

TINJAUAN PUSTAKA Analisis Gerombol 3 TINJAUAN PUSTAKA Analisis Gerombol Analisis gerombol merupakan analisis statistika peubah ganda yang digunakan untuk menggerombolkan n buah obyek. Obyek-obyek tersebut mempunyai p buah peubah. Penggerombolannya

Lebih terperinci

Analisis Cluster Average Linkage Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur

Analisis Cluster Average Linkage Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur Analisis Cluster Average Linkage Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur Qonitatin Nafisah, Novita Eka Chandra Jurusan Matematika Fakultas MIPA Universitas Islam Darul Ulum Lamongan

Lebih terperinci

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering

Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2016 Analisa Anggaran Pendapatan dan Belanja Daerah (APBD) dengan Metode Hierarchical Clustering Viga Apriliana Sari, Nur Insani Jurusan Pendidikan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

PENGELOMPOKAN KELAS KEKUATAN PADA BEBERAPA JENIS KAYU BERDASARKAN SIFAT MEKANIK DENGAN MENGGUNAKAN ANALISIS GEROMBOL

PENGELOMPOKAN KELAS KEKUATAN PADA BEBERAPA JENIS KAYU BERDASARKAN SIFAT MEKANIK DENGAN MENGGUNAKAN ANALISIS GEROMBOL Halaman Tulisan Jurnal (Judul dan Abstraksi) Jurnal Paradigma Ekonomika Vol.1, No.4 Oktober 2011 PENGELOMPOKAN KELAS KEKUATAN PADA BEBERAPA JENIS KAYU BERDASARKAN SIFAT MEKANIK DENGAN MENGGUNAKAN ANALISIS

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

UKDW BAB I PENDAHULUAN Latar Belakang

UKDW BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Konsumsi, Finansial, semakin menjadi hal yang tidak dapat dipisahkan seiring terus berkembangnya suatu negara. Transaksi, jual, beli, sudah menjadi kata yang sangat

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Pada Bab II akan dibahas mengenai landasan-landasan teori yang mendukung penelitian ini, yaitu analisis kelompok, metode pengelompokan hierarki (single linkage dan complete linkage),

Lebih terperinci

Anisa Bella Fathia, Dewi Rachmatin, Jarnawi Afgani Dahlan, Departemen Pendidikan Matematika FPMIPA Universitas Pendidikan Indonesia

Anisa Bella Fathia, Dewi Rachmatin, Jarnawi Afgani Dahlan, Departemen Pendidikan Matematika FPMIPA Universitas Pendidikan Indonesia MONOTHETIC DIVISIVE CLUSTERING (MONA) PADA DATA INTERVAL DAN HISTOGRAM (Studi Kasus : Data Indeks Komponen IPM pada Provinsiprovinsi di Indonesia Wilayah Timur Tahun 2012) Anisa Bella Fathia, Dewi Rachmatin,

Lebih terperinci