METODE MANHATTAN, EUCLIDEAN DAN CHEBYSHEV PADA ALGORITMA K-MEANS UNTUK PENGELOMPOKAN STATUS DESA

Ukuran: px
Mulai penontonan dengan halaman:

Download "METODE MANHATTAN, EUCLIDEAN DAN CHEBYSHEV PADA ALGORITMA K-MEANS UNTUK PENGELOMPOKAN STATUS DESA"

Transkripsi

1 METODE MANHATTAN, EUCLIDEAN DAN CHEBYSHEV PADA ALGORITMA K-MEANS UNTUK PENGELOMPOKAN STATUS DESA Yoga Religia 1 Program Magister Teknik Informatika, Fakultas Ilmu Komputer 1 Universitas Dian Nuswantoro, Semarang, Indonesia Jl. Imam Bonjol 207 Semarang Telp : (+6224) , Fax : (+6224) religia19@gmail.com 1 ABSTRAK Kementerian Desa, Pembangunan Daerah Tertinggal dan Transmigrasi (Kementerian Desa PDTT) merupakan kementerian dalam Pemerintahan Indonesia yang membidangi urusan pembangunan desa dan kawasan perdesaan, pemberdayaan masyarakat desa, percepatan pembangunan daerah tertinggal, dan transmigrasi. Data Potensi Desa tahun 2014 (Podes 2014) merupakan data yang dikeluarkan oleh Badan Pusat Statistik yang bekerjasama dengan Kementerian Desa PDTT dalam bentuk unsupervised dan terdiri dari Data Podes 2014 dibuat berdasarkan tingkat perkembangan desa (village specific) di Indonesia dengan menjadikan desa sebagai unit analisis. Data mining merupakan suatu metode yang dapat digunakan untuk menelompokkan objek dalam sebuah data kedalam kelas-kelas yang memiliki kriteria yang sama (clustering). Salahsatu algoritma yang dapat digunakan untuk proses clustering yaitu algoritma k-means. Pengelompokan data menggunakan k- means dilakukan dengan cara menghitung jarak terdekat dari suatu data ke sebuah titik centroid. Dalam penelitian ini akan dilakukan perbandingan metode perhitungan jarak pada k-means antara Manhattan, Euclidean dan Chebychev. Pengujian akan dilakukan menggunakan waktu eksekusi dan davies bouldin index. Dari pengujian yang sudah dilakukan, metode perhitungan jarak Chebyshev memiliki akumulasi waktu paling efisien dibandingkan Manhattan dan Euclidean, sedangkan metode Euclidean memiliki nilai Index Davies paling optimal dibanding metode Manhattan dan Chebyshev. Kata kunci: Pembangunan Desa, k-means, Manhattan, Euclidean, Chebychev I. PENDAHULUAN Negara Indonesia adalah Negara Kesatuan yang berbentuk Republik dan Negara hukum, dimana kedaulatannya berada ditangan rakyat yang dilaksanakan menurut Undang-Undang Dasar. Negara Kesatuan Republik Indonesia dibagi atas daerah-daerah provinsi, dimana daerah provinsi dibagi atas kabupaten dan Kota [1]. Setiap daerah kabupaten di Indonesia terdiri dari desa-desa yang mempunyai hak asal usul, hak tradisional dalam mengatur dan mengurus kepentingan masyarakat setempat dan berperan mewujudkan cita-cita kemerdekaan. Dalam perjalanan ketatanegaraan Republik Indonesia, desa telah berkembang dalam berbagai bentuk sehingga perlu dilindungi dan diberdayakan agar menjadi kuat, maju, mandiri, dan demokratis. Untuk melindungi dan memberdayakan desa maka dibentuklah otonomi desa [2]. Dengan adanya otonomi desa dan adanya Peraturan Presiden Nomor 165 Tahun 2014 tentang Penataan Tugas dan Fungsi Kabinet Kerja, maka dibentuklah Kementerian Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia. 1 Karya Ilmiah Data Mining, Agustus 2016

2 Kementerian Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi (Kementerian Desa PDTT) adalah kementerian dalam Pemerintahan Indonesia yang dipimpin oleh Menteri dan bertanggung jawab kepada Presiden. Kementerian Desa PDTT membidangi urusan pembangunan desa dan kawasan perdesaan, pemberdayaan masyarakat desa, percepatan pembangunan daerah tertinggal, dan transmigrasi [3]. Rencana Pembangunan Jangka Menengah Nasional (RPJMN) Kementerian Desa PDTT tahun merupakan dokumen strategis rencana pembangunan yang harus dilakukan oleh pemerintah lima tahun kedepan. Dokumen RPJMN ini memuat sasaran pembangunan desa yang harus dicapai yaitu mengurangi jumlah Desa Tertinggal sampai desa dan meningkatkan jumlah Desa Mandiri sedikitnya desa di tahun 2019 [4]. Dalam rangka pembangunan desa, Pemerintah dan Pemerintah Daerah wajib mengembangkan sistem informasi desa dan pembangunan kawasan perdesaan [5]. Dalam mengembangkan sistem informasi desa dibutuhkan tersedianya data tentang desa. Kementerian Desa PDTT bekerjasama dengan Badan Perencanaan Pembangunan Nasional dan Badan Pusat Statistik mengeluarkan data Potensi Desa tahun 2014 (Podes 2014) yang terdiri dari desa dan memiliki 42 indikator/attribute dependent tanpa label status desa. Data Podes 2014 merupakan cara pengukuran yang disusun berdasarkan tingkat perkembangan desa di Indonesia yang menjadikan desa sebagai unit analisis dengan mengacu pada Undang Undang Nomor 6 Tahun 2014 tentang desa, yang dimaksudkan untuk memotret tingkat perkembangan desa di Indonesia dan dapat digunakan sebagai acuan untuk penyusunan perencanaan kebijakan dan pengawasan pembangunan desa [6]. Dengan adanya data Podes 2014 dapat dijadikan sebagai acuan untuk penyusunan perencanaan kebijakan. Berdasarkan Peraturan Kementerian Desa PDTT nomor 2 tahun 2016, status desa dikelompokkan kedalam 5 status yaitu Desa Mandiri, Desa Maju, Desa Berkembang, Desa Tertinggal dan Desa Sangat Tertinggal [7]. Belum adanya pengelompokkan data Potensi Desa tahun 2014 kedalam 5 status desa di Indonesia dan pengelompokan kedalam 5 satus desa yang ada saat ini adalah menggunakan data Indek Desa Membangun yang dikelompokkan perdaerah-daerah di Indonesia. Menjadikan pengelompokan status desa di Indonesia menggunakan data Potensi Desa Tahun 2014 menjadi dibutuhkan. Dalam teknologi informasi, data merupakan bagian penting yang tidak bisa dipisahkan dari pengambilan informasi. Informasi terkait dengan status desa seperti tersebut diatas dapat diperoleh menggunakan proses data mining terhadap data Podes Data mining merupakan rangkaian kegiatan yang digunakan untuk menemukan pola-pola baru, tersembunyi atau tidak terduga yang terdapat didalam data. Istilah data mining sering dianggap sebagai sinonim dari knowledge discovery from data (KDD) yaitu penemuan pengetahuan dari data yang berfokus pada tujuan proses mining [8]. Data mining dapat digunakan untuk melakukan clustering, klasifikasi dan asosiasi. Clustering/ pengelompokan yaitu proses mengelompokkan data yang dilakukan dengan menemukan kesamaan karakteristik antara data yang sesuai dengan kelompok kelas tertentu [9]. Secara sederhana, clustering dapat digunakan untuk menganalisis sekumpulan data dan menghasilkan satu set pengelompokan aturan yang dapat digunakan untuk mengelompokkan data masa depan. Pada dunia nyata terkadang data tidak hanya dikelompokkan kedalam status biner (kelas biner), akan tetapi dibutuhkan juga untuk dikelompokkan kedalam multi status (multi-class). Dalam kasus data-set multi-class, pengelompokan akan menjadi lebih sulit 2 Karya Ilmiah Data Mining, Agustus 2016

3 dibandingkan kasus kelas biner. Ada beberapa algoritma yang dapat digunakan untuk pengelompokan multi-class. Pernah dilakukan suatu penelitian tentang penggunaan algoritma k-means untuk pengelompokan multi-class yang menunjukkan bahwa algoritma k-means memberikan hasil yang efektif untuk pengelompokan data-set multiclass [10]. Algoritma k-means merupakan algoritma pengelompokan iteraktif yang melakukan partisi data-set kedalam jumlah K cluster yang sudah di tentukan sejak awal. Dalam penelitian yang lain pernah dibandingkan clustering berbasis partisi, clustering berbasis hirarki dan clustering berbasis density yang mengungkapkan bahwa algoritma k-means merupakan algoritma berbasis partisi yang memberikan performa lebih baik, mampu membagi cluster dengan baik dan unggul untuk data yang berukuran besar/banyak dibandingkan algoritma clustering berbasis hirarki dan density [11] [12]. Selain itu beberapa penelitian yang lain juga menyebutkan bahwa clustering menggunakan algoritma k-means lebih cepat daripada clustering dengan algoritma lain dan juga menghasilkan cluster yang berkualitas ketika menggunakan data-set berukuran besar [13] [14] [15] [16]. Dalam melakukan pengelompokan, algoritma k-means membutuhkan metode perhitungan jarak untuk menghitung jarak terdekat antara suatu instance data ke sebuah titik centroid. Perhitungan jarak pada algoritma k-means dapat menggunakan Manhattan, Euclidean dan Chebychev. Pernah dilakukan penelitian tentang perbandingan metode perhitungan jarak Manhattan dan Euclidean pada algoritma k-means untuk mengetahui jumlah squar error, data yang digunakan dalam penelitian tersebut adalah Bank data-set yang diuji menggunakan tool WEKA [17]. Dari hasil pengujian menunjukkan bahwa metode perhitungan jarak Manhattan lebih baik dari pada metode Euclidean [17]. Pada penelitian lain dilakukan perbandingan 3 metode perhitungan jarak pada algoritma k-means yaitu Manhattan, Euclidean dan Minkowski untuk menemukan metode perhitungan jarak yang paling baik, penelitian tersebut dilakukan dengan membandingkan hasil dari penelitian sebelumnya yang mana disimpulkan bahwa metode perhitungan jarak Euclidean lebih baik dari pada metode Manhattan dan Minkowski [18]. Pernah dilakukan juga penelitian yang lain tentang perbandingan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev pada algoritma k-means untuk mengetahui akurasi dan mean absolute error [19]. Dari pengujian yang dilakukan menggunakan flower data-set diperoleh hasil bahwa metode perhitungan jarak Chebyshev lebih baik dari metode Manhattan dan Euclidean [19]. Dari penelitian-penelitian sebelumnya diketahui bahwa metode perhitungan jarak Manhattan, Euclidean dan Chebyshev saling unggul antara satu dengan yang lain tergantung data-set yang digunakan. Berdasarkan pertimbangan yang sudah disebutkan diatas, pada penelitian ini akan dilakukan pengelompokan status desa di Indonesia menggunakan algoritma k-means kedalam 5 status desa, serta membandingkan metode perhitungan jarak manakah yang paling efektif untuk pengelompokan data Podes II. TINJAUAN PUSTAKA Algoritma k-means merupakan algoritma pengelompokan iteraktif yang melakukan partisi data-set kedalam jumlah K cluster yang sudah di tentukan sejak awal. Dalam penelitian yang lain pernah dibandingkan clustering berbasis partisi, clustering berbasis hirarki dan clustering berbasis density yang mengungkapkan bahwa algoritma k-means merupakan algoritma berbasis partisi yang memberikan performa lebih baik, mampu membagi cluster dengan baik dan unggul untuk data yang berukuran besar/banyak 3 Karya Ilmiah Data Mining, Agustus 2016

4 dibandingkan algoritma clustering berbasis hirarki dan density [11] [12]. Selain itu beberapa penelitian yang lain juga menyebutkan bahwa clustering menggunakan algoritma k-means lebih cepat daripada clustering dengan algoritma lain dan juga menghasilkan cluster yang berkualitas ketika menggunakan data-set berukuran besar [13] [14] [15] [16]. Dalam melakukan pengelompokan, algoritma k-means membutuhkan metode perhitungan jarak untuk menghitung jarak terdekat antara suatu instance data ke sebuah titik centroid. Perhitungan jarak pada algoritma k-means dapat menggunakan Manhattan, Euclidean dan Chebychev. Pernah dilakukan penelitian tentang perbandingan metode perhitungan jarak Manhattan dan Euclidean pada algoritma k-means untuk mengetahui jumlah squar error, data yang digunakan dalam penelitian tersebut adalah Bank data-set yang diuji menggunakan tool WEKA [17]. Dari hasil pengujian menunjukkan bahwa metode perhitungan jarak Manhattan lebih baik dari pada metode Euclidean [17]. Pada penelitian lain dilakukan perbandingan 3 metode perhitungan jarak pada algoritma k-means yaitu Manhattan, Euclidean dan Minkowski untuk menemukan metode perhitungan jarak yang paling baik, penelitian tersebut dilakukan dengan membandingkan hasil dari penelitian sebelumnya yang mana disimpulkan bahwa metode perhitungan jarak Euclidean lebih baik dari pada metode Manhattan dan Minkowski [18]. Pernah dilakukan juga penelitian yang lain tentang perbandingan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev pada algoritma k-means untuk mengetahui akurasi dan mean absolute error [19]. Dari pengujian yang dilakukanmenggunakan flower data-set diperoleh hasil bahwa metode perhitungan jarak Chebyshev lebih baik dari metode Manhattan dan Euclidean [19]. Dari penelitian-penelitian sebelumnya yang lain diketahui bahwa metode perhitungan jarak Manhattan, Euclidean dan Chebyshev saling unggul antara satu dengan yang lain tergantung data-set yang digunakan [17] [18] [19] [20] [21] [22] [23]. Sehingga berdasarkan pertimbangan literature review yang ada, dalam penelitian ini akan dilakukan perbandingan metode perhitungan jarak manakah yang paling efektif untuk pengelompokan data Podes 2014 untuk memperoleh status desa di Indonesia Data Mining Data mining merupakan salah satu bidang paling penting dalam penelitian yang bertujuan untuk memperoleh informasi dari data set. Data mining mulai ada sejak 1990-an sebagai cara yang efektif untuk mengambil pola dan informasi yang sebelumnya tidak diketahui dari suatu data set [24]. Teknik data mining digunakan untuk menemukan hubungan antara data untuk melakukan pengklasifikasian yang memprediksikan nilainilai dari beberapa variabel (klasifikasi), atau untuk membagi data yang diketahui menjadi kelompok-kelompok yang mempunyai kesamaan karakteristik (clustering). Clustering merupakan bagian dari pembelajaran unsupervised yang digunakan sebagai alat yang efektif dalam data mining [25]. Clustering tidak memiliki atribut yang dapat digunakan untuk memandu proses pembelajaran (tidak memiliki label), sehingga seluruh atribut yang dimiliki diperlakukan sama. Metode clustering memungkinkan untuk mengungkapkan hubungan dan struktrur yang sebelumnya tidak jelas dari data-set. Tujuan dari clustering adalah untuk mengelompokkan data yang memiliki kesamaan karakteristik kedalam kelompok yang sama dan data yang berbeda karakteristik kedalam kelompok yang lain Algoritma K-Means K-means adalah salah salah satu algoritma clustering yang bertujuan untuk membagi data 4 Karya Ilmiah Data Mining, Agustus 2016

5 menjadi beberapa kelompok dari masukan berupa data tanpa label kelas. K-means merupakan metode partisi yang paling populer untuk melakukan clustering. Algoritma k- means pertama kali diperkenalkan oleh MacQueen pada tahun Pada algoritma k- means, setiap cluster diwakili oleh nilai ratarata dari objek dalam cluster. Algortma k- means terdiri dari 2 tahap yaitu [26]: Tahap Pertama: Memilih nilai centroid k secara acak, dimana nilai k sudah didefinisikan terlebih dahulu. Tahap kedua: Setiap objek didalam dataset diasosiasikan dengan centroid terdekat. Pada pengukuran jarak antara setiap objek data dan cluster centroid dapat menggunakan perhitungan manhattan distance, euclidean distance, dan chebyshev distance. Manhattan distance atau dikenal juga dengan City block distance digunakan untuk menghitung jarak dengan tujuan untuk mendapatkan jarak dari satu titik data ke titik data yang lain. Manhattan distance mencerminkan jarak antar titik di jalan perkotaan dalam 1 blok [27]. Persamaan matematik dari manhattan distance yaitu: D(x, y) = n i=1 x i y j 2.1 Dari persamaan 2.1, x = (x 1, x 2, x 3,, x n ) dan y = (y 1, y 2, y 3,, y n ). Perhitungan manhattan distance adalah dengan menjumlahkan hasil absolut dari pengurangan antar titik. Dalam matematika, Euclidean distance digunakan untuk megukur antara dua titik dalam satu dimensi yang memberikan hasil seperti rumus Pythagoras [28]. Persamaan Euclidean distance yaitu [27]: D(x, y) = (x ik y jk ) n k= Dari persamaan 2.2, x = (x i1, x i2, x i3,, x in ) dan y = (y j1, y j2, y j3,, y jn ). Euclidean distance diperoleh dari jumlah kuadrat antar titik yang diakar kuadratkan. Nilai jarak maksimum atau disebut juga Chebychev distance merupakan perhitungan jarak yang menghitung besarnya hasil absolut dari perbedaan antara sepasang objek [27]. Chebychev distance dapat dihitung menggunakan persamaan: D(x, y) = max ( x i y i ) 2.3 Metrik dalam chebychev distance, didefinisikan didalam ruang vektor yang mana jarak antara dua vektor yang memiliki perbedaan terbesar disepanjang dimensi koordinatnya [28] Davies Bouldin Index Davies Bouldin Index (DBI) merupakan cara validasi cluster yang dibuat oleh D.L. Davies. DBI adalah fungsi rasio dari jumlah distribusi didalam cluster untuk pemisahan antar cluster [29]. Pengukuran menggunakan DBI bertujuan untuk memaksimalkan jarak inter-cluster. Dalam penelitian ini, DBI digunakan untuk melakukan validasi data pada setiap cluster. DBI dapat dihitung menggunakan persamaan: max R i = j=1 k,i j R ij 2.4 var(x) = 1 N N 1 (x i x ) 2 Keterangan: R Var x x i=1 R ij i j = var(c i ) + var(c j ) c i c j k DB = 1 k R i i=1 : jarak antar cluster : variance dari data : data ke-i : rata-rata dari tiap cluster DB : validasi Davies Bouldin Dengan menggunakan Davies Bouldin Index suatu cluster akan dianggap memiliki skema clustering yang optimal jika memiliki Index Davies Bouldin minimal. 5 Karya Ilmiah Data Mining, Agustus 2016

6 2.4. Kerangka Pemikiran dan Hipotesis Saat ini ada banyak metode perhitungan jarak yang dapat digunakan. Dari metodemetode yang ada secara umum dikategorikan kedamam 2 measure type yaitu nominal measures dan numerical measures. Pada nominal measures dapat menggunakan perhitungan jarak Nominal distance, Dice similarity, Jaccar similarity, Simple maching similarity, dan lain-lain. Sedangkan pada numerical measures dapat menggunakan perhitungan jarak Euclidean distance, Manhattan distance, Chebyshev disatance. Apabila dilihat dari tipe data Podes 2014, data tersebut adalah data numerical. Sehingga dalam penelitian ini akan dibandingkan metode perhitungan jarak Euclidean distance, Manhattan distance, Chebyshev distance pada algoritma k-means yang paling baik untuk mengelompokkan data Podes Dalam penggunaan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev untuk pengelompokan data Podes 2014, penulis memiliki hipotesis mengenai metode perhitungan jarak yang paling efektif digunakan. Apabila dilihat dari kemangkusan metode diperoleh Big O dari setiap metode sebagai berikut: a) Manhattan distance memiliki persamaan D(x, y) = n i=1 x i y j Karena persamaan dari manhattan distance adalah berupa penjumlahan antar titik saja, dapat diketahui bahwa Big O dari manhattan adalah O(n). b) Euclidean distance memiliki persamaan D(x, y) = (x ik y jk ) n k=1 Untuk Big O dari akar kuadrat adalah O(sqrt(n)). Untuk Big O dari kuadrat adalah O(n 2 ). Untuk Big O dari penjumlahan adalah O(n). Sehingga dapat diketahui bahwa Big O dari Euclidean adalah O(sqrt(n 2 )). 2 c) Chebyshev distance memiliki persamaan D(x, y) = max ( x i y i ) Karena persamaan dari chebyshev distance adalah mengambil 1 nilai tertinggi antar titik saja, dapat diketahui bahwa Big O dari chebyshev adalah O(1) Dari Big O pada masing-masing metode, penulis berhipotesis bahwa metode perhitungan jarak yang paling efektif dalam hal waktu eksekusi yang lebih singkat untuk diterapkan pada penelitian ini adalah Chebyshev distance. Selain dilihat dari segi waktu, untuk memastikan performance suatu metode dapat menggunakan evaluasi internal dan evaluasi eksternal. Evaluasi internal atau disebut juga metrik unsupervised melakukan evaluasi dengan menggunakan informasi apa adanya yang ada didalam data-set. Sedangkan untuk evaluasi eksternal atau disebut juga metrik supervised, evaluasi dilakukan menggunakan informasi yang tidak disediakan didalam dataset. Karena dalam penelitian ini data dan metode yang digunakan adalah dalam bentuk unsupervised learning, maka evaluasi yang digunakan adalah evaluasi internal. Davies Bouldin Indexs (DBI) adalah salah satu metrik internal yang digunakan untuk melakukan evaluasi cluster untuk pada pengelompokan yang berbasis partisi. DBI digunakan untuk mengukur kohesi dan separasi pada cluster. Kohesi merupakan jumlah dari kedekatan data terhadap centroid yang diikutinya (ditunjukkan pada gambar 2.1), sedangkan Separasi merupakan jarak kedekatan antar cluster (ditunjukkan pada gambar 2.2). Gambar 2.1. Kohesi 6 Karya Ilmiah Data Mining, Agustus 2016

7 Sedangkan apabila jarak antar titik ditentukan dengan Euclidean distance: d(p,q) = (2 4) 2 + (1 5) 2 = 4.47 Gambar 2.2. Separasi Dengan mengguakan Davies Bouldin Indexs penulis memiliki hepotesis bahwa metode perhitungan jarak Euclidean memiliki indek bouldin yang paling optimal dibandingkan Manhattan dan Chebyshev. Hal itu didasari dengan 2 hal a) Euclidean dibandingkan Manhattan Milsalkan ada titik 2 dimensi yaitu p(2.1) dan q(4.5). Dari dua titik tersebut hendak dicari jarak terdekatnya. Gambar 2.3. Titik Dua Dimensi Apabila jarak antar titik ditentukan dengan Manhattan distance: d(p,q) = = 6 Sedangkan apabila jarak antar titik ditentukan dengan Euclidean distance: d(p,q) = (2 4) 2 + (1 5) 2 = 4.47 Dengan perhitungan dua dimensi dapat dilihat bahwa metode perhitungan jarak Euclidean menghasilkan jarak antar titik lebih dekat dibandingkan Manhattan. b) Euclidean dibandingkan Chebyshev Milsalkan ada titik 2 dimensi yaitu p(2.1) dan q(4.5) seperti yang ditunjukkan pada gambar 2.4. Apabila jarak antar titik ditentukan dengan Chebyshev distance: d(p,q) = max ( 2-4, 1-5 ) = 4 Memang apabila dibandingkan, Chebyshev memberikan jarak yang paling dekat. Akan tetapi Chebyshev hanya berfokus pada dimensi yang menghasilkan jarak maksimal, sedangkan dalam sebuah data setiap dimensi memiliki keterkaitan dengan dimensi yang lain. Sehingga apabila metode Chebyshev diterapkan untuk pengelompokan, penulis berhipotesis bahwa Chebyshev akan menghasilkan tingkan kohesi dan separasi yang rendah. III. METODE PENELITIAN Dalam penelitian ini metode yang digunakan adalah metode data mining dengan memakai teknik clustering/pengelompokan menggunakan algoritma k-means dengan perhitungan jarak Manhattan, Euclidean dan Chebyshev. Kemudian dari metode tersebut akan digunakan untuk mengelompokkan status desa berdasarkan data Potensi Desa tahun 2014 (Podes 2014). Dengan menggunakan algoritma k-means, data Podes 2014 akan dibagi kedalam 5 cluster yaitu cluster 0, cluster 1, cluster 2, cluster 3 dan cluster 4. Penentuan 5 cluster ini didasarkan pada Peraturan Menteri Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia nomor 2 tahun 2016 tentang Indek Desa Membangun, yang menyebutkan bahwa status desa dikelompokkan dalam 5 status desa. Adapun langkah pengujian yang digunakan dalam penelitian ini dapat dilihat pada gambar Karya Ilmiah Data Mining, Agustus 2016

8 Gambar 3.1. Langkah Pengujian Pada gambar 3.1 menunjukkan bahwa langkah pengujian diawali dari input berupa data Podes 2014 yang belum dikelompokkan kedalam status desa. Kemudian dari data input akan diproses menggunakan algoritma k- means. Adapun didalam algoritma k-means akan menggunakan 3 metode perhitungan jarak untuk menentukan centroid dari setiap cluser. Metode perhitungan jarak yang digunakan yaitu Manhattan, Euclidean dan Chebyshev. Dari setiap pengelompokan akan menghasilkan 5 cluster status desa, kemudian hasil akan di uji menggunakan Davies Bouldin Index dan waktu eksekusi untuk mengetahui metode perhitungan jarak manakah yang paling baik. dengan mengitung jumlah dari centroid untuk setiap cluster, yang ditulis dengan persamaan: Status desa = CI 1, CI 2,, CI Dari persamaan 4.4, CI merupakan centroid dari setiap indikator dan setiap cluster memiliki 42 indikator. Penentuan status desa akan diurutkan berdasarkan nilai penjumlahan centroid dari setiap indikator pada masingmasing cluster, yang mana nilai penjumlahan terendah akan diinisialisasikan sebagai status Desa Sangat Tertinggal dan nilai penjumlahan tertinggi akan diinisialisasikan sebagai status Desa Mandiri. Adapun urutan penamaan cluster dari yang nilai terendah sampai tertinggi yaitu Desa Sangat Tertinggal, Desa Tertinggal, Desa Berkembang, Desa Berkembang, Desa Maju, Desa Mandiri. Adapun nilai centroid dan jumlah cluster dari pengujian dari metode perhitungan jarak Manhattan, Euclidean dan Chebyshev dengan algoritma k-means yang telah dilakukan dapat dilihat pada tabel 4.1, 4.2 dan 4.3. Tabel 4.1. Status dan Jumlah Desa dengan Menggunakan Manhattan Tabel 4.2. Status dan Jumlah Desa dengan Menggunakan Euclidean IV. ANALISA PENGUJIAN Dari pengujian yang telah dilakukan diperoleh nilai centroid dan jumlah cluster yang berbeda untuk setiap metode perhitungan jarak yang digunakan. Pada data Potensi Desa tahun 2014, setiap atribut/ indikator mempunyai nilai 0 s/d 5, yang mana nilai 0 adalah nilai terendah sedangkan nilai 5 adalah nilai tertinggi. Sehingga pada penelitian ini untuk menentukan status desa dilakukan 8 Karya Ilmiah Data Mining, Agustus 2016

9 Tabel 4.3. Status dan Jumlah Desa dengan Menggunakan Chebyshev 4.1. Pengujian Waktu Eksekusi Akumulasi waktu dilakukan dengan melakukan eksekusi sebanyak 5 kali untuk setiap metode perhitungan jarak yang digunakan. Dari 5 kali eksekusi tersebut kemudian akan dirata-rata untuk memperoleh waktu eksekusi paling efisien dari setiap metode perhitungan jarak. Dari pengeujian yang telah dilakukan diperoleh lama waktu eksekusi yang berbeda, adapun lama waktu eksekusi dari pengujian dari metode perhitungan jarak Manhattan, Euclidean dan Chebyshev yang telah dilakukan dapat dilihat pada gambar 4.1. Detik Manhattan Euclidean Chebyshev Gambar 4.1. Lama Waktu Eksekusi Pada gambar 4.1 dapat dilihat bahwa waktu eksekusi dari metode Manhattan distance untuk pengujian 1 sampai pengujian 5 secara berturut-turut yaitu 69 detik, 66 detik, 65 detik, 66 detik dan 65 detik, sehingga apabila diambil rata-rata waktu eksekusi dari Manhattan distance adalah 66.2 detik. Sedangkan waktu eksekusi dari metode Euclidean distance untuk pengujian 1 sampai pengujian 5 secara berturut-turut yaitu 69 detik, 68 detik, 68 detik, 68 detik dan 67 detik, sehingga apabila diambil rata-rata waktu eksekusi dari Euclidean distance adalah 68 detik. Kemudian waktu eksekusi dari metode Chebyshev distance untuk pengujian 1 sampai pengujian 5 secara berturut-turut yaitu 36 detik, 33 detik, 38 detik, 34 detik dan 33 detik, sehingga apabila diambil rata-rata waktu eksekusi dari Chebyshev distance adalah 34.8 detik. Adapun secara lebih mudah dari waktu eksekusi yang dibutuhkan untuk metode Manhattan, Euclidean dan Chebyshev dapat dilihat pada tabel 4.4. Tabel 4.4. Lama Waktu Eksekusi Test (i) Waktu Eksekusi Manhattan Euclidean Chebyshev 1 69 detik 69 detik 36 detik 2 66 detik 68 detik 33 detik 3 65 detik 68 detik 38 detik 4 66 detik 68 detik 34 detik 5 65 detik 67 detik 33 detik Ratarata 66.2 detik 68 detik 34.8 detik 4.2. Pengujian Davies Bouldin Index Dalam penelitian ini, Davies Bouldin Index (DBI) digunakan untuk melakukan validasi data pada setiap cluster. Pengukuran menggunakan DBI bertujuan untuk memaksimalkan jarak inter-cluster. Dengan menggunakan DBI suatu cluster akan dianggap memiliki skema clustering yang optimal jika yang memiliki Index Davies minimal. Adapun dari pengujian yang sudah dilakukan diperoleh nilai Index Davies dari metode Manhattan, Euclidean dan Chebyshev yang ditunjukkan pada gambar ,000 4,000 2, ,156 2,700 2,604 DBI Manhattan Euclidean Chebyshev Gambar 4.2. Index Davies dari metode Manhattan, Euclidean dan Chebyshev 9 Karya Ilmiah Data Mining, Agustus 2016

10 Dari gambar 4.3 dapat dilihat bahwa nilai Index Davies dari metode Manhattan yaitu 2.700, nilai Index Davies dari metode Euclidean yaitu dan nilai Index Davies dari metode Chebyshev yaitu Adapun secara lebih mudah untuk nilai Index Davies dari metode Manhattan, Euclidean dan Chebyshev dapat dilihat pada tabel Tabel 4.5. Index Davies dari Manhattan, Euclidean dan Chebyshev Davies Bouldin Index Manhattan Euclidean Chebyshev Dari tabel 4.25 dapat diketahui bahwa nilai yang paling optimal dari metode Manhattan, Euclidean dan Chebyshev adalah metode Euclidean distance dengan nilai Index Davies yaitu Analisa Hasil Pengujian Dari pengujian metode pengelompokan data Potensi Desa Tahun 2014 menggunakan algoritma k-means dengan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev yang telah dilakukan dihasilkan: 1. Model pengujian yang digunakan dapat berjalan dengan baik dan menunjukkan hasil berupa nilai centroid untuk setiap cluster dari metode Manhattan, Euclidean dan Chebyshev, sehingga status desa dapat ditentukan dari jumlah centroid pada setiap cluster. 2. Penggunaan metode perhitungan jarak yang digunakan mempengaruhi jumlah data pada setiap cluster. 3. Akumulasi waktu yang diperoleh dari pengujian yang telah dilakukan menunjukkan bahwa metode perhitungan jarak Chebyshev memiliki waktu eksekusi paling efisien dengan akumulasi waktu rata-rata 34.8 detik. 4. Dengan menggunakan pengujian Davies Bouldin Index menunjukkan bahwa metode perhitungan jarak Euclidean memiliki nilai Index Davies paling optimal dengan dengan nilai Dari pengujian yang sudah dilakukan dapat diketahui bahwa pengelompokan data Potensi Desa Tahun 2014 menggunakan algoritma k-means dengan metode perhitungan jarak Chebyshev memiliki akumulasi waktu paling efisien dibandingkan Manhattan dan Euclidean, Sedangkan metode Euclidean memiliki nilai Index Davies paling optimal dibanding metode Manhattan dan Chebyshev. V. KESIMPULAN DAN SARAN 5.1. Kesimpulan Dari pembahasan dan evaluasi pada bab-bab sebelumnya, pengelompokan data Potensi Desa tahun 2014 kedalam 5 kelompokkan menggunakan algoritma k- means dengan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev diperoleh kesimpulan yaitu: 1. Telah dikelompokkannya data Potensi Desa tahun 2014 kedalam 5 status desa di Indonesia dengan diperoleh jumlah desa untuk setiap cluster yaitu cluster Desa Sangat Tertinggal sebanyak 7644 desa, cluster Desa Tetinggal sebanyak desa, cluster Desa Berkembang sebanyak desa, cluster Desa Maju sebanyak desa dan cluster Desa Mandiri sebanyak desa. 2. Pengelompokan data Potensi Desa tahun 2014 kedalam 5 status desa menggunakan algoritma k-means dengan metode perhitungan jarak Chebyshev memiliki akumulasi waktu paling efisien dibandingkan Manhattan dan Euclidean, Sedangkan metode Euclidean memiliki nilai Index Davies paling optimal dibanding metode Manhattan dan Chebyshev. 10 Karya Ilmiah Data Mining, Agustus 2016

11 5.2. Saran Dari penelitian ini di ketahui bahwa setiap cluster yang dihasilkan memiliki jarak dari cluster yang lain, dengan hasil cluster yang diperoleh diharapkan dapat diukur jarak setiap atribut antar cluster agar dapat ditentukan atribut mana yang perlu diperhatikan sebagai prioritas pembangunan agar status desa dapat meningkat. DAFTAR PUSTAKA [1] Undang-Undang Dasar Negara Republik Indonesia Tahun 1945, Negara Republik Indonesia, [2] Undang-Undang Dasar Negara Republik Indonesia Nomor 6 Tahun 2014, Tentang Desa, Presiden Republik Indonesia, [3] Peraturan Presiden Republik Indonesia Nomor 12 Tahun 2015, Tentang Kementerian Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi, Presiden Republik Indonesia, [4] Peraturan Presiden Republik Indonesia Nomor 2 Tahun 2015, Tentag Rencana Pembangunan Jangka Menengah Nasional Tahun , Presiden Republik Indonesia, [5] Undang Undang Republik Indonesia Nomor 6 Tahun 2015 tentang Desa, Presiden Republik Indonesia, [6] H. Barokah, D. R. W. W. Utami, Karmaji, C. S. M. Sugiarto, U. Suchaini, D. Widyaningsih, E. H. Nurcahyo, A. P. Rahtama and M. Abduh, Indeks Pembangunan Desa 2014 "Tentang Pemenuhan Standar Pelayanan Minimum Desa", Jakarta: Nasional, Badan Perencanaan Pembangunan, [7] Peraturan Menteri Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia Nomor 2 Tahun 2016, tentang Indek Desa Membangun, Menteri Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia, [8] L. Xu, C. Jiang, J. Wang, J. Yuan and Y. Ren, Information Security in Big Data: Privacy and Data Mining, IEEE Access: The Journal for Rapid Open Access Publishing, vol. 1, pp , 9 October [9] V. Deepa, Rapid Development of Applications in Data Mining, in International Conference on Green High Performance Computing, India, [10] M. F. Al-Roby and A. M. El-Halees, Classifying Muti-Class Imbalance Data, Egyptian Computer Science Journal, vol. 37, no. 5, pp , [11] B. Chaudhari and M. Parikh, A Comparative Study of clustering algorithms Using weka tools, International Journal of Application or Innovation in Engineering & Management, vol. 1, no. 2, pp , [12] C. Shah and A. Jivani, Comparison of Data Mining Clustering Algorithms, in Nirma University International Conference on Engineering, [13] N. Claypo and S. Jaiyen, Opinion Mining for Thai Restaurant Reviews using K-Means Clustering and MRF Feature Selection, in Knowledge and Smart Technology (KST), Chonburi, [14] M. Verma, M. Srivastava, N. Chack, A. K. Diswar and N. Gupta, A Comparative Study of Various Clustering Algorithms in Data Mining, International Journal of Engineering Research and Applications (IJERA), vol. 2, no. 3, pp , [15] S. Ghosh and S. K. Dubey, Comparative Analysis of K-Means and Fuzzy C-Means Algorithms, International Journal of Advanced Computer Science and Applications, vol. 4, no. 4, pp , [16] S. Chakraborty, N. K. Nagwani and L. Dey, Performance Comparison of Incremental K- means and Incremental DBSCAN Algorithms, International Journal of Computer Applications, vol. 27, no. 11, pp , [17] R. Awasthi, A. K. Tiwari and S. Pathak, Empirical Evaluation on K Means Clustering with Effect of Distance Functions for Bank, International Journal of Innovative Technology and Research, vol. 1, no. 3, pp , [18] A. Singh, A. Yadav and A. Rana, K-means with Three different Distance Metrics, International Journal of Computer Applications, vol. 67, no. 19, pp , [19] K. Kouser and Sunita, A comparative study of K Means Algorithm by Different Distance Measures, International Journal of Innovative Research in Computer and Communication Engineering, vol. 1, no. 9, pp , Karya Ilmiah Data Mining, Agustus 2016

12 [20] D. Sinwar and R. Kaushik, Study of Euclidean and Manhattan Distance Metrics using Simple K-Means Clustering, International Journal for Research in Applied Science and Engineering Technology, vol. 2, no. 5, pp , [21] D. J. Bora and A. K. Gupta, Effect of Different Distance Measures on the Performance of K-Means Algorithm: An Experimental Study in Matlab, International Journal of Computer Science and Information Technologies, vol. 5, no. 2, pp , [22] M. Anggara, H. Sujiani and H. Nasution, Pemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness, Jurnal Sistem dan Teknologi Informasi (JUSTIN), vol. 1, no. 1, pp. 1-6, [23] H. Prasetyo and A. Purwariati, Comparison of Distance Measures for Clustering Data with Mix Attribute Types, in International Conference on Information Technology Systems and Innovation, Bandung, [24] D. Tomar and S. Agarwal, A survey on Data Mining approaches for Healthcare, International Journal of Bio-Science and Bio- Technology, vol. 5, no. 5, pp , [25] S. Ding, F. Wu, Q. Jun, H. Jia and F. Jin, Research on data stream clustering algorithms, Artificial Intelligence Review, vol. 43, no. 4, pp , [26] J. Yadav and M. Sharma, A Review of K- mean Algorithm, International Journal of Engineering Trends and Technology (IJETT), vol. 4, no. 7, pp , [27] P. Grabust, The Choice of Metrics for Clustering Algorithms, in Proceedings of the 8th International Scientific and Practical Conference, Augstskola, [28] H. K. Sagar and V. Sharma, Error Evaluation on K- Means and Hierarchical Clustering with Effect of Distance Functions for Iris Dataset, International Journal of Computer Applications, vol. 86, no. 18, pp. 1-5, [29] B. K. Mishra, A. Rath, N. R. Nayak and S. Swain, Far Efficient K-Means Clustering Algorithm, in International Conference on Advances in Computing, Communications and Informatics, Chennai, PENULIS Yoga Religia, M.Kom Lulus Sarjana Teknik Informatika Tahun 2015 dan Lulus Magister Teknik Informatika tahun 2016 di Universitas Dian Nuswantoro Semarang. Saat ini bekerja di Kementerian Desa, Pembangunan Daerah Tertinggal dan Transmigrasi Repubik Indonesia sebagai asisten tenaga ahli di Direktorat Jenderal Pembangunan dan Pemberdayaan masyarakat Desa. 12 Karya Ilmiah Data Mining, Agustus 2016

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

ALGORITMA CLUSTERING K-MEDOIDS PADA E-GOVERNMENT BIDANG INFORMATION AND COMMUNICATION TECHNOLOGY DALAM PENENTUAN STATUS EDGI

ALGORITMA CLUSTERING K-MEDOIDS PADA E-GOVERNMENT BIDANG INFORMATION AND COMMUNICATION TECHNOLOGY DALAM PENENTUAN STATUS EDGI ALGORITMA CLUSTERING K-MEDOIDS PADA E-GOVERNMENT BIDANG INFORMATION AND COMMUNICATION TECHNOLOGY DALAM PENENTUAN STATUS EDGI Zaenal Mustofa 1, Iman Saufik Suasana 2 1,2 Sistem Komputer STEKOM Semarang

Lebih terperinci

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian Penerapan Data Mining dengan Menggunakan Metode Clustering K-Mean Untuk Mengukur Tingkat Ketepatan Kelulusan Mahasiswa Program Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang

Lebih terperinci

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra

Lebih terperinci

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS 1 KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS (Study Kasus : Tim Hockey Kabupaten Kendal) Alith Fajar Muhammad Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula No. 5-11 Semarang-50131

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

Techno.COM, Vol. 16, No. 1, Februari 2017 : Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang

Techno.COM, Vol. 16, No. 1, Februari 2017 : Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang Penerapan Algoritma K-Means Untuk Clustering Penilaian Dosen Berdasarkan Indeks Kepuasan Mahasiswa Application of K-Means Algorithm for Clustering Lecturer Based On Assessment of Student Satisfaction Index

Lebih terperinci

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN 1 K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN Rani Nooraeni*, Dr. Jadi Supriadi, DEA, Zulhanif, S.Si,M.Sc Jurusan statistika terapan, Fakultas MIPA UNPAD rnooraeni@gmail.com* Abstrak.Membagi suatu data

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam

Lebih terperinci

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP Page 87 Iin Parlina 1, Agus Perdana Windarto 2, Anjar Wanto 3, M.Ridwan Lubis

Lebih terperinci

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA 1 Yulison Herry Chrisnanto, 2 Gunawan Abdillah 1,2 Jurusan Informatika Fakultas

Lebih terperinci

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing

Lebih terperinci

Fuzzy C-means Clustering menggunakan Cluster Center Displacement

Fuzzy C-means Clustering menggunakan Cluster Center Displacement Fuzzy C-means Clustering menggunakan Cluster Center Displacement Fitri Hidayah Sundawati 1), Jadi Suprijadi 2), Titi Purwandari 3) 1) Mahasiswa Statistika Terapan, UniversitasPadjadjaran-Indonesia 2) Pengajar

Lebih terperinci

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa Aidina Ristyawan 1), Kusrini 2), Andi Sunyoto

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas 1. Memahami cakupan materi dan sistem perkuliahan Data Mining.

Lebih terperinci

Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni

Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni 1 Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni Femi Dwi Astuti Program Studi Teknik Informatika STMIK AKAKOM femi@akakom.ac.id Abstrak -

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

The 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang

The 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang Penerapan Seleksi Atribut Berdasarkan Koefisien Variansi dan Korelasi untuk Inisialisasi Pusat Awal Klaster pada Algoritma K- Means dalam Pemetaan E-Government Tahun 2016 Ivon Dewi Apriliyaningsih 1*,

Lebih terperinci

PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS

PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS Hartatik STMIK Amikom Manajemen Informatika STMIK AMIKOM Yogyakarta Jl. Ringroad Utara, Condong Catur, Depok,

Lebih terperinci

Oleh : Rahanimi Pembimbing : Dr. M Isa Irawan, M.T

Oleh : Rahanimi Pembimbing : Dr. M Isa Irawan, M.T PERAMALAN JUMLAH MAHASISWA PENDAFTAR PMDK JURUSAN MATEMATIKA MENGGUNAKAN METODE AUTOMATIC CLUSTERING DAN RELASI LOGIKA FUZZY (STUDI KASUS di INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA) Oleh : Rahanimi

Lebih terperinci

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun Vol. 4, No. 1, Tahun 2015 28 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : https://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Visualisasi Pengembangan Judul

Lebih terperinci

PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak

PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1 Wahyu Catur Wibowo 2 1 Program Studi Sistem Informasi, Universitas Jember 2 Fakultas Ilmu Komputer, Universitas Indonesia,

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA Diajeng Tyas Purwa Hapsari Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email :

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kecelakaan lalu lintas merupakan salah satu masalah kesehatan yang menjadi penyebab serius kematian didunia dan menempati peringkat 9 dunia. Indonesia sendiri merupakan

Lebih terperinci

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU Gita Premashanti Trayasiwi Program Studi Teknik Informatika S1,

Lebih terperinci

Prosiding SENATEK 2015 Fakultas Teknik, Universitas Muhammadiyah Purwokerto Purwokerto, 28 November 2015, ISBN

Prosiding SENATEK 2015 Fakultas Teknik, Universitas Muhammadiyah Purwokerto Purwokerto, 28 November 2015, ISBN SISTEM KLASTERISASI MENGGUNAKAN METODE K-MEANS DALAM MENENTUKAN POSISI ACCESS POINT BERDASARKAN POSISI PENGGUNA HOTSPOT DI UNIVERSITAS MUHAMMADIYAH PURWOKERTO Achmad Fauzan*, Abid Yanuar Badharudin, Feri

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM

METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1), Wahyu Catur Wibowo 2) 1) Program Studi Sistem Informasi, Universitas Jember 2) Fakultas Ilmu Komputer,

Lebih terperinci

Pemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness

Pemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness Pemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness Mario Anggara 1, Herry Sujiani 2, Helfi Nasution 3 Program Studi Teknik Informatika Fakultas Teknik Universitas

Lebih terperinci

SKRIPSI KLASTERISASI DAERAH RAWAN KECELAKAAN LALU LINTAS DI KOTA SEMARANG MENGGUNAKAN CHEBYSHEV DISTANCE K-MEANS

SKRIPSI KLASTERISASI DAERAH RAWAN KECELAKAAN LALU LINTAS DI KOTA SEMARANG MENGGUNAKAN CHEBYSHEV DISTANCE K-MEANS SKRIPSI KLASTERISASI DAERAH RAWAN KECELAKAAN LALU LINTAS DI KOTA SEMARANG MENGGUNAKAN CHEBYSHEV DISTANCE K-MEANS CLUSTERING TRAFFIC ACCIDENT PRONE AREA IN SEMARANG USING CHEBYSHEV DISTANCE K-MEANS Diajukan

Lebih terperinci

Perbandingan Metode Single Linkage dan Fuzzy C Means Untuk Pengelompokkan Trafik Internet

Perbandingan Metode Single Linkage dan Fuzzy C Means Untuk Pengelompokkan Trafik Internet Perbandingan Metode Single dan Fuzzy C Means ntuk Pengelompokkan Trafik Internet Auliya Burhanuddin 1, Ema tami, Eko Pramono 3 1 Program Studi Teknik Informastika, Fakultas Teknik, niversitas Muhammadiyah

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA

SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA Kamil Malik Jurusan Teknik Informatika STT Nurul Jadid Paiton nomor1001@gmail.com Andi Hutami Endang Jurusan Teknik Informatika

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

IMPLEMENTASI METODE K-MEANS CLUSTERING UNTUK ANALISA PRESTASI SISWA BERDASARKAN DATA SISWA DI SMA NEGERI 1 GROGOL SKRIPSI

IMPLEMENTASI METODE K-MEANS CLUSTERING UNTUK ANALISA PRESTASI SISWA BERDASARKAN DATA SISWA DI SMA NEGERI 1 GROGOL SKRIPSI IMPLEMENTASI METODE K-MEANS CLUSTERING UNTUK ANALISA PRESTASI SISWA BERDASARKAN DATA SISWA DI SMA NEGERI 1 GROGOL SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer

Lebih terperinci

MENGGUNAKAN DATA MINING

MENGGUNAKAN DATA MINING E.11 MENGGUNAKAN DATA MINING UNTUK SEGMENTASI CUSTOMER PADA BANK UNTUK MENINGKATKAN CUSTOMER RELATIONSHIP MANAGEMENT (CRM) DENGAN METODE KLASIFIKASI (AGORITMA J-48, ZERO-R DAN NAIVE BAYES) Maghfirah, Teguh

Lebih terperinci

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada

Lebih terperinci

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id

Lebih terperinci

Pengenalan Pola. Klasterisasi Data

Pengenalan Pola. Klasterisasi Data Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering

Lebih terperinci

PENCARIAN ISI CITRA MENGGUNAKAN METODE MINKOWSKI DISTANCE

PENCARIAN ISI CITRA MENGGUNAKAN METODE MINKOWSKI DISTANCE PENCARIAN ISI CITRA MENGGUNAKAN METODE MINKOWSKI DISTANCE Budi Hartono 1, Veronica Lusiana 2 Program Studi Teknik Informatika, Fakultas Teknologi Informasi, Universitas Stikubank Semarang Jl Tri Lomba

Lebih terperinci

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri

Lebih terperinci

DATA MINING DAN WAREHOUSE A N D R I

DATA MINING DAN WAREHOUSE A N D R I DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung

Lebih terperinci

PENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG

PENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG PENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG Sri Mulyati 1) 1 Pascasarjana, Universitas Putra Indonesia YPTK Padang e-mail: mulyati.sri52@gmail.com Abstrak

Lebih terperinci

CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH

CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH Darlis Heru Murti, Nanik Suciati, Daru Jani Nanjaya Jurusan Teknik Informatika, Fakultas Teknologi

Lebih terperinci

PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING

PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING A-99 PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING Rachmad Zaini Alberto 1, Winda Kurnia Sari 2, Samsuryadi 3, Anggina Primanita 4 1,2,3,4 Fakultas

Lebih terperinci

Pengenalan Pola. K-Means Clustering

Pengenalan Pola. K-Means Clustering Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan mahasiswa berdasarkan status gizi Body Mass Index (BMI) dan ukuran kerangka.

Lebih terperinci

Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan

Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Ni Made Anindya Santika Devi, I Ketut Gede Darma Putra, I Made Sukarsa Jurusan Teknologi Informasi, Universitas Udayana Bukit Jimbaran,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Dalam bagian ini dijelaskan aktifitas yang dilakukan dalam melakukan penelitian dibagi menjadi 2 (dua) yaitu: 1) Perancangan Skenario; dan 2) Penerapan Skenario. 3.1. Perancangan

Lebih terperinci

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT Ismail Setiawan 1) 1) Magister Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI PENGGUNAAN PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI Entin Martiana S.Kom,M.Kom, Nur Rosyid Mubtada i S. Kom, Edi Purnomo Jurusan Teknik Informatika

Lebih terperinci

PRISMA WAHYU WULAN DARA

PRISMA WAHYU WULAN DARA JURNAL Klasterisasi Daerah Pemasok Sampah Terbesar Ke TPA Klotok Di Kota Kediri Dengan Metode K-means Clustering Regional Clustering Largest Suppliers of Waste Landfill Klotok In the Town of Kediri With

Lebih terperinci

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

Descriptor Clustering SURF for Bag of Visual Words Representation in Fingerprint Images Using K-MEANS and Hierarchical Agglomerative Clustering

Descriptor Clustering SURF for Bag of Visual Words Representation in Fingerprint Images Using K-MEANS and Hierarchical Agglomerative Clustering 2015 International Conference on Information, Communication Technology and System Descriptor Clustering SURF for Bag of Visual Words Representation in Fingerprint Images Using K-MEANS and Hierarchical

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Penelitian Terdahulu Penelitian-penelitian terdahulu yang berhubungan dengan clustering yaitu penelitian yang dilakukan oleh Rismawan (2008). Pada penelitian ini, dibangun suatu

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Data menjadi sesuatu yang sangat berharga saat ini. Tidak hanya badan pemerintah saja, perusahaan-perusahaan saat ini pun sangat membutuhkan informasi dari data yang

Lebih terperinci

PENERAPAN K-MEANS CLUSTER UNTUK PENGARUH KECERDASAN EMOSI DAN STRES TERHADAP PRESTASI BELAJAR MAHASISWA

PENERAPAN K-MEANS CLUSTER UNTUK PENGARUH KECERDASAN EMOSI DAN STRES TERHADAP PRESTASI BELAJAR MAHASISWA PENERAPAN K-MEANS CLUSTER UNTUK PENGARUH KECERDASAN EMOSI DAN STRES TERHADAP PRESTASI BELAJAR MAHASISWA Finki Dona Marleny 1), Husnul Ma ad Junaidi 2), Mambang 3) 1), 2) STMIK INDONESIA Banjarmasin 3)

Lebih terperinci

ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG

ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG Oleh: BAGUS YAYANG FATKHURRAHMAN 13.1.03.02.0180 Dibimbing oleh : 1. Ahmad

Lebih terperinci

dengan Algoritma K Means

dengan Algoritma K Means K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

BAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek

BAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek 1 BAB I PENDAHULUAN 1.1. Latar Belakang Perguruan tinggi yang baik dipengaruhi oleh kualitas mahasiswa di dalamnya. Mahasiswa merupakan objek pembelajaran bagi perguruan tinggi sehingga jika prestasi mahasiswa

Lebih terperinci

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Sistem Informasi Pengertian Sistem Informasi pada dasarnya merupakan hasil dari dua arti, yakni sistem dan informasi yang digabungkan. Berikut definisi sistem menurut para ahli

Lebih terperinci

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING Moh Ahsan Universitas Kanjuruhan Malang ahsan@unikama.ac.id ABSTRAK. Universitas Kanjuruhan Malang

Lebih terperinci

Kluster Bag-of-Word Menggunakan Weka

Kluster Bag-of-Word Menggunakan Weka Bag-of-Word Menggunakan Weka Tari Mardiana, Rudy Dwi Nyoto 2 Jurusan Teknik Elektro dan Teknologi Informasi, UGM Yogyakarta 2 Program Studi Teknik Informatika, Universitas Tanjungpura - Pontianak e-mail:

Lebih terperinci

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas

Lebih terperinci

ALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK

ALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK ALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK Wiwit Agus Triyanto Fakultas Teknik, Program Studi Sistem Informasi Universitas Muria Kudus Email: at.wiwit@yahoo.co.id ABSTRAK Strategi pemasaran

Lebih terperinci

Penerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis

Penerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis Scientific Journal of Informatics Vol., No., November 015 p-issn 407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 460-0040 Penerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis

Lebih terperinci

CLUSTERING MOTIVASI BELAJAR SISWA ELEARNING BERBASIS ALGORITMA K-MEANS

CLUSTERING MOTIVASI BELAJAR SISWA ELEARNING BERBASIS ALGORITMA K-MEANS Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2017, pp. 379~383 379 CLUSTERING MOTIVASI BELAJAR SISWA ELEARNING BERBASIS ALGORITMA K-MEANS Sismadi AMIK BSI JAKARTA e-mail: sismadi.ssm@bsi.ac.id

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

KLASTERING DATA MENGGUNAKAN ALGORITMA DYNAMIC K-MEANS

KLASTERING DATA MENGGUNAKAN ALGORITMA DYNAMIC K-MEANS VOL. I NO. AGUSTUS 0 JURNAL KLASTERING DATA MENGGUNAKAN ALGORITMA DYNAMIC K-MEANS Widiarina Abstract The disadvantage of the K-means algorithm is sensitive to have problems determining the initial partition

Lebih terperinci

1. PENDAHULUAN. Kata Kunci: Data Mining, Clustering, Fuzzy C-Means

1. PENDAHULUAN. Kata Kunci: Data Mining, Clustering, Fuzzy C-Means CLUSTERING BIDANG PEKERJAAN BERDASARKAN PEMETAAN MATA KULIAH MENGGUNAKAN ALGORITMA FUZZY C-MEANS PADA FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO SEMARANG Taufiq Ramadhan Ashari 1, Ruri Suko Basuki

Lebih terperinci

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro

Lebih terperinci

Bab 2 Tinjauan Pustaka

Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Adapun penelitian terdahulu yang berkaitan dalam penelitian ini berjudul Penentuan Wilayah Usaha Pertambangan Menggunakan Metode Fuzzy K-Mean Clustering

Lebih terperinci

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Motivasi dalam penelitian ini berawal dari laporan (ID-SIRTII/CC, 2014) terkait serangan yang sering terjadi pada jaringan internet khususnya Indonesia, serangan

Lebih terperinci

PERANCANGAN TEXT MINING PENGELOMPOKKAN PENELITIAN DOSEN MENGGUNAKAN METODE SHARED NEAREST NEIGHBOR DENGAN EUCLIDEAN SIMILARITY

PERANCANGAN TEXT MINING PENGELOMPOKKAN PENELITIAN DOSEN MENGGUNAKAN METODE SHARED NEAREST NEIGHBOR DENGAN EUCLIDEAN SIMILARITY PERANCANGAN TEXT MINING PENGELOMPOKKAN PENELITIAN DOSEN MENGGUNAKAN METODE SHARED NEAREST NEIGHBOR DENGAN EUCLIDEAN SIMILARITY Mushlihudin 1*, Lisna Zahrotun 2 1, 2 Program Studi Teknik Informatika, Fakultas

Lebih terperinci

KARAKTERISTIK WAKTU TERJADI HOTSPOT MENGGUNAKAN K-MEANS CLUSTERING DI WILAYAH KALIMANTAN SELATAN. Nur Armina Rahmah

KARAKTERISTIK WAKTU TERJADI HOTSPOT MENGGUNAKAN K-MEANS CLUSTERING DI WILAYAH KALIMANTAN SELATAN. Nur Armina Rahmah Technologia Vol 8, No.1, Januari Maret 2017 20 KARAKTERISTIK WAKTU TERJADI HOTSPOT MENGGUNAKAN K-MEANS CLUSTERING DI WILAYAH KALIMANTAN SELATAN Nur Armina Rahmah (nur.armina@fti.uniska-bjm.ac.id) ABSTRAK

Lebih terperinci

SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING

SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING Ati Suci Dian Martha, S.Kom., M.T. 1, Dena Jatnika Kusumah 1, Program Studi Sistem Informasi, STMIK LPKIA, Bandung Jln. Soekarno Hatta No.

Lebih terperinci

ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING

ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING Ni Putu Eka Merliana, Ernawati, Alb. Joko Santoso Program Studi Magister Teknik Informatika, Fakultas Teknik Industri, Universitas

Lebih terperinci

ARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL

ARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL ARTIKEL PENERAPAN METODE K-MEANS DALAM PROSES CLUSTERING PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL Oleh: IRFAN DWI NURCAHYO BUDIARTO 13.1.03.02.0117 Dibimbing oleh : 1. Hermin Istiasih, ST.,M.M.,M.T.

Lebih terperinci

SISTEM PEMBAGIAN KELAS KULIAH MAHASISWA DENGAN METODE K-MEANS DAN K-NEAREST NEIGHBORS UNTUK MENINGKATKAN KUALITAS PEMBELAJARAN

SISTEM PEMBAGIAN KELAS KULIAH MAHASISWA DENGAN METODE K-MEANS DAN K-NEAREST NEIGHBORS UNTUK MENINGKATKAN KUALITAS PEMBELAJARAN Pradnyana dan Permana Sistem Pembagian Kelas Kuliah Mahasiswa dengan Metode K-means dan K-Nearest Neighbors untuk Meningkatkan Kualitas Pembelajaran SISTEM PEMBAGIAN KELAS KULIAH MAHASISWA DENGAN METODE

Lebih terperinci

METODE NON HIERARCHY ALGORITMA K-MEANS DALAM MENGELOMPOKKAN TINGKAT KELARISAN BARANG (STUDI KASUS : KOPERASI KELUARGA BESAR SEMEN PADANG)

METODE NON HIERARCHY ALGORITMA K-MEANS DALAM MENGELOMPOKKAN TINGKAT KELARISAN BARANG (STUDI KASUS : KOPERASI KELUARGA BESAR SEMEN PADANG) METODE NON HIERARCHY ALGORITMA K-MEANS DALAM MENGELOMPOKKAN TINGKAT KELARISAN BARANG (STUDI KASUS : KOPERASI KELUARGA BESAR SEMEN PADANG) Fakultas Ilmu Komputer, Universitas Putra Indonesia YPTK Padang

Lebih terperinci

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan

Lebih terperinci

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Siti Mutrofin 1, Arrie Kurniawardhani 2, Abidatul Izzah 3, Mukhamad Masrur 4 Universitas Pesantren Tinggi Darul Ulum

Lebih terperinci

PENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN MENGGUNAKAN METODE KOHONEN

PENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN MENGGUNAKAN METODE KOHONEN Prosiding Seminar Nasional Matematika dan Terapannya 016 p-issn : 550-0384; e-issn : 550-039 PENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN 009-013 MENGGUNAKAN

Lebih terperinci

LAPORAN KEGIATAN PENELITIAN

LAPORAN KEGIATAN PENELITIAN LAPORAN KEGIATAN PENELITIAN Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik Dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang Oleh : Asroni,

Lebih terperinci

Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen

Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen Dyah Herawatie Prodi Sistem Informasi Fakultas Sains dan Teknologi Universitas Airlangga Surabaya, Indonesia dy4h_h3r4@yahoo.com

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan

Lebih terperinci

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA Artikel Skripsi PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA SKRIPSI Diajukan Untuk Memenuhi Sebagian

Lebih terperinci

Lingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan

Lingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan sehingga dapat diproses dengan SOM. Pada tahap seleksi data, dipilih data perkembangan anak berdasarkan kategori dan rentang usianya. Kategori perkembangan tersebut merupakan perkembangan kognitif, motorik

Lebih terperinci