METODE MANHATTAN, EUCLIDEAN DAN CHEBYSHEV PADA ALGORITMA K-MEANS UNTUK PENGELOMPOKAN STATUS DESA
|
|
- Yanti Rachman
- 6 tahun lalu
- Tontonan:
Transkripsi
1 METODE MANHATTAN, EUCLIDEAN DAN CHEBYSHEV PADA ALGORITMA K-MEANS UNTUK PENGELOMPOKAN STATUS DESA Yoga Religia 1 Program Magister Teknik Informatika, Fakultas Ilmu Komputer 1 Universitas Dian Nuswantoro, Semarang, Indonesia Jl. Imam Bonjol 207 Semarang Telp : (+6224) , Fax : (+6224) religia19@gmail.com 1 ABSTRAK Kementerian Desa, Pembangunan Daerah Tertinggal dan Transmigrasi (Kementerian Desa PDTT) merupakan kementerian dalam Pemerintahan Indonesia yang membidangi urusan pembangunan desa dan kawasan perdesaan, pemberdayaan masyarakat desa, percepatan pembangunan daerah tertinggal, dan transmigrasi. Data Potensi Desa tahun 2014 (Podes 2014) merupakan data yang dikeluarkan oleh Badan Pusat Statistik yang bekerjasama dengan Kementerian Desa PDTT dalam bentuk unsupervised dan terdiri dari Data Podes 2014 dibuat berdasarkan tingkat perkembangan desa (village specific) di Indonesia dengan menjadikan desa sebagai unit analisis. Data mining merupakan suatu metode yang dapat digunakan untuk menelompokkan objek dalam sebuah data kedalam kelas-kelas yang memiliki kriteria yang sama (clustering). Salahsatu algoritma yang dapat digunakan untuk proses clustering yaitu algoritma k-means. Pengelompokan data menggunakan k- means dilakukan dengan cara menghitung jarak terdekat dari suatu data ke sebuah titik centroid. Dalam penelitian ini akan dilakukan perbandingan metode perhitungan jarak pada k-means antara Manhattan, Euclidean dan Chebychev. Pengujian akan dilakukan menggunakan waktu eksekusi dan davies bouldin index. Dari pengujian yang sudah dilakukan, metode perhitungan jarak Chebyshev memiliki akumulasi waktu paling efisien dibandingkan Manhattan dan Euclidean, sedangkan metode Euclidean memiliki nilai Index Davies paling optimal dibanding metode Manhattan dan Chebyshev. Kata kunci: Pembangunan Desa, k-means, Manhattan, Euclidean, Chebychev I. PENDAHULUAN Negara Indonesia adalah Negara Kesatuan yang berbentuk Republik dan Negara hukum, dimana kedaulatannya berada ditangan rakyat yang dilaksanakan menurut Undang-Undang Dasar. Negara Kesatuan Republik Indonesia dibagi atas daerah-daerah provinsi, dimana daerah provinsi dibagi atas kabupaten dan Kota [1]. Setiap daerah kabupaten di Indonesia terdiri dari desa-desa yang mempunyai hak asal usul, hak tradisional dalam mengatur dan mengurus kepentingan masyarakat setempat dan berperan mewujudkan cita-cita kemerdekaan. Dalam perjalanan ketatanegaraan Republik Indonesia, desa telah berkembang dalam berbagai bentuk sehingga perlu dilindungi dan diberdayakan agar menjadi kuat, maju, mandiri, dan demokratis. Untuk melindungi dan memberdayakan desa maka dibentuklah otonomi desa [2]. Dengan adanya otonomi desa dan adanya Peraturan Presiden Nomor 165 Tahun 2014 tentang Penataan Tugas dan Fungsi Kabinet Kerja, maka dibentuklah Kementerian Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia. 1 Karya Ilmiah Data Mining, Agustus 2016
2 Kementerian Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi (Kementerian Desa PDTT) adalah kementerian dalam Pemerintahan Indonesia yang dipimpin oleh Menteri dan bertanggung jawab kepada Presiden. Kementerian Desa PDTT membidangi urusan pembangunan desa dan kawasan perdesaan, pemberdayaan masyarakat desa, percepatan pembangunan daerah tertinggal, dan transmigrasi [3]. Rencana Pembangunan Jangka Menengah Nasional (RPJMN) Kementerian Desa PDTT tahun merupakan dokumen strategis rencana pembangunan yang harus dilakukan oleh pemerintah lima tahun kedepan. Dokumen RPJMN ini memuat sasaran pembangunan desa yang harus dicapai yaitu mengurangi jumlah Desa Tertinggal sampai desa dan meningkatkan jumlah Desa Mandiri sedikitnya desa di tahun 2019 [4]. Dalam rangka pembangunan desa, Pemerintah dan Pemerintah Daerah wajib mengembangkan sistem informasi desa dan pembangunan kawasan perdesaan [5]. Dalam mengembangkan sistem informasi desa dibutuhkan tersedianya data tentang desa. Kementerian Desa PDTT bekerjasama dengan Badan Perencanaan Pembangunan Nasional dan Badan Pusat Statistik mengeluarkan data Potensi Desa tahun 2014 (Podes 2014) yang terdiri dari desa dan memiliki 42 indikator/attribute dependent tanpa label status desa. Data Podes 2014 merupakan cara pengukuran yang disusun berdasarkan tingkat perkembangan desa di Indonesia yang menjadikan desa sebagai unit analisis dengan mengacu pada Undang Undang Nomor 6 Tahun 2014 tentang desa, yang dimaksudkan untuk memotret tingkat perkembangan desa di Indonesia dan dapat digunakan sebagai acuan untuk penyusunan perencanaan kebijakan dan pengawasan pembangunan desa [6]. Dengan adanya data Podes 2014 dapat dijadikan sebagai acuan untuk penyusunan perencanaan kebijakan. Berdasarkan Peraturan Kementerian Desa PDTT nomor 2 tahun 2016, status desa dikelompokkan kedalam 5 status yaitu Desa Mandiri, Desa Maju, Desa Berkembang, Desa Tertinggal dan Desa Sangat Tertinggal [7]. Belum adanya pengelompokkan data Potensi Desa tahun 2014 kedalam 5 status desa di Indonesia dan pengelompokan kedalam 5 satus desa yang ada saat ini adalah menggunakan data Indek Desa Membangun yang dikelompokkan perdaerah-daerah di Indonesia. Menjadikan pengelompokan status desa di Indonesia menggunakan data Potensi Desa Tahun 2014 menjadi dibutuhkan. Dalam teknologi informasi, data merupakan bagian penting yang tidak bisa dipisahkan dari pengambilan informasi. Informasi terkait dengan status desa seperti tersebut diatas dapat diperoleh menggunakan proses data mining terhadap data Podes Data mining merupakan rangkaian kegiatan yang digunakan untuk menemukan pola-pola baru, tersembunyi atau tidak terduga yang terdapat didalam data. Istilah data mining sering dianggap sebagai sinonim dari knowledge discovery from data (KDD) yaitu penemuan pengetahuan dari data yang berfokus pada tujuan proses mining [8]. Data mining dapat digunakan untuk melakukan clustering, klasifikasi dan asosiasi. Clustering/ pengelompokan yaitu proses mengelompokkan data yang dilakukan dengan menemukan kesamaan karakteristik antara data yang sesuai dengan kelompok kelas tertentu [9]. Secara sederhana, clustering dapat digunakan untuk menganalisis sekumpulan data dan menghasilkan satu set pengelompokan aturan yang dapat digunakan untuk mengelompokkan data masa depan. Pada dunia nyata terkadang data tidak hanya dikelompokkan kedalam status biner (kelas biner), akan tetapi dibutuhkan juga untuk dikelompokkan kedalam multi status (multi-class). Dalam kasus data-set multi-class, pengelompokan akan menjadi lebih sulit 2 Karya Ilmiah Data Mining, Agustus 2016
3 dibandingkan kasus kelas biner. Ada beberapa algoritma yang dapat digunakan untuk pengelompokan multi-class. Pernah dilakukan suatu penelitian tentang penggunaan algoritma k-means untuk pengelompokan multi-class yang menunjukkan bahwa algoritma k-means memberikan hasil yang efektif untuk pengelompokan data-set multiclass [10]. Algoritma k-means merupakan algoritma pengelompokan iteraktif yang melakukan partisi data-set kedalam jumlah K cluster yang sudah di tentukan sejak awal. Dalam penelitian yang lain pernah dibandingkan clustering berbasis partisi, clustering berbasis hirarki dan clustering berbasis density yang mengungkapkan bahwa algoritma k-means merupakan algoritma berbasis partisi yang memberikan performa lebih baik, mampu membagi cluster dengan baik dan unggul untuk data yang berukuran besar/banyak dibandingkan algoritma clustering berbasis hirarki dan density [11] [12]. Selain itu beberapa penelitian yang lain juga menyebutkan bahwa clustering menggunakan algoritma k-means lebih cepat daripada clustering dengan algoritma lain dan juga menghasilkan cluster yang berkualitas ketika menggunakan data-set berukuran besar [13] [14] [15] [16]. Dalam melakukan pengelompokan, algoritma k-means membutuhkan metode perhitungan jarak untuk menghitung jarak terdekat antara suatu instance data ke sebuah titik centroid. Perhitungan jarak pada algoritma k-means dapat menggunakan Manhattan, Euclidean dan Chebychev. Pernah dilakukan penelitian tentang perbandingan metode perhitungan jarak Manhattan dan Euclidean pada algoritma k-means untuk mengetahui jumlah squar error, data yang digunakan dalam penelitian tersebut adalah Bank data-set yang diuji menggunakan tool WEKA [17]. Dari hasil pengujian menunjukkan bahwa metode perhitungan jarak Manhattan lebih baik dari pada metode Euclidean [17]. Pada penelitian lain dilakukan perbandingan 3 metode perhitungan jarak pada algoritma k-means yaitu Manhattan, Euclidean dan Minkowski untuk menemukan metode perhitungan jarak yang paling baik, penelitian tersebut dilakukan dengan membandingkan hasil dari penelitian sebelumnya yang mana disimpulkan bahwa metode perhitungan jarak Euclidean lebih baik dari pada metode Manhattan dan Minkowski [18]. Pernah dilakukan juga penelitian yang lain tentang perbandingan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev pada algoritma k-means untuk mengetahui akurasi dan mean absolute error [19]. Dari pengujian yang dilakukan menggunakan flower data-set diperoleh hasil bahwa metode perhitungan jarak Chebyshev lebih baik dari metode Manhattan dan Euclidean [19]. Dari penelitian-penelitian sebelumnya diketahui bahwa metode perhitungan jarak Manhattan, Euclidean dan Chebyshev saling unggul antara satu dengan yang lain tergantung data-set yang digunakan. Berdasarkan pertimbangan yang sudah disebutkan diatas, pada penelitian ini akan dilakukan pengelompokan status desa di Indonesia menggunakan algoritma k-means kedalam 5 status desa, serta membandingkan metode perhitungan jarak manakah yang paling efektif untuk pengelompokan data Podes II. TINJAUAN PUSTAKA Algoritma k-means merupakan algoritma pengelompokan iteraktif yang melakukan partisi data-set kedalam jumlah K cluster yang sudah di tentukan sejak awal. Dalam penelitian yang lain pernah dibandingkan clustering berbasis partisi, clustering berbasis hirarki dan clustering berbasis density yang mengungkapkan bahwa algoritma k-means merupakan algoritma berbasis partisi yang memberikan performa lebih baik, mampu membagi cluster dengan baik dan unggul untuk data yang berukuran besar/banyak 3 Karya Ilmiah Data Mining, Agustus 2016
4 dibandingkan algoritma clustering berbasis hirarki dan density [11] [12]. Selain itu beberapa penelitian yang lain juga menyebutkan bahwa clustering menggunakan algoritma k-means lebih cepat daripada clustering dengan algoritma lain dan juga menghasilkan cluster yang berkualitas ketika menggunakan data-set berukuran besar [13] [14] [15] [16]. Dalam melakukan pengelompokan, algoritma k-means membutuhkan metode perhitungan jarak untuk menghitung jarak terdekat antara suatu instance data ke sebuah titik centroid. Perhitungan jarak pada algoritma k-means dapat menggunakan Manhattan, Euclidean dan Chebychev. Pernah dilakukan penelitian tentang perbandingan metode perhitungan jarak Manhattan dan Euclidean pada algoritma k-means untuk mengetahui jumlah squar error, data yang digunakan dalam penelitian tersebut adalah Bank data-set yang diuji menggunakan tool WEKA [17]. Dari hasil pengujian menunjukkan bahwa metode perhitungan jarak Manhattan lebih baik dari pada metode Euclidean [17]. Pada penelitian lain dilakukan perbandingan 3 metode perhitungan jarak pada algoritma k-means yaitu Manhattan, Euclidean dan Minkowski untuk menemukan metode perhitungan jarak yang paling baik, penelitian tersebut dilakukan dengan membandingkan hasil dari penelitian sebelumnya yang mana disimpulkan bahwa metode perhitungan jarak Euclidean lebih baik dari pada metode Manhattan dan Minkowski [18]. Pernah dilakukan juga penelitian yang lain tentang perbandingan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev pada algoritma k-means untuk mengetahui akurasi dan mean absolute error [19]. Dari pengujian yang dilakukanmenggunakan flower data-set diperoleh hasil bahwa metode perhitungan jarak Chebyshev lebih baik dari metode Manhattan dan Euclidean [19]. Dari penelitian-penelitian sebelumnya yang lain diketahui bahwa metode perhitungan jarak Manhattan, Euclidean dan Chebyshev saling unggul antara satu dengan yang lain tergantung data-set yang digunakan [17] [18] [19] [20] [21] [22] [23]. Sehingga berdasarkan pertimbangan literature review yang ada, dalam penelitian ini akan dilakukan perbandingan metode perhitungan jarak manakah yang paling efektif untuk pengelompokan data Podes 2014 untuk memperoleh status desa di Indonesia Data Mining Data mining merupakan salah satu bidang paling penting dalam penelitian yang bertujuan untuk memperoleh informasi dari data set. Data mining mulai ada sejak 1990-an sebagai cara yang efektif untuk mengambil pola dan informasi yang sebelumnya tidak diketahui dari suatu data set [24]. Teknik data mining digunakan untuk menemukan hubungan antara data untuk melakukan pengklasifikasian yang memprediksikan nilainilai dari beberapa variabel (klasifikasi), atau untuk membagi data yang diketahui menjadi kelompok-kelompok yang mempunyai kesamaan karakteristik (clustering). Clustering merupakan bagian dari pembelajaran unsupervised yang digunakan sebagai alat yang efektif dalam data mining [25]. Clustering tidak memiliki atribut yang dapat digunakan untuk memandu proses pembelajaran (tidak memiliki label), sehingga seluruh atribut yang dimiliki diperlakukan sama. Metode clustering memungkinkan untuk mengungkapkan hubungan dan struktrur yang sebelumnya tidak jelas dari data-set. Tujuan dari clustering adalah untuk mengelompokkan data yang memiliki kesamaan karakteristik kedalam kelompok yang sama dan data yang berbeda karakteristik kedalam kelompok yang lain Algoritma K-Means K-means adalah salah salah satu algoritma clustering yang bertujuan untuk membagi data 4 Karya Ilmiah Data Mining, Agustus 2016
5 menjadi beberapa kelompok dari masukan berupa data tanpa label kelas. K-means merupakan metode partisi yang paling populer untuk melakukan clustering. Algoritma k- means pertama kali diperkenalkan oleh MacQueen pada tahun Pada algoritma k- means, setiap cluster diwakili oleh nilai ratarata dari objek dalam cluster. Algortma k- means terdiri dari 2 tahap yaitu [26]: Tahap Pertama: Memilih nilai centroid k secara acak, dimana nilai k sudah didefinisikan terlebih dahulu. Tahap kedua: Setiap objek didalam dataset diasosiasikan dengan centroid terdekat. Pada pengukuran jarak antara setiap objek data dan cluster centroid dapat menggunakan perhitungan manhattan distance, euclidean distance, dan chebyshev distance. Manhattan distance atau dikenal juga dengan City block distance digunakan untuk menghitung jarak dengan tujuan untuk mendapatkan jarak dari satu titik data ke titik data yang lain. Manhattan distance mencerminkan jarak antar titik di jalan perkotaan dalam 1 blok [27]. Persamaan matematik dari manhattan distance yaitu: D(x, y) = n i=1 x i y j 2.1 Dari persamaan 2.1, x = (x 1, x 2, x 3,, x n ) dan y = (y 1, y 2, y 3,, y n ). Perhitungan manhattan distance adalah dengan menjumlahkan hasil absolut dari pengurangan antar titik. Dalam matematika, Euclidean distance digunakan untuk megukur antara dua titik dalam satu dimensi yang memberikan hasil seperti rumus Pythagoras [28]. Persamaan Euclidean distance yaitu [27]: D(x, y) = (x ik y jk ) n k= Dari persamaan 2.2, x = (x i1, x i2, x i3,, x in ) dan y = (y j1, y j2, y j3,, y jn ). Euclidean distance diperoleh dari jumlah kuadrat antar titik yang diakar kuadratkan. Nilai jarak maksimum atau disebut juga Chebychev distance merupakan perhitungan jarak yang menghitung besarnya hasil absolut dari perbedaan antara sepasang objek [27]. Chebychev distance dapat dihitung menggunakan persamaan: D(x, y) = max ( x i y i ) 2.3 Metrik dalam chebychev distance, didefinisikan didalam ruang vektor yang mana jarak antara dua vektor yang memiliki perbedaan terbesar disepanjang dimensi koordinatnya [28] Davies Bouldin Index Davies Bouldin Index (DBI) merupakan cara validasi cluster yang dibuat oleh D.L. Davies. DBI adalah fungsi rasio dari jumlah distribusi didalam cluster untuk pemisahan antar cluster [29]. Pengukuran menggunakan DBI bertujuan untuk memaksimalkan jarak inter-cluster. Dalam penelitian ini, DBI digunakan untuk melakukan validasi data pada setiap cluster. DBI dapat dihitung menggunakan persamaan: max R i = j=1 k,i j R ij 2.4 var(x) = 1 N N 1 (x i x ) 2 Keterangan: R Var x x i=1 R ij i j = var(c i ) + var(c j ) c i c j k DB = 1 k R i i=1 : jarak antar cluster : variance dari data : data ke-i : rata-rata dari tiap cluster DB : validasi Davies Bouldin Dengan menggunakan Davies Bouldin Index suatu cluster akan dianggap memiliki skema clustering yang optimal jika memiliki Index Davies Bouldin minimal. 5 Karya Ilmiah Data Mining, Agustus 2016
6 2.4. Kerangka Pemikiran dan Hipotesis Saat ini ada banyak metode perhitungan jarak yang dapat digunakan. Dari metodemetode yang ada secara umum dikategorikan kedamam 2 measure type yaitu nominal measures dan numerical measures. Pada nominal measures dapat menggunakan perhitungan jarak Nominal distance, Dice similarity, Jaccar similarity, Simple maching similarity, dan lain-lain. Sedangkan pada numerical measures dapat menggunakan perhitungan jarak Euclidean distance, Manhattan distance, Chebyshev disatance. Apabila dilihat dari tipe data Podes 2014, data tersebut adalah data numerical. Sehingga dalam penelitian ini akan dibandingkan metode perhitungan jarak Euclidean distance, Manhattan distance, Chebyshev distance pada algoritma k-means yang paling baik untuk mengelompokkan data Podes Dalam penggunaan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev untuk pengelompokan data Podes 2014, penulis memiliki hipotesis mengenai metode perhitungan jarak yang paling efektif digunakan. Apabila dilihat dari kemangkusan metode diperoleh Big O dari setiap metode sebagai berikut: a) Manhattan distance memiliki persamaan D(x, y) = n i=1 x i y j Karena persamaan dari manhattan distance adalah berupa penjumlahan antar titik saja, dapat diketahui bahwa Big O dari manhattan adalah O(n). b) Euclidean distance memiliki persamaan D(x, y) = (x ik y jk ) n k=1 Untuk Big O dari akar kuadrat adalah O(sqrt(n)). Untuk Big O dari kuadrat adalah O(n 2 ). Untuk Big O dari penjumlahan adalah O(n). Sehingga dapat diketahui bahwa Big O dari Euclidean adalah O(sqrt(n 2 )). 2 c) Chebyshev distance memiliki persamaan D(x, y) = max ( x i y i ) Karena persamaan dari chebyshev distance adalah mengambil 1 nilai tertinggi antar titik saja, dapat diketahui bahwa Big O dari chebyshev adalah O(1) Dari Big O pada masing-masing metode, penulis berhipotesis bahwa metode perhitungan jarak yang paling efektif dalam hal waktu eksekusi yang lebih singkat untuk diterapkan pada penelitian ini adalah Chebyshev distance. Selain dilihat dari segi waktu, untuk memastikan performance suatu metode dapat menggunakan evaluasi internal dan evaluasi eksternal. Evaluasi internal atau disebut juga metrik unsupervised melakukan evaluasi dengan menggunakan informasi apa adanya yang ada didalam data-set. Sedangkan untuk evaluasi eksternal atau disebut juga metrik supervised, evaluasi dilakukan menggunakan informasi yang tidak disediakan didalam dataset. Karena dalam penelitian ini data dan metode yang digunakan adalah dalam bentuk unsupervised learning, maka evaluasi yang digunakan adalah evaluasi internal. Davies Bouldin Indexs (DBI) adalah salah satu metrik internal yang digunakan untuk melakukan evaluasi cluster untuk pada pengelompokan yang berbasis partisi. DBI digunakan untuk mengukur kohesi dan separasi pada cluster. Kohesi merupakan jumlah dari kedekatan data terhadap centroid yang diikutinya (ditunjukkan pada gambar 2.1), sedangkan Separasi merupakan jarak kedekatan antar cluster (ditunjukkan pada gambar 2.2). Gambar 2.1. Kohesi 6 Karya Ilmiah Data Mining, Agustus 2016
7 Sedangkan apabila jarak antar titik ditentukan dengan Euclidean distance: d(p,q) = (2 4) 2 + (1 5) 2 = 4.47 Gambar 2.2. Separasi Dengan mengguakan Davies Bouldin Indexs penulis memiliki hepotesis bahwa metode perhitungan jarak Euclidean memiliki indek bouldin yang paling optimal dibandingkan Manhattan dan Chebyshev. Hal itu didasari dengan 2 hal a) Euclidean dibandingkan Manhattan Milsalkan ada titik 2 dimensi yaitu p(2.1) dan q(4.5). Dari dua titik tersebut hendak dicari jarak terdekatnya. Gambar 2.3. Titik Dua Dimensi Apabila jarak antar titik ditentukan dengan Manhattan distance: d(p,q) = = 6 Sedangkan apabila jarak antar titik ditentukan dengan Euclidean distance: d(p,q) = (2 4) 2 + (1 5) 2 = 4.47 Dengan perhitungan dua dimensi dapat dilihat bahwa metode perhitungan jarak Euclidean menghasilkan jarak antar titik lebih dekat dibandingkan Manhattan. b) Euclidean dibandingkan Chebyshev Milsalkan ada titik 2 dimensi yaitu p(2.1) dan q(4.5) seperti yang ditunjukkan pada gambar 2.4. Apabila jarak antar titik ditentukan dengan Chebyshev distance: d(p,q) = max ( 2-4, 1-5 ) = 4 Memang apabila dibandingkan, Chebyshev memberikan jarak yang paling dekat. Akan tetapi Chebyshev hanya berfokus pada dimensi yang menghasilkan jarak maksimal, sedangkan dalam sebuah data setiap dimensi memiliki keterkaitan dengan dimensi yang lain. Sehingga apabila metode Chebyshev diterapkan untuk pengelompokan, penulis berhipotesis bahwa Chebyshev akan menghasilkan tingkan kohesi dan separasi yang rendah. III. METODE PENELITIAN Dalam penelitian ini metode yang digunakan adalah metode data mining dengan memakai teknik clustering/pengelompokan menggunakan algoritma k-means dengan perhitungan jarak Manhattan, Euclidean dan Chebyshev. Kemudian dari metode tersebut akan digunakan untuk mengelompokkan status desa berdasarkan data Potensi Desa tahun 2014 (Podes 2014). Dengan menggunakan algoritma k-means, data Podes 2014 akan dibagi kedalam 5 cluster yaitu cluster 0, cluster 1, cluster 2, cluster 3 dan cluster 4. Penentuan 5 cluster ini didasarkan pada Peraturan Menteri Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia nomor 2 tahun 2016 tentang Indek Desa Membangun, yang menyebutkan bahwa status desa dikelompokkan dalam 5 status desa. Adapun langkah pengujian yang digunakan dalam penelitian ini dapat dilihat pada gambar Karya Ilmiah Data Mining, Agustus 2016
8 Gambar 3.1. Langkah Pengujian Pada gambar 3.1 menunjukkan bahwa langkah pengujian diawali dari input berupa data Podes 2014 yang belum dikelompokkan kedalam status desa. Kemudian dari data input akan diproses menggunakan algoritma k- means. Adapun didalam algoritma k-means akan menggunakan 3 metode perhitungan jarak untuk menentukan centroid dari setiap cluser. Metode perhitungan jarak yang digunakan yaitu Manhattan, Euclidean dan Chebyshev. Dari setiap pengelompokan akan menghasilkan 5 cluster status desa, kemudian hasil akan di uji menggunakan Davies Bouldin Index dan waktu eksekusi untuk mengetahui metode perhitungan jarak manakah yang paling baik. dengan mengitung jumlah dari centroid untuk setiap cluster, yang ditulis dengan persamaan: Status desa = CI 1, CI 2,, CI Dari persamaan 4.4, CI merupakan centroid dari setiap indikator dan setiap cluster memiliki 42 indikator. Penentuan status desa akan diurutkan berdasarkan nilai penjumlahan centroid dari setiap indikator pada masingmasing cluster, yang mana nilai penjumlahan terendah akan diinisialisasikan sebagai status Desa Sangat Tertinggal dan nilai penjumlahan tertinggi akan diinisialisasikan sebagai status Desa Mandiri. Adapun urutan penamaan cluster dari yang nilai terendah sampai tertinggi yaitu Desa Sangat Tertinggal, Desa Tertinggal, Desa Berkembang, Desa Berkembang, Desa Maju, Desa Mandiri. Adapun nilai centroid dan jumlah cluster dari pengujian dari metode perhitungan jarak Manhattan, Euclidean dan Chebyshev dengan algoritma k-means yang telah dilakukan dapat dilihat pada tabel 4.1, 4.2 dan 4.3. Tabel 4.1. Status dan Jumlah Desa dengan Menggunakan Manhattan Tabel 4.2. Status dan Jumlah Desa dengan Menggunakan Euclidean IV. ANALISA PENGUJIAN Dari pengujian yang telah dilakukan diperoleh nilai centroid dan jumlah cluster yang berbeda untuk setiap metode perhitungan jarak yang digunakan. Pada data Potensi Desa tahun 2014, setiap atribut/ indikator mempunyai nilai 0 s/d 5, yang mana nilai 0 adalah nilai terendah sedangkan nilai 5 adalah nilai tertinggi. Sehingga pada penelitian ini untuk menentukan status desa dilakukan 8 Karya Ilmiah Data Mining, Agustus 2016
9 Tabel 4.3. Status dan Jumlah Desa dengan Menggunakan Chebyshev 4.1. Pengujian Waktu Eksekusi Akumulasi waktu dilakukan dengan melakukan eksekusi sebanyak 5 kali untuk setiap metode perhitungan jarak yang digunakan. Dari 5 kali eksekusi tersebut kemudian akan dirata-rata untuk memperoleh waktu eksekusi paling efisien dari setiap metode perhitungan jarak. Dari pengeujian yang telah dilakukan diperoleh lama waktu eksekusi yang berbeda, adapun lama waktu eksekusi dari pengujian dari metode perhitungan jarak Manhattan, Euclidean dan Chebyshev yang telah dilakukan dapat dilihat pada gambar 4.1. Detik Manhattan Euclidean Chebyshev Gambar 4.1. Lama Waktu Eksekusi Pada gambar 4.1 dapat dilihat bahwa waktu eksekusi dari metode Manhattan distance untuk pengujian 1 sampai pengujian 5 secara berturut-turut yaitu 69 detik, 66 detik, 65 detik, 66 detik dan 65 detik, sehingga apabila diambil rata-rata waktu eksekusi dari Manhattan distance adalah 66.2 detik. Sedangkan waktu eksekusi dari metode Euclidean distance untuk pengujian 1 sampai pengujian 5 secara berturut-turut yaitu 69 detik, 68 detik, 68 detik, 68 detik dan 67 detik, sehingga apabila diambil rata-rata waktu eksekusi dari Euclidean distance adalah 68 detik. Kemudian waktu eksekusi dari metode Chebyshev distance untuk pengujian 1 sampai pengujian 5 secara berturut-turut yaitu 36 detik, 33 detik, 38 detik, 34 detik dan 33 detik, sehingga apabila diambil rata-rata waktu eksekusi dari Chebyshev distance adalah 34.8 detik. Adapun secara lebih mudah dari waktu eksekusi yang dibutuhkan untuk metode Manhattan, Euclidean dan Chebyshev dapat dilihat pada tabel 4.4. Tabel 4.4. Lama Waktu Eksekusi Test (i) Waktu Eksekusi Manhattan Euclidean Chebyshev 1 69 detik 69 detik 36 detik 2 66 detik 68 detik 33 detik 3 65 detik 68 detik 38 detik 4 66 detik 68 detik 34 detik 5 65 detik 67 detik 33 detik Ratarata 66.2 detik 68 detik 34.8 detik 4.2. Pengujian Davies Bouldin Index Dalam penelitian ini, Davies Bouldin Index (DBI) digunakan untuk melakukan validasi data pada setiap cluster. Pengukuran menggunakan DBI bertujuan untuk memaksimalkan jarak inter-cluster. Dengan menggunakan DBI suatu cluster akan dianggap memiliki skema clustering yang optimal jika yang memiliki Index Davies minimal. Adapun dari pengujian yang sudah dilakukan diperoleh nilai Index Davies dari metode Manhattan, Euclidean dan Chebyshev yang ditunjukkan pada gambar ,000 4,000 2, ,156 2,700 2,604 DBI Manhattan Euclidean Chebyshev Gambar 4.2. Index Davies dari metode Manhattan, Euclidean dan Chebyshev 9 Karya Ilmiah Data Mining, Agustus 2016
10 Dari gambar 4.3 dapat dilihat bahwa nilai Index Davies dari metode Manhattan yaitu 2.700, nilai Index Davies dari metode Euclidean yaitu dan nilai Index Davies dari metode Chebyshev yaitu Adapun secara lebih mudah untuk nilai Index Davies dari metode Manhattan, Euclidean dan Chebyshev dapat dilihat pada tabel Tabel 4.5. Index Davies dari Manhattan, Euclidean dan Chebyshev Davies Bouldin Index Manhattan Euclidean Chebyshev Dari tabel 4.25 dapat diketahui bahwa nilai yang paling optimal dari metode Manhattan, Euclidean dan Chebyshev adalah metode Euclidean distance dengan nilai Index Davies yaitu Analisa Hasil Pengujian Dari pengujian metode pengelompokan data Potensi Desa Tahun 2014 menggunakan algoritma k-means dengan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev yang telah dilakukan dihasilkan: 1. Model pengujian yang digunakan dapat berjalan dengan baik dan menunjukkan hasil berupa nilai centroid untuk setiap cluster dari metode Manhattan, Euclidean dan Chebyshev, sehingga status desa dapat ditentukan dari jumlah centroid pada setiap cluster. 2. Penggunaan metode perhitungan jarak yang digunakan mempengaruhi jumlah data pada setiap cluster. 3. Akumulasi waktu yang diperoleh dari pengujian yang telah dilakukan menunjukkan bahwa metode perhitungan jarak Chebyshev memiliki waktu eksekusi paling efisien dengan akumulasi waktu rata-rata 34.8 detik. 4. Dengan menggunakan pengujian Davies Bouldin Index menunjukkan bahwa metode perhitungan jarak Euclidean memiliki nilai Index Davies paling optimal dengan dengan nilai Dari pengujian yang sudah dilakukan dapat diketahui bahwa pengelompokan data Potensi Desa Tahun 2014 menggunakan algoritma k-means dengan metode perhitungan jarak Chebyshev memiliki akumulasi waktu paling efisien dibandingkan Manhattan dan Euclidean, Sedangkan metode Euclidean memiliki nilai Index Davies paling optimal dibanding metode Manhattan dan Chebyshev. V. KESIMPULAN DAN SARAN 5.1. Kesimpulan Dari pembahasan dan evaluasi pada bab-bab sebelumnya, pengelompokan data Potensi Desa tahun 2014 kedalam 5 kelompokkan menggunakan algoritma k- means dengan metode perhitungan jarak Manhattan, Euclidean dan Chebyshev diperoleh kesimpulan yaitu: 1. Telah dikelompokkannya data Potensi Desa tahun 2014 kedalam 5 status desa di Indonesia dengan diperoleh jumlah desa untuk setiap cluster yaitu cluster Desa Sangat Tertinggal sebanyak 7644 desa, cluster Desa Tetinggal sebanyak desa, cluster Desa Berkembang sebanyak desa, cluster Desa Maju sebanyak desa dan cluster Desa Mandiri sebanyak desa. 2. Pengelompokan data Potensi Desa tahun 2014 kedalam 5 status desa menggunakan algoritma k-means dengan metode perhitungan jarak Chebyshev memiliki akumulasi waktu paling efisien dibandingkan Manhattan dan Euclidean, Sedangkan metode Euclidean memiliki nilai Index Davies paling optimal dibanding metode Manhattan dan Chebyshev. 10 Karya Ilmiah Data Mining, Agustus 2016
11 5.2. Saran Dari penelitian ini di ketahui bahwa setiap cluster yang dihasilkan memiliki jarak dari cluster yang lain, dengan hasil cluster yang diperoleh diharapkan dapat diukur jarak setiap atribut antar cluster agar dapat ditentukan atribut mana yang perlu diperhatikan sebagai prioritas pembangunan agar status desa dapat meningkat. DAFTAR PUSTAKA [1] Undang-Undang Dasar Negara Republik Indonesia Tahun 1945, Negara Republik Indonesia, [2] Undang-Undang Dasar Negara Republik Indonesia Nomor 6 Tahun 2014, Tentang Desa, Presiden Republik Indonesia, [3] Peraturan Presiden Republik Indonesia Nomor 12 Tahun 2015, Tentang Kementerian Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi, Presiden Republik Indonesia, [4] Peraturan Presiden Republik Indonesia Nomor 2 Tahun 2015, Tentag Rencana Pembangunan Jangka Menengah Nasional Tahun , Presiden Republik Indonesia, [5] Undang Undang Republik Indonesia Nomor 6 Tahun 2015 tentang Desa, Presiden Republik Indonesia, [6] H. Barokah, D. R. W. W. Utami, Karmaji, C. S. M. Sugiarto, U. Suchaini, D. Widyaningsih, E. H. Nurcahyo, A. P. Rahtama and M. Abduh, Indeks Pembangunan Desa 2014 "Tentang Pemenuhan Standar Pelayanan Minimum Desa", Jakarta: Nasional, Badan Perencanaan Pembangunan, [7] Peraturan Menteri Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia Nomor 2 Tahun 2016, tentang Indek Desa Membangun, Menteri Desa, Pembangunan Daerah Tertinggal, dan Transmigrasi Republik Indonesia, [8] L. Xu, C. Jiang, J. Wang, J. Yuan and Y. Ren, Information Security in Big Data: Privacy and Data Mining, IEEE Access: The Journal for Rapid Open Access Publishing, vol. 1, pp , 9 October [9] V. Deepa, Rapid Development of Applications in Data Mining, in International Conference on Green High Performance Computing, India, [10] M. F. Al-Roby and A. M. El-Halees, Classifying Muti-Class Imbalance Data, Egyptian Computer Science Journal, vol. 37, no. 5, pp , [11] B. Chaudhari and M. Parikh, A Comparative Study of clustering algorithms Using weka tools, International Journal of Application or Innovation in Engineering & Management, vol. 1, no. 2, pp , [12] C. Shah and A. Jivani, Comparison of Data Mining Clustering Algorithms, in Nirma University International Conference on Engineering, [13] N. Claypo and S. Jaiyen, Opinion Mining for Thai Restaurant Reviews using K-Means Clustering and MRF Feature Selection, in Knowledge and Smart Technology (KST), Chonburi, [14] M. Verma, M. Srivastava, N. Chack, A. K. Diswar and N. Gupta, A Comparative Study of Various Clustering Algorithms in Data Mining, International Journal of Engineering Research and Applications (IJERA), vol. 2, no. 3, pp , [15] S. Ghosh and S. K. Dubey, Comparative Analysis of K-Means and Fuzzy C-Means Algorithms, International Journal of Advanced Computer Science and Applications, vol. 4, no. 4, pp , [16] S. Chakraborty, N. K. Nagwani and L. Dey, Performance Comparison of Incremental K- means and Incremental DBSCAN Algorithms, International Journal of Computer Applications, vol. 27, no. 11, pp , [17] R. Awasthi, A. K. Tiwari and S. Pathak, Empirical Evaluation on K Means Clustering with Effect of Distance Functions for Bank, International Journal of Innovative Technology and Research, vol. 1, no. 3, pp , [18] A. Singh, A. Yadav and A. Rana, K-means with Three different Distance Metrics, International Journal of Computer Applications, vol. 67, no. 19, pp , [19] K. Kouser and Sunita, A comparative study of K Means Algorithm by Different Distance Measures, International Journal of Innovative Research in Computer and Communication Engineering, vol. 1, no. 9, pp , Karya Ilmiah Data Mining, Agustus 2016
12 [20] D. Sinwar and R. Kaushik, Study of Euclidean and Manhattan Distance Metrics using Simple K-Means Clustering, International Journal for Research in Applied Science and Engineering Technology, vol. 2, no. 5, pp , [21] D. J. Bora and A. K. Gupta, Effect of Different Distance Measures on the Performance of K-Means Algorithm: An Experimental Study in Matlab, International Journal of Computer Science and Information Technologies, vol. 5, no. 2, pp , [22] M. Anggara, H. Sujiani and H. Nasution, Pemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness, Jurnal Sistem dan Teknologi Informasi (JUSTIN), vol. 1, no. 1, pp. 1-6, [23] H. Prasetyo and A. Purwariati, Comparison of Distance Measures for Clustering Data with Mix Attribute Types, in International Conference on Information Technology Systems and Innovation, Bandung, [24] D. Tomar and S. Agarwal, A survey on Data Mining approaches for Healthcare, International Journal of Bio-Science and Bio- Technology, vol. 5, no. 5, pp , [25] S. Ding, F. Wu, Q. Jun, H. Jia and F. Jin, Research on data stream clustering algorithms, Artificial Intelligence Review, vol. 43, no. 4, pp , [26] J. Yadav and M. Sharma, A Review of K- mean Algorithm, International Journal of Engineering Trends and Technology (IJETT), vol. 4, no. 7, pp , [27] P. Grabust, The Choice of Metrics for Clustering Algorithms, in Proceedings of the 8th International Scientific and Practical Conference, Augstskola, [28] H. K. Sagar and V. Sharma, Error Evaluation on K- Means and Hierarchical Clustering with Effect of Distance Functions for Iris Dataset, International Journal of Computer Applications, vol. 86, no. 18, pp. 1-5, [29] B. K. Mishra, A. Rath, N. R. Nayak and S. Swain, Far Efficient K-Means Clustering Algorithm, in International Conference on Advances in Computing, Communications and Informatics, Chennai, PENULIS Yoga Religia, M.Kom Lulus Sarjana Teknik Informatika Tahun 2015 dan Lulus Magister Teknik Informatika tahun 2016 di Universitas Dian Nuswantoro Semarang. Saat ini bekerja di Kementerian Desa, Pembangunan Daerah Tertinggal dan Transmigrasi Repubik Indonesia sebagai asisten tenaga ahli di Direktorat Jenderal Pembangunan dan Pemberdayaan masyarakat Desa. 12 Karya Ilmiah Data Mining, Agustus 2016
Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means
Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.
Lebih terperinciALGORITMA CLUSTERING K-MEDOIDS PADA E-GOVERNMENT BIDANG INFORMATION AND COMMUNICATION TECHNOLOGY DALAM PENENTUAN STATUS EDGI
ALGORITMA CLUSTERING K-MEDOIDS PADA E-GOVERNMENT BIDANG INFORMATION AND COMMUNICATION TECHNOLOGY DALAM PENENTUAN STATUS EDGI Zaenal Mustofa 1, Iman Saufik Suasana 2 1,2 Sistem Komputer STEKOM Semarang
Lebih terperinci1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian
Penerapan Data Mining dengan Menggunakan Metode Clustering K-Mean Untuk Mengukur Tingkat Ketepatan Kelulusan Mahasiswa Program Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang
Lebih terperinciPerancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra
Lebih terperinciKLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS
1 KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS (Study Kasus : Tim Hockey Kabupaten Kendal) Alith Fajar Muhammad Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula No. 5-11 Semarang-50131
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan
Lebih terperinciPENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN
PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas
Lebih terperinciMETODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami
METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling
Lebih terperinciTechno.COM, Vol. 16, No. 1, Februari 2017 : Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang
Penerapan Algoritma K-Means Untuk Clustering Penilaian Dosen Berdasarkan Indeks Kepuasan Mahasiswa Application of K-Means Algorithm for Clustering Lecturer Based On Assessment of Student Satisfaction Index
Lebih terperinciK-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN
1 K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN Rani Nooraeni*, Dr. Jadi Supriadi, DEA, Zulhanif, S.Si,M.Sc Jurusan statistika terapan, Fakultas MIPA UNPAD rnooraeni@gmail.com* Abstrak.Membagi suatu data
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma
Lebih terperinciLABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING
LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam
Lebih terperinciMEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP
MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP Page 87 Iin Parlina 1, Agus Perdana Windarto 2, Anjar Wanto 3, M.Ridwan Lubis
Lebih terperinciPENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA
PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA 1 Yulison Herry Chrisnanto, 2 Gunawan Abdillah 1,2 Jurusan Informatika Fakultas
Lebih terperinciCLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)
CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing
Lebih terperinciFuzzy C-means Clustering menggunakan Cluster Center Displacement
Fuzzy C-means Clustering menggunakan Cluster Center Displacement Fitri Hidayah Sundawati 1), Jadi Suprijadi 2), Titi Purwandari 3) 1) Mahasiswa Statistika Terapan, UniversitasPadjadjaran-Indonesia 2) Pengajar
Lebih terperinciPemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa
Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa Aidina Ristyawan 1), Kusrini 2), Andi Sunyoto
Lebih terperinciPENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA
PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo
Lebih terperinciMateri 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya
Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas 1. Memahami cakupan materi dan sistem perkuliahan Data Mining.
Lebih terperinciSeleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni
1 Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni Femi Dwi Astuti Program Studi Teknik Informatika STMIK AKAKOM femi@akakom.ac.id Abstrak -
Lebih terperinciBAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran
BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya
Lebih terperinciThe 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang
Penerapan Seleksi Atribut Berdasarkan Koefisien Variansi dan Korelasi untuk Inisialisasi Pusat Awal Klaster pada Algoritma K- Means dalam Pemetaan E-Government Tahun 2016 Ivon Dewi Apriliyaningsih 1*,
Lebih terperinciPENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS
PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS Hartatik STMIK Amikom Manajemen Informatika STMIK AMIKOM Yogyakarta Jl. Ringroad Utara, Condong Catur, Depok,
Lebih terperinciOleh : Rahanimi Pembimbing : Dr. M Isa Irawan, M.T
PERAMALAN JUMLAH MAHASISWA PENDAFTAR PMDK JURUSAN MATEMATIKA MENGGUNAKAN METODE AUTOMATIC CLUSTERING DAN RELASI LOGIKA FUZZY (STUDI KASUS di INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA) Oleh : Rahanimi
Lebih terperinciJurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun
Vol. 4, No. 1, Tahun 2015 28 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : https://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Visualisasi Pengembangan Judul
Lebih terperinciPERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak
PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1 Wahyu Catur Wibowo 2 1 Program Studi Sistem Informasi, Universitas Jember 2 Fakultas Ilmu Komputer, Universitas Indonesia,
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering
Lebih terperinciPENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA
PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA Diajeng Tyas Purwa Hapsari Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email :
Lebih terperinciKata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,
K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Kecelakaan lalu lintas merupakan salah satu masalah kesehatan yang menjadi penyebab serius kematian didunia dan menempati peringkat 9 dunia. Indonesia sendiri merupakan
Lebih terperinciPENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU
PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU Gita Premashanti Trayasiwi Program Studi Teknik Informatika S1,
Lebih terperinciProsiding SENATEK 2015 Fakultas Teknik, Universitas Muhammadiyah Purwokerto Purwokerto, 28 November 2015, ISBN
SISTEM KLASTERISASI MENGGUNAKAN METODE K-MEANS DALAM MENENTUKAN POSISI ACCESS POINT BERDASARKAN POSISI PENGGUNA HOTSPOT DI UNIVERSITAS MUHAMMADIYAH PURWOKERTO Achmad Fauzan*, Abid Yanuar Badharudin, Feri
Lebih terperinciTAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas
TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge
Lebih terperinciMETODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM
METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1), Wahyu Catur Wibowo 2) 1) Program Studi Sistem Informasi, Universitas Jember 2) Fakultas Ilmu Komputer,
Lebih terperinciPemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness
Pemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness Mario Anggara 1, Herry Sujiani 2, Helfi Nasution 3 Program Studi Teknik Informatika Fakultas Teknik Universitas
Lebih terperinciSKRIPSI KLASTERISASI DAERAH RAWAN KECELAKAAN LALU LINTAS DI KOTA SEMARANG MENGGUNAKAN CHEBYSHEV DISTANCE K-MEANS
SKRIPSI KLASTERISASI DAERAH RAWAN KECELAKAAN LALU LINTAS DI KOTA SEMARANG MENGGUNAKAN CHEBYSHEV DISTANCE K-MEANS CLUSTERING TRAFFIC ACCIDENT PRONE AREA IN SEMARANG USING CHEBYSHEV DISTANCE K-MEANS Diajukan
Lebih terperinciPerbandingan Metode Single Linkage dan Fuzzy C Means Untuk Pengelompokkan Trafik Internet
Perbandingan Metode Single dan Fuzzy C Means ntuk Pengelompokkan Trafik Internet Auliya Burhanuddin 1, Ema tami, Eko Pramono 3 1 Program Studi Teknik Informastika, Fakultas Teknik, niversitas Muhammadiyah
Lebih terperinciBAB 2 LANDASAN TEORI
7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.
Lebih terperinciSEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA
SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA Kamil Malik Jurusan Teknik Informatika STT Nurul Jadid Paiton nomor1001@gmail.com Andi Hutami Endang Jurusan Teknik Informatika
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami
Lebih terperinciIMPLEMENTASI METODE K-MEANS CLUSTERING UNTUK ANALISA PRESTASI SISWA BERDASARKAN DATA SISWA DI SMA NEGERI 1 GROGOL SKRIPSI
IMPLEMENTASI METODE K-MEANS CLUSTERING UNTUK ANALISA PRESTASI SISWA BERDASARKAN DATA SISWA DI SMA NEGERI 1 GROGOL SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer
Lebih terperinciMENGGUNAKAN DATA MINING
E.11 MENGGUNAKAN DATA MINING UNTUK SEGMENTASI CUSTOMER PADA BANK UNTUK MENINGKATKAN CUSTOMER RELATIONSHIP MANAGEMENT (CRM) DENGAN METODE KLASIFIKASI (AGORITMA J-48, ZERO-R DAN NAIVE BAYES) Maghfirah, Teguh
Lebih terperinciBAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode
BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada
Lebih terperinciClustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means
Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id
Lebih terperinciPengenalan Pola. Klasterisasi Data
Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering
Lebih terperinciPENCARIAN ISI CITRA MENGGUNAKAN METODE MINKOWSKI DISTANCE
PENCARIAN ISI CITRA MENGGUNAKAN METODE MINKOWSKI DISTANCE Budi Hartono 1, Veronica Lusiana 2 Program Studi Teknik Informatika, Fakultas Teknologi Informasi, Universitas Stikubank Semarang Jl Tri Lomba
Lebih terperinciBAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam
BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri
Lebih terperinciDATA MINING DAN WAREHOUSE A N D R I
DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung
Lebih terperinciPENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG
PENERAPAN DATA MINING DENGAN METODE CLUSTERING UNTUK PENGELOMPOKAN DATA PENGIRIMAN BURUNG Sri Mulyati 1) 1 Pascasarjana, Universitas Putra Indonesia YPTK Padang e-mail: mulyati.sri52@gmail.com Abstrak
Lebih terperinciCLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH
CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH Darlis Heru Murti, Nanik Suciati, Daru Jani Nanjaya Jurusan Teknik Informatika, Fakultas Teknologi
Lebih terperinciPENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING
A-99 PENGELOMPOKKAN PERFORMA AKADEMIK MAHASISWA BERDASARKAN INDEKS PRESTASI MENGGUNAKAN K-MEANS CLUSTERING Rachmad Zaini Alberto 1, Winda Kurnia Sari 2, Samsuryadi 3, Anggina Primanita 4 1,2,3,4 Fakultas
Lebih terperinciPengenalan Pola. K-Means Clustering
Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan mahasiswa berdasarkan status gizi Body Mass Index (BMI) dan ukuran kerangka.
Lebih terperinciImplementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan
Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Ni Made Anindya Santika Devi, I Ketut Gede Darma Putra, I Made Sukarsa Jurusan Teknologi Informasi, Universitas Udayana Bukit Jimbaran,
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Dalam bagian ini dijelaskan aktifitas yang dilakukan dalam melakukan penelitian dibagi menjadi 2 (dua) yaitu: 1) Perancangan Skenario; dan 2) Penerapan Skenario. 3.1. Perancangan
Lebih terperinciPENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT
PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT Ismail Setiawan 1) 1) Magister Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,
Lebih terperinciPENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI
PENGGUNAAN PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI Entin Martiana S.Kom,M.Kom, Nur Rosyid Mubtada i S. Kom, Edi Purnomo Jurusan Teknik Informatika
Lebih terperinciPRISMA WAHYU WULAN DARA
JURNAL Klasterisasi Daerah Pemasok Sampah Terbesar Ke TPA Klotok Di Kota Kediri Dengan Metode K-means Clustering Regional Clustering Largest Suppliers of Waste Landfill Klotok In the Town of Kediri With
Lebih terperinciPERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN
PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem
Lebih terperinciINTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN
INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com
Lebih terperinciDescriptor Clustering SURF for Bag of Visual Words Representation in Fingerprint Images Using K-MEANS and Hierarchical Agglomerative Clustering
2015 International Conference on Information, Communication Technology and System Descriptor Clustering SURF for Bag of Visual Words Representation in Fingerprint Images Using K-MEANS and Hierarchical
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Penelitian Terdahulu Penelitian-penelitian terdahulu yang berhubungan dengan clustering yaitu penelitian yang dilakukan oleh Rismawan (2008). Pada penelitian ini, dibangun suatu
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Data menjadi sesuatu yang sangat berharga saat ini. Tidak hanya badan pemerintah saja, perusahaan-perusahaan saat ini pun sangat membutuhkan informasi dari data yang
Lebih terperinciPENERAPAN K-MEANS CLUSTER UNTUK PENGARUH KECERDASAN EMOSI DAN STRES TERHADAP PRESTASI BELAJAR MAHASISWA
PENERAPAN K-MEANS CLUSTER UNTUK PENGARUH KECERDASAN EMOSI DAN STRES TERHADAP PRESTASI BELAJAR MAHASISWA Finki Dona Marleny 1), Husnul Ma ad Junaidi 2), Mambang 3) 1), 2) STMIK INDONESIA Banjarmasin 3)
Lebih terperinciARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG
ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG Oleh: BAGUS YAYANG FATKHURRAHMAN 13.1.03.02.0180 Dibimbing oleh : 1. Ahmad
Lebih terperincidengan Algoritma K Means
K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan
Lebih terperinciBAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek
1 BAB I PENDAHULUAN 1.1. Latar Belakang Perguruan tinggi yang baik dipengaruhi oleh kualitas mahasiswa di dalamnya. Mahasiswa merupakan objek pembelajaran bagi perguruan tinggi sehingga jika prestasi mahasiswa
Lebih terperinciBAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.
BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung
Lebih terperinciBAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk
BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Sistem Informasi Pengertian Sistem Informasi pada dasarnya merupakan hasil dari dua arti, yakni sistem dan informasi yang digabungkan. Berikut definisi sistem menurut para ahli
Lebih terperinciKLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING
KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING Moh Ahsan Universitas Kanjuruhan Malang ahsan@unikama.ac.id ABSTRAK. Universitas Kanjuruhan Malang
Lebih terperinciKluster Bag-of-Word Menggunakan Weka
Bag-of-Word Menggunakan Weka Tari Mardiana, Rudy Dwi Nyoto 2 Jurusan Teknik Elektro dan Teknologi Informasi, UGM Yogyakarta 2 Program Studi Teknik Informatika, Universitas Tanjungpura - Pontianak e-mail:
Lebih terperinciDATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA
DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas
Lebih terperinciALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK
ALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK Wiwit Agus Triyanto Fakultas Teknik, Program Studi Sistem Informasi Universitas Muria Kudus Email: at.wiwit@yahoo.co.id ABSTRAK Strategi pemasaran
Lebih terperinciPenerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis
Scientific Journal of Informatics Vol., No., November 015 p-issn 407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 460-0040 Penerapan Fuzzy C-Means untuk Deteksi Dini Kemampuan Penalaran Matematis
Lebih terperinciCLUSTERING MOTIVASI BELAJAR SISWA ELEARNING BERBASIS ALGORITMA K-MEANS
Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2017, pp. 379~383 379 CLUSTERING MOTIVASI BELAJAR SISWA ELEARNING BERBASIS ALGORITMA K-MEANS Sismadi AMIK BSI JAKARTA e-mail: sismadi.ssm@bsi.ac.id
Lebih terperinciIMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING
IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember
Lebih terperinciKLASTERING DATA MENGGUNAKAN ALGORITMA DYNAMIC K-MEANS
VOL. I NO. AGUSTUS 0 JURNAL KLASTERING DATA MENGGUNAKAN ALGORITMA DYNAMIC K-MEANS Widiarina Abstract The disadvantage of the K-means algorithm is sensitive to have problems determining the initial partition
Lebih terperinci1. PENDAHULUAN. Kata Kunci: Data Mining, Clustering, Fuzzy C-Means
CLUSTERING BIDANG PEKERJAAN BERDASARKAN PEMETAAN MATA KULIAH MENGGUNAKAN ALGORITMA FUZZY C-MEANS PADA FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO SEMARANG Taufiq Ramadhan Ashari 1, Ruri Suko Basuki
Lebih terperinciPENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU
PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro
Lebih terperinciBab 2 Tinjauan Pustaka
Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Adapun penelitian terdahulu yang berkaitan dalam penelitian ini berjudul Penentuan Wilayah Usaha Pertambangan Menggunakan Metode Fuzzy K-Mean Clustering
Lebih terperinciK-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia
K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang Masalah
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Motivasi dalam penelitian ini berawal dari laporan (ID-SIRTII/CC, 2014) terkait serangan yang sering terjadi pada jaringan internet khususnya Indonesia, serangan
Lebih terperinciPERANCANGAN TEXT MINING PENGELOMPOKKAN PENELITIAN DOSEN MENGGUNAKAN METODE SHARED NEAREST NEIGHBOR DENGAN EUCLIDEAN SIMILARITY
PERANCANGAN TEXT MINING PENGELOMPOKKAN PENELITIAN DOSEN MENGGUNAKAN METODE SHARED NEAREST NEIGHBOR DENGAN EUCLIDEAN SIMILARITY Mushlihudin 1*, Lisna Zahrotun 2 1, 2 Program Studi Teknik Informatika, Fakultas
Lebih terperinciKARAKTERISTIK WAKTU TERJADI HOTSPOT MENGGUNAKAN K-MEANS CLUSTERING DI WILAYAH KALIMANTAN SELATAN. Nur Armina Rahmah
Technologia Vol 8, No.1, Januari Maret 2017 20 KARAKTERISTIK WAKTU TERJADI HOTSPOT MENGGUNAKAN K-MEANS CLUSTERING DI WILAYAH KALIMANTAN SELATAN Nur Armina Rahmah (nur.armina@fti.uniska-bjm.ac.id) ABSTRAK
Lebih terperinciSISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING
SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING Ati Suci Dian Martha, S.Kom., M.T. 1, Dena Jatnika Kusumah 1, Program Studi Sistem Informasi, STMIK LPKIA, Bandung Jln. Soekarno Hatta No.
Lebih terperinciANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING
ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING Ni Putu Eka Merliana, Ernawati, Alb. Joko Santoso Program Studi Magister Teknik Informatika, Fakultas Teknik Industri, Universitas
Lebih terperinciARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL
ARTIKEL PENERAPAN METODE K-MEANS DALAM PROSES CLUSTERING PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL Oleh: IRFAN DWI NURCAHYO BUDIARTO 13.1.03.02.0117 Dibimbing oleh : 1. Hermin Istiasih, ST.,M.M.,M.T.
Lebih terperinciSISTEM PEMBAGIAN KELAS KULIAH MAHASISWA DENGAN METODE K-MEANS DAN K-NEAREST NEIGHBORS UNTUK MENINGKATKAN KUALITAS PEMBELAJARAN
Pradnyana dan Permana Sistem Pembagian Kelas Kuliah Mahasiswa dengan Metode K-means dan K-Nearest Neighbors untuk Meningkatkan Kualitas Pembelajaran SISTEM PEMBAGIAN KELAS KULIAH MAHASISWA DENGAN METODE
Lebih terperinciMETODE NON HIERARCHY ALGORITMA K-MEANS DALAM MENGELOMPOKKAN TINGKAT KELARISAN BARANG (STUDI KASUS : KOPERASI KELUARGA BESAR SEMEN PADANG)
METODE NON HIERARCHY ALGORITMA K-MEANS DALAM MENGELOMPOKKAN TINGKAT KELARISAN BARANG (STUDI KASUS : KOPERASI KELUARGA BESAR SEMEN PADANG) Fakultas Ilmu Komputer, Universitas Putra Indonesia YPTK Padang
Lebih terperinciTipe Clustering. Partitional Clustering. Hirerarchical Clustering
Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan
Lebih terperinciOptimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika
Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Siti Mutrofin 1, Arrie Kurniawardhani 2, Abidatul Izzah 3, Mukhamad Masrur 4 Universitas Pesantren Tinggi Darul Ulum
Lebih terperinciPENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN MENGGUNAKAN METODE KOHONEN
Prosiding Seminar Nasional Matematika dan Terapannya 016 p-issn : 550-0384; e-issn : 550-039 PENGELOMPOKAN KABUPATEN/KOTA DI PROVINSI JAWA TENGAH BERDASARKAN PERSENTASE PENDUDUK MISKIN TAHUN 009-013 MENGGUNAKAN
Lebih terperinciLAPORAN KEGIATAN PENELITIAN
LAPORAN KEGIATAN PENELITIAN Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik Dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang Oleh : Asroni,
Lebih terperinciPerbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen
Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen Dyah Herawatie Prodi Sistem Informasi Fakultas Sains dan Teknologi Universitas Airlangga Surabaya, Indonesia dy4h_h3r4@yahoo.com
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan
Lebih terperinciPENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA
Artikel Skripsi PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA SKRIPSI Diajukan Untuk Memenuhi Sebagian
Lebih terperinciLingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan
sehingga dapat diproses dengan SOM. Pada tahap seleksi data, dipilih data perkembangan anak berdasarkan kategori dan rentang usianya. Kategori perkembangan tersebut merupakan perkembangan kognitif, motorik
Lebih terperinci