PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

Ukuran: px
Mulai penontonan dengan halaman:

Download "PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ"

Transkripsi

1 PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ SKRIPSI Oleh Dwi Noviati Nango JURUSAN TEKNIK INFORMATIKA PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK UNIVERSITAS NEGERI GORONTALO JULI 2012

2 PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ SKRIPSI Diajukan untuk memenuhi salah satu syarat memperoleh Gelar Sarjana pada Program Studi Sistem Informasi Oleh Dwi Noviati Nango JURUSAN TEKNIK INFORMATIKA PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK UNIVERSITAS NEGERI GORONTALO JULI 2012

3 iii

4 iv

5 v

6 KATA PENGANTAR Syukur Alhamdulilah penulis panjatkan kehadirat Allah SWT, karena hanya dengan rahmat dan hidayah-nya, penulis dapat menyusun dan menyelesaikan laporan akhir Skripsi ini dalam waktu yang telah ditetapkan. Teriring ucapan terima kasih serta penghargaan yang setinggi-tingginya kepada semua pihak yang telah banyak membantu dan mendukung demi rampungnya laporan ini, terutama kepada : 1. Kedua orang tua tercinta atas doa dan dukungannya. 2. Bapak Syafrudin K. Lamusu, SE, MM, selaku sekretaris Kepala Badan Pengelola Keuangan dan Aset Daerah. 3. Ibu Ir. Rawiyah Husnan, MT, selaku Dekan Fakultas Teknik Universitas Negeri Gorontalo. 4. Pembantu Dekan I, Pembantu Dekan II dan Pembantu Dekan III Fakultas Teknik, Universitas Negeri Gorontalo. 5. Bapak Arip Mulyanto, M.Kom, selaku Ketua Jurusan Teknik Informatika Fakultas Teknik Universitas Negeri Gorontalo. 6. Bapak Agus Lahinta, ST, M.Kom, selaku Ketua Program Studi S1 Sistem Informasi Universitas Negeri Gorontalo, sekaligus pembimbing I. 7. Ibu Lillyan Hadjaratie, S.Kom, M.Si, selaku pembimbing II. 8. Seluruh staf dosen pengajar S1 Sistem Informasi Teknik Informatika Universitas Negeri Gorontalo, yang telah mendidik dan memberikan berbagai bekal vi

7 pengetahuan yang tak ternilai harganya kepada penulis selama mengikuti perkuliahan. 9. Semua teman-teman senasib dan seperjuangan, khususnya Angkatan 2008 S1 Sistem Informasi Teknik Informatika Fakultas Teknik universitas Negeri Gorontalo. 10. Seluruh keluargaku tercinta 11. Serta semua orang yang telah mendukung dalam penyusunan ini yang tidak bisa disebutkan satu persatu. Sebagai manusia yang tidak luput dari kesalahan, penulis menyadari bahwa dalam penyusunan laporan ini tetap saja masih terdapat kekurangan. Untuk itu penulis sangat mengharapkan saran dan kritik yang sifatnya membangun demi kesempurnaan laporan ini. Akhir kata semoga laporan ini dapat bermanfaat. Amin. Gorontalo, Juli 2012 Penulis vii

8 Intisari Penelitian ini bertujuan untuk mengelompokkan data APBD tahun yang memiliki kemiripan karakteristik berdasarkan kedekatan jarak, menggunakan teknik clustering dengan algoritma K-Means. Pembentukan cluster diuji dengan 3 nilai centroid dan 2 nilai centroid, yang dilanjutkan dengan menghitung nilai SSE (Sum of Squared Error). Hasil cluster dengan nilai SSE terkecil dijadikan sebagai parameter untuk mengestimasi data anggaran belanja yang akan datang. Berdasarkan penelitian yang dilakukan dapat diketahui bahwa pembentukan cluster dengan 3 nilai centroid adalah cluster yang terbaik, karena memiliki nilai SSE terkecil yaitu ,88,. Untuk nilai pendapatan tahun 2012 sebesar Rp ,-, diperoleh hasil estimasi nilai belanja tidak langsung sebesar Rp ,76,- sampai Rp ,24. Serta estimasi nilai belanja langsung sebesar Rp ,76,- sampai Rp ,24,-. Kata Kunci : Clustering, K-Means, estimasi. viii

9 Abstract The objective of this research to group the data of Local Budget revenue and expenditure fiscal year which has resemblance characteristics based on distance by using clustering technique with K-Means algorithm. Cluster formed tested by 3 value of centroid and 2 value of centroid which continued by calculation SSE (Sum of Squared Error) value. Cluster result with the smallest SSE value became a parameter to estimate the next budget expenditure. Based on the study, it can reveal that cluster formed by 3 centroid value is the best cluster because has SSE smallest 4 value that is , 88,. Revenue value on 2012 around Rp ,-, obtained estimation value indirect expenditure around Rp ,76 to Rp ,24. Direct estimation expenditure value around Rp ,76.- to Rp ,24,-. Keywords: clustering, K-Means, estimate. ix

10 DAFTAR ISI Halaman HALAMAN SAMPUL... i HALAMAN JUDUL... ii LEMBAR PERNYATAAN... iii LEMBAR PERSETUJUAN... iv LEMBAR PENGESAHAN... v MOTTO DAN PERSEMBAHAN... vi KATA PENGANTAR... vii INTISARI... ix ABSTRACT... x DAFTAR ISI... xi DAFTAR TABEL...xiii DAFTAR GAMBAR...xiv DAFTAR LAMPIRAN... xv BAB I PENDAHULUAN... 1 A. Latar Belakang... 1 B. Rumusan Masalah... 2 C. Ruang Lingkup Penulisan... 2 D. Tujuan Penulisan... 3 E. Manfaat Penulisan... 3 BAB II TINJAUAN PUSTAKA... 5 A. Knowledge Discovery in Database (KDD) dan Data Mining Pengertian data mining Tujuan data mining Pengelompokkan data mining... 8 B. Clustering Pengertian clustering Metode clustering Document clustering Klasifikasi algoritma clustering C. Penelitian Terkait D. Algoritma K-Means Pengertian K-Means Algoritma K-Means Tahapan algoritma K-Means x

11 BAB III METODOLOGI PENELITIAN A. Objek Penelitian Gambaran umum badan pengelola keuangan dan aset daerah Visi badan pengelola keuangan dan aset daerah Misi badan pengelola keuangan dan aset daerah Struktur organisasi badan pengelola keuangan dan aset daerah B. Metode Penelitian C. Teknik Pengumpulan Data Studi literatur Teknik pengumpulan data arsip D. Tahapan Penelitian Studi pustaka Pengumpulan data arsip Praproses data Clustering menggunakan algoritma K-Means Analisis hasil clusterisasi Selesai E. Jadwal Penelitian BAB IV HASIL DAN PEMBAHASAN A. Tahapan Penelitian Pra proses data Cleaning data Clustering menggunakan algoritma K-Means B. Tahap Analisis Proses clustering dalam K-Means Pola hasil clustering dengan K-Means Flowchart clustering K-Means C. Desain Hasil Hasil implementasi input data parameter k dan x Hasil implementasi input data nama k Hasil implementasi input data APBD Hasil implementasi tampilan proses hasil perhitungan centroid Hasil implementasi perhitungan jarak data ke centroid Hasil implementasi iterasi Hasil implementasi SSE Hasil implementasi laporan data mining Hasil implementasi nilai estimasi xi

12 BAB V PENUTUP A. Kesimpulan B. Saran DAFTAR PUSTAKA LAMPIRAN xii

13 DAFTAR TABEL Tabel 4.1 Contoh data yang redundant Tabel 4.2 Data APBD Kabupaten XYZ 6 tahun terakhir Tabel 4.3 Hasil perhitungan centroid setiap cluster pada pengujian 2 parameter Tabel 4.4 Hasil perhitungan jarak data pada nilai k dengan masing-masing centroid setiap cluster Tabel 4.5 Perhitungan iterasi pertama pada cluster pendapatan Tabel 4.6 Perhitungan iterasi pertama pada cluster belanja tidak langsung Tabel 4.7 Perhitungan iterasi pertama pada cluster belanja langsung Tabel 4.8 Perhitungan iterasi pertama pada cluster pendapatan Tabel 4.9 Perhitungan iterasi pertama pada cluster belanja tidak langsung Tabel 4.10 Perhitungan iterasi pertama pada cluster belanja langsung Tabel 4.11 Hasil perhitungan jarak data terhadap masing-masing nilai centroid untuk dijadikan seagai perhitungan Tabel 4.12 Perhitungan iterasi kedua pada cluster pendapatan Tabel 4.13 Perhitungan iterasi kedua pada cluster belanja tidak langsung Tabel 4.14 Perhitungan iterasi kedua pada cluster belanja langsung Tabel 4.15 Hasil akhir perhitungan iterasi dengan 3 nilai centroid dan 2 nilai centroid Tabel 4.16 Hasil perhitungan nilai SSE dengan 3 nilai centroid dan 2 nilai centroid Tabel 4.17 Data APBD sebelum di cluster Tabel 4.18 Nilai anggota pendapatan, belanja tidak langsung dan belanja langsung pada (C 0 ) Tabel 4.19 Nilai anggota pendapatan, belanja tidak langsung dan belanja langsung pada (C 1 ) Tabel 4.20 Nilai anggota pendapatan, belanja tidak langsung dan belanja langsung pada (C 2 ) Tabel 4.21 Nilai anggota pendapatan Tabel 4.22 Contoh nilai outlier Tabel 4.23 Contoh estimasi nilai outlier xiii

14 DAFTAR GAMBAR Gambar 2.1 Tahapan dalam KDD... 5 Gambar 2.2 Contoh clustering Gambar 2.3 Cara kerja algoritma K-Means Gambar 3.1 Tahapan penelitian Gambar 4.1 Flow chart K-Means Gambar 4.2 Implementasi input data parameter k dan x dengan 3 nilai centroid Gambar 4.3 Implementasi input data parameter k dan x dengan 2 nilai centroid Gambar 4.4 Implementasi input data nama k dengan 3 nilai centroid Gambar 4.5 Implementasi input data nama k dengan 2 nilai centroid Gambar 4.6 Implementasi input data APBD dengan 3 nilai centroid Gambar 4.7 Implementasi input data APBD dengan 2 nilai centroid Gambar 4.8 Implementasi tampilan proses hasil perhitungan dengan 3 nilai centroid Gambar 4.9 Implementasi tampilan proses hasil perhitungan dengan 2 nilai centroid Gambar 4.10 Implementasi tampilan perhitungan jarak data dengan 3 nilai centroid Gambar 4.11 Implementasi tampilan perhitungan jarak data dengan 2 nilai centroid Gambar 4.12 Implementasi tampilan iterasi dengan 3 nilai centroid Gambar 4.13 Implementasi tampilan iterasi dengan 2 nilai centroid Gambar 4.14 Implementasi tampilan akhir iterasi dengan 2 nilai centroid Gambar 4.15 Implementasi tampilan nilai SSE dengan 3 nilai centroid Gambar 4.16 Implementasi tampilan nilai SSE dengan 2 nilai centroid Gambar 4.17 Implementasi laporan data mining dengan 3 nilai centroid Gambar 4.18 Implementasi laporan data mining dengan 2 nilai centroid Gambar 4.19 Implementasi tampilan nilai estimasi xiv

15 DAFTAR LAMPIRAN Lampiran data APBD Kabupaten XYZ tahun 2006 (part 1)... 1 Lampiran data APBD Kabupaten XYZ tahun 2006 (part 2)... 2 Lampiran data APBD Kabupaten XYZ tahun Lampiran data APBD Kabupaten XYZ tahun Lampiran data APBD Kabupaten XYZ tahun Lampiran data APBD Kabupaten XYZ tahun Lampiran data APBD Kabupaten XYZ tahun Lampiran surat ijin pengambilan data di Kabupaten XYZ... 8 Lampiran surat pelaksanaan penelitian dari Kabupaten XYZ... 9 Lampiran terjemahan intisari dari pusat bahasa xv

16 BAB I PENDAHULUAN A. Latar Belakang Masalah Saat ini begitu banyak data yang terdapat dalam sebuah organisasi, sehingga menimbulkan kesulitan dalam hal pengelompokkan data. Namun dengan perkembangan Teknologi Informasi (TI) terdapat berbagai macam solusi untuk mengatasi kesulitan tersebut, salah satunya adalah dengan menggunakan teknik Data Mining (DM). DM merupakan proses pencarian pola dan relasi-relasi yang tersembunyi dalam sejumlah data yang besar dengan tujuan untuk melakukan klasifikasi, estimasi, prediksi, asosiasi rule, clustering, deskripsi dan visualisasi (Han dkk,2001, dalam Baskoro,2010). Data Anggaran Pendapatan Belanja Daerah (APBD) yang dikelola oleh badan keuangan daerah di Kabupaten XYZ pada dasarnya sudah dikelompokkan berdasarkan pendapatan, belanja langsung dan tidak langsung. Akan tetapi karena data yang dikelola oleh badan pengelola keuangan daerah tersebut memiliki data yang begitu banyak, maka perlu diketahui bagaimana keterkaitan antar data pendapatan, belanja langsung dan tidak langsung dari lembaga tersebut. Salah satu metode yang digunakan yaitu clustering. Dengan clustering dimaksudkan untuk mengidentifikasi data APBD yang memiliki kesamaan dalam karakteristik tertentu. 1

17 Terdapat berbagai algoritma yang digunakan dalam teknik DM dengan metode clustering salah satunya adalah algoritma K-Means. Algoritma K-Means adalah salah satu algoritma unsupervised learning yang paling sederhana yang dikenal dapat menyelesaikan permasalahan clustering dengan baik (Mac Queen, 1967). Dengan diterapkannya algoritma K-Means dalam proses clusterisasi APBD maka diharapkan dapat mengelompokkan dan menentukan jumlah cluster yang paling tepat/akurat juga memprediksi nilai belanja tidak langsung serta nilai belanja langsung yang akan datang terhadap data APBD Kabupaten XYZ. Berdasarkan permasalahan tersebut maka penulis mengusulkan sebuah penulisan yang berjudul Penerapan Algoritma K-Means Untuk Clustering Data Anggaran Pendapatan Belanja Daerah di Kabupaten XYZ. B. Rumusan Masalah Berdasarkan latar belakang permasalahan yang ada, maka rumusan masalahnya adalah bagaimana menerapkan algoritma K-Means untuk mengclustering data APBD yang dikelola oleh badan pengelola keuangan daerah di Kabupaten XYZ? C. Ruang Lingkup Penulisan Ruang lingkup penulisan meliputi : a. Dataset yang digunakan adalah data APBD 6 tahun terakhir ( ). b. Atribut pendapatan yang digunakan dalam dataset ini adalah pendapatan. 2

18 c. Atribut belanja tidak langsung yang digunakan dalam dataset ini adalah belanja pegawai. d. Atribut belanja langsung yang digunakan dalam dataset ini adalah seluruh item pembelanjaan disetiap instansi. D. Tujuan Penulisan Adapun tujuan dari penulisan ini adalah : a. Membangun protipe clusterisasi data APBD Kabupaten XYZ. b. Menerapkan algoritma K-Means untuk mengelompokkan dan menentukan jumlah cluster yang paling tepat/akurat terhadap data APBD Kabupaten XYZ. c. Menganalisa hasilnya untuk menentukan parameter-parameter batasan berdasarkan karakteristik pada masing-masing cluster. d. Dapat mengestimasi nilai belanja tidak langsung dan belanja langsung di masa yang akan datang. E. Manfaat Penulisan Manfaat yang diperoleh dalam penulisan ini yaitu : a. Memberikan gambaran langkah-langkah penerapan algoritma K-Means pada data APBD kabupaten XYZ. b. Dapat memberikan suatu informasi penting bagi organisasi tentang bagaimana mengelompokkan data APBD dengan cara clustering menggunakan algoritma K-Means. 3

19 c. Dengan adanya clustering dapat memperoleh pengetahuan tentang estimasi nilai belanja daerah di kabupaten XYZ pada masa yang akan datang. 4

20 BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu kumpulan data yang besar. Akan tetapi kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Salah satu tahapan dalam proses KDD adalah data mining (Han & Kamber,2006 dalam Baskoro,2010). Han and Kamber (2006) menyatakan : Knowledge Discovery in Database (KDD) adalah proses menentukan informasi yang berguna serta pola-pola yang ada dalam data. Informasi ini terkandung dalam basis data yang berukuran besar yang sebelumnya tidak diketahui dan potensial bermanfaat. Data Mining merupakan salah satu langkah dari serangkaian proses iterative KDD. Tahapan proses KDD dapat dilihat pada gambar dibawah ini. Gambar 2.1 Tahapan dalam KDD (Han and Kamber 2006) 5

21 Tahapan proses KDD terdiri dari : a. Data Selection Pada proses ini dilakukan pemilihah himpunan data, menciptakan himpunan data target, atau memfokuskan pada subset variabel (sampel data) dimana penemuan (discovery) akan dilakukan. Hasil seleksi disimpan dalam suatu berkas yang terpisah dari basis data operasional. b. Pre-Processing dan Cleaning Data Pre-Processing dan Cleaning Data dilakukan membuang data yang tidak konsisten dan noise, duplikasi data, memperbaiki kesalahan data, dan bisa diperkaya dengan data eksternal yang relevan. c. Transformation Proses ini mentransformasikan atau menggabungkan data ke dalam yang lebih tepat untuk melakukan proses mining dengan cara melakukan peringkasan (agregasi). d. Data Mining Proses data mining yaitu proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik, metode atau algoritma tertentu sesuai dengan tujuan dari proses KDD secara keseluruhan. e. Interpretation / Evaluasi Proses untuk menerjamahkan pola-pola yang dihasilkan dari data mining. Mengevaluasi (menguji) apakah pola atau informasi yang ditemukan bersesuaian atau bertentangan dengan fakta atau hipotesa sebelumnya. Pengetahuan yang 6

22 diperoleh dari pola-pola yang terbentuk dipresentasikan dalam bentuk visualisasi. 1. Pengertian data mining. Santosa (2007) menyatakan bahwa data mining merupakan suatu kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menentukan keteraturan, pola atau hubungan dalam set data berukuran besar. Salah satu tugas utama dari data mining adalah pengelompokan clustering dimana data yang dikelompokkan belum mempunyai contoh kelompok. Larose (2005) menyatakan bahwa data mining adalah suatu proses pencarian korelasi, pola dan tren baru yang berguna dalam media penyimpanan data berukuran besar menggunakan teknologi pengenalan pola seperti teknik-teknik statistik dan matematis. Istilah lain yang sering digunakan antara lain knowledge mining from data, knowledge extraction, data/pattern analysis, data archeology, dan data dredging. 2. Tujuan data mining. Baskoro (2010) menyatakan bahwa adapun tujuan dari adanya data mining adalah : a. Explanatory, yaitu untuk menjelaskan beberapa kegiatan observasi atau suatu kondisi. b. Confirmatory, yaitu untuk mengkonfirmasikan suatu hipotesis yang telah ada. c. Exploratory, yaitu untuk menganalisis data baru suatu relasi yang janggal. 7

23 3. Pengelompokkan data mining. Tan et. al. (2005), menyatakan : Secara garis besar data mining dapat dikelompokkan menjadi 2 kategori utama : a. Descriptive mining, yaitu proses untuk menemukan karakteristik penting dari data dalam suatu basis data. Teknik data mining yang termasuk dalam descriptive mining adalah clustering, association, dan sequential mining. b. Predictive mining, yaitu proses untuk menemukan pola dari data dengan menggunakan beberapa variabel lain di masa depan. Salah satu teknik yang terdapat dalam predictive mining adalah klasifikasi. Larose and Daniel (2005), menyatakan : Pengelompokkan data mining berdasarkan tugas yang dapat dilakukan yaitu : a. Deskripsi Deskripsi adalah menggambarkan pola dan kecenderungan yang terdapat dalam data yang memungkinkan memberikan penjelasan dari suatu pola atau kecenderungan tersebut. b. Estimasi Estimasi hampir sama dengan klasifikasi, akan tetapi variabel target estimasi lebih ke arah numerik daripada ke arah kategori. c. Prediksi Prediksi hampir sama dengan klasifikasi dan estimasi, akan tetapi dalam prediksi nilai dari hasil akan terwujud di masa yang akan datang. 8

24 d. Klasifikasi Klasifikasi adalah proses untuk menemukan model atau fungsi yang menggambarkan dan membedakan kelas data atau konsep dengan tujuan memprediksikan kelas untuk data yang tidak diketahui kelasnya (Han and Kamber, 2006). e. Clustering Clustering atau analisis cluster adalah proses pengelompokan satu set bendabenda fisik atau abstrak ke dalam kelas objek yang sama (Han & Kamber, 2006). f. Asosiasi Asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Kusrini dkk (2009), menyatakan bahwa : Pengelompokkan data mining diatas dijadikan sebagai teknik dari data mining berdasarkan tugas yang bisa dilakukan, yaitu : a. Deskripsi Para penulis/analis biasanya mencoba menemukan cara untuk mendeskripsikan pola dan trend yang tersembunyi dalam data. b. Estimasi Estimasi mirip dengan klasifikasi, kecuali variabel tujuan yang lebih ke arah numerik daripada kategori. Misalnya, akan dilakukan estimasi tekanan systolic dari pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. 9

25 c. Prediksi Prediksi memiliki kemiripan dengan estimasi dan klasifikasi. Hanya saja, prediksi hasilnya menunjukkan sesuatu yang belum terjadi (mungkin terjadi dimasa depan). Misalnya, ingin diketahui prediksi harga beras tiga bulan yang akan datang. d. Klasifikasi Dalam klasifikasi variable, tujuan bersifat kategorik. Misalnya, kita akan mengklasifikasikan pendapatan dalam tiga kelas, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. e. Clustering Clustering lebih kearah pengelompokan record, pengamatan, atau kasus dalam kelas yang memiliki kemiripan. Sebuah cluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lain dan memiliki ketidak miripan dengan record-record dalam cluster yang lain, misalnya untuk tujuan audit akuntasi akan dilakukan segmentasi perilaku financial dalam kategori dan mencurigakan. f. Asosiasi Mengidentifikasi hubungan antara berbagai peristiwa yang terjadi pada satu waktu. Pendekatan asosiasi tersebut menekankan sebuah kelas masalah yang dicirikan dengan analisis keranjang pasar. 10

26 B. Clustering 1. Pengertian clustering. Clustering atau analisis cluster adalah proses pengelompokan satu set bendabenda fisik atau abstrak ke dalam kelas objek yang sama (Han and Kamber, 2006). Baskoro (2010) menyatakan bahwa : Clustering atau clusterisasi adalah salah satu alat bantu pada data mining yang bertujuan mengelompokkan obyek-obyek ke dalam cluster-cluster. Cluster adalah sekelompok atau sekumpulan obyek-obyek data yang similar satu sama lain dalam cluster yang sama dan dissimilar terhadap obyek-obyek yang berbeda cluster. Obyek akan dikelompokkan ke dalam satu atau lebih cluster sehingga obyek-obyek yang berada dalam satu cluster akan mempunyai kesamaan yang tinggi antara satu dengan lainnya. Obyek-obyek dikelompokkan berdasarkan prinsip memaksimalkan kesamaan obyek pada cluster yang sama dan memaksimalkan ketidaksamaan pada cluster yang berbeda. Kesamaan obyek biasanya diperoleh dari nilai-nilai atribut yang menjelaskan obyek data, sedangkan obyek-obyek data biasanya direpresentasikan sebagai sebuah titik dalam ruang multidimensi. Dengan menggunakan clusterisasi, kita dapat mengidentifikasi daerah yang padat, menemukan pola-pola distribusi secara keseluruhan, dan menemukan keterkaitan yang menarik antara atribut-atribut data. Dalam data mining, usaha difokuskan pada metode-metode penemuan untuk cluster pada basis data berukuran besar secara efektif dan efisien. Beberapa kebutuhan clusterisasi dalam data mining meliputi skalabilitas, kemampuan untuk menangani tipe 11

27 atribut yang berbeda, mampu menangani dimensionalitas yang tinggi, menangani data yang mempunyai noise, dan dapat diterjemahkan dengan mudah. Cluster1 Cluster 2 outliers Gambar 2.2 Contoh Clustering (Baskoro 2010) Adapun tujuan dari data clustering ini adalah untuk meminimalisasikan objective function yang diset dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan memaksimalisasikan variasi antar cluster. 2. Metode clustering. Secara garis besar, terdapat beberapa metode clusterisasi data. Pemilihan metode clusterisasi bergantung pada tipe data dan tujuan clusterisasi itu sendiri. Metodemetode beserta algoritma yang termasuk didalamnya meliputi (Baskoro, 2010): 12

28 a. Partitioning Method Membangun berbagai partisi dan kemudian mengevaluasi partisi tersebut dengan beberapa kriteria, yang termasuk metode ini meliputi algoritma K-Means, K- Medoid, PROCLUS, CLARA, CLARANS, dan PAM. b. Hierarchical Methods Membuat suatu penguraian secara hierarkikal dari himpunan data dengan menggunakan beberapa kriteria. Metode ini terdiri atas dua macam, yaitu Agglomerative yang menggunakan strategi bottom-up dan Disisive yang menggunakan strategi top-down. Metode ini meliputi algoritma BIRCH, AGNES, DIANA, CURE, dan CHAMELEON. c. Density-based Methods Metode ini berdasarkan konektivitas dan fungsi densitas. Metode ini meliputi algoritma DBSCAN, OPTICS, dan DENCLU. d. Grid-based Methods Metode ini berdasarkan suatu struktur granularitas multi-level. Metode clusterisasi ini meliputi algoritma STING, WaveCluster, dan CLIQUE. e. Model-based Methods Suatu model dihipotesakan untuk masing-masing cluster dan ide untuk mencari best fit dari model tersebut untuk masing-masing yang lain. Metode clusterisasi ini meliputi pendekatan statitik, yaitu algoritma COBWEB dan jaringan syaraf tiruan, yaitu SOM. 13

29 Sadaaki et. al. (2008) menyatakan : Sebelum memutuskan berapa jumlah cluster yang akan dibentuk bahwa terdapat dua pendekatan yang dapat digunakan yaitu : a. supervised (jika jumlah cluster ditentukan). b. unsupervised (jika jumlah cluster tidak ditentukan/alami). 3. Document clustering. Document clustering merupakan suatu teknik untuk mengelompokkan dokumen-dokumen berdasarkan kemiripannya dengan tujuan mendapatkan sekumpulan dokumen yang tepat (Widyawati, 2010). Dokumen-dokumen tersebut dikelompokan ke dalam cluster berdasarkan tingkat kemiripannya. Suatu cluster dapat dikatakan bagus apabila tingkat kemiripan antar anggota cluster sangat tinggi dan tingkat kemiripan antar cluster sangat rendah. Sedangkan kualitas suatu cluster dapat diukur melalui kemampuannya dalam menemukan pola-pola yang tersembunyi. 4. Klasifikasi algoritma clustering. Algoritma clustering secara luas diklasifikasikan menjadi dua algoritma, yaitu hierarchical clustering, dan non-hierarchical clustering (Henjaya, 2010). Han and Kamber (2006) menyatakan bahwa hierarchical clustering adalah sebuah metode hierarkis yang menciptakan komposisi hierarkis yang diterapkan pada objek data, sehingga akan menghasilkan cluster-cluster yang bersarang. Algoritma hierarchical clustering mengatur seluruh objek dalam sebuah pohon untuk melihat 14

30 hubungan antara setiap objek (Henjaya, 2010). Contoh algoritma Hierarchical clustering adalah HAC (Hierarchical Agglomerative Clustering) (Karhendana, 2008). Non-hierarchical clustering, pada umumnya disebut algoritma partitional clustering, memberikan sejumlah n objek dan k yang merupakan jumlah dari cluster yang terbentuk. Algoritma partitional clustering mengolah objek ke dalam k- kelompok berdasarkan kriteria optimasi tertentu, dimana setiap kelompok merupakan representasi sebuah cluster. Han and Kamber (2006) menyatakan bahwa contoh algoritma partitional clustering antara lain K-Means. C. Penulisan Terkait Berdasarkan penulisan yang dilakukan oleh Firdausi dkk pada tahun 2011 tentang Analisis Financial Distress Dengan Pendekatan Data Mining Pada Industri Manufaktur Go-Public Di Indonesia, dikemukakan bahwa penulisan tersebut berisi tentang perbandingan algoritma K-Means dan Fuzzy C-Means (FCM). Cara kerja algoritma K-Means dalam pengelompokan data keuangan dan data perusahaan yang akan mengalami kebangkrutan lebih baik dari cara kerja algoritma FCM, dimana dalam penulisan itu menggunakan rumus sum squared error (SSE) serta icdrate (internal cluster disprersion rate). Dimana dari penulisan ini didapatkan nilai SSE terkecil pada K-Means, menunjukkan bahwa total kesalahan kuadrat yang terjadi pada pengelompokkan metode tersebut kecil. Sehingga metode itu dapat dikatakan memiliki nilai error terkecil dan lebih baik dibandingkan metode FCM. 15

31 Pada metode FCM, keragaman dalam cluster (Sum of Squared Within) SSW bernilai tertinggi serta keragaman antar cluster (Sum of Squared Between) SSB bernilai paling rendah sehingga metode FCM memiliki nilai icdrate tertinggi dibandingkan K-Means. Hal ini menunjukkan pada pengelompokkan dengan menggunakan metode FCM, terdapat banyak data berbeda dalam tiap cluster yang terbentuk dan tercermin pada nilai SSW yang tinggi. Serta sedikitnya perbedaan data antar cluster yang terbentuk dapat dikatakan perbedaan antar cluster 1 dan 2 tidak jauh beda yang tercermin pada nilai SSB yang rendah. Nilai terkecil pada seluruh metode K-Means tercipta karena keragaman dalam cluster SSW yang terbentuk sangat kecil dan keragaman antar cluster SSB sangat tinggi. Oleh karena itu antara metode K-Means dengan FCM setelah dibandingkan dengan mempertimbangkan nilai SSE dan icdrate, didapatkan metode K-Means sebagai metode terbaik. Penulisan lain yang dilakukan oleh Wahyuni pada tahun 2009 dalam jurnalnya yang berjudul Penggunaan Cluster-Based Sampling Untuk Penggalian Kaidah Asosiasi Multi Obyektif, menjelaskan bahwa algoritma K-Means lebih baik dibandingkan algoritma FCM. Dalam penulisan ini berisi tentang dua pembandingan metode clustering yaitu K-Means dan FCM. Adapun penulisan ini membahas hasil penggalian kaidah asosiasi multi obyektif dengan menggunakan sampel yang dilakukan proses clustering terlebih dahulu akan menghasilkan kaidah-kaidah asosiasi yang lebih baik. Hal ini ditunjukkan dengan nilai rata-rata yang diperoleh mempunyai nilai yang lebih besar dibandingkan data yang tidak melalui proses clustering terlebih dahulu. Perbandingan metode clustering yang digunakan yaitu K- Means dan FCM. Metode K-Means lebih baik daripada FCM, hal ini ditunjukkan 16

32 dengan nilai rata-rata confidence yang dihasilkan menggunakan metode K-Means mempunyai nilai yang lebih besar dibandingkan dengan metode FCM. Penulisan yang dilakukan oleh Widyawati pada tahun 2010 dalam skripsinya yang berjudul Perbandingan Clustering Based On Frequent Word Sequence (CFWS) Dan K-Means Untuk Pengelompokkan Dokumen Berbahasa Indonesia menjelaskan bahwa didapatkan nilai F-Measure dan Purity hasil implementasi menggunakan algoritma K-Means lebih tinggi dibandingkan dengan implementasi menggunakan algoritma CFWS. Hal ini membuktikan bahwa algoritma K-Means lebih tepat digunakan untuk pengelompokkan dokumen berbahasa Indonesia. D. Algoritma K-Means 1. Pengertian K-Means. K-Means merupakan algoritma yang umum digunakan untuk clustering dokumen. Prinsip utama K-Means adalah menyusun k prototype atau pusat massa (centroid) dari sekumpulan data berdimensi n (Aryan, 2010). Sebelum diterapkan proses algoritma K-means, dokumen akan di preprocessing terlebih dahulu. Kemudian dokumen direpresentasikan sebagai vektor yang memiliki term dengan nilai tertentu. Agusta (2007) menyatakan bahwa K-Means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Metode ini mempartisi data ke dalam cluster/kelompok sehingga data yang memiliki karakteristik sama dikelompokkan ke dalam satu cluster yang sama. 17

33 2. Algoritma K-Means. Algoritma k-means merupakan algoritma yang membutuhkan parameter input sebanyak k dan membagi sekumpulan n objek kedalam k cluster sehingga tingkat kemiripan antar anggota dalam satu cluster tinggi sedangkan tingkat kemiripan dengan anggota pada cluster lain sangat rendah. Kemiripan anggota terhadap cluster diukur dengan kedekatan objek terhadap nilai mean pada cluster atau dapat disebut sebagai centroid cluster atau pusat massa (Widyawati, 2010). Berikut rumus pengukuran jarak menurut (Santosa, 2007) : d (x,y) = x-y 2 = n i=1(xi y i) 2... ( 1 ) Adapun rumus perhitungan jarak lainnya didefinisikan sebagai berikut : d (x,y) = ( xi yi ) 2 + ( xi yi ) 2... ( 2 ) Keterangan : d = titik dokumen x = data record y = data centroid Jarak yang terpendek antara centroid dengan dokumen menentukan posisi cluster suatu dokumen. Misalnya dokumen A mempunyai jarak yang paling pendek ke centroid 1 dibanding ke yang lain, maka dokumen A masuk ke group 1. Hitung kembali posisi centroid baru untuk tiap-tiap centroid (C i..j )dengan mengambil rata- 18

34 rata dokumen yang masuk pada cluster awal (G i..j ). Iterasi dilakukan terus hingga posisi group tidak berubah. Berikut rumus dari penentuan centroid. C (i) = 1 Gi xεc dx... ( 3 ) Adapun rumus iterasi lainnya didefinisikan sebagai berikut : C(i) = x 1 + x 2 + x.. + x... ( 4 ) x Keterangan : x 1 x 2 x = nilai data record ke-1 = nilai data record ke-2 = jumlah data record K-Means merupakan algoritma clustering yang bersifat partitional yaitu membagi himpunan objek data ke dalam sub himpunan (cluster) yang tidak overlap, sehingga setiap objek data berada tepat dalam satu cluster. Strategi partitionalclustering yang paling sering digunakan adalah berdasarkan kriteria square error. Secara umum, tujuan kriteria square error adalah untuk memperoleh partisi (jumlah cluster tetap) yang meminimalkan total square error. SSE (Sum Squared of Error) menyatakan total kesalahan kuadarat yang terjadi bila n data i n x,..., x dikelompokkan kedalam k cluster dengan pusat tiap cluster adalah k m,...,m 1. Nilai SSE tergantung pada jumlah cluster dan bagaimana data dikelompokkan ke dalam cluster-cluster tersebut. Semakin kecil nilai SSE, semakin bagus hasil clustering-nya. 19

35 Adapun rumus SSE adalah sebagai berikut : SSE = (C i ) 2 + (C i ) 2 + (C.. ) 2 + (C.. ) 2... ( 5 ) Keterangan : C i = nilai centroid 3. Tahapan algoritma K-Means. Widyawati (2010), menyatakan : Proses algoritma K-Means sebagai berikut : a. Pilih secara acak objek sebanyak k, objek-objek tersebut akan direpresentasikan sebagai mean pada cluster. b. Untuk setiap objek dimasukan kedalam cluster yang tingkat kemiripan objek terhadap cluster tersebut tinggi. Tingkat kemiripan ditentukan dengan jarak objek terhadap mean atau centroid cluster tersebut. c. Hitung nilai centroid yang baru pada masing-masing cluster. d. Proses tersebut diulang hingga anggota pada kumpulan cluster tersebut tidak berubah. Sedangkan menurut Adiningsih (2007) tahap penyelesaian algoritma K-Means adalah sebagai berikut : a. Menentukan K buah titik yang merepresentasikan obyek pada setiap cluster (centroid awal). b. Menetapkan setiap obyek pada cluster dengan posisi centroid terdekat. c. Jika semua obyek sudah dikelompokkan maka dilakukan perhitungan ulang dalam menentukan centroid yang baru. 20

36 d. Ulangi langkah ke-2 dan ke-3 sampai centroid tidak berubah. Kurniawan dkk (2010) menyatakan : Langkah-langkah dari algoritma K-Means yaitu : Start. Number of cluster K Centroid Distance objects to centroids No object move group End Grouping based on minimum distance Gambar 2.3 Cara Kerja Algoritma K-Means (Kurniawan dkk 2010) Berikut penjelasan dari gambar 2.3, dengan algoritma K-means dilakukan cara berikut hingga ditemukan hasil iterasi yang stabil : a. Menentukan data centroid, pada sistem ini, ditentukan bahwa centroid pertama adalah n data pertama dari data-data yang akan di-cluster. b. Menghitung jarak antara centroid dengan masing-masing data. c. Mengelompokkan data berdasarkan jarak minimum. 21

37 d. Jika penempatan data sudah sama dengan sebelumnya, maka stop. Jika tidak, kembali ke cara yang ke-2. 22

38 BAB III METODOLOGI PENELITIAN A. Objek Penelitian Penelitian ini dilakukan di salah satu Kabupaten yang ada di Provinsi Gorontalo, yaitu di Badan Pengelola Keuangan Dan Aset Daerah (BPKAD). 1. Gambaran umum badan pengelola keuangan dan aset daerah (BPKAD). Berdasarkan PP nomor 8 tahun 2003 tentang Pedoman Organisasi Perangkat Daerah mengamanatkan adanya penataan kembali Organisasi Perangkat Daerah. Sehingga Bagian Keuangan Sekretariat Daerah Kabupaten XYZ mengalami perubahan nama menjadi Badan Pengelola Keuangan dan Aset Daerah disingkat (BPKAD), yang dibentuk berdasarkan Peraturan Daerah Kabupaten XYZ nomor 15 tahun 2005 sampai dengan sekarang. Organisasinya terdiri dari Kepala Badan, Bagian Tata Usaha, Bidang Pendapatan, Bidang Belanja, Bidang Kekayaan dan Aset, Bidang Pembukuan dan Pelaporan, Kelompok Jabatan Fungsional, dan Unit Pelaksana Teknis (UPT) Badan Pengelola Keuangan dan Aset Daerah dipimpin oleh seorang Kepala Badan yang berada dibawah dan bertanggung jawab kepada Bupati melalui Sekretaris Daerah, mempunyai tugas menyelenggarakan kewenangan pemerintah dalam bidang Pengelolaan Keuangan dan Aset Daerah. 23

39 2. Visi badan pengelola keuangan dan aset daerah (BPKAD). Perencanaan pengendalian manajemen pengelolaan keuangan daerah serta optimalisasi penerimaan pendapatan dan pengelolaan aset daerah dalam rangka mendukung pencapaian program pemerintah daerah Kabupaten XYZ. 3. Misi badan pengelola keuangan dan aset daerah (BPKAD). a. Merumuskan kebijakan teknis pengelolaan keuangan. b. Optimalisasi dan diversifikasi potensi penerimaan. c. Penataan dan pengembangan sistem pengelolaan keuangan. d. Peningkatan kemampuan sumber daya aparatur pengelola keuangan daerah. e. Diversifikasi pemanfaatan dan pengamanan aset daerah dalam menunjang pelaksanaan program. f. Pengendalian dan pengawasan teknis pengelolaan keuangan daerah. 24

40 4. Struktur organisasi badan pengelola keuangan dan aset daerah (BPKAD). STRUKTUR ORGANISASI BADAN PENGELOLA KEUANGAN DAN ASET DAERAH KABUPATEN XYZ KEPALA BADAN SEKRETARIS SUB BAGIAN KEUANGAN SUB BAGIAN PENYUSUNAN PROGRAM SUB BAGIAN UMUM & KEPEGAWAIAN BIDANG PENDAPATAN BIDANG BELANJA BIDANG KEKAYAAN DAN ASSET BIDANG PEMBUKUAN DAN PELAPORAN SUB BIDANG PAD SUB BID. ANGGARAN DAN PERMODALAN SUB BIDANG PENGADAAN DAN PERAWATAN SUB BIDANG VERIVIKASI SUB BID. PENDAPATAN DAERAH LAINNYA SUB BID. PERBENDAHARAAN SUB BID. PEMANFAATAN DAN PENGENDALIAN SUB BID. PEMBUKUAN DAN PELAPORAN UPT 25

41 B. Metode Penelitian Metode penelitian yang digunakan pada penulisan kali ini adalah metode eksperimen. Metode eksperimen merupakan rancangan penelitian yang mengidentifikasi hubungan kausal (Sudaryono dkk:45, 2011). C. Teknik Pengumpulan Data Adapun teknik yang dilakukan oleh penulis yaitu : 1. Studi literatur. Dengan mengumpulkan dan mempelajari literatur yang berkaitan dengan konsep DM clustering, yang menggunakan algoritma K-Means. Sumber literatur berupa buku teks, paper, jurnal, karya ilmiah, dan situs-situs penunjang. 2. Teknik pengumpulan data arsip. Dengan mengumpulkan data arsip yang berkaitan dengan data APBD Kabupaten XYZ serta data tentang analisis isi yang digunakan. 26

42 D. Tahapan Penelitian Mulai pengumpulan data Jurnal, Buku Studi Pustaka Pengumpulan DataArsip Instansi / SKPD praproses Seleksi data Cleaning Tranformasi data Clustering (menggunkan Algoritma K-means) Hasil Selesai Gambar 3.1 Tahapan penelitian 27

43 Adapun tahapan penelitian yang akan dilakukan penulis dalam proses penelitian ini adalah sebagai berikut : 1. Studi pustaka. Dengan mengumpulkan dan mempelajari literatur yang berkaitan dengan konsep DM clustering, yang menggunakan algoritma K-Means. Sumber literatur berupa buku teks, paper, jurnal, karya ilmiah, dan situs-situs penunjang. 2. Pengumpulan data arsip. Untuk mengetahui informasi yang dibutuhkan, penulis melakukan pengumpulan data arsip (laporan APBD dari tahun ). 3. Praproses data. Praproses data meliputi : a. Seleksi data. Untuk memilih himpunan data (dataset) yang akan digunakan pada penulisan ini, yaitu data pendapatan, belanja langsung dan tidak langsung. b. Cleaning. Untuk membersihkan data, yaitu melengkapi data, menghapus data duplikat, menghilangkan noise. c. Transformasi data. Untuk memformat data agar siap di cluster. 4. Clustering menggunakan algoritma k-means. Tahapan proses dimana data yang sudah dipraproses di cluster dengan menggunakan cara kerja algoritma K-Means. 28

44 a. Pilih jumlah cluster k. Inisialisasi k pusat cluster ini dapat dilakukan dengan berbagai cara. Cara random sering digunakan, pusat-pusat cluster diberi nilai awal dengan angka-angka random dan digunakan sebagai pusat cluster awal. b. Tempatkan setiap data/obyek ke cluster terdekat, kedekatan kedua obyek ditentukan berdasarkan jarak kedua obyek tersebut. Demikian juga kedekatan suatu data ke cluster tertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap ini perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak paling dekat antara satu data dengan satu cluster tertentu akan menentukan suatu data masuk dalam cluster mana. Adapun penghitungan jarak menggunakan rumus Eulidean. d (x,y) = ( xi yi ) 2 + ( xi yi ) 2 c. Hitung kembali pusat cluster dengan keanggotaan cluster yang sekarang. Pusat cluster adalah rata-rata dari semua data/obyek dalam cluster tertentu. Penghitungannya melalui penentuan centroid/pusat cluster. C(i) = x 1 + x 2 + x.. + x x Jarak yang terpendek antara pusat cluster dengan data/obyek menentukan posisi cluster suatu data/obyek. Misalnya data/obyek A mempunyai jarak yang paling pendek ke pusat cluster 1 dibanding ke yang lain, maka data/obyek A masuk ke cluster 1. d. Tugaskan kembali setiap obyek dengan menggunakan pusat cluster yang baru. Jika pusat cluster sudah tidak berubah lagi, maka proses pengclusteran selesai. 29

45 Bila berubah, maka kembali ke langkah no.3 hingga pusat cluster tidak berubah lagi. e. Setelah proses pengclusteran selesai, maka akan di hitung nilai SSE dari setiap cluster. Nilai SSE tergantung pada jumlah cluster dan bagaimana data dikelompokkan ke dalam cluster-cluster tersebut. Tujuannya untuk memperoleh partisi (jumlah cluster tetap) yang meminimalkan total square error. Semakin kecil nilai SSE, semakin bagus hasil clustering-nya. Berikut cara kerja dari SSE. SSE = (C i ) 2 + (C i ) 2 + (C.. ) 2 + (C.. ) 2 5. Analisis hasil clusterisasi. Tahapan untuk menganalisa hasil yang sudah diperoleh pada proses clustering. 6. Selesai. 30

46 E. Jadwal Penelitian NO KEGIATAN BULAN Maret April Mei Juni Juli Penyusunan Proposal 2. Pengumpulan Data 3. Praproses data 4. Clusterisasi Data 5. Analisis Hasil Clusterisasi 6. Penyusunan Laporan 7. Ujian Skripsi 31

47 BAB IV HASIL DAN PEMBAHASAN A. Tahapan Penelitian 1. Praproses data. Data yang digunakan dalam penelitian ini yaitu 6 tahun terakhir ( ) yang terdiri dari beberapa tabel antara lain tabel tahun, nama instansi, uraian, rincian item, dan rincian biaya. Adapun atribut tersebut yaitu : a. Tahun. Merupakan atribut yang berisi laporan tiap tahun di setiap laporan data anggaran dan pendapatan. b. Nama instansi. Merupakan atribut yang berisi nama-nama badan pemerintah yang tercantum pada kabupaten tersebut. c. Uraian. Merupakan atribut yang berisi item pendapatan, belanja tidak langsung dan belanja langsung. d. Rincian item. Merupakan atribut yang berisi rincian pembelanjaan dari transaksi pendapatan, belanja tidak langsung dan belanja langsung dari setiap instansi. e. Rincian biaya. Merupakan atribut yang berisi jumlah keuangan dari setiap transaksi. 32

48 Hasil akhir dari seleksi atribut didapatkan 4 atribut yang telah relevan dan konsisten, tetapi hanya 2 atribut saja yang digunakan dalam proses clustering yaitu atribut uraian ( pendapatan, belanja langsung dan belanja tidak langsung ) dan rincian biaya. Karena informasi yang terkandung di dalamnya sudah mewakili informasi yang dibutuhkan untuk dijadikan indikator penentu dalam proses clustering menggunakan algoritma K-Means. 2. Cleaning data. Dilakukan pembersihan data terhadap data yang memiliki redundant. Dalam dataset terdapat tabel tahun, nama instansi, rincian item dan rincian biaya, atribut yang dihapus yaitu (tabel tahun, nama instansi dan rincian item). Hal itu dilakukan karena data tersebut tidak akan memberikan informasi apapun jika dipertahankan. Tabel 4.1 Contoh data yang redundant Tahun Nama Instansi Rincian Item 2007 Dinas Pendidikan o Hasil retribusi daerah o Belanja pegawai o Program pelayanan administrasi perkantoran o Program peningkatan sarana dan prasarana aparatur o Program peningkatan disiplin aparatur o Program peningkatan kapasitas sumber daya aparatur 3. Clustering menggunakan algoritma K-Means. Berikut cara algoritma K-Means mempartisi dataset ke dalam cluster. a. Algoritma menerima jumlah cluster untuk mengelompokkan data. Dataset yang akan dicluster dijadikan sebagai nilai input. 33

49 b. Algoritma membuat sebanyak k cluster awal (k = jumlah cluster yang terbentuk) dari dataset. c. Algoritma K-Means menghitung nilai rata-rata dari setiap cluster yang dibentuk dalam dataset. Sebagai contoh jika di dalam dataset terdapat record Q yang menerima nilai pendapatan, belanja tidak langsung dan belanja langsung, maka ditulis Q = {pendapatan, belanja tidak langsung, belanja langsung}. Jika nilai pendapatan , belanja tidak langsung , belanja langsung Maka ditulis Q = { , , }, d. K-Means menghitung ulang rata-rata dari semua cluster. Rata-rata dari setiap cluster adalah rata-rata dari semua record dalam cluster. Sebagai contoh, sebuah cluster berisi 3 record Q = { , , }, dan R = { , , }. Maka rata-rata dalam sebuah record dinyatakan sebagai, nilai rata-rata pendapatan pada record Q ditambahkan nilai rata-rata pendapatan pada record R, kemudian dibagi 2. Rata-rata pada pendapatan = ( )/2. Rata-rata pada belanja tidak langsung = ( )/2. Ratarata pada belanja langsung = ( )/2. Rataan nilai itu akan menjadi pusat dari cluster yang baru. e. K-Means mengirimkan lagi setiap data record di dalam dataset ke salah satu dari cluster yang baru terbentuk. f. Hitung kembali pusat cluster dengan anggota cluster sebelumnya, hingga terbentuk cluster yang stabil dan prosedur K-Means selesai. Cluster stabil terbentuk saat iterasi dari K-Means tidak membuat cluster baru sebagai pusat cluster, yang mana nilai cluster baru sama dengan nilai cluster lama. 34

50 g. Menghitung nilai SSE. B. Tahap Analisis Dalam penelitian ini penulis menentukan dahulu jumlah k, yaitu ada 3 (pendapatan, belanja tidak langsung dan belanja langsung). Tabel 4.2 Data APBD Kabupaten XYZ 6 tahun terakhir Tahun Pendapatan Belanja Tidak Belanja Langsung Langsung Proses clustering dalam k-means. Dalam tahap ini penulis menentukan nilai centroid menjadi 2 bagian, yaitu yang mempunyai 3 centroid serta 2 centroid. Hal ini dilakukan untuk mengetahui jumlah centroid mana yang paling baik, karena dalam perumusan K-Means nilai cluster yang paling terkecil akan menjadi nilai cluster yang paling baik. a. Proses clustering dalam k-means dengan pengujian 3 nilai centroid dan 2 nilai centroid. 35

51 1) Perhitungan centroid awal. Tahapan clusterisasi menggunakan algoritma K-Means, diawali dengan pembentukan cluster pada dataset yaitu 3 cluster dengan pengujian 2 parameter berupa 3 nilai centroid dan 2 nilai centroid. a) Perhitungan centroid awal dengan 3 nilai centroid. Cluster Nilai Pendapatan : (C 0 ) = ,5 2 (C 1 ) = (C 2 ) = Cluster Nilai Belanja Tidak Langsung : (C 0 ) = ,5 2 (C 1 ) = ,5 2 (C 2 ) = ,5 2 36

52 Cluster Nilai Belanja Langsung : (C 0 ) = (C 1 ) = ,5 2 (C 2 ) = b) Perhitungan centroid awal dengan 2 nilai centroid. Cluster Nilai Pendapatan : (C 0 ) = ,34 3 (C 1 ) = ,67 3 Cluster Nilai Belanja Tidak Langsung : (C 0 ) = (C 1 ) = ,

53 Cluster Nilai Belanja Langsung : (C 0 ) = ,67 3 (C 1 ) = Tabel 4.3 Hasil perhitungan centroid setiap cluster pada pengujian 2 parameter 3 centroid 2 centroid Cluster C 0 C 1 C 2 C 0 C 1 Pendapatan , , ,67 Belanja Tidak Langsung , , , ,67 Belanja Langsung , , ) Proses perhitungan jarak. Dalam langkah ini dilakukan proses perhitungan jarak untuk mengetahui masing masing hasil jarak data pada jumlah k di setiap centroid. Melakukan penghitungan untuk menentukan jarak setiap data dengan centroid awal, menggunakan rumus euclidiance distance. a) Perhitungan jarak dengan 3 nilai centroid. Jarak antara data pertama dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,58 38

54 Jarak antara data pertama dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ,5) 2 + ( ,5) 2 = ,44 Jarak antara data pertama dengan centroid ketiga (C 2 ) : d 1,2 = ( ) 2 + ( ,5) 2 + ( ) 2 = ,21 Jarak antara data kedua dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,58 Jarak antara data kedua dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ,5) 2 + ( ,5) 2 = ,79 Jarak antara data kedua dengan centroid ketiga (C 2 ) : d 1,2 = ( ) 2 + ( ,5) 2 + ( ) 2 = ,41 Jarak antara data ketiga dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,35 39

55 Jarak antara data ketiga dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ,5) 2 + ( ,5) 2 = ,19 Jarak antara data ketiga dengan centroid ketiga (C 2 ) : d 1,2 = ( ) 2 + ( ,5) 2 + ( ) 2 = ,53 Jarak antara data keempat dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,7 Jarak antara data keempat dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ,5) 2 + ( ,5) 2 = ,19 Jarak antara data keempat dengan centroid ketiga (C 2 ) : d 1,2 = ( ) 2 + ( ,5) 2 + ( ) 2 = ,81 Jarak antara data kelima dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,39 40

56 Jarak antara data kelima dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ,5) 2 + ( ,5) 2 = ,69 Jarak antara data kelima dengan centroid ketiga(c 2 ) : d 1,2 = ( ) 2 + ( ,5) 2 + ( ) 2 = ,64 Jarak antara data keenam dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,6 Jarak antara data keenam dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ,5) 2 + ( ,5) 2 = ,18 Jarak antara data keenam dengan centroid ketiga (C 2 ) : d 1,2 = ( ) 2 + ( ,5) 2 + ( ) 2 = ,64 b) Perhitungan jarak dengan 2 nilai centroid. Jarak antara data pertama dengan centroid pertama (C 0 ) : d 1,0 = ( ,34) 2 + ( ) 2 + ( ,67) 2 = ,95 41

57 Jarak antara data pertama dengan centroid kedua (C 1 ) : d 1,1 = ( ,67) 2 + ( ,67) 2 + ( ) 2 = ,91 Jarak antara data kedua dengan centroid pertama (C 0 ) : d 1,0 = ( ,33) 2 + ( ) 2 + ( ,67) 2 = ,92 Jarak antara data kedua dengan centroid kedua (C 1 ) : d 1, 1 = ( ,67) 2 + ( ,67) 2 + ( ) 2 = Jarak antara data ketiga dengan centroid pertama (C 0 ) : d 1,0 = ( ,33) 2 + ( ) 2 + ( ,67) 2 = ,57 Jarak antara data ketiga dengan centroid kedua (C 1 ) : d 1,1 = ( ,67) 2 + ( ,67) 2 + ( ) 2 = ,98 Jarak antara data keempat dengan centroid pertama (C 0 ) : d 1,0 = ( ,33) 2 + ( ) 2 + ( ,67) 2 = ,25 42

58 Jarak antara data keempat dengan centroid kedua (C 1 ) : d 1,1 = ( ,67) 2 + ( ,67) 2 + ( ) 2 = ,21 Jarak antara data kelima dengan centroid pertama (C 0 ) : d 1,0 = ( ,33) 2 + ( ) 2 + ( ,67) 2 = ,52 Jarak antara data kelima dengan centroid kedua (C 1 ) : d 1,1 = ( ,67) 2 + ( ,67) 2 + ( ) 2 = ,03 Jarak antara data keenam dengan centroid pertama (C 0 ) : d 1,0 = ( ,33) 2 + ( ) 2 + ( ,67) 2 = ,38 Jarak antara data keenam dengan centroid kedua (C 1 ) : d 1,1 = ( ,67) 2 + ( ,67) 2 + ( ) 2 = ,12 43

59 Tabel 4.4 Hasil perhitungan jarak data pada nilai k dengan masing-masing centroid setiap cluster Data 3 centroid 2 centroid C 0 C 1 C 2 C 0 C , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,12 3) Melakukan iterasi. Berdasarkan cara kerja algoritma K-Means setelah ditentukan nilai k lalu menghitung nilai centroid dan jarak antar data pada setiap masing-masing centroid. Dalam tahap ini dilakukan perhitungan kembali nilai centroid pada masing-masing cluster yang dinamakan iterasi, hingga nilai centroid tidak berubah dari sebelumnya. a) Perhitungan iterasi pertama pada cluster pendapatan dengan 3 nilai centroid. Tabel 4.5 Perhitungan iterasi pertama pada cluster pendapatan Tahun Data Ke- Centroid C 0 C 1 C , , , , , , , , , , , , , , , , , ,64 44

60 Hitung kembali centroid o centroid pertama (C 0 ) = = ,5 o centroid kedua (C 1 ) = = o centroid ketiga (C 2 ) = = b) Perhitungan iterasi pertama pada cluster belanja tidak langsung dengan 3 nilai centroid. Tabel 4.6 Perhitungan iterasi pertama pada cluster belanja tidak langsung Tahun Data Ke- Centroid C 0 C 1 C , , , , , , , , , , , , , , , , , ,64 45

61 Hitung kembali centroid o centroid pertama (C 0 ) = = ,5 o centroid kedua (C 1 ) = = ,5 o centroid ketiga (C 2 ) = = ,5 c) Perhitungan iterasi pertama pada cluster belanja langsung dengan 3 nilai centroid. Tabel 4.7 Perhitungan iterasi pertama pada cluster belanja langsung Tahun Data Ke- Centroid C 0 C 1 C , , , , , , , , , , , , , , , , , ,64 46

62 Hitung kembali centroid o centroid pertama (C 0 ) = = o centroid kedua (C 1 ) = = ,5 o centroid ketiga (C 2 ) = = Karena pada iterasi pertama nilai centroid pusat tidak berubah sama dengan nilai centroid sebelumnya, maka proses iterasi dihentikan. 47

63 d) Perhitungan iterasi pertama pada cluster pendapatan dengan 2 nilai centroid. Tabel 4.8 Perhitungan iterasi pertama pada cluster pendapatan Tahun Data Ke- Centroid C 0 C , , , , , , , , , , , ,12 Hitung kembali centroid o centroid pertama (C 0 ) = = ,5 o centroid kedua (C 1 ) = =

64 e) Perhitungan iterasi pertama pada cluster belanja tidak langsung dengan 2 nilai centroid. Tabel 4.9 Perhitungan iterasi pertama pada cluster belanja tidak langsung Tahun Data Ke- Centroid C 0 C , , , , , , , , , , , ,12 Hitung kembali centroid o centroid pertama (C 0 ) = = ,5 o centroid kedua (C 1 ) = =

65 f) Perhitungan iterasi pertama pada cluster belanja langsung dengan 2 nilai centroid. Tabel 4.10 Perhitungan iterasi pertama pada cluster belanja langsung Centroid Tahun Data Ke- C 0 C , , , , , , , , , , , ,12 Hitung kembali centroid o centroid pertama (C 0 ) = = o centroid kedua (C 1 ) = = ,8 Karena nilai centroid dari hasil iterasi pertama berbeda dari nilai centroid awal, maka dilakukan lagi iterasi kedua. 50

66 Jarak antara data pertama dengan centroid pertama (C 0 ) : d 1,0 = ( ) 2 + ( ,5) 2 + ( ) 2 = ,58 Jarak antara data pertama dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ) 2 + ( ,8) 2 = ,08 Jarak antara data kedua dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,88 Jarak antara data kedua dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ) 2 + ( ,8) 2 = ,65 Jarak antara data ketiga dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,35 Jarak antara data ketiga dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ) 2 + ( ,8) 2 = ,95 51

67 Jarak antara data keempat dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,70 Jarak antara data keempat dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ) 2 + ( ,8) 2 = ,58 Jarak antara data kelima dengan centroid pertama (C 0 ) : d 1,0 = ( ,5) 2 + ( ,5) 2 + ( ) 2 = ,39 Jarak antara data kelima dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ) 2 + ( ,8) 2 = ,17 Jarak antara data keenam dengan centroid pertama (C 0 ) : d 1,0 = (360, ) , = ,60 Jarak antara data keenam dengan centroid kedua (C 1 ) : d 1,1 = ( ) 2 + ( ) 2 + ( ,8) 2 = ,26 52

68 Tabel 4.11 Hasil perhitungan jarak data terhadap masing-masing nilai centroid untuk dijadikan sebagai perhitungan Data ke - C 0 C , , , , , , , , , , , ,26 g) Perhitungan iterasi kedua pada cluster pendapatan dengan 2 nilai centroid. Tabel 4.12 Perhitungan iterasi kedua pada cluster pendapatan Tahun Data Ke- Centroid C 0 C , , , , , , , , , , , ,26 Hitung kembali centroid o centroid pertama (C 0 ) = = ,5 o centroid kedua (C 1 ) = =

69 h) Perhitungan iterasi kedua pada cluster belanja tidak langsung dengan 2 nilai centroid. Tabel 4.13 Perhitungan iterasi kedua pada cluster belanja tidak langsung Tahun Data Ke- Centroid C 0 C , , , , , , , , , , , ,26 Hitung kembali centroid o centroid pertama (C 0 ) = = ,5 o centroid kedua (C 1 ) = =

70 i) Perhitungan iterasi kedua pada cluster belanja langsung dengan 2 nilai centroid. Tabel 4.14 Perhitungan iterasi kedua pada cluster belanja langsung Centroid Tahun Data Ke- C 0 C , , , , , , , , , , , ,26 Hitung kembali centroid o centroid pertama (C 0 ) = = o centroid kedua (C 1 ) = = ,8 Karena hasil nilai centroid pada iterasi kedua sama dengan hasil iterasi pertama, maka perhitungan dihentikan. 55

71 Tabel 4.15 Hasil akhir perhitungan iterasi dengan 3 nilai centroid dan 2 nilai centroid Centroid Iterasi Cluster 3 2 C 0 C 1 C 2 C 0 C 1 Pertama Pendapatan , , Belanja , , , , Tidak Langsung Belanja , ,8 Langsung Kedua Pendapatan , Belanja , Tidak Langsung Belanja ,8 Langsung 4) Menghitung nilai SSE. Dalam tahap ini akan dilakukan perhitungan nilai centroid dari hasil iterasi, jika hasil nilai SSE-nya semakin kecil maka akan semakin baik hasil clusteringnya. Akan ada 2 pengujian parameter dalam menghitung nilai SSE, hasilnya akan dijadikan sebagai penentu cluster mana yang paling baik. a) Perhitungan nilai SSE pada 3 nilai centroid. SSE = (48.561, ,58 2 ) + (11.974, ,19 2 ) + (24.826, ,64 2 ) = ,88 b) Perhitungan nilai SSE pada 2 nilai centroid. SSE = (48.561, ,58 2 ) + (42.704, , ,26 2 ) = ,67 56

72 Setelah dihitung ternyata nilai SSE pada 3 centroid yang paling kecil dibandingkan dengan 2 centroid, bisa disimpulkan bahwa cluster dengan 3 centroid yang paling baik dan dijadikan sebagai cluster yang terbaik dalam penulisan ini. Tabel 4.16 Hasil perhitungan nilai SSE dengan 3 nilai centroid dan 2 nilai centroid Centroid SSE , ,67 2. Pola hasil clustering dengan K-Means. Algoritma K-means dalam proses clustering pada data pendapatan, belanja tidak langsung serta belanja langsung digunakan untuk pembentukan nilai clustering dan karakteristik dari setiap cluster yang akan menemukan nilai centroid / means ( ratarata ) sehingga akan terbentuk jarak pada setiap data yang akhirnya akan terbentuk nilai anggota pada setiap cluster. Setelah terbentuk nilai anggota pada masing-masing cluster, maka akan terlihat cluster nilai pendapatan, belanja tidak langsung dan belanja langsung di setiap tahunnya. Dengan membandingkan data asli dari nilai pendapatan, belanja tidak langsung dan belanja langsung sebelum di cluster. Nilai anggota tersebut yang akan digunakan dalam melakukan estimasi nilai pendapatan, belanja tidak langsung dan belanja langsung pada waktu yang akan datang. Berikut data APBD sebelum di cluster : 57

73 Tabel 4.17 Data APBD sebelum di cluster Tahun Pendapatan Belanja Tidak Langsung Belanja Langsung Data APBD setelah di cluster : 1) Nilai anggota pada cluster pertama (C 0 ). Tabel 4.18 Nilai anggota pendapatan, belanja tidak langsung dan belanja langsung pada (C 0 ) Tahun Pendapatan Belanja Tidak Belanja Langsung Langsung 2006 Rp Rp Rp Rp Rp Rp ) Nilai anggota pada cluster kedua (C 1 ). Tabel 4.19 Nilai anggota pendapatan, belanja tidak langsung dan belanja langsung pada (C 1 ) Tahun Pendapatan Belanja Tidak Belanja Langsung Langsung 2008 Rp Rp Rp Rp Rp Rp

74 3) Nilai anggota pada cluster ketiga (C 2 ). Tabel 4.20 Nilai anggota pendapatan, belanja tidak langsung dan belanja langsung pada (C 2 ) Tahun Pendapatan Belanja Tidak Belanja Langsung Langsung 2010 Rp Rp Rp Rp Rp Rp Berdasarkan hasil clustering dengan K-Means, maka didapatkan pola hasilnya dari setiap cluster. Berikut penjelasan dari masing-masing cluster pada setiap anggota cluster : a) Anggota data pada cluster pertama (C 0 ) mempunyai karakteristik nilai pendapatan sebesar Rp ,- sampai Rp ,-. Nilai belanja tidak langsung Rp ,- sampai Rp ,-. Nilai belanja langsung Rp ,- sampai Rp ,-. b) Anggota data pada cluster kedua (C 1 ) mempunyai karakteristik nilai pendapatan sebesar Rp ,- sampai Rp ,-. Nilai belanja tidak langsung Rp ,- sampai Rp ,-. Nilai belanja langsung Rp ,- sampai Rp ,-. c) Anggota data pada cluster ketiga (C 2 ) mempunyai karakteristik nilai pendapatan sebesar Rp ,- sampai Rp ,-. Nilai belanja tidak langsung Rp ,- sampai Rp ,-. Nilai belanja langsung Rp ,- sampai Rp ,-. 59

75 Setelah seluruh nilai anggota pada cluster terbentuk maka akan diketahui termasuk kedalam cluster berapa nilai pendapatan, belanja tidak langsung dan belanja langsung pada record data selanjutnya. Hanya dengan mengetahui nilai pendapatan, maka dapat diketahui estimasi nilai belanja tidak langsung dan belanja langsung pada lembaga pemerintahan tersebut. Berikut data APBD pada tahun Tabel 4.21 Nilai anggota pendapatan 2012 Tahun Pendapatan 2012 Rp Misalkan record data pada tabel diatas dimasukkan kedalam tabel yang berisi hasil perhitungan dari clustering menggunakan K-Means, maka akan bisa diestimasi nilai belanja tidak langsung dan belanja langsung. Tabel 4.22 Contoh nilai outlier Tahun Data ke- Pendapatan Rp Rp = x Rp Belanja Tidak Langsung Rp Rp Belanja Langsung Rp Rp Clus ter C 2 C 2? 60

76 Berdasarkan nilai pendapatan, dapat diketahui termasuk dalam cluster berapa data APBD yang selanjutnya. Jika data APBD 2012 mempunyai nilai pendapatan = Rp ,-, maka bisa di estimasi nilai belanja tidak langsung Rp = ,76,- Rp ,24,- serta estimasi nilai belanja langsung = Rp ,76,- Rp ,24,-. Maka dapat diketahui record data tersebut termasuk dalam cluster (C 2 ). Hal ini didasari atas kedekatan jarak data sebelumnya dengan data yang baru ( data x ). Tabel 4.23 Contoh estimasi nilai outlier Data ke- Pendapatan 5 Rp Rp = x Rp Belanja Tidak Langsung Belanja Langsung Cluster Rp Rp C 2 Rp Rp C 2 Rp = ,76,- Rp ,24 (estimasi) Rp = ,76, - Rp ,24 (estimasi) C 2 61

77 3. Flowchart clustering K-Means. start jumlah k = 3 jumlah data = 6 Hitung nilai centroid Menghitung jarak antara setiap record data dengan centroid awal Mengelompokkan data berdasarkan nilai terkecil pada masing-masing record data Menghitung kembali nilai centroid centroid berubah Yes Menghitung jarak antara setiap record data dengan centroid baru Menghitung nilai SSE No end Gambar 4.1 Flowchart K-Means 62

78 C. Desain Hasil 1. Hasil implementasi input data parameter k dan x. a. Dengan 3 nilai centroid. Gambar 4.2 Implementasi input data parameter k dan x dengan 3 nilai centroid b. Dengan 2 nilai centroid. Gambar 4.3 Implementasi input data parameter k dan x dengan 2 nilai centroid 63

79 2. Hasil implementasi input data nama k. a. Dengan 3 nilai centroid. Gambar 4.4 Implementasi input data nama k dengan 3 nilai centroid b. Dengan 2 nilai centroid. Gambar 4.5 Implementasi input data nama k dengan 2 nilai centroid 64

80 3. Implementasi input data APBD. a. Dengan 3 nilai centroid. Gambar 4.6 Implementasi input data APBD dengan 3 nilai centroid b. Dengan 2 nilai centroid. Gambar 4.7 Implementasi input data APBD dengan 2 nilai centroid 65

81 4. Hasil implementasi tampilan proses hasil perhitungan centroid. a. Dengan 3 nilai centroid. Gambar 4.8 Implementasi tampilan proses hasil perhitungan dengan 3 nilai centroid b. Dengan 2 nilai centroid. Gambar 4.9 Implementasi tampilan proses hasil perhitungan dengan 2 nilai centroid 66

82 5. Hasil implementasi perhitungan jarak data ke centroid. a. Dengan 3 nilai centroid. Gambar 4.10 Implementasi tampilan perhitungan jarak data dengan 3 nilai centroid b. Dengan 2 nilai centroid. Gambar 4.11 Implementasi tampilan perhitungan jarak data dengan 2 nilai centroid 67

83 6. Hasil implementasi iterasi. a. Dengan 3 nilai centroid. Gambar 4.12 Implementasi tampilan iterasi dengan 3 nilai centroid b. Dengan 2 nilai centroid. Gambar 4.13 Implementasi tampilan iterasi dengan 2 nilai centroid, dan iterasi harus dilanjutkan 68

84 Gambar 4.14 Implementasi tampilan akhir iterasi dengan 2 nilai centroid 7. Hasil implementasi niai SSE. a. Dengan 3 nilai centroid. Gambar 4.15 Implementasi tampilan nilai SSE dengan 3 nilai centroid b. Dengan 2 nilai centroid. Gambar 4.16 Implementasi tampilan nilai SSE dengan 2 nilai centroid 69

85 8. Hasil implementasi laporan data mining. a. Dengan 3 nilai centroid. Gambar 4.17 Implementasi laporan data mining dengan 3 nilai centroid b. Dengan 2 nilai centroid. Gambar 4.18 Implementasi laporan data mining dengan 2 nilai centroid 70

86 9. Hasil implementasi nilai estimasi. Gambar 4.19 Implementasi tampilan nilai estimasi 71

87 BAB V PENUTUP A. Kesimpulan 1. Pada penelitian ini menggunakan jumlah k sebanyak 3, yaitu cluster pendapatan, cluster belanja tidak langsung serta cluster belanja langsung. Serta melakukan pengujian 2 parameter nilai centroid yaitu 3 nilai centroid dan 2 nilai centroid. 2. Hasil eksperimen metode clustering menggunakan algoritma K-Means dengan 3 nilai centroid lebih bagus dibandingkan dengan 2 nilai centroid, ini dikarenakan hasil nilai SSE dari 3 nilai centroid lebih kecil dari pada 2 nilai centroid yaitu = ,88,- serta hasil nilai SSE dari 2 nilai centroid = ,67,-. 3. Hasil cluster dengan 3 nilai centroid digunakan untuk mengestimasi nilai belanja tidak langsung dan belanja langsung berdasarkanan nilai pendapatan yang sudah diketahui sebelumnya. B. Saran Berdasarkan hasil penulisan yang telah dilakukan maka diharapkan penulisan selanjutnya : 1. Menggunakan data historis yang lebih banyak untuk menemukan pola yang lebih baik. 2. Diuji kembali dengan menggunakan algoritma clustering lainnya. 3. Program dibuat dinamis. 72

88 DAFTAR PUSTAKA Adiningsih, N. (2007). Penggunaan K-Means Clustering untuk Pelabelan Fonem Sinyal Ucapan. Skripsi Tidak Terpublikasi. Bandung:Institut Teknologi Bandung. Agusta, Y. (2007). K-Means-Penerapan,Permasalahan dan Metode Terkait. Jurnal Sistem dan Informatika Vol.3 : Aryan, P. (2010). Algoritma K-Means Clustering. [Tersedia]: A Tutorial on Clustering Algorithms. Tersedia : Baskoro, H.(2010). Implementasi Algoritma K-Means Menggunakan Data Penyewaan Alat Berat Untuk Melakukan Estimasi Nilai Outcome. Skripsi. Jakarta : Fakultas Ilmu Komputer, Universitas Pembangunan Nasional Veteran Jakarta. Firdausi, Nabila. Dkk. (2011). Analisis Financial Distress Dengan Pendekatan Data Mining Pada Industri Manufaktur Go-Public Di Indonesia. Surabaya : Jurusan Teknik Industri, Institut Teknologi Sepuluh Nopember. [Tersedia] : ( diakses 30 Maret 2012) Han J dan Kamber M. (2006). Data Mining Concepts and Techniques 2 nd Edition. San Fransisco : Morgan Kaufmann publisher. Henjaya, R. (2010). Penerapan Algoritma K-Means Pada Clustering Berita Berbahasa Indonesia. Skripsi. Bandung: Program Ilmu Komputer. Fakultas Pendidikan Matematika Dan Ilmu Pengetahuan Alam. Universitas Pendidikan Indonesia. [Tersedia]: 73

89 (abstrak.digilib.upi.edu/...algoritma_k-means.../cover.pdf, diakses 15 April 2012) Jogiyanto. (2007). Metodologi Penelitian Bisnis: Salah Kaprah dan Pengalamanpengalaman. Yogyakarta: BPFE. Karhendana, A. (2008). Pemanfaatan Document Clustering pada Agregator Berita. Skripsi Tidak Terpublikasi. Bandung:Institut Teknologi Bandung. Kurniawan. A. (2010). Klasterisasi kompetensi Guru Menggunakan Hasil Penilaian Portofolio Sertifikasi Guru Dengan Metode Data Mining. Surabaya:Institut Teknologi Sepuluh November. [Tersedia]: ( diakses 16 April 2012) Kusrini & Lutfi, Emha Taufiq. (2009). Algoritma Data Mining. Yogyakarta:Penerbit Andi. Larose, Daniel T. (2005). Doscovering Knowledge in Data : An Introduction to Data Mining. John Willey & Sons, Inc. MacQueen JB. Some Methods For Classification And Analysis Of Multivariate Observations. Proc. of 5 th Berkeley Symposium on Mathematical Statistic and Probability.. 1: Sadaaki M, Hidetomo I, Katsuhiro H Algorithm for Fuzzy Clustering. Di dalam : Studies in Fuzziness and Soft Computing. ISSN : Santosa, Budi Data Mining Terapan dengan MATLAB, Edisi Pertama, Graha Ilmu, Yogyakarta. 74

90 Santosa, Budi. (2007). DATA MINING : Teknik Pemanfaatan Data Untuk Keperluan Bisnis. Edisi Pertama, Graha Ilmu, Yogyakarta Sawir, Agnes, Sudaryono, Guritno S, Rahardja U. (2011). Theory And Application Of IT Research : Metodologi Penelitian Teknologi Informasi. Yogyakarta : Andi. Tan, Dan. Dkk Discovering Knowledge in Data. John Wiley s and Son. Wahyuni, Santi Febriana. (2009). Penggunaan Cluster-Based Sampling Untuk Penggalian Kaidah Asosiasi Multi Obyektif. Jurnal. Malang: Jurusan Teknik Informatika, Fakultas Teknologi Industri. Institut Teknologi Nasional. Widyawati, N. (2010). Perbandingan Clustering Based On Frequent Word Sequence (CFWS) Dan K-Means Untuk Pengelompokan Dokumen Berbahasa Indonesia. Skripsi. Bandung: Fakultas Pendidikan Matematika Dan Ilmu Pengetahuan Alam, Universitas Pendidikan Indonesia. [Tersedia] : (abstrak.digilib.upi.edu/.../skripsi/...clustering...k-means.../fi..., diakses 20 April 2012) 75

91 76

92 Data APBD Kabupaten XYZ tahun 2006 ( part 1 ) 77

93 Data APBD Kabupaten XYZ tahun 2006 ( part 2 ) 78

94 Data APBD Kabupaten XYZ tahun

95 Data APBD Kabupaten XYZ tahun

96 Data APBD Kabupaten XYZ tahun

97 Data APBD Kabupaten XYZ tahun

98 Data APBD Kabupaten XYZ tahun

99 Surat ijin pengambilan data di Kabupaten XYZ 84

100 Surat Pelaksanaan Penelitian Dari Kabupaten XYZ 85

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ SKRIPSI Diajukan untuk memenuhi salah satu syarat memperoleh Gelar Sarjana pada Program Studi Sistem

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN A. Objek Penelitian Penelitian ini dilakukan di salah satu Kabupaten yang ada di Provinsi Gorontalo, yaitu di Badan Pengelola Keuangan Dan Aset Daerah (BPKAD). 1. Gambaran

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan analisa datadan algoritma Fuzzy C-Means untuk mangetahui pola perilaku konsumen. 2.1. Pola

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penambangan Data (Data Mining) Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

DATA MINING DAN WAREHOUSE A N D R I

DATA MINING DAN WAREHOUSE A N D R I DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: Yogyakarta, Maret 2016

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: Yogyakarta, Maret 2016 PENERAPAN DATA MINING PEMAKAIAN AIR PELANGGAN UNTUK MENENTUKAN KLASIFIKASI POTENSI PEMAKAIAN AIR PELANGGAN BARU DI PDAM TIRTA RAHARJA MENGGUNAKAN ALGORITMA K-MEANS Gunawan Abdillah, Firman Ananda Putra,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Clustering Clustering atau analisis cluster adalah proses pengelompokan satu set benda- benda fisik atau abstrak ke dalam kelas objek yang sama (Han, 2006). Baskoro (2010) menyatakan

Lebih terperinci

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH

KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH Citra Arum Sari dan Dwi Sukma D Program Studi Teknik Industri, FTI-UPN Jatim ABSTRAK Besarnya peminat dari setiap program studi di

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Konsep Pemasaran Dalam merancang dan mengembangkan produk, baik yang berupa jasa maupun barang, tidak terlepas dari konsep pemasaran yang bertujuan memenuhi

Lebih terperinci

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI Diajukan Sebagai Salah satu Syarat Untuk Memperoleh Gelar Sarjana

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

ANALISIS DATA ANGGARAN PENDAPATAN BELANJA DAERAH MENGGUNAKAN CLUSTERING K-MEANS DAN FORECASTING (Studi Kasus pada DPKA Kota Padang)

ANALISIS DATA ANGGARAN PENDAPATAN BELANJA DAERAH MENGGUNAKAN CLUSTERING K-MEANS DAN FORECASTING (Studi Kasus pada DPKA Kota Padang) 1 ANALISIS DATA ANGGARAN PENDAPATAN BELANJA DAERAH MENGGUNAKAN CLUSTERING K-MEANS DAN FORECASTING (Studi Kasus pada DPKA Kota Padang) JURNAL Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana

Lebih terperinci

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak DATA MINING MELIHAT POLA HUBUNGAN NILAI TES MASUK MAHASISWA TERHADAP DATA KELULUSAN MAHASISWA UNTUK MEMBANTU PERGURUAN TINGGI DALAM MENGAMBIL KEBIJAKAN DALAM RANGKA PENINGKATAN MUTU PERGURUAN TINGGI Timor

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

Penerapan Algoritma K-Means untuk Clustering

Penerapan Algoritma K-Means untuk Clustering Seminar Perkembangan dan Hasil Penelitian Ilmu Komputer (SPHP-ILKOM) 71 Penerapan Algoritma K-Means untuk ing Dokumen E-Jurnal STMIK GI MDP Ernie Kurniawan* 1, Maria Fransiska 2, Tinaliah 3, Rachmansyah

Lebih terperinci

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS Muhammad Toha, 1), I Ketut Edy Purnama 2) dan Surya Sumpeno 3) 1) Bidang Keahlian Telematika (Konsentrasi CIO) Jurusan Teknik Elektro

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Sponge atau poriferans berasal dari bahasa Latin yaitu porus yang artinya pori dan ferre yang artinya memiliki. Sponge adalah hewan berpori, pada umumnya terdapat di lautan,

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

PROPOSAL PENERAPAN DATA MINING UNTUK MENENTUKAN STRATEGI PENJUALAN PADA TOKO BUKU GRAMEDIA PALEMBANG MENGGUNAKAN METODE CLUSTERING

PROPOSAL PENERAPAN DATA MINING UNTUK MENENTUKAN STRATEGI PENJUALAN PADA TOKO BUKU GRAMEDIA PALEMBANG MENGGUNAKAN METODE CLUSTERING 1 PROPOSAL PENERAPAN DATA MINING UNTUK MENENTUKAN STRATEGI PENJUALAN PADA TOKO BUKU GRAMEDIA PALEMBANG MENGGUNAKAN METODE CLUSTERING I. Pendahuluan 1.1. Latar Belakang Seiring dengan pertumbuhan bisnis

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDHULUN Listrik merupakan sumber daya yang sangat dibutuhkan saat ini. Penggunaan listrik setiap tahun, bahkan setiap bulan terus meningkat. Hal ini dibuktikan dengan selalu bertambahnya

Lebih terperinci

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA Artikel Skripsi PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA SKRIPSI Diajukan Untuk Memenuhi Sebagian

Lebih terperinci

Surmayanti 1, Hari Marfalino 2, Ade Rahmi 3 Fakultas Limu Komputer Universitas Putra Indonesia YPTK Padang

Surmayanti 1, Hari Marfalino 2, Ade Rahmi 3 Fakultas Limu Komputer Universitas Putra Indonesia YPTK Padang PENERAPAN ANALYSIS CLUSTERING PADA PENJUALAN KOMPUTER DENGAN PERANCANGANAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA K-MEANS (STUDY KASUS TOKO TRI BUANA KOMPUTER KOTA SOLOK) Surmayanti 1, Hari Marfalino

Lebih terperinci

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree Disusun oleh : Budanis Dwi Meilani Achmad dan Fauzi Slamat Jurusan Sistem Informasi Fakultas Teknologi Informasi.

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

2.2 Data Mining. Universitas Sumatera Utara

2.2 Data Mining. Universitas Sumatera Utara Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record

Lebih terperinci

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id

Lebih terperinci

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU PROYEK TUGAS AKHIR IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU (Studi Kasus : SMK Pembangunan Nasional Purwodadi) Disusun oleh: Novian Hari Pratama 10411 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

SISTEM MARKET BASKET UNTUK MENENTUKAN TATA LETAK PRODUK PADA SUATU SWALAYAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING SKRIPSI STEFFI ANDINA SEBAYANG

SISTEM MARKET BASKET UNTUK MENENTUKAN TATA LETAK PRODUK PADA SUATU SWALAYAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING SKRIPSI STEFFI ANDINA SEBAYANG SISTEM MARKET BASKET UNTUK MENENTUKAN TATA LETAK PRODUK PADA SUATU SWALAYAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING SKRIPSI STEFFI ANDINA SEBAYANG 071402041 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS

Lebih terperinci

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 ANALISA PERBANDINGAN METODE HIERARCHICAL CLUSTERING, K-MEANS DAN GABUNGAN KEDUANYA DALAM MEMBENTUK CLUSTER DATA (STUDI KASUS : PROBLEM KERJA PRAKTEK JURUSAN

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN UNTUK PENGELOMPOKAN NILAI AKADEMIK SISWA MENGGUNAKAN METODE K-MEANS UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA SKRIPSI

SISTEM PENDUKUNG KEPUTUSAN UNTUK PENGELOMPOKAN NILAI AKADEMIK SISWA MENGGUNAKAN METODE K-MEANS UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA SKRIPSI SISTEM PENDUKUNG KEPUTUSAN UNTUK PENGELOMPOKAN NILAI AKADEMIK SISWA MENGGUNAKAN METODE K-MEANS UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA SKRIPSI Disusun oleh : AYU RAHMAWATI 0934010160 JURUSAN TEKNIK

Lebih terperinci

ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG

ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG ARTIKEL SISTEM PEMBAGIAN KELOMPOK BELAJAR SISWA MENGGUNAKAN METODE K-MEANS CLUSTERING DI SD NEGERI 1 NGEBONG KABUPATEN TULUNGAGUNG Oleh: BAGUS YAYANG FATKHURRAHMAN 13.1.03.02.0180 Dibimbing oleh : 1. Ahmad

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD) Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika Knowledge Discovery in Databases (KDD) Knowledge Discovery in Databases (KDD) Definisi Knowledge Discovery

Lebih terperinci

dengan Algoritma K Means

dengan Algoritma K Means K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

LAPORAN SKRIPSI PENERAPAN ALGORITMA FUZZY C_MEANS DALAM PENENTUAN BEASISWA. Oleh : ARI IRAWAN

LAPORAN SKRIPSI PENERAPAN ALGORITMA FUZZY C_MEANS DALAM PENENTUAN BEASISWA. Oleh : ARI IRAWAN LAPORAN SKRIPSI PENERAPAN ALGORITMA FUZZY C_MEANS DALAM PENENTUAN BEASISWA Oleh : ARI IRAWAN 2010-51-221 SKRIPSI DIAJUKAN SEBAGAI SALAH SATU SYARAT UNTUK MEMPEROLEH GELAR SARJANA KOMPUTER PROGRAM STUDI

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) Meriska Defriani 1, Noviyanti 2 1 STT Wastukancana 2 Teknik Informatika,

Lebih terperinci

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING Marlindawati1), Andri2) 1), 2) Sistem Informasi UNIVERSITAS BINA DARMA Palembang Jl, Jend. A.Yani

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita Anggraeni, Ragil Saputra, Beta Noranita APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita

Lebih terperinci

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM) ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM) Nurani 1, Hamdan Gani 2 1 nurani_nanni@yahoo.com, 2 hamdan.gani.inbox@gmail.com

Lebih terperinci

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun

Lebih terperinci

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

Penerapan Metode Clustering Dengan K-Means Untuk Memetakan Potensi Tanaman Padi Di Kota Semarang

Penerapan Metode Clustering Dengan K-Means Untuk Memetakan Potensi Tanaman Padi Di Kota Semarang 1 Penerapan Metode ing Dengan K-Means Untuk Memetakan Potensi Tanaman Padi Di Kota Lianna Felicia Fakultas Ilmu Komputer, Universitas Dian Nuswantoro Abstract Berdasarkan data hasil pertanian padi di Dinas

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMBAGIAN KELAS SISWA

IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMBAGIAN KELAS SISWA IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMBAGIAN KELAS SISWA SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Program Studi Teknik Informatika OLEH : NISIA

Lebih terperinci

Bab 2 Tinjauan Pustaka

Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Adapun penelitian terdahulu yang berkaitan dalam penelitian ini berjudul Penentuan Wilayah Usaha Pertambangan Menggunakan Metode Fuzzy K-Mean Clustering

Lebih terperinci

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521 JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: 2301-9271 A-521 Analisa Perbandingan Metode Hierarchical Clustering, K-means dan Gabungan Keduanya dalam Cluster Data (Studi kasus : Problem Kerja Praktek Jurusan

Lebih terperinci

2.1 Penelitian Terkait

2.1 Penelitian Terkait BAB II TINJAUAN PUSTAKA 2.1 Penelitian Terkait Penelitian yang dilakukan oleh Dinda Setiawati Devi dengan menggunakan metode Apriori untuk analisa keranjang pasar untuk 100 data transaksi dan 55 jenis

Lebih terperinci

baris data atau rekaman data

baris data atau rekaman data TAKARIR action state langkah-langkah dalam sebuah aktivitas clustering pengelompokan data dengan melakukan pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan data flow

Lebih terperinci

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing

Lebih terperinci

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. 2.1. Data Mining Data mining adalah suatu istilah yang digunakan

Lebih terperinci

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author) TEKNOSI, Vol. 02, No. 03, Desember 2016 31 PENERAPAN DATA MINING DALAM MENINGKATKAN MUTU PEMBELAJARAN PADA INSTANSI PERGURUAN TINGGI MENGGUNAKAN METODE K-MEANS CLUSTERING (STUDI KASUS DI PROGRAM STUDI

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Tinjauan Studi Sebelum penelitian ini dilakukan, sudah terdapat beberapa penelitian yang menjadi dasar untuk menyelesaikan penelitian ini, penelitian tersebut diantaranya sebagai

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE

SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE WRS Nurwidodo 1) dan Mochamad Hariadi 2) Jurusan Teknik Elektro FTI, ITS, Surabaya Kampus ITS Keputih,

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki

Lebih terperinci

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING Marlindawati 1) Andri 2) 1) Manajemen Informatika Universitas Bina Darma Jl. Ahmad Yani No. 3, Palembang

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Pasar modal merupakan salah satu bagian dari pasar keuangan, di samping pasar uang, yang sangat penting peranannya bagi pembangunan nasional pada umumnya dan bagi

Lebih terperinci

PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR

PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR PENGELOMPOKAN BIMBINGAN BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMA NEGERI 1 CILAKU KABUPATEN CIANJUR SIDANG SKRIPSI Oleh Adry Rahadinata 10108069 Penguji 1 Andri Heryandi, S.T., M.T. Penguji 2 Adam Mukharil

Lebih terperinci

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Pada bab ini, akan dibahas dasar teori, penelitian terdahulu, kerangka pikir dan hipotesis yang mendasari penyelesaian permasalahan memprediksi inflasi dengan menggunakan algoritma

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

CLUSTERING PENENTUAN POTENSI KEJAHATAN DAERAH DI KOTA BANJARBARU DENGAN METODE K-MEANS

CLUSTERING PENENTUAN POTENSI KEJAHATAN DAERAH DI KOTA BANJARBARU DENGAN METODE K-MEANS Volume 01, No01 September 2014 CLUSTERING PENENTUAN POTENSI KEJAHATAN DAERAH DI KOTA BANJARBARU DENGAN METODE K-MEANS Sri Rahayu 1,Dodon T Nugrahadi 2, Fatma Indriani 3 1,2,3 Prog Studi Ilmu Komputer Fakultas

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

ANALISIS KELAYAKAN PEMBERIAN BEASISWA DI POLITEKNIK NEGERI BATAM DENGAN METODE CLUSTERING

ANALISIS KELAYAKAN PEMBERIAN BEASISWA DI POLITEKNIK NEGERI BATAM DENGAN METODE CLUSTERING ANALISIS KELAYAKAN PEMBERIAN BEASISWA DI POLITEKNIK NEGERI BATAM DENGAN METODE CLUSTERING TUGAS AKHIR Oleh : Maria 3310801006 Silvianty Noerliani 3310801016 Disusun untuk memenuhi syarat kelulusan Program

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 2, No. 1, Tahun

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 2, No. 1, Tahun Vol. 2, No. 1, Tahun 2013 65 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : https://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Analisa Penjualan Barang Menggunakan

Lebih terperinci

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to

Lebih terperinci

PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak

PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Dini Fakta Sari Teknik Informatika STMIK AKAKOM Yogyakarta dini@akakom.ac.id Abstrak Tenaga

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Text Mining Text mining, yang juga disebut text data mining (TDM) atau knowledge discovery in text( KDT), secara umum mengacu pada proses ekstraksi informasi dari dokumen-dokumen

Lebih terperinci