BAB II TINJAUAN PUSTAKA

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II TINJAUAN PUSTAKA"

Transkripsi

1 BAB II TINJAUAN PUSTAKA 2.1. Defenisi Data Dalam Webster s New World s Dictionary tertulis bahwa datum: something known or assumed. Artinya, datum (bentuk tunggal data) merupakan suatu yangdiketahui/dianggap. Dengan demikian, data dapat memberi gambaran tentang suatukeadaan atau persoalan. Sedangkan, data menurut kamus Oxford Dictionary adalah The Facts. Jadi, dapat disimpulkan bahwa data adalah sesuatu yang nyata diketahuiatau dianggap yang dipakai untuk keperluan suatu analisa, diskusi, presentasi ilmiah atau tes statistic. Data dapat dibagi menjadi 4 bagian, yaitu: (Ong, 2013) Jenis Data Berdasarkan Sifatnya Jenis-jenis data dapat dibagi menurut sifatnya, menurut sumbernya, menurut cara memperolehnya dan menurut waktu pengumpulannya. Menurut sifatnya data dapat terbagi menjadi dua jenis, yaitu data kualitatif (non-metrik) dan data kauntitatif (metrik). Kemudian jenis data kualitatif terbagi lagi menjadi dua jenis, yaitu data nominal dan data ordinal. Begitu pula dengan jenis data kuantitatif terbagi menjadi dua jenis, yaitu data interval dan data rasio (Hidayat & Istiadah 2011). a. Data Kualitatif Data kualitatif secara sederhana dapat disebut data yang bukan berupa angka. Ciri utama data kualitatif didapat dengan cara menghitung, sehingga tidak memiliki nilai desimal. Selain itu data kualitatif memiliki ciri-ciri tidak bisa dilakukan operasi matematika, seperti penambahan, pengurangan, perkalian dan pembagian. Contoh data kualitatif adalah data gender, data golongan darah, data tempat tinggal atau data jenis pekerjaan. Agar dapat dilakukan proses pada data kualitatif atau non metric, data tersebut harus diubah ke dalam bentuk angka, proses ini dinamakan kategorisasi. Data kualitatif dibedakan menjadi dua jenis, yaitu data nominal dan data ordinal (Santoso, 2010).

2 Data Nominal adalah jenis data kualitatif yang digunakan mengidentifikasi, mengklasifikasi, atau membedakan objek. Data nominal merupakan data yang paling rendah dalam level pengukuran data. Semua data memiliki posisi setara dalam arti tidak ada data yang memiliki tingkat yang lebih atau kurang dibandingkan dengan data yang lain. Jenis data nominal ini tidak memiliki jarak, urutan dan titik origin (Hidayat, 2011). Data Ordinal adalah jenis data kualitatif namun memiliki level lebih tinggi dari data nominal. Data ordinal memiliki karakteristik nominal tapi terdapat perbedaan derajat, urutan, atau peringkat dalam objek tersebut (posisi data tidak setara) (Hidayat & Istiadah 2011). b. Data Kuantitatif Data kuantitatif dapat disebut sebagai data berupa angka dalam arti sebenarnya. Jadi, berbagai jenis operasi matematika dapat dilakukan pada data kuantitatif. Data kuantitatif merupakan data yang didapat dengan jalan mengukur sehingga bisa mempunyai nilai desimal. Contoh data kuantitatif adalah tinggi badan, usia, penjualan barang, dan sebagainya. Sebagai contoh, tinggi badan seseorang bisa bernilai 165 cm atau cm. Seperti pada jenis data kualitatif, jenis data kuantitatif juga terbagi menjadi dua, yaitu data interval dan data rasio (Santoso, 2010). Data interval menempati level pengukuran data yang lebih tinggi dari data ordinal karena selain bisa bertingkat urutannya, urutan tersebut juga bisa dikuantitatifkan serta memiliki indikator jarak. Contohnya seperti pengukuran temperatur sebuah ruangan. Interval temperature ruangan tersebut adalah: a. Cukup panas jika temperatur antara 50 0 C 80 0 C. b. Panas jika temperatur antara 80 0 C C. c. Sangat panas jika temperatur antara C C. Dalam kasus di atas, data temperatur bisa dikatakan data interval karena data mempunyai interval (jarak) tertentu, yaitu 30 0 C. Data rasio merupakan data dengan tingkat pengukuran paling tinggi diantara jenis data lainnya. Data rasio adalah data yang bersifat angka dalam arti yang sebenarnya, bukan kategori seperti data nominal dan data ordinal sehinggga dapat dilakukan operasi matematika seperti penambahan, pengurangan, perkalian, dan pembagian. Perbedaan dengan data interval adalah data rasio memiliki indikator titik origin yang tidak dapat berubah (absolute). Contoh dari data rasio adalah jumlah suatu produk, jika jumlah produk 0 (nol) berarti memang

3 tidak ada produk atau contoh lainnya adalah berat badan dan tinggi badan, pengukuran-pengukurannya mempunyai nilai 0 (nol) yang sebenarnya. Misalnya jika berat badan 0 berarti memang tanpa berat Jenis Data Menurut Sumbernya Pembagian jenis data menurut sumbernya didasarkan pada sumber perolehan data tersebut, yaitu data internal dan data eksternal (Ong, 2013).Data internal adalah data yang dikumpulkan oleh suatu organisasi untuk menggambarkan keadaan atau kegiatan organisasi yang bersangkutan serta berguna untuk keperluan kegiatan harian dan pengawasan internal. Misalnya, data penjualan, data produksi suatu perusahaan, data keuangan, data kepegawaian, dan lain sebagainya. Data eksternal adalah data yang dikumpulkan untuk menggambarkan suatu keadaan atau kegiatan di luar organisasi tersebut. Contoh dari data eksternal seperti data jumlah penduduk dan data pendapatan nasional yang didapat dari kantor pusat statistik setempat. Suatu perusahaan memerlukan data eksternal seperti jumlah penduduk untuk memprediksi potensi permintaan, sedangkan data pendapatan nasional utnuk menentukan tingkat daya beli masyarakat yang berguna untuk dasar kebijakan tingkat harga Jenis Data Menurut Cara Memperolehnya Berdasarkan cara memperolehnya, data dapat dibedakan menjadi dua jenis, yaitu data primer dan data sekunder (Ong, 2013). Data primer adalah data yang dikumpulkan dan diolah sendiri oleh organisasi atau perorangan langsung dari objeknya. Misalnya suatu perusahaan ingin mengetahui konsumsi rata-rata suatu produk terhadap penduduk disuatu daerah dengan cara melakukan wawancara langsung kepada penduduk setempat. Data sekunder adalah data yang diperoleh dalam bentuk jadi dan telah diolah oleh pihak lainnya. Biasanya data sekunder ini dalam bentuk publikasi Jenis Data Menurut Waktu Pengumpulannya Berdasarkan waktu pengumpulannya, data dapat dibedakan menjadi dua jenis, yaitu data cross sectiondan data berkala (time series) (Ong, 2013). Data cross sectionadalah data yang dikumpulkan dalam suatu periode tertentu, biasanya menggambarkan keadaan atau kegiatan dalam periode tersebut. Misalnya, hasil sensus penduduk tahun 2014 menggambarkan keadaan Indonesia pada tahun 2014 menurut, umur, jenis kelamin, agama, tingkat pendidikan, dan sebagainya.

4 Data berkala (time series) adalah data yang dikumpulkan dari waktu ke waktu. Tujuannya adalah untuk menggambarkan perkembangan suatu kegiatan dari waktu ke waktu. Misalnya, perkembangan produksi di suatu perusahaan selama lima tahun terakhir, perkembangan penjualan produk selama lima tahun terakhir, dan lain sebagainya. Jenis data ini juga sering disebut sebagai data historis Data Mining Data Miningadalah suatu metode pengolahan data untuk menemukan pola yang tersembunyi dari data tersebut. Hasil dari pengolahan data dengan metode Data Miningini dapat digunakan untuk mengambil keputusan di masa depan. Data Mining ini juga dikenal dengan istilah pattern recognition (Ong, 2013). Data Mining, sering juga disebut knowledge discovery in database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari Data Mining ini biasa dipakai untuk memperbaiki pengambilan keputusan di masa depan. Sehingga istilah pattern recognition sekarang jarang digunakan karena ia termasuk bagian dari Data Mining (Santosa, 2007). Data Mining suatu proses kegiatan yang berulang-ulang pada analisis database dalam jumlah besar, dengan tujuan untuk melakukan penggalian informasi dan pengetahuan yang dapat membuktikan keakuratan dan potensi yang berguna bagi pengetahuan pekerja yang terlibat dalam pengambilan keputusan dan pemecahan masalah. Istilah data mining itu merujuk pada keseluruhan proses yang terdiri dari pengumpulan data analisis, pengembangan model pembelajaran induktif dan adopsi keputusan praktis seta tindakan berdasarkan pengetahuan yang diperoleh (Vercilles, 2009).Kegiatan data mining dapat dibagi kedalam dua inti penyelidikan utama, sesuai dengan tujuan utama dari analisis, yaitu: interpretasi dan prediksi (Vercilles, 2009). 1. Interpretasi Tujuan interpretasi adalah untuk mengidentifikasi pola yang teratur dalam data dan untuk mengekspresikan data melalui peraturan dan kriteria yang dapat dengan mudah dipahami oleh para ahli dalam domain aplikasi. Contoh; Clustering, Association Rules.

5 2. Prediksi Tujuan dari prediksi adalah untuk mengantisipasi atau memprediksi nilai suatu variable random yang akan menggambarkan kondisi dimasa mendatang atau memperkirakan kemungkinan peristiwa masa depan. Contoh; Classification, Regression, Time Series Analysis. Berdasarkan tugas dan tujuan analisis, proses data mining dapat dibagi menjadi dua kategori utama, Tergantung pada adanya target variabel dan metode belajar (learning) yaitu antara proses belajar yang diawasi (supervised) dan tanpa pengawasan (unsupervised) (Vercilles, 2009). 1. Belajar yang diawasi (supervised learning) Dalam analisis supervised learning, atribut target/label menggambarkan kelas yang dimiliki setiap catatan. Atau dengan kata lain metode belajar dengan adanya latihan (training) dan pelatih/label. Contoh: Regresi, analisa Deskriminan, Artificial Neural Network dan Support Vektor Machine. 2. Belajar tanpa pengawasan (unsupervised learning). Tanpa pengawasan analisis belajar tidak dipandu oleh atribut target/label. Oleh karena itu, data mining dalam hal ini ditujukan untuk menemukan pola berulang dan kedekatan dalam kumpulan data. Atau dengan kata lain metode belajar tanpa adanya latihan (training) dan pelatih/label. Contoh clustering dan Self Organization Map (SOM). Data Miningmerupakan metode pengolahan data berskala besar oleh karena itu Data Mining ini memiliki peranan penting dalam bidang industri, keuangan, cuaca, ilmu dan teknologi. Secara umum kajian Data Mining membahas metode-metode seperti, clustering, klasifikasi, regresi, seleksi variable, dan market basket analisis. (Santosa, 2007). Data Mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu (Paulanda, 2012) : 1. Deskripsi (Description) Terkadang penelitian analisis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan.

6 2. Estimasi (Estimation) Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun menggunakan recordlengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya. 3. Prediksi (Prediction) Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan penelitian adalah : a. Prediksi harga beras dalam tiga bulan yang akan datang. b. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan dinaikkan. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi. 4. Klasifikasi (Classification) Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang dan pendapatan rendah. Berikut contoh dari Klasifikasi: a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan. b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk. c. Mendiagnosis penyakit seorang pasien untuk mendapatkan kategori penyakit apa.

7 5. Pengklusteran (Clustering) Pengklusteran merupakan pengelompokkan record, pengamatan atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. clusteradalah kumpulan recordyang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-recorddalam clusterlain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan recorddalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan recorddalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah : a. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan perilaku dari gen dalam jumlah besar. b. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam keadaan baik atau mencurigakan. c. Asosiasi (Assosiation) d. Tugas asosiasi dalam Data Miningadalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian adalah : a. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan. b. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar. c. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respons posistif terhadap penawaran upgrade layanan yang diberikan Proses Data Mining Berikut ini adalah langkah-langkah dalam perancangan proses model pembelajaran teknik Data Mining, ditunjukan pada gambar 2.1

8 Prediction and interpretation Model Development Selection of Atributes Exploratory analysis Data mart Data gathering and itegration Objectives defenition Gambar 2.1. Perancangan Proses Data Mining Sumber:(Budiman, 2012) 2.4.Clustering Salah satu teknik yang dikenal dalam Data Mining yaitu clustering. Pengertian clusteringkeilmuan dalam Data Mining adalah pengelompokan sejumlah data atau objek ke dalam cluster(group) sehingga setiap dalam clustertersebut akan berisi data yang semirip mungkin dan berbeda dengan objek dalam clusteryang lainnya. Sampai saat ini, para ilmuwan masih terus melakukan berbagai usaha untuk melakukan perbaikan model clusterdan menghitung jumlah clusteryang optimal sehingga dapat dihasilkan clusteryang paling baik. Dalam clustering diupayakan untuk menempatkan objek yang mirip (jaraknya dekat) dalam satu klaster dan membuat jarak antar klaster sejauh mungkin. Hermansyah, A (2001) menyatakan bahwa clustering adalah proses pengelompokan objek data ke dalam kelompok yang sama. Klaster adalah sekumpulan objek data yang memiliki kesamaan satu sama lain di satukan dalam kelompok yang sama dan tidak memiliki kesamaan dengan objek data yang lain (Hosseini, 2010). Dalam clustering diupayakan untuk menempatkan objek yang mirip (jaraknya dekat) dalam satu cluster dan membuat jarak antar cluster sejauh mungkin. Clustering merupakan teknik

9 unsupervised learning yang tidak memerlukan label ataupun keluaran dari setiap data (Santoso, 2007). Ada dua pendekatan dalam clustering yaitu partisi dan hirarki. Dalam partisi pengelompokan objek dimasukan ke dalam k cluster, dapat dilakukan dengan menentukan pusat cluster awal lalu dilakukan realokasi objek berdasarkan kriteria tertentu sampai dicapai pengelompokan yang optimum. Dalam cluster hirarki dimulai dengan membuat m cluster dimana setiap cluster beranggotakan satu objek dan berakhir dengan satu cluster dimana anggota m objek, pada setiap tahap prosedurnya, satu cluster digabung dengan satu cluster lain, lalu dapat dipilih cluster yang diinginkan dengan menentukan cut off pada tingkat tertentu (Santoso, 2007). Clustering melakukan pengelompokan data tanpa berdasar pada kelas data tertentu yang sudah ditetapkan dari awal. Proses ini sangat berbeda dengan proses pada classification yang pada awal proses harus memberikan kelas-kelas data. Sehingga clustering sering disebut dengan pengelompokan data yang tidak terstruktur Ciri- ciri Cluster Menurut Santoso, 2002, ciri-ciri Cluster adalah: 1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (Within Cluster). 2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang lainya (Between Cluster) Istilah penting dalam Cluster 1. Skedul Aglomerasi (Aglomeration Schedule), ialah jadwal yang memberikan informasi tentang objek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu proses analisis cluster dengan metode hierarki. 2. Rata-rata Cluster (ClusterCentroid), ialah nilai rata-rata variabel dari semua objek atau observasi dalam cluster tertentu. 3. Pusat Cluster (Cluster Centers), ialah titik awal dimulainya pengelompokan di dalam cluster non hierarki. 4. Keanggotaan Cluster (ClusterMemberships), ialah keanggotaan yang menunjukan cluster untuk setiap objek yang menjadi anggotanya. 5. Dendogram, dapat disebut juga dengan grafik pohon, yaitu output SPSS yang menggambarkan hasil analisis cluster yang dilakukan peneliti. Garis vertikal atau tegak menunjukan cluster yang digabung bersama. Posisi garis pada skala

10 menunjukan jarak untuk mana cluster digabung. Dendogram harus dibaca dari kiri ke kanan. 6. Distances Between Cluster Centers, ialah jarak yang menunjukan bagaimana terpisahnya pasangan individu cluster (Supranto, 2004). 2.5.Algoritma Clustering (Clustering Algorithm) Data Clusteringmerupakan salah satu metode Data Mining yang bersifat tanpa arahan (unsupervised). K-Means merupakan salah satu metode data Clustering Non Hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi data ke dalam clustersehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu clusteryang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. Adapun tujuan dari data clusteringini adalah untuk meminimalisasikan objective functionyang diatur dalam proses clustering, yang pada umumnya berusaha meminimalkan variasi di dalam suatu clusterdan memaksimalkan variasi antar cluster (Heryanto, et al. 2013). Pada dasarnya clustering merupakan suatu metode untuk mencari dan mengelompokkan data yang memiliki kemiripan karakteriktik (similarity) antara satu data dengan data yang lain. Clusteringmerupakan salah satu metode Data Miningyang bersifat tanpa arahan (unsupervised), maksudnya metode ini diterapkan tanpa adanya latihan (training) dan tanpa ada guru (teacher)serta tidak memerlukan target output. Dalam Data Mining ada dua jenis metode clustering yang digunakan dalam pengelompokan data, yaitu HierarchicalClusteringdan Non HierarchicalClustering (Santosa, 2007). Cluster memegang peran penting dalam pengklasifikasian obyek. Bergantung pada aplikasinya, obyek biasa berupa sinyal, pelanggan, pasien, berita, tanaman, dan lainlain. Teknik clustering adalah teknik nonparametric yang sangat banyak diaplikasikan dalam kasus nyata. Teknik cluster dikelompokkan ke dalam dua kelas besar : Partioning Cluster dan Hierarcichal Cluster. Ada dua macam teknik cluster yang cukup sering dipakai. Yang pertama adalah K-Means (mewakili Partitioning Cluster atau Non Hierarcichal) dan yang berikutnya adalah hierarcichal Clustering (Santosa, 2007).

11 Tujuan utama dari metoda klaster adalah pengelompokan sejumlah data/obyek ke dalam cluster (group) sehingga setiap klaster akan berisi data yang semirip mungkin. Ini berarti obyek dalam satu klaster sangat mirip satu sama lain dan berbeda dengan obyek dalam klaster-klaster yang lain (Santosa, 2007) Gambar 2.2 Contoh Proses Clustering Sumber : (Nugraheni, 2011) Ada dua metode Clustering yang kita kenal, yaitu Hierarchical Clustering dan Partitioning Clustering. Metode Hierarchical Clusteringsendiri terdiri dari Complete Linkage Clustering, Single Linkage Clustering, Average Linkage Clusteringdan Centroid Linkage Clustering. Sedangkan metode Partitioningsendiri terdiri dari K- Means dan Fuzzy K-Means (Alfina, et al. 2012). Hierachical Clusteringadalah suatu metode pengelompokan data yang dimulai dengan mengelompokkan dua atau lebih objek yang memiliki kesamaan paling dekat. Kemudian proses diteruskan ke objek lain yang memiliki kedekatan kedua. Demikian seterusnya sehingga cluster akan membentuk semacam pohon dimana ada hierarki (tingkatan) yang jelas antar objek, dari yang paling mirip sampai yang paling tidak mirip. Secara logika semua objek pada akhirnya hanya akan membentuk sebuah cluster. Dendogram biasanya digunakan untuk membantu memperjelas proses hierarki tersebut (Santoso, 2010). Berbeda dengan metode Hierarchical Clustering, metode Non HierarchicalClusteringjustru dimulai dengan menentukan terlebih dahulu jumlah cluster yangdiinginkan (dua cluster, tiga cluster, atau lain sebagainya). Setelah jumlah clusterdiketahui, baru proses cluster dilakukan tanpa mengikuti proses hierarki. Metode inibiasa disebut dengan K-MeansClustering (Santoso, 2010).

12 Clustering Hirarkhi (Hierarchical Clustering) Clusteringhirarkhi membangun sebuah hirarkhi clusteratau dengan kata lain sebuah pohon cluster, yang juga dikenal sebagai dendrogram. Setiap node clustermengandung clusteranak; cluster-cluster saudara yang membagi point yang ditutupi oleh induk mereka. Metode-metode clusteringhirarkhi dikategorikan ke dalam agglomerative (bawah-atas) dan idivisive (atas-bawah) (Paulanda, 2012). Clustering agglomerative dimulai dengan clustersatu point (singleton) dan secara berulang mengabungkan dua atau lebih clusteryang paling tepat. Cluster divisive dimulai dengan satu clusterdari semua point data dan secara berulang membagi clusteryang paling tepat. Proses tersebut berlanjut hingga kriteria penghentian (seringkali, jumlah k yang diperlukan dari cluster) dicapai. Kelebihan clusterhirarkhi meliputi : 1. Fleksibilitas yang tertanam mengenai level granularitas. 2. Kemudahan menangani bentuk-bentuk kesamaan atau jarak. 3. Pada akhirnya, daya pakai pada tipe-tipe atribut apapun Kelemahan dari clusteringhirarkhi berhubungan dengan : 1. Ketidakjelasan kriteria terminasi. 2. Terhadap perbaikan hasil clustering, sebagian besar algoritma hirarkhi tidak mengunjungi kembali cluster-clusternya yang telah dikonstruksi. Untuk clusteringhirarki, menggabungkan atau memisahkan subset dari point-point dan bukan point-point individual, jarak antara point-point individu harus digeneralisasikan terhadap jarak antara subset. Ukuran kedekatan yang diperoleh disebut metrik hubungan. Tipe metrik hubungan yang digunakan secara signifikan mempengaruhi algortima hirarkhi, karena merefleksikan konsep tertentu dari kedekatan dan koneksitas. Metrik hubungan antar clusterutama (Paulanda, 2011) termasuk hubungan tunggal, hubungan rata-rata dan hubungan sempurna. Dalam clustering hirarki kita hitung jarak masing-masing obyek dengan setiap obyek yang lain. Selanjutnya kita temukan pasangan obyek yang jaraknya dekat. Sehingga tiap obyek akan berpasangan dengan satu obyek atau kelompok obyek yang lain yang paling dekat jaraknya. Langkah-langkah yang perlu dilakukan untuk melakukan clustering dengan cara clustering hirarki adalah: (Santosa, 2007)

13 a. Kelompokkan setiap obyek ke dalam kelompok/clusternya sendiri. b. Temukan pasangan paling mirip untuk dimasukkan ke dalam cluster yang sama dengan melihat data dalam matriks kemiripan (resemblance). c. Gabungkan kedua obyek dalam satu cluster. d. Ulangi sampai tersisa hanya satu cluster. Clusteringhirarkhi membangun sebuah hirarkhi clusteratau dengan kata lain sebuah pohon cluster, yang juga dikenal sebagai dendrogram. Setiap nodeclustermengandung clusteranak; cluster-cluster saudara yang membagi point yang ditutupi oleh induk mereka. Metode-metode clusteringhirarkhi dikategorikan ke dalam agglomerative(bawah-atas) dan idivisive (atas-bawah). Clustering agglomerative dimulai dengan clustersatu point (singleton) dan secara berulang mengabungkan dua atau lebih clusteryang paling tepat. Clusterdivisivedimulai dengan satu clusterdari semua point data dan secara berulang membagi clusteryang paling tepat. Proses tersebut berlanjut hingga kriteria penghentian (seringkali, jumlah k yang diperlukan dari cluster) dicapai (Paulanda, 2012). Untuk clusteringhirarkhi, menggabungkan atau memisahkan subset dari point-point dan bukan point-point individual, jarak antara point-point individu harus digeneralisasikan terhadap jarak antara subset (Paulanda, 2012). Ukuran kedekatan yang diperoleh disebut metrik hubungan. Tipe metrik hubungan yang digunakan secara signifikan mempengaruhi algortima hirarkhi, karena merefleksikan konsep tertentu dari kedekatan dan koneksitas. Metrik hubungan antar clusterutama (termasuk hubungan tunggal, hubungan rata-rata dan hubungan sempurna). a. Single Lingkage Clustering (Pautan Tunggal) Metode ini didasarkan pada jarak minimum. Dimulai dengan dua objek yang dipisahkan dengan jarak paling pendek, maka keduanya akan ditempatkan pada cluster pertama, dan seterusnya. Metode ini dikenal pula dengan nama pendekatan tetangga terdekat. Metode Pautan Tunggal (single lingkage) akan mengelompokan dua objek yang mempunyai jarak terdekat dahulu. Jadi pada setiap tahapan, banyaknya cluster berkurang satu. Secara formal dua buah cluster Br dan Bs, jarak antara Br dan Bs misalkan h (Br, Bs) didefinisikan sebagai:

14 Hasil Single Linkage Clustering dapat disajikan dalam bentuk Dendogram atau diagram pohon. Cabang-cabang tersebut bertemu bersama-sama (menggabung) pada simpul posisinya sepanjang suatu sumbu jarak (kemiringan) menunjukan tingkat dimana penggabungan terjadi. Input untuk algoritma single linkage bisa berujud jarak atau similarities antara pasangan-pasangan dari objek-objek. Kelompok-kelompok dibentuk dari entities individu dengan menggabungkan jarak paling pendek atau similarities (kemiripan) yang paling besar. b. Complete Linkage Clustering (Pautan Lengkap) Metode ini didasarkan pada jarak maksimum. Metode Pautan Lengkap (Complete lingkage) akan mengelompokan dua objek yang mempunyai jarak terjauh dahulu. Metode ini dikenal pula dengan nama pendekatan tetangga terjauh. Metode ini memberikan kepastian bahwa semua item-item dalam satu kelompok berada dalam jarak paling jauh (similaritas terkecil) satu sama lain. Hasil Complete Linkage Clustering dapat disajikan dalam bentuk Dendogram atau diagram pohon. Cabang-cabang tersebut bertemu bersama-sama (menggabung) pada simpul posisinya sepanjang suatu sumbu jarak (kemiringan) menunjukan tingkat dimana penggabungan terjadi. Complete Linkage memberikan kepastian bahwa semua item-item dalam satu cluster berada dalam jarak paling jauh (similaritas terkecil) satu sama lain. c. Averaging Lingkage Clustering Average Linkage memperlakukan jarak antara dua cluster sebagai jarak rata-rata antara semua pasangan item-item di mana satu anggota dari pasangan tersebut kepunyaan tiap cluster. Mulai dengan mencari matriks jarak D = {dik} untuk memperoleh objek-objek paling dekat ( paling mirip) misalnya U dan V. Objek objek ini digabungkan untuk membentuk cluster (UV). Untuk langkah dari algoritma di atas jarak-jarak antara(uv) dan cluster W yang lain ditentukan oleh: =

15 di mana dik adalah jarak antara objek i dalam Cluster (UV) dan objek k dalam ClusterW, dan Nuv dan Nw berturut-turut adalah banyaknya item-item dalam Cluster (UV) dan W Clustering Partisional (Partitional Clustering) Dalam partisioning kita mengelompokkan obyek ke dalam k cluster. Ini bisa dilakukan dengan menentukan pusat cluster awal, lalu dilakukan realokasi obyek berdasarkan kriteria tertentu sampai dicapai pengelompokan yang optimum. Dalam cluster hirarki, kita mulai dengan membuat m cluster dimana setiap cluster beranggotakan satu obyek dan berakhir dengan satu cluster dimana anggotanya adalah m obyek. Pada setiap tahap dalam prosedurnya, satu cluster digabung dengan satu cluster yang lain. Kita bisa memilih berapa jumlah cluster yang diinginkan dengan menentukan cut-off pada tingkat tertentu (Santosa, 2007). Salah satu isu dengan algoritma-algoritma tersebut adalah kompleksitas tinggi, karena menyebutkan semua pengelompokkan yang memungkinkan dan berusaha mencari optimum global. Bahkan untuk jumlah objek yang kecil, jumlah partisi adalah besar. Itulah sebabnya mengapa solusi-solusi umum dimulai dengan sebuah partisi awal, biasanya acak, dan berlanjut dengan penyempurnaannya. Sebuah pendekatan terhadap pembagian data adalah mengambil sudut pandang konseptual yang mengidentifikasikan clusterdengan model tertentu yang parameternya tidak diketahui harus ditemukan. Model-model probabilistik menganggap bahwa data berasal dari campuran beberapa populasi yang didistribusi dan prioritasnya ingin ditemukan. Sebuah kelebihan yang jelas dari metode-metode probabilitas adalah daya interpretasi dari cluster-clusteryang dibuat. Dengan memiliki representasi clusteryang tepat juga memungkinkan penghitungan yang tidak ekspensif dari ukuran-ukuran intra-clusterdari kesesuaian yang memberikan fungsi objektif yang tergantung pada sebuah pembagian (partition). (Paulanda, 2012). Sedangkan metode partitioning sendiri terdiri dari k-means dan fuzzy K-Means.Dengan mengetahui objek-objek database N, sebuah algoritma clusteringpartisional membentuk k bagian dari data, dimana setiap clustermengoptimalkan kriteria clustering, seperti minimasi jumlah jarak kuadrat dari rata-rata dalam setiap cluster. Salah satu isu dengan algoritma-algoritma tersebut adalah kompleksitas tinggi, karena menyebutkan semua pengelompokkan yang memungkinkan dan berusaha mencari

16 optimum global. Bahkan untuk jumlah objek yang kecil, jumlah partisi adalah besar. Itulah sebabnya mengapa solusi-solusi umum dimulai dengan sebuah partisi awal, biasanya acak, dan berlanjut dengan penyempurnaannya. Praktek yang lebih baik akan berupa pelaksanaan algoritma partisional untuk kumpulan point-point awal yang berbeda (yang dianggap sebagai representative) dan meneliti apakah semua solusi menyebabkan partisi akhir yang sama atau tidak. Algoritma-algoritma clusteringpartisional berusaha memperbaiki secara local sebuah kriteria tertentu. Pertama, menghitung nilai-nilai kesamaan atau jarak, mengurutkan hasil, dan mengangkat nilai yang mengoptimalkan kriteria. Oleh karena itu, dapat dianggap sebagai algoritma seperti greedy. Sebuah pendekatan terhadap pembagian data adalah mengambil sudut pandang konseptual yang mengidentifikasikan clusterdengan model tertentu yang parameternya tidak diketahui harus ditemukan. Model-model probabilistik menganggap bahwa data berasal dari campuran beberapa populasi yang didistribusi dan prioritasnya ingin ditemukan. Sebuah kelebihan yang jelas dari metode-metode probabilitas adalah daya interpretasi dari cluster-clusteryang dibuat. Dengan memiliki representasi clusteryang tepat juga memungkinkan penghitungan yang tidak ekspensif dari ukuran-ukuran intra clusterdari kesesuaian yang memberikan fungsi objektif yang tergantung pada sebuah pembagian (partition). Tergantung pada bagaimana representative dibuat, algoritma partitioning optimasi literative dibagi lagi ke dalam metode-metode K-medoids dan K- means. a. K-Means Clustering Salah satu metode partisi atau biasa disebut juga dengan metode non hirarki. Salah satu metode partisi yang biasa digunakan adalah metode K-Means Clustering. Metode K-Means Clustering dapat diterapkan pada kasus dengan jumlah objek yang sangat besar (Utami & Sutikno, 2010). Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah clustering k-means. Dalam teknik ini kita ingin mengelompokkan obyek ke dalam k kelompok atau cluster. Untuk melakukan clustering ini, nilai k harus ditentukan terlebih dahulu. Biasanya user atau pemakai sudah mempunyai informasi awal tentang obyek yang sedang dipelajari, termasuk berapa jumlah cluster yang paling tepat. Secara detail kita bisa menggunakan ukuran ketidakmiripan untuk mengelompokkan obyek kita. Jika jarak dua obyek atau data titik cukup dekat, maka dua obyek itu

17 mirip. Semakin dekat berarti semakin tinggi kemiripannya. Semakin tinggi nilai jarak, semakin tinggi ketidakmiripannya (Santosa, 2007) K-Means Clusteringmerupakan salah satu metode data clustering non hirarki yang mengelompokan data dalam bentuk satu atau lebih cluster/kelompok. Data-data yang memiliki karakteristik yang sama dikelompokan dalam satu cluster/kelompok dan data yang memiliki karakteristik yang berbeda dikelompokan dengan cluster/kelompok yang lain sehingga data yang berada dalam satu cluster/kelompok memiliki tingkat variasi yang kecil (Agusta, 2007). Metode K-Means digunakan sebagai alternatif metode cluster untuk data dengan ukuran besar karena memiliki kecepatan yang lebih tinggi dibandingkan metode hirarki. Menurut Forgy (1965) K-Means adalah salah satu algoritma terkenal dalam clustering, awalnya dikenal sebagai metode Forgy s dan telah digunakan secara luas di berbagai bidang termasuk Data Mining, analisi statistik data dan aplikasi bisnis lainnya. Untuk k-means, k menunjukkan jumlah cluster. Nilai k ditentukan oleh pemakai atau user. Untuk kasus dimana ada pertimbangan dari ahli yang kompeten atau expert di bidangnya, nilai k akan mudah di tentukan. Tetapi sering sekali terjadi bahwa nilai k ini harus ditentukan dengan melihat pada data (tanpa ada pertimbangan dari expert) (Mahrus, et al. 2013) K-Means merupakan algoritma clustering yang berulang-ulang. Algoritma K-Means dimulai dengan pemilihan secara acak K, K disini merupakan banyaknya cluster yang ingin dibentuk. Kemudian tetapkan nilai-nilai K secara random, untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan centroid, mean atau means. Hitung jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus Euclidian hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasikan setiap data berdasarkan kedekatannya dengan centroid. Lakukan langkah tersebut hingga nilai centroid tidak berubah (stabil) (Rismawan, 2008) Konsep dasar dari algortima K-Means adalah pencarian pusat cluster (centroidpoints) secara iterative. Pusat cluster ditetapkan berdasarkan jarak setiap data ke pusat cluster. Proses clustering dimulai dengan mengidentifikasikan data yang akan di-cluster, dengan n adalah jumlah data yang akan di cluster dan m adalah jumlah variable.

18 Pada awal iterasi, pusat setiap cluster ditetapkan secara bebas (sembarang),. Kemudian dihitung jarak antara setiap data dengan setiap pusat cluster. Untuk melakukan perhitungan jarak data ke - ke-i pada pusat cluster ke, diberi nama dapat digunakan formula Euclidean, yaitu: Suatu data akan menjadi anggota dari clusterke-j apabila jarak data tersebut ke pusat clusterke-j bernilai paling kecil jika dibandingkan dengan jarak ke pusat clusterlainnya. Selanjutnya, kelompokkan data-data yang menjadi anggota pada setiap cluster. Nilai pusat clusteryang baru dapat dihitung dengan cara mencari nilai rata-rata dari data-data yang menjadi anggota pada clustertersebut, dengan rumus: Menurut Santosa (2007), langkah-langkah melakukan Clustering dengan metode K-Meansadalah sebagai berikut: a. Pilih jumlah cluster k. b. Inisialisasi k pusat clusterini bisa dilakukan dengan berbagai cara. Namun yang paling sering dilakukan adalah dengan cara random. Pusat-pusat cluster diberi nilai awal dengan angka-angka random. c. Alokasikan semua data/ objek ke cluster terdekat. Kedekatan dua objek ditentukan berdasarkan jarak kedua objek tersebut. Demikian juga kedekatan suatu data ke clustertertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap ini perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak paling antara satu data dengan satu clustertertentu akan menentukan suatu data masuk dalam Clustermana. Untuk menghiutng jarak semua data ke setiap tiitk pusat Cluster dapat menggunakan teori jarak Euclidean yang dirumuskan sebagai berikut:

19 dimana: Jarak data ke i ke pusat Clusterj Data ke i pada atribut data ke k Titik pusat ke j pada atribut ke k d. Hitung kembali pusat Clusterdengan keanggotaan Clusteryang sekarang. Pusat Clusteradalah rata-rata dari semua data/ objek dalam Clustertertentu. Jika dikehendaki bisa juga menggunakan median dari Cluster tersebut. Jadi ratarata (mean) bukan satu-satunya ukuran yang bisa dipakai. e. Tugaskan lagi setiap objek memakai pusat Clusteryang baru. Jika pusat Clustertidak berubah lagi maka proses clusteringselesai. Atau, kembali ke langkah nomor 3 sampai pusat clustertidak berubah lagi. Algoritma K-Means adalah algoritma yang terbaik dalam algoritma Partitional Clustering dan yang paling sering digunakan diantara algoritma Clustering lainnya, karena kesederhanaan dan efesiensinya (Budiman, 2012). Menentukan jumlah Cluster Menentukan centroid Menentukan nilai De (Distance Euclidean) Menghitung jarak objek dengan nilai De (Distance Euclidean) Ya Ada Objek yang berpindah Tidak Gambar 2.3 Flowchart Algoritma Metode K-MeansClustering Sumber : (Nugraheni, 2011)

20 Seperti disinggung dalam salah satu langkah dalam prosedur clustering bahwa ratarata (mean) sebagai pusat cluster bisa diganti dengan ukuran pemusatan yang lain seperti median. Untuk kasus-kasus tertentu pemakaian median sebagai alternatif dari mean memberikan hasil yang lebih baik. Seperti kita ketahui median tidak sensitif terhadap data outlier, data yang terletak jauh dari kebanyakan data yang lain. Jika kita mempunyai data yang kita yakini mempunyai data outlier yang mengandung informasi penting pemakaian ukuran pemusatan berupa median dalam Clustering ini mungkin bisa di coba. Perhatikan contoh berikut ini a. Mean dari 1, 3, 5, 7, 9 adalah 5 b. Mean dari 1, 3, 5, 7, 1009 adalah 205 c. Median dari 1, 3, 5, 7, 1009 adalah 5 d. Kelihatan bahwa median tidak sensitif terhadap nilai ekstrim. Hasil Cluster dengan metode K-Mean sangat bergantung pada nilai pusat Cluster yang diberikan. Pemberian nilai awal yang berbeda bisa menghasilkan hasil Cluster yang berbeda. Ada beberapa cara memberi nilai awal misalnya dengan mengambil sampel awal dari data, lalu mencari pusatnya, memberi nilai awal secara random, kita tentukan nilai awalnya atau menggunakan hasil dari Cluster hirarki dengan jumlah Cluster yang sesuai. Pada Survey yang dipublikasikan Springer Tio 10 Algorithm in Data Mining (Budiman, 2012), algoritma K-Means ditempatkan pada posisi 2 (dua) sebagai algoritma paling banyak digunakan dalam Data Mining menjadi posisi pertama untuk algoritma Clustering. Urutan Top Algoritma-nya adalah sebagai berikut : 1) C4.5 2) K-Means 3) SVM (Support Vector Machines) 4) Algoritma Apriori 5) EM (Expectation Maximazation) 6) Algoritma PageRank 7) Algoritma AdaBoost 8) K-Nearest Neighbor 9) Naïve Bayes 10) Classification and Regression Trees.

21 b. Fuzzy K-Means Clustering Fuzzy K-means Clustering atau fuzzy isodata dikembangkan oleh Bezdek pada tahun 1981 untuk menyelesaikan masalah optimasi (Agusta, 2007). Pengelompokan dengan mempertimbangkan tingkat keanggotaan yang mencakup himpunan fuzzy sebagai dasar pembobotan bagi pengelompokan disebut dengan Fuzzy Clustering. Metode Fuzzy K-means Clustering merupakan pengembangan dari metode K-means Clustering untuk meminimalkan masalah kegagalan konvergen (Utami & Sutikno, 2010). Metode K-Means Clustering memiliki matriks keanggotaan biner yaitu 0 dan 1, sedangkan fuzzy K-Means Clustering memiliki matriks keanggotaan kontinu antara 0 dan 1. Pada Fuzzy K-Means Clustering, fungsi keanggotaan memiliki nilai antara 0 sampai 1 dengan fungsi pembatas berikut: Derajat keanggotaan terbesar dari setiap objek menunjukkan kecenderungan objek tersebut menjadi anggota dari kelompok tertentu. Prinsip utama dari fuzzy K-means Clustering adalah meminimumkan fungsi objektif, yaitu jarak antara objek dengan setiap pusat kelompok. Tidak ada nilai w yang optimum, tetapi nilai w yang sering digunakan adalah 2 (Agusta, 2007). Fungsi objektif dapat diminimumkan dengan fungsi pembatas dengan menggunakan pengganda lagrange kelompok yang optimum pada metode fuzzy K- means clustering. 2.6.Sum of Squared Error (SSE) Sum of Squared Error (SSE) diterjemahkan sebagai penjumlahan nilai kuadrat dari jarak data dengan pusat Cluster. SSE dinyatakan dengan rumus berikut: Dimana, d adalah jarak antara data dengan pusat cluster.

22 2.7.Distance Space Untuk Menghitung Jarak Antara Data dan Centroid Tetapi secara umum distance space yang sering digunakan adalah Manhattan dan Euclidean. Euclidean sering digunakan karena penghitungan jarak dalam distance space ini merupakan jarak terpendek yang bisa didapatkan antara dua titik yangdiperhitungkan, sedangkan Manhattan sering digunakan karena kemampuannya dalammendeteksi keadaan khusus seperti keberadaaan outliers dengan lebih baik. Konsep ketidakmiripan pada metode ini berdasarkan pada ukuran jarak antar objek, dimana jarak yang besar menunjukan sedikit kesamaan dan jarak yang pendek atau kecil menunjukan bahwa suatu objek semakin mirip dengan objek yang lainya. Berbeda dengan ukuran korelasi, ukuran jarak berfokus pada besarnya nilai. Cluster berdasarkan ukuran korelasi bisa saja tidak memiliki kesamaan nilai tapi hanya memiliki kesamaan pola, sedangkan cluster berdasarkan ukuran jarak lebih memiliki kesamaan nilai meskipun polanya berbeda. Adapun macam-macam dari ukuran jarak dapat diuraikan sebagai berikut: Jarak Euclidean Konsep jarak Euclidean ini memperlakukan semua peubah adalah bebas (tidak berkorelasi). Transformasi baku yang dilakukan berarti menghilangkan pengaruh keragaman data atau dengan kata lain semua peubah akan memberikan kontribusi yang sama untuk jarak. Jarak Euclidean adalah besarnya jarak suatu garis lurus yang menghubungkan antar objek. Misalkan ada dua objek yaitu A dengan koordinat (x1,y1) dan B dengan koordinat (x2,y2) maka jarak antar kedua objek tersebut dapat diukur dengan rumus: Ukuran jarak atau ketidaksamaan antar objek ke-i denganobjek ke-j, disimbolkan dengan dij dan k=1,..,p. Nilai dij diperoleh melalui perhitungan jarak kuadrat Euclidean sebagai berikut: Keterangan : dij = Jarak Kuadrat Euclidean antar objek ke-i dengan obejk ke-j P = Jumlah Variabel cluster

23 Xik = Nilai atau data dari objek ke-i pada variable ke-k Xjk = Nilai atau data dari objek ke-j pada variable ke-k (Everit, 1993) Jarak Menhattan Jarak manhattan adalah besarnya jarak daridua objek ditinjau dari nilai selisih kedua objek tersebut. Misalkan ada dua objek yaitu A dengan koordinat (x1,y1) dan B dengan koordinat (x2,y2) maka jarak antar kedua objek tersebut dapat diukur dengan rumus. Maka jarak manhattan dari objek i ke objek j, disimbolkan dij dengan k=1,2,,p variabel objek dapat dihintung dengan : Jarak Pearson Jarak Pearson merupakan perluasan dari jarak Euclidean. Ukuran kesamaan dalam jarak ini meninjau varian dari kedua objeknya juga. Ukuran pearson merupakan ukuran jarak Euclidean yang dalam tiap variabelnya dibagi dengan varian seluruh variabel yang ada. Maka jarak pearson dari objek i ke objek j, disimbolkan dij dengan k=1,2,,p variabel objekdapat dihitung dengan: Namun pada umumnya, ukuran jarak yang sering dipakai oleh peneliti adalah jarak Euclidean. Karena jarak ini cukup fleksibel untuk dilakukan modifikasi dalam mengatasi kelemahan data. Misalnya kelemahan karena unit pengukuran dan atau skala pengukuran yang berbeda bisa diperbaiki dengan melakukan transformasi baku (Z) dari rumus jaraknya. Beberapa distance spacetelah diimplementasikan dalam menghitung jarak (distance) antara data dan centroidtermasuk di antaranya L1 (Manhattan/City Block) distance space, L2 (Euclidean) distance space, dan Lp (Minkowski) distance space. Jarak antara dua titik x1dan x2 pada Manhattan/City Block distance spacedihitung dengan menggunakan rumussebagai berikut:

24 Rumus: dimana : P : Dimensi data. : Nilai Absolut Sedangkan untuk L2 (Euclidean) distance space, jarak antara dua titik dihitung menggunakan rumus sebagai berikut: Rumus: dimana : p : Dimensi data Lp (Minkowski) distance spaceyang merupakan generalisasi dari beberapa distance space yang ada seperti L1 (Manhattan/City Block) dan L2 (Euclidean), juga telahdiimplementasikan. 2.8.Riset Terkait Dalam melakukan penelitian, penulis menggunakan beberapa riset terkait yang dijadikan acuan yang membuat penelitian berjalan lancar. Adapun riset-riset terkait yang dijadikan acuan yang membuat penelitian berjalan lancar. Adapun riset-riset terkait tersebut adalah seperti tercantum pada tabel 2.1 berikut ini. No 1 3 Judul Riset Modifikasi K-Means Berbasis Ordered Weighted Averaging (OWA) Untuk Kasus Klastering Aplikasi K-Means Untuk Pengelompokkan Mahasiswa Berdasarkan Tabel 2.1 Riset-riset Terkait Nama dan Tahun Peneliti Ulya. M (2011) Kusuma dewi. S., Rismawan. Metode yang Digunakan Algoritma K-Means OWA Algoritma K-Mean Clustering Hasil Penelitian Penentuan Pusat Clustering dengan Algoritma K-Means OWA Penentuan pusat Cluster Menggunakan

25 4 5 Nilai Body Mass Index (BMI) & Ukuran Kerangka Implementasi Algoritma K- Means Clustering Untuk Menentukan Strategi Marketing PresidentUniversity Penerapan Radial Basis Function Network Dengan K-Means Cluster Untuk Peramalan Kebutuhan Straw T (2008) Ong. J. O (2013) Heryanto, D. N., Rachman, F. H. & Satoto, B. D (2013) Algoritma K-Mean Clustering Metode Radial Basis Function Metode K-Means Clustering Penentuan Pusat Cluster Menggunakan Metode K-Means Clustering Penentuan Pusat Cluster dan Titik Centroid Menggunakan Metode Radial Basis Function 2.9.Perbedaan dengan Riset Sebelumnya Berdasarkan riset yang telah dilakukan, peneliti membuat perbedaan dalam penelitian ini, yaitu; 1. Algoritma K-MeansClustering yang digunakan dalam penentuan pusat cluster adalah algoritma Modified K-MeansClustering berbasis Sum Of Squared Error (SSE) 2. Untuk menghitung jarak (distance) antara data dan centroid menggunakan Euclidean Distance Space.

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam

Lebih terperinci

DATA MINING DAN WAREHOUSE A N D R I

DATA MINING DAN WAREHOUSE A N D R I DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster Analisis Cluster Analisis Cluster adalah suatu analisis statistik yang bertujuan memisahkan kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain.

Lebih terperinci

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

BAB III K-MEDIANS CLUSTERING

BAB III K-MEDIANS CLUSTERING BAB III 3.1 ANALISIS KLASTER Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Metode interdependensi berfungsi untuk memberikan makna terhadap seperangkat

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Traveling Salesmen Problem (TSP) Travelling Salesman Problem (TSP) merupakan sebuah permasalahan optimasi yang dapat diterapkan pada berbagai kegiatan seperti routing. Masalah

Lebih terperinci

PERANCANGAN APLIKASI MENENTUKAN BERAT BADAN IDEAL DENGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING

PERANCANGAN APLIKASI MENENTUKAN BERAT BADAN IDEAL DENGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PERANCANGAN APLIKASI MENENTUKAN BERAT BADAN IDEAL DENGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING Johan Candra Juliner Hutabarat Mahasiswa Program Studi Teknik Informatika STMIK Budi Darma Medan Jl. Sisingamangaraja

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang

BAB I PENDAHULUAN. Analisis statistik multivariat adalah metode statistik di mana masalah yang BAB I PENDAHULUAN 1.1. LATAR BELAKANG MASALAH Analisis statistik multivariat adalah metode statistik di mana masalah yang diteliti bersifat multidimensional dengan menggunakan tiga atau lebih variabel

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 3 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2015 Definisi Set Data Set Data / Data Set / Himpunan Data Kumpulan

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to

Lebih terperinci

Bab 2 Tinjauan Pustaka

Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Adapun penelitian terdahulu yang berkaitan dalam penelitian ini berjudul Penentuan Wilayah Usaha Pertambangan Menggunakan Metode Fuzzy K-Mean Clustering

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Pada penelitian yang dilakukan oleh (Chen, Sain, & Guo, 2012) berfokus untuk mengetahui pola penjualan, pelanggan mana yang paling berharga, pelanggan mana yang

Lebih terperinci

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Mobilitas adalah hal yang tidak dapat dipisahkan dalam gaya hidup masyarakat sekarang ini. Serangkaian aktifitas menuntut seseorang untuk berada di suatu tempat bahkan

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU PROYEK TUGAS AKHIR IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU (Studi Kasus : SMK Pembangunan Nasional Purwodadi) Disusun oleh: Novian Hari Pratama 10411 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS

Lebih terperinci

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT Ismail Setiawan 1) 1) Magister Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Sistem Informasi Pengertian Sistem Informasi pada dasarnya merupakan hasil dari dua arti, yakni sistem dan informasi yang digabungkan. Berikut definisi sistem menurut para ahli

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA Artikel Skripsi PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA SKRIPSI Diajukan Untuk Memenuhi Sebagian

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan

Lebih terperinci

Surmayanti 1, Hari Marfalino 2, Ade Rahmi 3 Fakultas Limu Komputer Universitas Putra Indonesia YPTK Padang

Surmayanti 1, Hari Marfalino 2, Ade Rahmi 3 Fakultas Limu Komputer Universitas Putra Indonesia YPTK Padang PENERAPAN ANALYSIS CLUSTERING PADA PENJUALAN KOMPUTER DENGAN PERANCANGANAN APLIKASI DATA MINING MENGGUNAKAN ALGORITMA K-MEANS (STUDY KASUS TOKO TRI BUANA KOMPUTER KOTA SOLOK) Surmayanti 1, Hari Marfalino

Lebih terperinci

The 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang

The 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang Penerapan Seleksi Atribut Berdasarkan Koefisien Variansi dan Korelasi untuk Inisialisasi Pusat Awal Klaster pada Algoritma K- Means dalam Pemetaan E-Government Tahun 2016 Ivon Dewi Apriliyaningsih 1*,

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan analisa datadan algoritma Fuzzy C-Means untuk mangetahui pola perilaku konsumen. 2.1. Pola

Lebih terperinci

dengan Algoritma K Means

dengan Algoritma K Means K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB II LANDASAN TEORI. Nama Judul. Hasil Peneliti, Penelitian. Penelitian Tahun 1. Johan. Implementasi

BAB II LANDASAN TEORI. Nama Judul. Hasil Peneliti, Penelitian. Penelitian Tahun 1. Johan. Implementasi BAB II LANDASAN TEORI A. Tinjauan Pustaka Tabel berikut ini akan menjelaskan beberapa hasil penelitian yang telah dilakukan dan memiliki kesamaan topik maupun metode yang dilakukan pada penelitian ini.

Lebih terperinci

Peranan Statistika. Disusun oleh Putriaji Hendikawati, S.Si., M.Pd., M.Sc. Dr. Scolastika Mariani, M.Si.

Peranan Statistika. Disusun oleh Putriaji Hendikawati, S.Si., M.Pd., M.Sc. Dr. Scolastika Mariani, M.Si. Peranan Statistika Disusun oleh Putriaji Hendikawati, S.Si., M.Pd., M.Sc. Dr. Scolastika Mariani, M.Si. 1. Pengertian Statistika Statistika banyak dimanfaatkan dalam berbagai aspek dan bidang kehidupan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Clustering Pada dasarnya clustering terhadap data adalah suatu proses untuk mengelompokkan sekumpulan data tanpa suatu atribut kelas yang telah didefinisikan sebelumnya, berdasarkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Sistem Pendukung Keputusan II.1.1 Definisi Sistem Pendukung Keputusan Berdasarkan Efraim Turban dkk, Sistem Pendukung Keputusan (SPK) / Decision Support System (DSS) adalah sebuah

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN Latar Belakang Kredit merupakan salah satu usaha sekunder yang dapat dilakukan untuk pemenuhan kebutuhan sehari-hari. Pada umumnya, proses kredit dapat dilayani melalui lembaga keuangan

Lebih terperinci

Partitional clustering KLASTERING DENGAN METODE K-MEANS

Partitional clustering KLASTERING DENGAN METODE K-MEANS Partitional clustering KLASTERING DENGAN METODE K-MEANS PENDAHULUAN K-mean merupakan teknik klastering yang paling umum dan sederhana. Tujuan klastering ini adalah mengelompokkan obyek ke dalam k klaster/kelompok.

Lebih terperinci

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing

Lebih terperinci

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Jurnal Ilmiah ILKOM Volume 8 mor (Agustus 16) ISSN: 87-1716 PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Widya Safira Azis 1 dan Dedy Atmajaya 1 safiraazis18@gmail.com dan dedy.atmajaya@umi.ac.id

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN 1.1. Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Analisis cluster merupakan salah satu alat yang penting dalam pengolahan data statistik untuk melakukan analisis data. Analisis cluster merupakan seperangkat metodologi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

http://www.brigidaarie.com proses menganalisa data untuk mencari polapola tersembunyi dengan menggunakan metodologi otomatis Istilah lain : Machine Learning Knowledge Discovery in Database (KDD) Predictive

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Penelitian Terkait Pada penelitian ini, peneliti melakukan penelitian yang didasarkan pada penelitian terdahulu yang terkait dengan penelitian yang akan dilakukan peneliti.

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA II.1 BAB II TINJAUAN PUSTAKA 2.1 Travelling Salesman Problem (TSP) Permasalahan tentang Traveling Salesman Problem dikemukakan pada tahun 1800 oleh matematikawan Irlandia William Rowan Hamilton dan matematikawan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) 157 Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) Elly Muningsih AMIK BSI Yogyakarta E-Mail : elly.emh@bsi.ac.id Abstrak Berkembangnya

Lebih terperinci

1. Sekumpulan angka untuk menerangkan sesuatu, baik angka yang belum tersusun maupun angka angka yang sudah tersusun dalam suatu daftar atau grafik.

1. Sekumpulan angka untuk menerangkan sesuatu, baik angka yang belum tersusun maupun angka angka yang sudah tersusun dalam suatu daftar atau grafik. 1. Sekumpulan angka untuk menerangkan sesuatu, baik angka yang belum tersusun maupun angka angka yang sudah tersusun dalam suatu daftar atau grafik. 3. Sekumpulan angka yang menjelaskan sifat-sifat data

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan.

Jumlah persentase ini tidak harus persis seperti diatas tetapi bisa bervariasi tergantung di perusahaan mana metode ini diterapkan. BAB 2 TINJAUAN PUSTAKA 2.1 Metode Pengelompokan ABC Pada abad ke-18, Villfredo Pareto, dalam penelitiannya mengenai distribusi kekayaan penduduk di Milan Italia, menemukan bahwa 20% dari total populasi

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Clustering Analysis Clustering analysis merupakan metode pengelompokkan setiap objek ke dalam satu atau lebih dari satu kelompok,sehingga tiap objek yang berada dalam satu kelompok

Lebih terperinci

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning CLUSTERING DEFINISI Clustering : Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis Bentuk yang paling umum digunakan adalah unsupervised learning # Unsupervised learning

Lebih terperinci

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 ANALISA PERBANDINGAN METODE HIERARCHICAL CLUSTERING, K-MEANS DAN GABUNGAN KEDUANYA DALAM MEMBENTUK CLUSTER DATA (STUDI KASUS : PROBLEM KERJA PRAKTEK JURUSAN

Lebih terperinci

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks

BAB II KAJIAN TEORI. linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks BAB II KAJIAN TEORI Pada bab II akan dibahas tentang materi-materi dasar yang digunakan untuk mendukung pembahasan pada bab selanjutnya, yaitu matriks, kombinasi linier, varian dan simpangan baku, standarisasi

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET

PENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET PENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET Handi Kurniawan Sohdianata 1, Sushermanto 2 Jurusan Teknik Informatika STMIK Banjarbaru 1, Jurusan Sistem Informasi STMIK Banjarbaru 2 Jl.

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penambangan Data (Data Mining) Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Tinjauan Pustaka Hosseini dan Gholaiman (2010) dan Pradono dkk (2011) melakukan pengelompokkan konsumen dengan data yang bersifat metric dan menggunakan metode K-Means. Hosseini

Lebih terperinci

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Data Mining A. Pengertian Data Mining Menurut Gartner Group data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan

Lebih terperinci

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521 JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: 2301-9271 A-521 Analisa Perbandingan Metode Hierarchical Clustering, K-means dan Gabungan Keduanya dalam Cluster Data (Studi kasus : Problem Kerja Praktek Jurusan

Lebih terperinci

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS)

ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS) ANALISIS MULTIVARIAT ANALISIS CLUSTER DENGAN METODE K-MEANS (TEORI DAN CONTOH STUDY KASUS) Oleh : Rizka Fauzia 1311 100 126 Dosen Pengampu: Santi Wulan Purnami S.Si., M.Si. PROGRAM STUDI SARJANA JURUSAN

Lebih terperinci

Pengenalan Pola. Klasterisasi Data

Pengenalan Pola. Klasterisasi Data Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering

Lebih terperinci

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE

PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster) Volume 05, No. 2 (2016), hal 97 102. PENENTUAN JUMLAH CLUSTER OPTIMAL PADA MEDIAN LINKAGE DENGAN INDEKS VALIDITAS SILHOUETTE Nicolaus, Evy Sulistianingsih,

Lebih terperinci

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA Akmal Hidayat 1) & Entin Martiana 2) 1) Teknik Elektro Politeknik Bengkalis Jl.

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan:

Lebih terperinci

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP Page 87 Iin Parlina 1, Agus Perdana Windarto 2, Anjar Wanto 3, M.Ridwan Lubis

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Konsep Pemasaran Dalam merancang dan mengembangkan produk, baik yang berupa jasa maupun barang, tidak terlepas dari konsep pemasaran yang bertujuan memenuhi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Data menjadi sesuatu yang sangat berharga saat ini. Tidak hanya badan pemerintah saja, perusahaan-perusahaan saat ini pun sangat membutuhkan informasi dari data yang

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) Meriska Defriani 1, Noviyanti 2 1 STT Wastukancana 2 Teknik Informatika,

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

STUDI KOMPARATIF PENERAPAN METODE HIERARCHICAL, K-MEANS DAN SELF ORGANIZING MAPS (SOM) CLUSTERING PADA BASIS DATA. Abstract

STUDI KOMPARATIF PENERAPAN METODE HIERARCHICAL, K-MEANS DAN SELF ORGANIZING MAPS (SOM) CLUSTERING PADA BASIS DATA. Abstract STUDI KOMPARATIF PENERAPAN METODE HIERARCHICAL, K-MEANS DAN SELF ORGANIZING MAPS (SOM) CLUSTERING PADA BASIS DATA Undang Syaripudin 1, Ijang Badruzaman 2, Erwan Yani 3, Dede K 4, M. Ramdhani 5 1, 2 Teknik

Lebih terperinci

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS

Pertemuan 14 HIERARCHICAL CLUSTERING METHODS Pertemuan 14 HIERARCHICAL CLUSTERING METHODS berdasar gambar berdasar warna A A A A Q Q Q Q K K K K J J J J 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 10 10 10 10 A K Q J (a). Individual

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang

BAB III PEMBAHASAN. survei yang dilakukan BPS pada 31 Oktober Langkah selanjutnya yang BAB III PEMBAHASAN Data yang digunakan dalam skripsi ini merupakan data sekunder yang diperoleh dari buku saku Ikhtisar Data Pendidikan Tahun 2016/2017. Data tersebut dapat dilihat pada Lampiran 1. Data

Lebih terperinci

Clustering. Virginia Postrel

Clustering. Virginia Postrel 8 Clustering Most of us cluster somewhere in the middle of most statistical distributions. But there are lots of bell curves, and pretty much everyone is on a tail of at least one of them. We may collect

Lebih terperinci

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree Disusun oleh : Budanis Dwi Meilani Achmad dan Fauzi Slamat Jurusan Sistem Informasi Fakultas Teknologi Informasi.

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada

BAB I PENDAHULUAN. Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada BAB I PENDAHULUAN 1.1 Latar Belakang Masalah dalam kehidupan sehari-hari tidak hanya didasarkan pada hubungan satu variabel atau dua variabel saja, akan tetapi cenderung melibatkan banyak variabel. Analisis

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Tinjauan Studi Sebelum penelitian ini dilakukan, sudah terdapat beberapa penelitian yang menjadi dasar untuk menyelesaikan penelitian ini, penelitian tersebut diantaranya sebagai

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan

BAB III METODOLOGI PENELITIAN. Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan BAB III METODOLOGI PENELITIAN A. Jenis Penelitian Jenis penelitian yang digunakan dalam menyusun skripsi ini menggunakan metode deskriptif. Menurut Sugiono dalam bukunya Metodologi Penelitian Bisnis (2009)

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS Sinawati ), Ummi Syafiqoh 2) ), 2) Sistem Informasi STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos

Lebih terperinci

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN : Clustering Data Status Tugas Belajar Dan Ijin Belajar Menggunakan Metode Fuzzy C-Means (Studi Kasus : Di Lingkungan Pemerintah Provinsi Kalimantan Timur) Fevin Triyas Rantika 1, Indah Fitri Astuti, M.Cs

Lebih terperinci

BAB II KAJIAN PUSTAKA

BAB II KAJIAN PUSTAKA BAB II KAJIAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah alat dan teknik perangkat lunak yang bisa memberikan saransaran untuk item yang sekiranya bermanfaat bagi pengguna (Ricci, et al.,

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ SKRIPSI Diajukan untuk memenuhi salah satu syarat memperoleh Gelar Sarjana pada Program Studi Sistem

Lebih terperinci