BAB 2 TINJAUAN PUSTAKA
|
|
- Verawati Hadiman
- 6 tahun lalu
- Tontonan:
Transkripsi
1 BAB 2 TINJAUAN PUSTAKA 2.1. Penelitian Terkait Pada penelitian ini, peneliti melakukan penelitian yang didasarkan pada penelitian terdahulu yang terkait dengan penelitian yang akan dilakukan peneliti. Penelitian terdahulu yang telah dilakukan berguna sebagai referensi untuk melengkapi penelitian yang akan dilakukan. Penelitian terkait yang menggunakan metode K-Means untuk menyelesaikan pengelompokan telah banyak dilakukan. Mardiani (2014) melakukan penelitian mengenai perbandingan algoritma K-Means dan EM untuk clusterisasi nilai mahasiswa berdasarkan asal sekolah. Dari hasil clustering algoritma K-Means dan EM dibagi menjadi beberapa kelompok. Dari sekolah-sekolah tersebut, nilai IPK dikelompokkan menjadi 3 cluster dengan ketentuan tinggi, sedang dan rendah dengan jumlah sekolah. Dari hasil yang didapat bahwa algoritma K-Means lebih banyak mengelompokan sekolah-sekolah ke kategori tinggi dibanding EM, sedangkan untuk EM lebih banyak mengelompokan sekolah-sekolah ke kategori sedang. Ni Made, et al (2015), melakukan penelitian mengenai clustering metode DBSCAN pada proses pengambilan keputusan. Dalam penelitian tersebut pengujian sistem pada metode DBSCAN dilakukan untuk mengetahui bagaimana metode tersebut mampu menentukan pelanggan potensial untuk membantu proses pengambilan keputusan. Langkah awal pada penelitian tersebut adalah memilih field field yang digunakan dalam proses clustering. Field field tersebut nantinya dapat mempresentasikan nilai nilai pada proses transformasi data dan kemudian disimpan pada sebuah tabel statis atau tabel standar. Proses uji coba clustering metode DBSCAN tersebut menggunakan data selama satu tahun yang dibentuk menjadi beberapa cluster. Dari penelitian terkait tersebut, dalam hal ini penulis akan menguji beberapa metode dengan menggunakan metode DBSCAN dan K-Means dalam sistem pendukung keputusan yang akan membentuk cluster data dengan terdapat kriteria -
2 kriteria di dalamnya dan menghasilkan kinerja metode yang efektif dan optimal dengan penggunaan uji statistik dalam pengujiannya Sistem Pendukung Keputusan (SPK) Konsep Sistem Pendukung Keputusan (SPK) atau disebut dengan Decision Support Sistem (DSS) pertama kali diungkapkan pada awal tahun 1970-an oleh Michael S. Scott Morton dengan istilah Management Decision Sistem. Sistem tersebut adalah suatu sistem yang berbasis komputer yang ditujukan untuk membantu pengambil keputusan dengan memanfaatkan data dan model tertentu untuk memecahkan berbagai persoalan yang tidak terstruktur. Menurut Hick (1993), Sistem Pendukung Keputusan sebagai sekumpulan tools komputer yang terintegrasi yang mengijinkan seorang decision maker untuk berinteraksi langsung dengan komputer untuk menciptakan informasi yang bergunaka dalam membuat keputusan semi terstruktur dan keputusan tak terstruktur yang tidak terantisipasi. Sedangakn menurut Bonczek (1980), Sistem Pendukung Keputusan sebagai sebuah sistem berbasis komputer yang terdiri atas komponenkomponen antara lain komponen sistem bahasa (languange), komponen sistem pengetahuan (knowledge), dan komponen sistem pemrosesan masalah (problem processing) yang saling berinteraksi satau dengan yang lainnya. Sprague dan Watson mendefinisikan Sistem Pendukung keputusan (SPK) sebagai sistem yang memiliki lima karakteristik utama, yaitu (1) sistem yang berbasis komputer, (2) dipergunankan untuk membantu para pengambil keputusan, (3) untuk memecahkan masalah-masalah rumit yang mustahil dilakukan dengan kalkulasi manual, (4) melalui cara simulasi yang interaktif, dan (5) dimana data dan model analisis sebagai komponen utama. Secara umum Sistem pendukung Keputusan (SPK) dibangun oleh tiga komponen besar yaitu database management, model base, dan software system/user interface.
3 Gambar 2.1 Komponen Sistem Pendukung Keputusan (SPK) Sumber: Abdan S. (2016) 2.3. Data Mining Istilah data mining mulai dikenal sejak tahun 1990, ketika pekerjaan pemanfaatan data menjadi sesuatu yang penting dalam berbagai bidang, mulai dari bidang akademik, bisnis hingga medis (Gorunescu, 2011 dalam Eko Prasetyo, 2014). Munculnya data mining didasarkan pada jumlah data yang tersimpan dalam basis data semakin besar. Dalam berbagai literatur, teori-teori pada data mining sudah ada sejak lama seperti antara lain Naïve-Bayes dan Nearest Neighbour, Pohon Keputusan, aturan asosiasi, K- Means Clustering dan text mining (Bramer, 2007 dalam Prabowo, 2013). Data mining disebut juga dengan knowledge-discovery in database (KDD) ataupun pattern recognition. Istilah KDD atau disebut penemuan pengetahuan data karena tujuan utama data mining adalah untuk memanfaatkan data dalam basis data dengan mengolahnya sehingga menghasilkan informasi baru yang berguna. Sedangkan istilah pattern recognition atau disebut pengenalan pola mempunyai tujuan pengetahuan yang akan digali dari dalam bongkahan data yang sedang dihadapi.
4 Dari kedua istilah tersebut, data mining sebagai disiplin ilmu memiliki tujuan utama yaitu untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang dimilki. Sesuai dengan tujuan utama data mining, terdapat enam fungsi dalam data mining (Prabowo, 2013), diantaranya: (1) fungsi deskripsi (description), (2) fungsi estimasi (estimation), (3) fungsi prediksi (prediction), (4) fungsi klasifikasi (classification), (5) fungsi pengelompokan (clustering), dan (6) fungsi asosiasi (association). Kegiatan data mining dapat dibagi kedalam dua inti penyelidikan utama, sesuai dengan tujuan utama analisis, yaitu: interpretasi dan prediksi (Vercilles, 2009). 1. Interpretasi Dalam hal ini, tujuan dari interpretasi adalah untuk mengidentifikasi pola yang teratur dalam data dan untuk mengekspresikan data melalui peraturan dan kriteria yang dapat dengan mudah dipahami oleh para ahli dalam domain aplikasi, sebagai contoh: clustering, association rules. 2. Prediksi Dalam hal ini, tujuan dari prediksi adalah untuk mengantisipasi atau memprediksi nilai suatu variabel random (acak) yang akan menggambarkan kondisi dimasa mendatang atau memperkirakan kemungkinan peristiwa masa depan, sebagai contoh: classification regression, time series analysis Proses Data Mining Secara sistematis, ada tiga langkah utama dalam data mining (Gonunescu, 2011) 1. Eksplorasi/pemrosesan awal data Eksplorasi atau pemrosesan awal data terdiri dari pembersihan data, normalisasi data, transformasi data, penanganan data yang salah, reduksi dimensi, pemilihan subset. 2. Membangun model dan melakukan validasi terhadapnya Membangun model dan melakukan validasi terhadapnya berarti melakukan analisis berbagai model dan memilih model dengan kinerja prediksi yang terbaik. Dalam langkah ini digunakan metode-metode seperti klasifikasi, regresi, analisis cluster, deteksi anomali, analisis asosiasi, analisis pola sekuensial. Dalam beberapa referensi,
5 deteksi anomali juga masuk dalam langkah eksplorasi, akan tetapi deteksi anomali juga dapat digunakan sebagai algoritma utama, terutama untuk mencari data yang spesial. 3. Penerapan Penerapan berarti menerapkan model pada data yang baru untuk menghasilkan perkiraan/prediksi masalah yang diinvestigasi. Gambar 2.2 Proses Data Mining Sumber: Berka (2009) Data Mining dalam Berbagai Disiplin Ilmu Para ahli telah menentukan posisi bidang data mining diantara bidang bidang yang lain. Hal ini dikarenakan ada kesamaan antara sebagian bahasan dalam data mining dengan bahasan di bidang lain. Kesamaan bidang data mining dengan bidang statistik adalah penyampelan, estimasi, dan pengujian hipotesis. Seperti halnya dalam penelitian ini data mining akan dikaitkan dengan bidang ilmu statistik yang mengahasilkan sebuah hipotesis dalam pengujian penelitian. Selain itu, data mining terdapat kesamaan dengan kecerdasan buatan (artificial intelligence), pengenalan pola (pattern recognition), dan pembelajaran mesin (machine learning)adalah algoritma pencarian, teknik pemodelan, dan teori pembelajaran (Eko P., 2012), seperti pada gambar 2.2.
6 Gambar 2.3 Posisi Data Mining di antara Beberapa Bidang Ilmu Sumber: Eko P. (2012) 2.4. Clustering Analisis kelompok (cluster analysis) adalah mengelompokkan data (objek) yang didasarkan hanya pada informasi yang ditemukan dalam data yang menggambarkan objek tersebut dan hubungan diantaranya (Tan, dalam Eko Prasetyo, 2012). Analisis kelompok tersebut bertujuan objek-objek yang bergabung dalam sebuah kelompok merupakan objek-objek yang mirip satu sama lain dan berbeda dalam kelompok dan lebih besar perbedaannya diantara kelompok lain. Analisis Cluster sebagai metodologi untuk klasifikasi data secara otomatis menjadi beberapa kelompok dengan menggunakan ukuran asosiasi, sehingga data yang sama berada dalam satu kelompok yang sama dan data yang berbeda berada dalam kelompok data yang tidak sama. Masukan (input) untuk sistem analisis cluster adalah seperangkat data dan kesamaan ukuran (atau perbedaan) antara dua data. Sedangkan keluaran (output) dari analisis cluster adalah sejumlah kelompok yang membentuk sebuah partisi atau struktur partisi dari kumpulan data. Salah satu hasil tambahan dari analisis cluster adalah deskripsi umum dari setiap cluster dan hal itu sangat penting untuk analisis lebih dalam dari karakteristik data set tersebut (Ni Putu et al, 2014). Untuk pemberian data set ada beberapa cara untuk menemukan kesamaan antara data untuk menghasilkan cluster. Karakteristik clustering telah menyebabkan pengembangan beberapa algoritma clustering. Masing-masing algoritma menggunakan
7 kriteria yang berbeda untuk membentuk cluster dari data. Diantara algoritma yang paling banyak digunakan untuk clustering adalah K-Means dan DBSCAN (Eko P, 2014) Konsep Clustering Menurut Eko P. (2014), Ada saatnya di mana set data yang akan diproses dalam data mining belum diketahui label kelasnya. Pengelompokan data dilakukan dengan menggunakan algoritma yang sudah ditentukan dan selanjutnya data akan diproses oleh algoritma untuk dikelompokkan menurut karakteristik alaminya. Tidak unsur pembimbingan (dengan pemberian label kelas), melainkan algoritma akan berjalan dengan sendirinya untuk mengelompokkan data tersebut. Data yang lebih dekat (mirip) dengan data yang lain akan berkelompok dalam satu cluster, sedangkan data yang lebih jauh (berbeda) dari data yang lain akan berpisah dalam kelompok yang berbeda. Gambar 2.4 Pengelompokan dengan Cluster Sumber: Eko P. (2014) Untuk masalah pengelompokan data berdasarkan kemiripan /ketidakmiripan antar-data tanpa ada label kelas yang diketahui sebelumnya disebut pembelajaran tidak
8 terbimbing (unsupervised learning). Dalam konteks lain pembelajaran tidak terbimbing disebut juga dengan pengelompokan (clustering). Banyak metode clustering yang telah dikembangkan oleh para ahli, masing-masing metode memilki karakterk, kelebihan, dan kekurangan. Clustering dapat dibedakan menurut struktur cluster, keanggotaan data dalam cluster, dan kekompakan data dalam cluster. Menurut kategori kekompakan, clustering terbagi menjadi dua, yaitu komplet dan parsial. Jika semua data dapat bergabung menjadi satu (dalam konteks partisi) maka dapat dikatakan semua data kompak menjadi satu cluster, tetapi jika ada satu atau dua data yang tidak ikut bergabung dalam cluster mayoritas maka data tersebut dikatakan data yang mempunyai perilaku yang menyimpang. Data yang menyimpang ini disebut outlier, noise atau uninterested background. Maka dari itu, metode yang tangguh untuk melakukan deteksi outlier adalah DBSCAN. Akan tetapi metode lain seperti K-Means juga dapat melakukan deteksi outlier dengan sejumlah komputasi tambahan Ciri Ciri Cluster Clustering melakukan pengelompokan data tanpa berdasarkan pada kelas data tertentu yang sudah ditetapkan dari awal. Proses ini sangat berbeda dengan proses yang terdapat pada classification yang pada awal proses harus memberikan kelas kelas data. Sehingga clustering sering disebut dengan pengelompokan data yang tidak terstruktur. Tugas clustering tidak untuk mengklasifikasikan, mengestimasi, atau memprediksi nilai variabel target (Larose, 2005). Algoritma clustering berusaha mensegmentasikan seluruh kumpulan data ke dalam subkelompok subkelompok atau cluster cluster homogen secara relatif. Adapun ciri ciri pada cluster adalah (Santoso, 2002): 1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster. 2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang lain. Selain terdapat ciri ciri pada cluster, terdapat pula istilah penting dalam cluster, diantaranya:
9 1. Skedul Algomerasi (Algomeration Schedule), merupakan jadwal yang memberikan informasi tentang objek atau kasus yang akan dikelompokan pada setiap tahap suatu proses analisis cluster dengan metode hierarki. 2. Rata rata Cluster (Cluster Centroid), merupakan nilai rata rata variabrl dari semua objek atau observasi dalam cluster tertentu. 3. Pusat Cluster (Cluster Centers), merupakan titik awal dimulainya pengelompokan di dalam cluster nonhierarki. 4. Keanggotaan Cluster (Cluster Memberships), merupakan keanggotaan yang menunjukkan cluster untuk setiap objek yang menjadi anggotanya. 5. Dendogram atau disebut dengan grafik pohon, merupakan output SPSS yang menggambarkan hasil analisis cluster yang dilakukan. 6. Distance between cluster centers, merupakan jarak yang menunjukkan bagaimana terpisahnya pasangan individu cluster (Supranto, 2004) Hierarchical dan Non Hierarchical Clustering Hierarchical dan Non Hierarchical Clustering termasuk merupakan metode pada clustering. Menurut Santoso (2010), hierarchical clustering yaitu suatu metode pengelompokan dua atau lebih objek yang memiliki kesamaan paling dekat. Kemudian proses dilanjutkan ke objek lain yang memiliki kedekatan kedua. Demikian seterusnya sehingga cluster akan membentuk semacam pohon dimana ada hierarki (tingkatan) yang jelas antar objek, dari yang paling mirip hingga yang paling tidak mirip. Secara logika semua objek pada kahirnya akan hanya membentuk sebuah cluster. Berbeda dengan hierarchical clustering, pada non hierarchical clustering dapat dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua cluster, tiga cluster, atau lain sebgainya). Setelah jumlah cluster diketahui, baru proses cluster dilakukan tanpa mengikuti proses hierarki. Metode ini biasa disebut dengan metode K-Means Clustering (Santoso, 2010).
10 2.5. Rule-Based Classification Rule-based classification dalam penelitian ini merupakan metode tambahan sebagai perbandingan antara clustering dan classification. Pada rule-based classification ini, terdapat aturan model IF - THEN yang ditunjukkan sebagai satu set aturan. Rules adalah sebuah cara yang baik untuk menggambarkan informasi atau pengetahuan. Sebuah aturan menggunakan seperangkat peraturan IF THEN untuk klasifikasi data. Sebuah aturan IF THEN merupakan ekspresi dari bentuk berikut: IF condition THEN conclusion Sebagai contoh adalah rule R1, R1: IF age = youth AND student = yes THEN buys_computer = yes. Pada IF dari rule tersebut disebut sebagai aturan pendahulu atau prasyarat. Sedangkan pada THEN adalah aturan sebagai akibat. Dalam aturan pendahulu, kondisi (condition) terdiri dari satu atau lebih atribut, sebagai contoh: age = youth and student = yes (Jiawei Han et al, 2012). Dalam penelitian ini, peneliti akan menerapkan rulebased classification untuk mengklasifikasi data dalam jumlah sedikit Metode DBSCAN Menurut Eko P. (2012), Density-Based Spatial Clustering of Applications with Noise (DBSCAN) merupakan algoritma pengelompokan yang didasarkan pada kepadatan (density) data. Konsep kepadatan yang dimaksud dalam DBSCAN adalah jumlah data yang berada dalam radius Eps (ԑ) dari setiap data. Jika jumlah data tersebut dalam radius ԑ lebih dari atau sama dengan MinPts (jumlah minimal data dalam radius ԑ), data tersebut masuk ke dalam kategori kepadatan yang diinginkan, jumlah data radius tersebut termasuk data itu sendiri. Konsep kepadatan tersebut akan memunculkan tiga macam status dari setiap data, diantaranya inti (core), batas (border), dan noise (noise). Sebuah data akan dimasukkan sebagai inti apabila jumlah data tetangga dan dirinya sendiri pada radius ԑ berjumlah >= MinPts. Nilai radius ԑ dan MinPts ini ditetapkan secara mandiri. Untuk data yang jumlah tetangga dan dirinya sendiri dalam
11 radius ԑ < MinPts, tetapi tetangganya menjadi inti karena keberadaannya, data tersebut dikategorikan sebagai batas. Sementara, jika tidak memenuhi kondisi jumlah tetangga dan dirinya sendiri dalam radius ԑ < MinPts dan tidak ada tetangga yang menjadi inti karena keberadaannya, maka data tesebut dikategorikan sebagai noise.metode ini melakukan pengelompokan dengan baik pada data berkepadatan tinggi, dan dapat menemukan sembarang kelompok dengan baik. Karena basisnya dari kepadatan data, DBSCAN dapat memisahkan data berkepadatan tinggi dan data berkepadatan rendah. DBSCAN bekerja dengan cara melakukan pengumpulan data jarak secara iterasi dimulai titik pertama sampai titik terakhir, mengumpulkan jumlah titik titik yang menjadi tetangga dengan batas jarak antar titik tetangga dengan titik acuan tidak boleh lebih dari Eps. Kemudian membandingkan jumlah titik tetangga tersebut dengan parameter MinPts. Perbandingan ini dilakukan untuk menentukan tipe titik (core, border, noise) dan membentuk cluster baru. Cluster yang terbentuk akan memiliki tingkat kesamaan yang tinggi di dalam cluster itu sendiri, dan tingkat kesamaan yang rendah antar cluster yang berbeda (Kantarzzic,dalam Yuwono, 2009). Ada beberapa konsep kunci dari definisi DBSCAN (Irving et al, 2015), di bawah ini penjelasannya sebagai berikut: a. N ε (p): untuk titik p X, lingkungan ϵ yang didefinisikan sebagai N ε (p) = {x X dist (x, p) ε} dimana dist adalah fungsi jarak. b. Core point: sebuah titik p X adalah sebuah titik inti jika N ε (p) MinPts. c. Directly density reachable: sebuah titik p X adalah kepadatan yang dicapai langsung dari x X jika p N ε (x) dan x adalah sebuah titik inti. d. Density reachable: sebuah titik y X adalah kepadatan yang dicapai dari x X jika ada sebuah rantai titik p 1, p 2,...., p n dimana y = p 1 dan x = p n dan masing-masing p n y adalah kepadatan yang dicapai langsung dari p n 1
12 e. Density connected: sebuah titik p X adalah kepadatan yang terhubung ke q X jika ada sebuah titik x X sehingga p, q adalah kepadatan yang dicapai dari x. f. Cluster: C adalah sebuah cluster X jika C ʗ X dan untuk setiap p, q, p dan q adalah density connected. g. Border point: p adalah titik perbatsan, jika p cluster dan p bukan titik inti. h. Noise point: p adalah titik perbatasan jika bukan milik bagian cluster. Adapun Menurut Mumtaz (Eko Prasetyo, 2012) terdapat beberapa karakteristik, diantaranya: 1. DBSCAN tidak perlu mengetahui jumlah kelompok dalam data secara sesukanya seperti pada K-Means. Hal ini memberikan keuntungan karena umumnya bentuk dan jumlah kelompok yang sebaiknya diberikan pada data berdimensi tinggi tidak dapat diketahui dengan cara analisis visual data. 2. DBSCAN dapat menemukan bentuk kelompok sembarang, bahkan kelompok berbentuk melingkar yang tidak dapat ditangani K-Means. Untuk hal ini dapat disesuaikan dengan menentukan nilai MinPts. 3. Dapat mengenali noise dengan baik. 4. Hanya membutuhkan dua parameter yang kebanyakan tidak sensitif terhadap urutan data dalam basis data. Tetapi penentuan parameter Eps (ԑ) hanya mudah diberikan ketika melihat data spasial dua dimensi. Untuk data berdimensi tinggi, nilai Eps (ԑ) yang tepat sangat sulit ditentukan. 5. Hanya memberikan hasil kelompok yang baik jika menggunakan jarak Euclidean, tetapi tidak berguna untuk berdimensi tinggi.
13 6. Tidak dapat memberikan hasil yang baik untuk data yang mempunyai kelompok kepadatan yang berbeda. Hal ini karena DBSCAN hanya melihat proses pengelompokan berdasarkan radius Eps (ԑ), sehingga ketika ada dua kelompok atau lebih yang mempunyai kepadatan yang berbeda, DBSCAN tidak dapat memberi hasil yang baik Metode K-Means Pengelompokan K-Means merupakan metode analisis kelompok yang mengarah pada pemartisian N objek pengamatan ke dalam K kelompok (cluster), dimana setiap objek pengamatan dimiliki oleh sebuah kelompok dengan rata-rata terdekat. K-Means merupakan salah satu metode pengelompokan nonhierarki yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. Metode ini mempartisi data ke dalam kelompok sehingga data berkarakteristik sama dikelompokan ke dalam satu kelompok yang sama data yang berkarakteristik berbeda dikelompokan ke dalam kelompok yang lain. Tujuan pengelompokan ini adalah untuk meminimalkan fungsi objek yang diset dalam proses pengelompokan, yang pada umumnya berusaha meminimalkan variasi di dalam suatu kelompok dan memaksimalkan variasi antarkelompok (Eko P., 2012). Lokasi sentroid setiap kelompok yang diambil dari rata-rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M menyatakan jumlah data dalam sebuah kelompok, i menyatakan fitur ke-i dalam sebuah kelompok, dan p menyatakan dimensi data (Eko Prasetyo, 2012). Untuk menghitung sentroid fitur ke-i digunakan formula: C i = 1 M M X j j=1... (2.2) Formula tersebut dilakukan sebanyak p dimensi sehingga i mulai dari 1 sampai p. Pengukuran jarak pada ruang jarak Euclidean menggunakan formula: p j=1 D(x 2, x 1 ) = x 2 x 1 2 = x 2j x 1j D adalah jarak antara data x2 dan x1, dan. adalah nilai mutlak (2.3)
14 Pengukuran jarak pada ruang jarak Manhattan menggunakan formula: p D(x 2, x 1 ) = x 2 x 1 1 = j=1 x 2j x 1j... (2.4) Pengukuran jarak pada ruang jarak Minkowsky menggunakan formula: p j=1 D(x 2, x 1 ) = x 2 x 1 λ= x 2j x 1j λ λ... (2.5) Adapun karakteristik dari K-Means (Eko P., 2012) adalah sebagai berikut: 1. K-Means merupakan metode pengelompokan yang sederhana dan dapat digunakan dengan mudah. 2. Pada jenis set data tertentu, K-Means tidak dapat melakukan segmentasi data dengan baik dimana hasil segmentasinya tidak dapat memberikan pola kelompok yang mewakili karakteristik bentuk alami data. 3. K-Means dapat mengalami masalah ketika mengelompokan data yang mengandung outlier Konvergen Apabila clustering pada metode K-Means telah diimplementasikan dengan benar, maka akan membentuk kelompok sesuai subkelompok berdasarkan kriteria data, sehingga menghasilkan cluster yang optimal. Dalam hal ini, pengelompokan data dimulai dari menyusun k buah rata rata, yang dapat membentuk centroid dari sekumpulan data berdimensi n. Kemudian data tersebut akan membentuk cluster cluster. Setelah cluster telah terbentuk, maka akan dihitung rata rata dari setiap cluster untuk membentuk centroid pada cluster cluster tersebut. Tahap tersebut akan terus berulang dan akan berhenti hingga membentuk cluster yang tidak mengubah nilai pusat cluster. Konvergen merupakan pembentukan kelompok yang tidak terjadi perubahan yang signifikan pada pusat cluster. Perubahan tersebut pada umumnya dapat diukur menggunakan jumlah atau rata rata jarak terdekat pada setiap data dengan pusat cluster dalam kelompoknya. Cluster dinyatakan konvergen apabila data tidak ada yang berpindah cluster atau dinyatakan berakhir ketika tidak ada perubahan yang terjadi diantara dua iterasi berturut turut (Subkhan, 2010) sehingga perhitungan centroid pada iterasi terhenti dan terbentuklah cluster yang sesuai.
15 2.9. Statistik Nonparametrik Metode statistik nonparametrik merupakan metode statistik yang dapat digunakan dengan mengabaikan asumsi asumsi yang melandasi penggunaan metode statistik parametrik, terutama yang berkaitan dengan distribusi normal atau dengan istilah lain disebut statistik bebas (distribution free statistics) distribusi dan uji bebas asumsi (assumption-free test). Istilah nonparametrik pertama kali digunakan oleh Wolfwofiz, pada tahun Uji statistik nonparametrik adalah suatu uji statistik yang tidak memerlukan adanya asumsi asumsi mengenai sebaran data populasi. Statistik nonparametrik dapat digunakan untuk menganalisis data yang berskala nominal atau ordinal, karena pada umumnya data berjenis nominal dan ordinal tidak menyebar normal. Statistik nonparametrik merupakan suatu analisis data statistik yang cocok digunakan untuk menguji data ilmu ilmu sosial karena asumsi asumsi yang digunakan dalam uji nonparametrik adalah pengamatan pengamatannya yang bebas, tidak mengikat, dan lebih longgar dibanding uji parametrik (Mutijah, 2007). Adapun beberapa macam yang terdapat pada uji nonparametrik, diantaranya: a. Uji Tanda (Sign Test) b. Uji Peringkat 2 Sampel Wilcoxon c. Uji Korelasi Peringkat Spearman (Rank-Correlation Method) d. Uji Konkordansi Kendall e. Uji Run(S) f. Uji Median (Median Test) g. Uji Chi-Square Dalam penelitian ini berdasarkan beberapa macam uji nonparametrik, peneliti hanya membahas mengenai uji tanda (sign test Uji Tanda (Sign Test) Uji tanda (sign test) merupakan salah satu prosedur uji nonparametrik untuk menguji beda rata rata dua kelompok sampel berpasangan. Uji tanda didasarkan atas tanda tanda, positif (+) atau negatif (-) dari perbedaan antara pasangan pengamatan. Uji tanda
16 dapat digunakan untuk mengevaluasi efek dari suatu treatment tertentu. Efek dari variabel eksperimen atau treatment tidak dapat diukur hanya dapat diberi tanda positif (+) atau negatif (-) saja. Dalam hal ini, pengaruh diukur oleh rata rata, sehingga uji tanda tersebut dapat digunakan untuk menguji kesamaan dua rata rata populasi (samsudin). Uji tanda (sign test) dapat digunakan untuk menguji hipotesis dengan dua komparatif dan datanya berbentuk data ordinal dan dilakukan berdasarkan tanda (+) dan (-) yang didapat dari selisih nilai pengamatan. Adapun syarat syarat untuk menggunakan uji tanda sebagai berikut (Nur Fadlilah, 2012): 1. Pasangan hasil pengamatan yang sedang dibandingkan bersifat independen 2. Masing masing pengamatan dari tiap pasang terjadi karena pengaruh kondisi yang sama 3. Pasangan yang berlainan terjadi karena kondisi berbeda Uji tanda ini hanya memerhatikan arah perbedaan dan tidak besarnya perbedaan tersebut. Berdasarkan hal tersebut, terdapat 2 macam uji tanda (Harry K., 2010) diantaranya: 1. Uji untuk sampel kecil (n 30), menggunakan uji binominal 2. Uji untuk sampel besar (n > 30), menggunakan uji Z
PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN
PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan
Lebih terperinciBAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk
BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.
Lebih terperinciBAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran
BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya
Lebih terperinciMateri 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya
Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Memahami definisi, proses serta teknik data mining. Pengenalan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciPENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER
PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Pada penelitian yang dilakukan oleh (Chen, Sain, & Guo, 2012) berfokus untuk mengetahui pola penjualan, pelanggan mana yang paling berharga, pelanggan mana yang
Lebih terperinciMEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP
MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP Page 87 Iin Parlina 1, Agus Perdana Windarto 2, Anjar Wanto 3, M.Ridwan Lubis
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA Hal-hal yang dipaparkan pada Bab Tinjauan Pustaka adalah penelaahan kepustakaan yang mendasari proses perancangan dan pembuatan aplikasi meliputi data mining, Customer Relationship
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan
Lebih terperinciData Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining
Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering
Lebih terperinciImplementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan
Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Ni Made Anindya Santika Devi, I Ketut Gede Darma Putra, I Made Sukarsa Jurusan Teknologi Informasi, Universitas Udayana Bukit Jimbaran,
Lebih terperinci3 METODOLOGI PENELITIAN
19 3 METODOLOGI PENELITIAN 3.1. Kerangka Berpikir Kebakaran hutan yang sering terjadi di Indonesia berkaitan erat dengan dua faktor utama yaitu faktor alam dan faktor manusia. Kemungkinan terdapat karakteristik
Lebih terperinciBAB 2 LANDASAN TEORI
7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.
Lebih terperinciTAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas
TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge
Lebih terperinciMETODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami
METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering
Lebih terperinciMateri 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya
Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas 1. Memahami cakupan materi dan sistem perkuliahan Data Mining.
Lebih terperinciPENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT
PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT Ismail Setiawan 1) 1) Magister Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,
Lebih terperinciBAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI
BAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI 2.1 Penelitian Terkait Ada beberapa penelitian terkait dengan penggunaan Data Mining metode cluster dengan menggunakan Algoritma Fuzzy C-Means untuk dapat mengelompokkan
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau
Lebih terperinciDATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi
DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 2 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Mengapa Data Mining? Penumpukan data Minimnya pemanfaatan data
Lebih terperinciBAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan
6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan
Lebih terperinciClustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means
Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Konsep Pemasaran Dalam merancang dan mengembangkan produk, baik yang berupa jasa maupun barang, tidak terlepas dari konsep pemasaran yang bertujuan memenuhi
Lebih terperinciKLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING
KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING Moh Ahsan Universitas Kanjuruhan Malang ahsan@unikama.ac.id ABSTRAK. Universitas Kanjuruhan Malang
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan
Lebih terperinci1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian
Penerapan Data Mining dengan Menggunakan Metode Clustering K-Mean Untuk Mengukur Tingkat Ketepatan Kelulusan Mahasiswa Program Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling
Lebih terperincihttp://www.brigidaarie.com proses menganalisa data untuk mencari polapola tersembunyi dengan menggunakan metodologi otomatis Istilah lain : Machine Learning Knowledge Discovery in Database (KDD) Predictive
Lebih terperinciAbidah Elcholiqi, Beta Noranita, Indra Waspada
Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah
Lebih terperinciBAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain
BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami
Lebih terperinciK-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia
K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id
Lebih terperinciStatistik Non Parameter
Statistik Non Parameter A. Pengertian Non Parametrik Istilah nonparametrik sendiri pertama kali digunakan oleh Wolfowitz, 1942. Istilah lain yang sering digunakan antara lain distribution-free statistics
Lebih terperinciPerancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra
Lebih terperinciBAB II LANDASAN TEORI
6 BAB II LANDASAN TEORI 2 2.1 Tinjauan Pustaka Aplikasi sistem pendukung keputusan untuk menentukan penjurusan pada tingkat SMA sudah beberapa kali dilakukan dengan menggunakan metode yang bermacam-macam.
Lebih terperinciPenerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)
157 Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) Elly Muningsih AMIK BSI Yogyakarta E-Mail : elly.emh@bsi.ac.id Abstrak Berkembangnya
Lebih terperinci2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database
2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Sistem Pendukung Keputusan II.1.1 Definisi Sistem Pendukung Keputusan Berdasarkan Efraim Turban dkk, Sistem Pendukung Keputusan (SPK) / Decision Support System (DSS) adalah sebuah
Lebih terperinciBAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam
BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri
Lebih terperinciSTATISTIKA UJI NON-PARAMETRIK
STATISTIKA UJI NON-PARAMETRIK DISUSUN OLEH : Jayanti Syahfitri DOSEN PENGAMPU : Dr. Risnanosanti, M.Pd PROGRAM PASCASARJANA MAGISTER PENDIDIKAN BIOLOGI (S-2) FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS
Lebih terperinciTipe Clustering. Partitional Clustering. Hirerarchical Clustering
Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan
Lebih terperinciBAB III K-MEDIANS CLUSTERING
BAB III 3.1 ANALISIS KLASTER Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Metode interdependensi berfungsi untuk memberikan makna terhadap seperangkat
Lebih terperinciMODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015
1 MODEL DATA MINING N. Tri Suswanto Saptadi CAPAIAN PEMBELAJARAN Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 1 3 Definisi Mining : proses atau usaha untuk mendapatkan sedikit barang
Lebih terperinciPREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES
PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal
Lebih terperinciBAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode
BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada
Lebih terperinciBAB 2 LANDASAN TEORI
6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database
Lebih terperinciANALISIS DATA KUANTITATIF
1 ANALISIS DATA KUANTITATIF Analisis data merupakan proses pengolahan, penyajian, dan interpretasi yang diperoleh dari lapangan agar data yang disajikan mempunyai makna. A. Tujuan Analisis Data 1. Menjawab
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan dunia pariwisata, tidak diiringi dengan perkembangan teknologi yang digunakan. Ditambah lagi dengan kondisi, banyak wisatawan yang tidak mau berwisata
Lebih terperinci- PERTEMUAN 1 - KNOWLEGDE DISCOVERY
DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining
Lebih terperinciStudent Clustering Based on Academic Using K-Means Algoritms
Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com
Lebih terperinciPENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI
PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
4 BAB 2 TINJAUAN PUSTAKA Pada bab ini membahas tentang sistem pendataan di segala sistem dan data data yang digunakan dalam teknik data mining dan aplikasinya. Tesis ini fokus pada pengelompokan data multidimensi
Lebih terperinciKata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,
K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN Latar Belakang Kredit merupakan salah satu usaha sekunder yang dapat dilakukan untuk pemenuhan kebutuhan sehari-hari. Pada umumnya, proses kredit dapat dilayani melalui lembaga keuangan
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Data menjadi sesuatu yang sangat berharga saat ini. Tidak hanya badan pemerintah saja, perusahaan-perusahaan saat ini pun sangat membutuhkan informasi dari data yang
Lebih terperinciBAB 1 PENDAHULUAN 1.1. Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Analisis cluster merupakan salah satu alat yang penting dalam pengolahan data statistik untuk melakukan analisis data. Analisis cluster merupakan seperangkat metodologi
Lebih terperinciBAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah
BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perguruan tinggi merupakan strata terakhir sebelum mahasiswa dapat bersaing didalam dunia kerja. Agar mampu bersaing didalam dunia kerja, mahasiswa dituntut
Lebih terperinciPENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS
PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to
Lebih terperinciData Mining II Estimasi
Data Mining II Estimasi Matakuliah Data warehouse Universitas Darma Persada Oleh: Adam AB Data Mining-2012-a@b 1 Tahapan proses datamining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/
Lebih terperinciDATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi
DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 9 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Clustering Data Mining Penklusteran (clustering) digunakan untuk
Lebih terperinciRENCANA PEMBELAJARAN SEMESTER
RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Big Data and Data Analytics Semester Tujuh Kode SMXXXXXX Prodi MBTI Dosen Andry Alamsyah SKS 4 Capaian Pembelajaran 1. Memahami fenomena, framework, peluang dan
Lebih terperinciBAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket
Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa
Lebih terperinciANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)
ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) Meriska Defriani 1, Noviyanti 2 1 STT Wastukancana 2 Teknik Informatika,
Lebih terperinciBAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.
BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. 2.1. Data Mining Data mining adalah suatu istilah yang digunakan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan
Lebih terperinciBAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.
BAB I PENDAHULUAN 1.1. Latar Belakang Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang
Lebih terperinciTEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel )
TEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel ) Ahlihi Masruro 1) 1) Teknik Informatika STMIK AMIKOM Yogyakarta Jl. Ring Road Utara Condong Catur
Lebih terperinciJurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN
Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN
Lebih terperinciPenerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien
1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha
Lebih terperinciModifikasi DBSCAN (Density-Based Spatial Clustering With Noise) pada Objek 3 Dimensi
Jurnal Komputer Terapan Vol. 3, No. 1, Mei 2017, 41-52 41 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Modifikasi DBSCAN (Density-Based Spatial Clustering With Noise) pada Objek 3 Dimensi Ibnu
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penambangan Data (Data Mining) Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Sebelum melakukan penelitian adapun penulis mencari penelitian penelitian yang memungkinkan terkait dengan penelitian antara lain : 1. Analisis Kinerja Data
Lebih terperinciPENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA
PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA Diajeng Tyas Purwa Hapsari Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email :
Lebih terperinciPERBANDINGAN METODE K-MEANS DAN METODE DBSCAN PADA PENGELOMPOKAN RUMAH KOST MAHASISWA DI KELURAHAN TEMBALANG SEMARANG
ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 5, Nomor 4, Tahun 2016, Halaman 757-762 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PERBANDINGAN METODE K-MEANS DAN METODE DBSCAN PADA PENGELOMPOKAN
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI Bab ini berisi landasan teori dalam penelitian mengenai aplikasi algoritma spasial clustering pada data mahasiswa baru. Pembahasan diawali dengan penjelasan secara umum mengenai data
Lebih terperinciTEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)
TEKNOSI, Vol. 02, No. 03, Desember 2016 31 PENERAPAN DATA MINING DALAM MENINGKATKAN MUTU PEMBELAJARAN PADA INSTANSI PERGURUAN TINGGI MENGGUNAKAN METODE K-MEANS CLUSTERING (STUDI KASUS DI PROGRAM STUDI
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining
Lebih terperincidengan Algoritma K Means
K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan
Lebih terperinciDATA MINING. Pertemuan 1. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi
DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 1 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Ketentuan Perkuliahan Perkuliahan diselenggarakan 14 kali pertemuan
Lebih terperinciIMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU
PROYEK TUGAS AKHIR IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU (Studi Kasus : SMK Pembangunan Nasional Purwodadi) Disusun oleh: Novian Hari Pratama 10411 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS
Lebih terperinciBAB IV GAMBARAN UMUM METODOLOGI DATA MINING
BAB IV GAMBARAN UMUM METODOLOGI DATA MINING A. Metodologi Data Mining Metodologi Data Mining Komponen data mining pada proses KDD seringkali merupakan aplikasi iteratif yang berulang dari metodologi data
Lebih terperinciANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK
ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika
Lebih terperinciBAB 3 ANALISA SISTEM
BAB 3 ANALISA SISTEM Pada perancangan suatu sistem diperlakukan analisa yang tepat, sehingga proses pembuatan sistem dapat berjalan dengan lancar dan sesuai seperti yang diinginkan. Setelah dilakukan analisis
Lebih terperinciTINJAUAN PUSTAKA. Definisi Data Mining
TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data
Lebih terperinciIMPLEMENTASI ALGORITMA K-MEANS CLUSTERING DALAM PENENTUAN PRIORITAS REHABILITASI DAERAH ALIRAN SUNGAI (DAS)
IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING DALAM PENENTUAN PRIORITAS REHABILITASI DAERAH ALIRAN SUNGAI (DAS) Muhammad Farid Fahmi 1), Yoyon K Suprapto 2) Jurusan Teknik Elektro, Fakultas Teknologi Industri,
Lebih terperinciKonsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009
Konsep Data Mining Pendahuluan Bertalya Universitas Gunadarma 2009 Latar Belakang Data yg dikumpulkan semakin bertambah banyak Data web, e-commerce Data pembelian di toko2 / supermarket Transaksi Bank/Kartu
Lebih terperinciBAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan
BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Data Mining A. Pengertian Data Mining Menurut Gartner Group data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan
Lebih terperinciPENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA
Artikel Skripsi PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA SKRIPSI Diajukan Untuk Memenuhi Sebagian
Lebih terperinci2.2 Data Mining. Universitas Sumatera Utara
Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record
Lebih terperinci