BAB II LANDASAN TEORI
|
|
- Sudirman Gunardi
- 6 tahun lalu
- Tontonan:
Transkripsi
1 BAB II LANDASAN TEORI Bab ini berisi landasan teori dalam penelitian mengenai aplikasi algoritma spasial clustering pada data mahasiswa baru. Pembahasan diawali dengan penjelasan secara umum mengenai data mining. Pembahasan dilanjutkan dengan penjelasan secara terperinci mengenai algoritma clustering yang digunakan dalam penelitian. Algoritma tersebut yaitu algoritma Density-based Spatial Clustering of Application with Noise (DBSCAN). 2.1 Penjelasan Umum Data Mining Data yang tersimpan di dalam suatu basis data biasanya berupa data mentah yang tidak dapat memberikan informasi-informasi berharga secara langsung. Untuk melakukan ekstraksi informasi yang terkandung, perlu dilakukan langkah-langkah pemrosesan tertentu. Metode pemrosesan data dengan tujuan untuk mendapatkan informasi penting yang terkandung di dalamnya dapat dilakukan dengan proses data mining. Secara sederhana, data mining sebagai proses ekstraksi atau penggalian informasi-informasi penting yang terkandung dalam sejumlah data (Han & Kamber, 2006, p. 5). Proses penggalian informasi tersebut terdiri dari langkah-langkah pemrosesan data. Langkah-langkah dan metode pemrosesan data disesuaikan dengan tujuan dan karakteristik data yang akan diproses. Langkahlangkah tersebut dapat dilihat di gambar di bawah ini. 6
2 Gambar 2.1 Data mining sebagai salah satu langkah Knowledge Discovery Sumber: (Han & Kamber, 2006, p. 6) Di gambar tersebut, data mining menjadi salah satu langkah dalam proses knowledge discovery. Meskipun demikian, dalam knowledge discovery, data mining merupakan inti dalam proses tersebut. Beberapa pakar memberikan definisi yang sama terhadap kedua terminologi ini. Di dalam penelitian ini, terminologi data mining dan knowledge discovery selanjutnya disebut sebagai 7
3 data mining. Jiawei Han dan Micheline Kamber membagi proses data mining ke dalam tujuh langkah (Han & Kamber, 2006). Pembersihan data (data cleaning), merupakan proses pembersihan data dari noise dan dari data yang tidak konsisten; Integrasi data (data integration), merupakan proses intergrasi data dari berbagai sumber data yang dapat dikombinasikan; Seleksi data (data selection), merupakan proses pengambilan data-data dari basis data yang relevan dengan penelitian; Transformasi data (data transformation), merupakan proses transformasi atau konsolidasi data ke dalam bentuk yang sesuai dengan proses analisis data mining; Data mining, merupakan proses inti yang melakukan ekstraksi atau penggalian pola (pattern); Evaluasi pola (pattern evaluation), merupakan proses menemukan pola yang menarik berdasarkan pengukuran-pengukuran kemenarikan tertentu; Presentasi pengetahuan (knowledge presentation) merupakan proses visualisasi dengan menggunakan teknik-teknik representasi untuk menampilkan informasi kepada pengguna. Langkah satu sampai dengan langkah empat disebut juga sebagai data preprocessing. Data preprocessing dilakukan untuk menyiapkan data dan memodifikasi data sedemikian rupa agar dapat dilakukan data mining. Metodemetode yang sering digunakan dalam data preprocessing antara lain normalisasi, agregasi data, seleksi fitur dan ekstraksi fitur. Spasial data mining merupakan bentuk data mining yang melakukan analisis terhadap data spasial. Data spasial diambil dari tempat tertentu (spasial), dimana dalam. Dengan demikian, setiap titik pengamatan dalam area tersebut mengandung sequential data. Dalam analisis spasial data mining, data-data tersebut dianalisis untuk menemukan pola-pola menarik yaitu pola kemiripan antara satu titik pengamatan dengan titik pengamatan lain. Pola-pola tersebut dicari dengan fungsionalitas tertentu yang ada dalam spasial data mining. Berikut beberapa fungsionalitas dalam data mining (Han & Kamber, 2006, pp ). 8
4 a. Deskripsi konsep atau kelas, terdiri dari karakterisasi dan diskriminasi Karakterisasi data merupakan proses menemukan ciri-ciri umum yang terdapat di dalam data. Proses karakterisasi dilakukan untuk mengumpulkan ciri-ciri yang ada dalam suatu kelas atau suatu konsep data. Sementara itu, diskriminasi data merupakan proses perbandingan antara ciri-ciri umum dalam suatu kelas dengan kelas lain. b. Pattern mining, assoiciation rule dan korelasi Pattern mining merupakan proses menemukan pola-pola yang terjadi secara spesifik atau berulang-ulang. Pola tersebut antara lain pola dalam itemset, subsequence, atau substructure. Dalam association rule, hubungan antardata dihitung berdasarkan probabilitasnya. Support dan confidence merupakan dua unsur yang ada dalam association rule. Jika di dalam suatu basis data D terdapat dua kumpulan data, kumpulan data A dan kumpulan data B, support didefinisikan sebagai persentase jumlah transaksi di D yang mengandung A dan B atau ( ), sedangkan confidence didefinisikan sebagai persentase jumlah transaksi di D yang memiliki hubungan kondisional jika ada A maka ada B atau ( ). Hubungan antardata tersebut dianggap menarik jika support dan confidence melebihi minimum support threshold dan minimum confidence threshold. c. Klasifikasi dan prediksi Klasifikasi dan prediksi merupakan proses menemukan model (atau classifier) yang membedakan antara satu kelas dengan kelas yang lain. Model atau classifier dalam metode klasifikasi dibangun untuk memprediksi label yang berbentuk kategorial. Sementara itu, model atau classifier dalam metode prediksi digunakan untuk memprediksi fungsi bernilai kontinu. Baik klasifikasi maupun prediksi berguna untuk memberi label kepada data yang masih belum terlabelkan. d. Analisis cluster Analisis cluster atau clustering merupakan proses pengelompokkan data-data ke dalam cluster tertentu tanpa ada infomasi label secara langsung dalam data. Cluster merupakan sekumpulan data yang mirip satu sama lain di dalam 9
5 cluster tersebut dan berbeda dengan data yang ada di cluster lain. Kemiripan dalam analisis cluster dihitung dengan fungsi jarak. e. Analisis pencilan Analisi pencilan (outlier) merupakan proses menemukan data pencilan atau data yang memiliki perilaku yang berbeda dengan perilaku data pada umumnya. 2.2 Spasial Clustering Penelitian ini akan berfokus kepada analisis spasial clustering yaitu analisis pengelompokkan data spasial menggunakan algoritma clustering yang sudah ada. Berbeda dengan klasifikasi, dalam analisis spasial clustering tidak memiliki label atau tidak memasukkan label data tersebut ke dalam proses clustering. Dengan kata lain, analisis spasial clustering merupakan proses unsupervised. Untuk data spasial berukuran besar, biaya komputasi spasial clustering biasanya lebih mahal karena harus menemukan label-label masing-masing profil dalam data tersebut. Untuk itu diperlukan algoritma komputasi yang efektif dan efisien untuk memproses data spasial yang berukuran besar dengan dimensi data yang tinggi tersebut. Profil merupakan istilah untuk satu baris data sepanjang jumlah dimensi data. Adapun beberapa kebutuhan-kebutuhan umum yang mendorong penelitian dalam algoritma clustering antara lain sebagai berikut (Han & Kamber, 2006, pp ): skalabilitas, kemampuan untuk menangani berbagai jenis atribut, kemampuan menemukan cluster dalam data yang acak, hanya membutuhkan pengetahuan minimal terhadap domain pengetahuan asal data untuk menentukan parameter masukkan, kemampuan untuk menangani noisy data, clustering bersifat inkremental dan tidak sensitif terhadap urutan masukkan data, kemampuan menangani data berdimensi tinggi, constaint-based clustering, 10
6 hasil clustering dapat diinterpretasikan dan digunakan. Setiap algoritma yang digunakan dalam analisis clustering dapat memberikan hasil yang baik untuk suatu bentuk data, namun dapat memberikan hasil yang tidak baik apabila diimplementasikan terhadap data yang lain. Untuk mengetahui metode yang memberikan akurasi paling baik, diperlukan langkah-langkah tertentu. Langkah-langkah yang umum dilakukan dalam analisis clustering adalah sebagai berikut (Jain, Murty, & Flynn, 1999, hal. 266): pattern representation (termasuk proses ekstraksi atau proses seleksi fitur), pendefinisian cara menghitungan kedekatan atau jarak dalam pola yang sesuai dengan domain data, clustering, proses abstraksi data (opsional), dan peninjauan hasil (opsional). Pattern representation merupakan proses menentukan parameter-parameter masukkan dalam analisis clustering. Proses tersebut antara lain proses menentukan jumlah cluster yang diharapkan dan proses identifikasi jenis, jumlah dan skala atribut-atribut yang dimiliki data. Tidak semua atribut yang dimiliki data perlu diikutsertakan dalam proses analisis spasial clustering. Hanya atributatribut tertentu yang relevan terhadap tujuan spasial clustering yang diperlukan dalam clustering. Seleksi atribut merupakan langkah memilih atribut-atribut yang sesuai dengan tujuan clustering. Meskipun demikian, dalam kasus-kasus tertentu, atribut yang diperlukan tidak secara eksplisit tersedia dalam data. Perlu dilakukan ekstraksi fitur atau atribut terlebih dahulu untuk mendapatkan atribut tersebut. Ekstraksi atribut melakukan pengolahan terhadap data dan menghasilkan atribut baru bedasarkan masukkan dari atribut-atribut yang sudah ada. Penghitungan kedekatan atau jarak antarprofil digunakan untuk menentukan kemiripan dalam profil-profil tersebut. Bisanya perhitungan ini menggunakan rumus jarak tertentu. Rumus perhitungan jarak yang umum digunakan dalam analisis clustering antara lain jarak Euclidean, jarak Minkowski, jarak Manhattan, dan jarak Mahalanobis. a. Rumus pengukuran jarak Euclidean (Han & Kamber, 2006, p. 388) 11
7 ( ) ( ) ( ) ( ) Dengan ( ) dan ( ) merupakan dua profil berdimensi. Adapun dalam bentuk matriks, perhitungan jarak Euclidean dapat dilakuan dengan cara sebagai berikut (Jain, Murty, & Flynn, 1999, hal. 271): ( ) ( ( ) ) b. Rumus pengukuran jarak Manhattan atau dikenal juga dengan city block (Han & Kamber, 2006, p. 388) ( ) c. Rumus pengukuran jarak menggunakan jarak Minkowski (Han & Kamber, 2006, p. 389) ( ) ( ) Adapun dalam bentuk matriks, perhitungan jarak Minkowski dapat dilakukan dengan cara sebagai berikut (Jain, Murty, & Flynn, 1999, hal. 372) ( ) ( ( ) ) d. Rumus pengukuran jarak menggunakan jarak Mahalanobis (Jain, Murty, & Flynn, 1999, hal. 372) ( ) ( ) ( ) Dalam melakukan clustering, untuk bentuk data tertentu digunakan pendekatan algoritma clustering yang berbeda dengan bentuk data yang lain. Dalam jurnal Data Clustering: A Review (Jain, Murty, & Flynn, 1999), terbentuk satu representasi taksonomi metode clustering. Secara umum, pendekatan metode 12
8 clustering dibagi menjadi dua pendekatan utama, yaitu pendekatan secara hirarki dan pendekatan secara partisi. Clustering Hierarchical Partition Single Link Squared Error Graph Theoretic Mixture Resolving Mode Seeking Complete Link K-means Expectation Maximization Gambar 2.2 Taksonomi Pendekatan Clustering Sumber: Jain, Murty, & Flynn, 1999, hal. 275 (telah diolah kembali) Pembentukan taksonomi tersebut berdasarkan beberapa kriteria yang membedakan antara satu algoritma dengan algoritma yang lain. Dibawah ini dijelaskan kriteria-kriteria pembeda yang dimaksud (Jain, Murty, & Flynn, 1999, hal ). a. Pendekatan agglomerative dibandingkan dengan pendekatan divisive Dalam pendekatan agglomerative, mula-mula setiap profil dianggap sebagai satu cluster tersendiri. Dengan menggunakan perhitungan kemiripan, profilprofil yang memiliki kemiripan kemudian digabung sampai memenuhi kriteria tertentu. Sebaliknya, dalam pendekatan divisive, mula-mula seluruh profil dianggap sebagai satu cluster yang sama. Dengan menggunakan perhitungan kemiripan, cluster tersebut kemudian dipecah menjadi beberapa cluster sampai memenuhi kriteria tertentu. b. Pendekatan monothetic dibandingkan dengan pendekatan polythetic Dalam pendekatan monothetic, perhitungan kemiripan profil menggunakan atribut yang dimasukkan secara bertahap. Dalam hal ini, setiap kali tambahan 13
9 atribut dimasukkan, cluster kemudian dipecah sesuai masukkan atribut baru tersebut. Berbeda dengan pendekatan monothetic, dalam pendekatan polythetic, semua atribut dimasukkan dalam perhitungan kemiripan secara bersama-sama. Metode clustering yang ada pada umumnya menggunakan pendekatan polythetic. c. Pendekatan hard clustering dibandingkan dengan pendekatan fuzzy clustering Dalam pendekatan hard clustering, satu profil menjadi anggota satu cluster saja. Sementara itu, dalam pendekatan fuzzy clustering, satu profil memiliki derajat keanggotaan di semua cluster. Pendekatan fuzzy clustering dapat diubah menjadi hard clustering dengan memilih derajat keanggotaan paling tinggi sebagai cluster data tersebut. d. Pendekatan deterministic dibandingkan dengan pendekatan sthocastic Dalam pendekatan secara deterministic, optimisasi fungsi squared error dilakukan dengan teknik tradisional, sedangkan dalam pendekatan secara stochastic, optimisasi fungsi squared error dilakukan dengan random search terhadap state space yang terdiri dari keseluruhan label yang mungkin. e. Pendekatan non-inkremental dibandingkan dengan pendekatan inkremental Dalam pendekatan non-inkremental, seluruh profil yang akan dianalisis diproses secara bersama-sama. Hal ini berkaitan dengan kemampuan dari komputasi, alokasi waktu, dan alokasi memori yang harus disediakan. Dengan pendekatan inkremental, jumlah profil yang diproses disesuaikan dengan batasan kemampuan komputasi, memori dan waktu tersebut. 2.3 Algoritma DBSCAN Density-based Spatial Clustering of Application with Noise atau lebih dikenal dengan sebutan DBSCAN termasuk ke dalam algoritmas clustering berbasis kepadatan (density-based). DBSCAN mencari kumpulan data dengan kepadatan yang tinggi untuk dijdikan sebagai cluster. Bentuk cluster yang dihasilkan oleh DBSCAN bergantung kepada kepadatan tersebut. Sehingga dengan algoritma ini dimungkinkan untuk menghasilkan bentuk cluster yang sembarang. Suatu cluster dalam DBSCAN didefinisikan sebagai sekumpulan maksimum data yang terhubung di dalam kepadatan tersebut (density-connected). Keanggotaan dari 14
10 setiap profil dihitung berdasarkan rumus jarak. DBSCAN termasuk ke dalam unsupervised clustering karena jumlah cluster yang dihasilkan ditentukan oleh bentuk persebaran data itu sendiri, bukan diinisialisasi di awal. Gambar 2.3 Contoh Clustering dengan algoritma DBSCAN Sumber: (Ester, Kriegel, Sander, & Xu, August 1996) Algoritma DBSCAN pertama kali diperkenalkan dalam jurnal ilmiah yang berjudul A Density-Based Algorithm for Discovering Clusters in Large Spatial Database with Noise. Dalam jurnal ilmiah tersebut diperkenalkan beberapa komponen baru dalam proses analisis clustering yang ada di dalam DBSCAN. Komponen-komponen tersebut antara lain (Ester, Kriegel, Sander, & Xu, August 1996): a. Epsilon Epsilon kekerabatan dari sebuah profil atau Eps-neigborhood dari sebuah profil, ( ), didefinisikan sebagai ( ) * ( ) + D adalah basis data yang dianalisis, q adalah profil lain. Eps adalah nilai ambang jarak antarprofil untuk dapat dimasukkan ke dalam cluster yang sama. Dari definisi tersebut, profil p dapat berkerabat dengan profil q (berada dalam satu cluster yang sama) jika jarak dari p ke q tidak lebih dari nilai Eps. b. Minimum Points Meskipun p berada dalam Eps-neigborhood dari q, akan tetapi jika hanya dua profil itu saja yang berkerabat, maka akan ada kasus dimana terdapat banyak cluster dengan jumlah anggota yang sedikit. Untuk mengantisipasi hal tersebut, 15
11 diperkenalkan istilah minimum points atau MinPts. MinPts merupakan nilai ambang yang merepresentasikan jumlah minimal profil yang berada dalam Eps-neigborhood profil p agar dapat terbentuk cluster. Dengan nilai ambang ini, maka ada tiga klasifikasi jenis profil di DBSCAN, yaitu profil yang berada di berada di luar daerah padat disebut outlier, profil yang berada di pangkal daerah padat disebut border point, dan profil yang berada di dalam daerah padat disebut core point. c. Directly density-reachable Sebuah profil p dikatakan directly density-reachable terhadap profil q jika ( ), dan ( ) (q merupakan core point) Dari definisi tersebut dapat diketahui bahwa agar profil p directly densityreachable terhadap profil q, maka harus memenuhi dua syarat yaitu profil p berada pada Eps-neighborhood profil q dan profil q merupakan core poin. Directly density-reachable bersifat simetris jika p dan q keduanya adalah core point. Artinya, jika p directly density-reachable terhadap q, maka q directly density-reachable terhadap p. Gambar 2.4 Contoh sepasang profil yang directly density-reachable Sumber: Ester, Kriegel, Sander, & Xu, August 1996 (telah diolah kembali) d. Density-reachable Sebuah profil p dikatakan density-reachable terhadap profil q jika terdapat rantai, dengan dan, sedemikian sehingga bersifat directly density-reachable terhadap. Dari definisi tersebut dapat diketahui bahwa dua buah profil dikatakan density-reachable jika ada satu rantai profil 16
12 sedemikian sehingga dari profil satu ke profil lain di dalam rantai tersebut bersifat directly density-reachable. Sifat density-reachable tidak menjamin dua border point bersifat density-reachable. Gambar 2.5 Contoh sepasang profil yang density-reachable Sumber: Ester, Kriegel, Sander, & Xu, August 1996 (telah diolah kembali) e. Density-connected Sebuah profil p dikatakan density-connected terhadap profil q jika terdapat profil o sedemikian sehingga profil p dan profil q bersifat density-reachable terhadap poin o. Dengan demikian, setidaknya dua profil di dalam satu cluster bersifat density-connected. Density-connected bersifat simetris dan refleksif. Artinya, jika profil p bersifat density-connected terhadap poin q, maka profil q bersifat density-connected terhadap profil p. Gambar 2.6 Contoh sepasang profil yang density-connected Sumber: Ester, Kriegel, Sander, & Xu, August 1996 (telah diolah kembali) Nilai eps dan MinPts harus diketahui untuk dapat menjalankan algoritma DBSCAN. Algoritma DBSCAN dimulai dengan memilih satu profil p secara acak, kemudian mencari profil-profil lain yang density-reachable terhadap profil p. Jika p merupakan core point, maka terbentuk suatu cluster. Akan tetapi jika p adalah border point, maka DBSCAN akan mengambil profil lain dari basis data. Dalam 17
13 proses tersebut, terdapat kemungkinan dua cluster bergabung jika kedua custer tersebut dekat. Berikut pseudocode dari algoritma DBSCAN: DBSCAN (SetOfPoints, Eps, MinPts) // SetOfPoints is UNCLASIFIED ClusterId := nextid(noise) FOR i FROM 1 TO SetOfPoints.size DO Point = SetOfPoints.get(i) IF Point.ClID = UNCLASSIFIED THEN IF ExpandCluster(SetOfPoints, Point, ClusterId, Eps, MinPts) THEN ClusterId := nextid(clusterid) END IF END IF END FOR END; // DBSCAN Algoritma 2.1 Pseudocode fungsi DBSCAN untuk algoritma DBSCAN Sumber: (Ester, Kriegel, Sander, & Xu, August 1996) ExpandCluster(SetOfPoints, Point, ClID, Eps, MinPts) : Boolean; seeds:= SetOfPoints.regionQuery(Point, Eps); IF seeds.size < MinPts THEN // no core point SetOfPoints.changeClIds(Point, NOISE); RETURN False ELSE // all points in seeds are density- // reachable from point SetOfPoints.changeClID(seeds, ClId); seeds.delete(point); WHILE seeds <> Empty DO currentp := seeds.first(); result := SetOfPoints.regionQuery(currentP, Eps); IF result.size >= MinPts THEN FOR i FROM 1 TO result.size DO resultp := result.get(i); IF resultp.clid IN {UNCLASSIFIED, NOISE} THEN IF resultp.clid = UNCLASSIFIED 18
14 THEN END IF; seeds.append(resultp); SetOfPoints.changeClId( resultp, ClId); END IF; // UNCLASSIFIED or NOISE END FOR; END IF; // result.size >= MinPts seeds.delete(currentp); END WHILE; // seeds <> Empty Return True; END IF END // ExpandCluster Algoritma 2.2 Pseudocode fungsi ExpandCluster untuk algoritma DBSCAN Sumber: (Ester, Kriegel, Sander, & Xu, August 1996) Dan berikut flowchart dari algoritma DBSCAN: Gambar 2.7 Flowchart Algoritma DBSCAN 19
15 Berdasarkan gambar diatas, dalam algoritma DBSCAN dilakukan input data yang akan digunakan, kemudian dilakukan proses loop. Pada proses loop ini dilakukan pengecekan tiap nilai yang density reachable. Jika data yang dicek ini merupakan titik inti maka akan dibentuk cluster. Jika tidak,maka akan dicek apakah titik itu merupakan titik tepi, jika iya maka titik itu akan melakukan proses pengecekan kembali. Jika tidak, maka akan dimasukkan kedalam kategori noise. Proses ini berlanjut hingga semua titik diperiksa. 2.4 Metode Silhouette Index Setiap algoritma clustering memiliki kelebihan dalam menganalisis cluster untuk jenis data tertentu, namun belum tentu lebih baik jika diaplikasikan terhadap data lain. Dengan demikian, perlu ada satu metode khusus yang dapat membandingkan secara objektif hasil-hasil analisis clustering tersebut. Dalam clustering, perbandingan tersebut dikenal sebagai cluster evaluation atau cluster validation. Evaluasi clustering dilakukan dengan memvalidasi hasil analisis clustering. Pelabelan keanggotaan terhadap setiap profil dievaluasi dengan menggunakan teknik validasi tertentu. Validasi diperlukan untuk menghitung nilai akurasi dari hasil cluster tersebut. Nilai akurasi tersebut diperlukan antara lain untuk membandingkan akurasi hasil clustering dengan menggunakan beberapa algoritma terhadap data yang sama. Dalam penelitian ini, metode validasi hasil analisi spasial clustering yang digunakan adalah metode Silhouette index. Metode Silhouette index pertama kali diperkenalkan oleh Rousseeuw (1987) dalam jurnal ilmiah yang berjudul Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Dalam jurnal tersebut, Rousseeuw memperkenalkan metode validasi dengan mengukur kesamaan atau ketidaksamaan antara profil yang ada dalam satu cluster dengan cluster lain hasil analisis clustering. Pengukuran kesamaan atau ketidaksamaan tesebut dihitung dengan rumus jarak. Jika diketahui data yang dianalisis * + jumlah profil dalam data, dan diketahui A adalah salah satu cluster yang dihasilkan, maka dapat dicari: ( ) = jarak rata-rata profil ke terhadap profil lain yang ada dalam cluster A 20
16 Jika diketahui terdapat cluster C dimana, maka dapat dicari ( ) jarak rata-rata profil ke terhadap profil yang ada dalam cluster C. Jika terdapat lebih dari satu cluster lain selain cluster A, maka perlu dicari cluster yang paling dekat dengan cluster A dengan menghitung ( ) ( ) Silhouette index terhadap profil ke yaitu ( ) didefinisikan sebagai berikut (Rousseeuw, 1987, hal. 56): ( ) ( ) ( ) * ( ) ( )+ Gambar 2.8 Ilustrasi Silhouette indeks Contoh elemen yang terlibat dalam perhitungan ( ). Profil i berada di cluster A Sumber: (Rousseeuw, 1987, hal. 55) Rentang nilai ( ) yang diperoleh dari perhitungan tersebut adalah ( ). Nilai ( ) lebih dekat ke 1 menunjukkan bahwa data tersebut sudah well clustered. Artinya, kemiripan data tersebut dengan data lain yang ada dalam cluster yang sama jauh lebih besar dibandingkan dengan kemiripan data tersebut dengan data dari cluster lain yang berdekatan. Nilai ( ) lebih dekat ke 0 menunjukkan bahwa data tersebut termasuk dalam intermediate case. Artinya, kemiripan data tersebut dengan data lain yang ada dalam cluster yang sama relatif sama besar dibandingkan dengan kemiripan data tersebut dengan data dari cluster lain yang berdekatan. Data yang berada pada intermediate case dapat dipindah ke cluster yang berdekatan. Nilai ( ) lebih dekat ke -1 menunjukkan bahwa data 21
17 tersebut misclassified. Artinya, kemiripan data tersebut dengan data lain yang ada di cluster yang sama dibandingkan dengan data di cluster yang berdekatan jauh lebih mirip terhadap data dari cluster yang berdekatan. Setelah menghitung masing-masing nilai Silhouette index dalam data, maka dapat diketahui yaitu rata-rata nilai Silhouette index dari data: ( ) menyatakan cluster ke-i, menyatakan data ke dalam cluster ke, dan ( ) menyatakan nilai Silhouette index data ke dalam cluster ke. Nilai dari menyatakan akurasi hasil analisi clustering. 2.5 Studi Literatur Dalam studi literatur ini akan dijabarkan tiga buah penelitian yang telah dilakukan menggunakan algoritma DBSCAN. Penelitian pertama yaitu Aplikasi Algoritma Spasial dan Temporal Clustering pada Data Curah Hujan, penelitian kedua Pengembangan Aplikasi berbasis Clustering dan Prediksi Untuk Pemetaan Potensi Sumberdaya Perikanan Ikan Tuna di Indonesia, dan penelitian ketiga Comparative Study Between Density Based Clustering - DBSCAN and OPTICS. TAHUN PENELITI JUDUL DATA METODE HASIL 2012 Wawan Aplikasi Data Penelitian Dari hasil Setiawan Algoritma curah yang eksperimen, Spasial dan hujan dilakukan disimpulkan bahwa Temporal untuk algoritma paling Clustering mendapatka akurat dalam pada Data n algoritma proses spasial Curah Hujan spasial clustering adalah clustering algoritma dan DBSCAN dan algoritma algoritma paling temporal akurat dalam 22
18 clustering proses temporal yang akurat clustering adalah dan cepat algoritma Iterative terhadap K-means. Waktu data curah komputasi hujan. algoritma Iterative Implementa K-means hampir si yang 20 kali lebih cepat dilakukan dibandingkan adalah dengan algoritma melakukan K-means. Selain perbandinga perbandingan hasil n akurasi clustering, dan waktu penelitian juga komputasi menghasilkan pola- terhadap pola persebaran masing- curah hujan yang masing diperoleh dari hasil algoritma. clustering Dr.Achmad Pengembang Data Peneiti Algoritma spatio- Nizar an Aplikasi tangkap melakukan temporal clustering Hidayanto, berbasis an ikan integrasi yang digunakan S.Kom., Clustering dilaut data cluster untuk menentukan M.Kom, dan Prediksi spatio- area penangkapan Prof. Dr. Untuk temporal ikan dilakukan Aniati Murni Pemetaan tangkapan dengan 2 skema, Arymurthy, Potensi ikan dengan skema 1 secara M.Sc, Sumberdaya data berjenjang, yaitu Devi Fitrianah, Perikanan oseanografi spasial terlebih S.Kom., MTI Ikan Tuna di dahulu baru Dina Chahyati, Indonesia kemudian 23
19 S.Kom., M.Kom algoritma temporal, skema 2 yaitu dengan cara bersamaan, dimana data spasial dan temporal diproses secara bersamaan. Untuk skema 1, algoritma spasial yang digunakan adalah algoritma DBSCAN yang ditambahkan modifikasi berupa threshold untuk menentukan area penangkapan dengan jumlah tangkapan tertinggi. Kemudian dari hasil identifikasi area tangkapan tertinggi dilakukan algoritma temporal untuk melihat periode tangkapan tertinggi Pranjal Dubey, Comparative Data Peneliti Hasilnya pada Anand rajavat Study Yang mencoba kerapatan dengan Between Diguna melakukan DBSCAN, boolean 24
20 Density kan analisa valuenya itu high Based Data perbandinga atau low. Dan Clustering - Rando n clustering keanggotaan DBSCAN m dengan clusternya, boolean and OPTICS DBSCNA valuenya itu yes dan atau no. OPTICS Sedangkan, dengan OPTICS, hasil kerapatannya memiliki numerical value yaitu core dan distance. Dan keanggotaan clusternya memiliki numerical value reachable distance Rizky Algian Analisa Data Peneliti Peneliti Kurniaputra, Spasial koordin melakukan mendapatkan hasil Dr. Devi Clustering at penerapan clustering dengan Fitrianah, Dengan mahasis algoritma beberapa parameter S.Kom., MTI Menggunaka wa spasial yang berbeda. Dan n Algoritma universi clustering peneliti DBSCAN. tas yaitu mendapatkan mercu DBSCAN kesimpulan dari buana pada data hasil clustering, koordinat validasi clustering, mahasiswa index. universitas mercubuana 25
PENGELOMPOKAN SUNSPOT PADA CITRA DIGITAL MAHATARI MENGGUNAKAN METODE CLUSTERING DBSCAN
PENGELOMPOKAN SUNSPOT PADA CITRA DIGITAL MAHATARI MENGGUNAKAN METODE CLUSTERING DBSCAN Gregorius Satia Budhi 1, Rudy Adipranata 2, Matthew Sugiarto 3, Bachtiar Anwar 4, Bambang Setiahadi 5 1,2,3 Universitas
Lebih terperinciModifikasi DBSCAN (Density-Based Spatial Clustering With Noise) pada Objek 3 Dimensi
Jurnal Komputer Terapan Vol. 3, No. 1, Mei 2017, 41-52 41 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Modifikasi DBSCAN (Density-Based Spatial Clustering With Noise) pada Objek 3 Dimensi Ibnu
Lebih terperinciBAB IV IMPLEMENTASI DAN PENGUJIAN
BAB IV IMPLEMENTASI DAN PENGUJIAN Bab ini berisi penjelasan mengenai proses implementasi dan pengujian yang dilakukan dalam penelitian mengenai aplikasi algoritma spasial clustering pada data mahasiswa
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA Hal-hal yang dipaparkan pada Bab Tinjauan Pustaka adalah penelaahan kepustakaan yang mendasari proses perancangan dan pembuatan aplikasi meliputi data mining, Customer Relationship
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling
Lebih terperinci2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian
3 Ruang Lingkup Penelitian 1. Teknik yang digunakan dalam membentuk clustering titik panas adalah DBSCAN. 2. Data yang digunakan pada penelitian ini adalah data titik panas kebakaran hutan di Indonesia
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data mining merupakan serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan
Lebih terperinciImplementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan
Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Ni Made Anindya Santika Devi, I Ketut Gede Darma Putra, I Made Sukarsa Jurusan Teknologi Informasi, Universitas Udayana Bukit Jimbaran,
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Penelitian Terkait Pada penelitian ini, peneliti melakukan penelitian yang didasarkan pada penelitian terdahulu yang terkait dengan penelitian yang akan dilakukan peneliti.
Lebih terperinci(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M
(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M 1Toza Sathia Utiayarsih, 2 Yadi Suprijadi, 3 Bernik Maskun 1Mahasiswa Magister Statistika
Lebih terperinci- PERTEMUAN 1 - KNOWLEGDE DISCOVERY
DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data
Lebih terperinciBAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk
BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.
Lebih terperinciPengenalan Pola. Klasterisasi Data
Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering
Lebih terperinciBAB 2 LANDASAN TEORI
6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN Bab ini berisi pembahasan mengenai gambaran umum penelitian dalam analisis spasial clustering pada data mahasiswa Universitas Mercu Buana. Pembahasan diawali dengan penjelasan mengenai
Lebih terperinci3 METODOLOGI PENELITIAN
19 3 METODOLOGI PENELITIAN 3.1. Kerangka Berpikir Kebakaran hutan yang sering terjadi di Indonesia berkaitan erat dengan dua faktor utama yaitu faktor alam dan faktor manusia. Kemungkinan terdapat karakteristik
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang
Lebih terperinciBAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain
BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup
Lebih terperinciBAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran
BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya
Lebih terperinciTipe Clustering. Partitional Clustering. Hirerarchical Clustering
Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
Latar Belakang PENDAHULUAN Sponge atau poriferans berasal dari bahasa Latin yaitu porus yang artinya pori dan ferre yang artinya memiliki. Sponge adalah hewan berpori, pada umumnya terdapat di lautan,
Lebih terperinciPENDAHULUAN. Latar Belakang
Latar Belakang PENDAHULUAN Perkembangan teknologi informasi yang sangat pesat yang terjadi dewasa ini menuntut manusia untuk mampu beradaptasi dengan perkembangan tersebut. Upaya adaptasi yang dilakukan
Lebih terperinciBAB 2 LANDASAN TEORI
7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.
Lebih terperinciHASIL DAN PEMBAHASAN. Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Performansi Hasil Cluster
Performansi Hasil Cluster Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Pada tahap ini dilakukan analisis terhadap hasil cluster. Analisis yang digunakan adalah analisis cluster ce. Besarnya
Lebih terperinciBAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.
BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. 2.1. Data Mining Data mining adalah suatu istilah yang digunakan
Lebih terperinciSEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR
SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR Diajukan Guna Memenuhi Sebagian Persyaratan Dalam Rangka Menyelesaikan Pendidikan Sarjana Strata
Lebih terperinci2.2 Data Mining. Universitas Sumatera Utara
Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record
Lebih terperinciPERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan
BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal
Lebih terperinciPENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER
PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan
Lebih terperinci2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database
2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma
Lebih terperinciBAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan
6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciTAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas
TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge
Lebih terperinciCLUSTERING DATASET TITIK PANAS DENGAN ALGORITME RDBC MENGGUNAKAN WEB FRAMEWORK SHINY PADA BAHASA R ARIES SANTOSO
CLUSTERING DATASET TITIK PANAS DENGAN ALGORITME RDBC MENGGUNAKAN WEB FRAMEWORK SHINY PADA BAHASA R ARIES SANTOSO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI Bab ini berisi penjelasan mengenai image clustering, pengukuran kemiripan dan pengukuran jarak, representasi citra, ruang warna, algoritma clustering, dan penelitian yang berhubungan.
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN. Metode penelitian yang digunakan dalam penelitian ini adalah :
BAB III ANALISIS DAN PERANCANGAN 3.1 Metode Penelitian Metode penelitian yang digunakan dalam penelitian ini adalah : Gambar 4 Flowchart metode penelitian Berikut adalah penjelasan dari flowchart diatas:
Lebih terperinciStudent Clustering Based on Academic Using K-Means Algoritms
Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com
Lebih terperinciPENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU
PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU Gita Premashanti Trayasiwi Program Studi Teknik Informatika S1,
Lebih terperinciIMPLEMENTASI DENSITY BASED SPATIAL CLUSTERING APPLICATION WITH NOISE (DBSCAN) DALAM PERKIRAAN TERJADI BANJIR DI BANDUNG
IMPLEMENTASI DENSITY BASED SPATIAL CLUSTERING APPLICATION WITH NOISE (DBSCAN) DALAM PERKIRAAN TERJADI BANJIR DI BANDUNG Bima Aryo Putro¹, Kemas Rahmat Saleh Wiharja², Shaufiah³ ¹Teknik Informatika,, Universitas
Lebih terperinciKonsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009
Konsep Data Mining Pendahuluan Bertalya Universitas Gunadarma 2009 Latar Belakang Data yg dikumpulkan semakin bertambah banyak Data web, e-commerce Data pembelian di toko2 / supermarket Transaksi Bank/Kartu
Lebih terperinciEkstraksi Objek pada Citra Radar FM-CW dengan Metode DBSCAN. Object Extraction on FM-CW Radar Image Using DBSCAN Method
Ekstraksi Objek pada Citra Radar FM-CW dengan Metode DBSCAN Object Extraction on FM-CW Radar Image Using DBSCAN Method Vicky Zilvan UPT LPSN Lembaga Ilmu Pengetahuan Indonesia (LIPI), Jl. Ranggamalela
Lebih terperinciIMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING
IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember
Lebih terperinciPembuatan Aplikasi Pendeteksi Anomali Pada Pola Konsumsi Listrik Pelanggan Kota Surabaya Menggunakan Algoritma Klasterisasi Berbasis Densitas
1 Pembuatan Aplikasi Pendeteksi Anomali Pada Pola Konsumsi Listrik Pelanggan Kota Surabaya Menggunakan Algoritma Klasterisasi Berbasis Densitas Achmad Zainuddin Zakariya, Arif Djunaidy, Renny Pradina Kusumawardani
Lebih terperinciII. TINJAUAN PUSTAKA
II. TINJAUAN PUSTAKA 2.1 Sistem Informasi Manajemen Mcleod R dan Schell G, (2004) membagi sumber daya menjadi dua bagian yaitu sumberdaya fisikal dan sumberdaya konseptual. Sumber daya fisikal terdiri
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1. Data Mining Data mining adalah bagian dari knowledge discovery di database yang menganalisa database berukuran besar untuk menemukan pola yang berguna pada data (Silberschatz,
Lebih terperinciPE DAHULUA. Latar Belakang
Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di
Lebih terperinciTahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)
Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (
Lebih terperinciAPLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)
Hapsari Dita Anggraeni, Ragil Saputra, Beta Noranita APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penambangan Data (Data Mining) Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini
Lebih terperinciKata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,
K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan
Lebih terperinciAbidah Elcholiqi, Beta Noranita, Indra Waspada
Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah
Lebih terperinciGambar 3.1 Contoh Citra yang digunakan
BAB III DATASET DAN RANCANGAN PENELITIAN Pada bab ini dijelaskan tentang dataset citra yang digunakan dalam penelitian ini serta rancangan untuk melakukan penelitian. 3.1 DATASET PENELITIAN Penelitian
Lebih terperinciAnalisis Perbandingan Algoritma Fuzzy C-Means dan K-Means
Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.
Lebih terperinciPERTEMUAN 14 DATA WAREHOUSE
PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung
Lebih terperinciTahapan Proses KDD (Peter Cabena)
Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (Business
Lebih terperinciSEGMENTASI CITRA REMOTE SENSING LAUT DENGAN METODE CLUSTERING DBSCAN
SEGMENTASI CITRA REMOTE SENSING LAUT DENGAN METODE CLUSTERING DBSCAN Magister Teknik Elektro, Program Pascasarjana, Universitas Udayana Kampus Sudirman, Denpasar, Bali *Email: putrasuwija@gmail.com Abstrak
Lebih terperinciGambar Tahap-Tahap Penelitian
BAB III METODELOGI PENELITIAN Dalam menyelesaikan penelitian ini dibuat beberapa tahapan. Tahap-tahap kegiatan dijelaskan dalam Gambar 3.1 Studi Literatur Pengumpulan Data Retrieve Data Pre-Processing
Lebih terperinciPENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI
PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
4 BAB 2 TINJAUAN PUSTAKA Pada bab ini membahas tentang sistem pendataan di segala sistem dan data data yang digunakan dalam teknik data mining dan aplikasinya. Tesis ini fokus pada pengelompokan data multidimensi
Lebih terperinciIMPLEMENTASI ALGORITMA PENENTUAN PARAMETER DENSITAS PADA METODE DBSCAN UNTUK PENGELOMPOKAN DATA
TUGAS AKHIR KI1502 IMPLEMENTASI ALGORITMA PENENTUAN PARAMETER DENSITAS PADA METODE DBSCAN UNTUK PENGELOMPOKAN DATA AKHMAD BAKHRUL ILMI NRP 5111100087 Dosen Pembimbing I Dr. Eng. Chastine Fatichah, S.Kom.,
Lebih terperinciBAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat
BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
Latar Belakang PENDAHULUAN Pola pengaksesan pengguna terhadap sebuah situs web biasanya tergambarkan dalam sebuah pola sekuensial. Pola sekuensial mengindikasikan bahwa transaksi biasanya terjadi secara
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database
Lebih terperinciProses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer
Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer Mewati Ayub Jurusan Teknik Informatika, Fakultas Teknologi Informasi Universitas Kristen Maranatha, Bandung Email : mewati.ayub@eng.maranatha.edu
Lebih terperinciK-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia
K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Sistem Informasi Pengertian Sistem Informasi pada dasarnya merupakan hasil dari dua arti, yakni sistem dan informasi yang digabungkan. Berikut definisi sistem menurut para ahli
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
1 BAB I PENDAHULUAN 1.1 Latar Belakang Data mining adalah salah satu teknik dan proses untuk menemukan suatu pola dan pengetahuan dari data yang berjumlah besar (Han dkk., 2011). Proses yang dilakukan
Lebih terperinciBAB IV METEDOLOGI PENELITIAN
BAB IV METEDOLOGI PENELITIAN 4.1. Desain Penelitian Desain penelitian yang digunakan adalah pendekatan cross sectional. Penelitian cross sectional dicirikan dengan satu pengukuran atau observasi untuk
Lebih terperinciDATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA
DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas
Lebih terperinciUniversitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)
Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika Knowledge Discovery in Databases (KDD) Knowledge Discovery in Databases (KDD) Definisi Knowledge Discovery
Lebih terperinciMetode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN Methods of Density-Based Clustering Algorithm using DBSCAN
Prosiding Statistika ISSN: 2460-6456 Metode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN Methods of Density-Based Clustering Algorithm using DBSCAN 1 Nur Arsih, 2 Nusar Hajarisman, 3 Sutawanir
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Text Mining Text mining, yang juga disebut text data mining (TDM) atau knowledge discovery in text( KDT), secara umum mengacu pada proses ekstraksi informasi dari dokumen-dokumen
Lebih terperinciKonsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009
Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES Bertalya Universitas Gunadarma 2009 Data Mining (DM) DM merupakan suatu proses penjelajahan otomatis untuk mendapatkan informasi berguna
Lebih terperincidengan Algoritma K Means
K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan
Lebih terperinciBAB 6 ANALISIS CLUSTER
BAB 6 ANALISIS CLUSTER Pendahuluan Analisis cluster membagi data ke dalam grup (cluster) yang bermakna, berguna, atau keduanya. Jika tujuannya mencari grup yang memiliki makna, maka cluster seharusnya
Lebih terperinciKLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE
KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE Warih Maharani Fakultas
Lebih terperinciBAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah
BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan
Lebih terperinciPENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA
PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo
Lebih terperinciMETODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM
METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1), Wahyu Catur Wibowo 2) 1) Program Studi Sistem Informasi, Universitas Jember 2) Fakultas Ilmu Komputer,
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan
Lebih terperinciPengenalan Pola. K-Means Clustering
Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan
Lebih terperinci2.1 Penelitian Terkait
BAB II TINJAUAN PUSTAKA 2.1 Penelitian Terkait Penelitian yang dilakukan oleh Dinda Setiawati Devi dengan menggunakan metode Apriori untuk analisa keranjang pasar untuk 100 data transaksi dan 55 jenis
Lebih terperinciPENERAPAN DYNAMIC DENSITY BASED CLUSTERING PADA DATA KEBAKARAN HUTAN FANI WULANDARI
PENERAPAN DYNAMIC DENSITY BASED CLUSTERING PADA DATA KEBAKARAN HUTAN FANI WULANDARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENERAPAN
Lebih terperinciKlasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means
Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means Nielza Atthina Jurusan Teknik Informatika Universitas Islam Indonesia Yogyakarta 09523458@students.uii.ac.id
Lebih terperinciManajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM :
Manajemen Data Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : 1011601026 MAGISTER ILMU KOMPUTER UNIVERSITAS BUDI LUHUR 2011 DIT TI / DJHKI SKPL-DJHKI-01.04.2011.xx Halaman 0
Lebih terperinciPENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN
PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Sistem Pendukung Keputusan II.1.1 Definisi Sistem Pendukung Keputusan Berdasarkan Efraim Turban dkk, Sistem Pendukung Keputusan (SPK) / Decision Support System (DSS) adalah sebuah
Lebih terperinciMODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015
1 MODEL DATA MINING N. Tri Suswanto Saptadi CAPAIAN PEMBELAJARAN Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 1 3 Definisi Mining : proses atau usaha untuk mendapatkan sedikit barang
Lebih terperinciBAB III METODOLOGI PENELITIAN
40 BAB III METODOLOGI PENELITIAN 3.1 DESAIN PENELITIAN Dalam melakukan penelitian, dibutuhkan desain penelitian agar penelitian yang dilakukan dapat berjalan dengan baik. Berikut ini merupakan desain penelitian
Lebih terperinciDATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI
DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
Latar Belakang PENDHULUN Listrik merupakan sumber daya yang sangat dibutuhkan saat ini. Penggunaan listrik setiap tahun, bahkan setiap bulan terus meningkat. Hal ini dibuktikan dengan selalu bertambahnya
Lebih terperinciBab 2 Tinjauan Pustaka
Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Adapun penelitian terdahulu yang berkaitan dalam penelitian ini berjudul Penentuan Wilayah Usaha Pertambangan Menggunakan Metode Fuzzy K-Mean Clustering
Lebih terperinciAPLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA
APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA Yuli Asriningtias, Rodhyah Mardhiyah Program Studi Teknik Informatika Fakultas Bisnis & Teknologi Informasi, Universitas Teknologi
Lebih terperinciAkurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa
Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :
Lebih terperinci