BAB II LANDASAN TEORI

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II LANDASAN TEORI"

Transkripsi

1 BAB II LANDASAN TEORI Bab ini berisi landasan teori dalam penelitian mengenai aplikasi algoritma spasial clustering pada data mahasiswa baru. Pembahasan diawali dengan penjelasan secara umum mengenai data mining. Pembahasan dilanjutkan dengan penjelasan secara terperinci mengenai algoritma clustering yang digunakan dalam penelitian. Algoritma tersebut yaitu algoritma Density-based Spatial Clustering of Application with Noise (DBSCAN). 2.1 Penjelasan Umum Data Mining Data yang tersimpan di dalam suatu basis data biasanya berupa data mentah yang tidak dapat memberikan informasi-informasi berharga secara langsung. Untuk melakukan ekstraksi informasi yang terkandung, perlu dilakukan langkah-langkah pemrosesan tertentu. Metode pemrosesan data dengan tujuan untuk mendapatkan informasi penting yang terkandung di dalamnya dapat dilakukan dengan proses data mining. Secara sederhana, data mining sebagai proses ekstraksi atau penggalian informasi-informasi penting yang terkandung dalam sejumlah data (Han & Kamber, 2006, p. 5). Proses penggalian informasi tersebut terdiri dari langkah-langkah pemrosesan data. Langkah-langkah dan metode pemrosesan data disesuaikan dengan tujuan dan karakteristik data yang akan diproses. Langkahlangkah tersebut dapat dilihat di gambar di bawah ini. 6

2 Gambar 2.1 Data mining sebagai salah satu langkah Knowledge Discovery Sumber: (Han & Kamber, 2006, p. 6) Di gambar tersebut, data mining menjadi salah satu langkah dalam proses knowledge discovery. Meskipun demikian, dalam knowledge discovery, data mining merupakan inti dalam proses tersebut. Beberapa pakar memberikan definisi yang sama terhadap kedua terminologi ini. Di dalam penelitian ini, terminologi data mining dan knowledge discovery selanjutnya disebut sebagai 7

3 data mining. Jiawei Han dan Micheline Kamber membagi proses data mining ke dalam tujuh langkah (Han & Kamber, 2006). Pembersihan data (data cleaning), merupakan proses pembersihan data dari noise dan dari data yang tidak konsisten; Integrasi data (data integration), merupakan proses intergrasi data dari berbagai sumber data yang dapat dikombinasikan; Seleksi data (data selection), merupakan proses pengambilan data-data dari basis data yang relevan dengan penelitian; Transformasi data (data transformation), merupakan proses transformasi atau konsolidasi data ke dalam bentuk yang sesuai dengan proses analisis data mining; Data mining, merupakan proses inti yang melakukan ekstraksi atau penggalian pola (pattern); Evaluasi pola (pattern evaluation), merupakan proses menemukan pola yang menarik berdasarkan pengukuran-pengukuran kemenarikan tertentu; Presentasi pengetahuan (knowledge presentation) merupakan proses visualisasi dengan menggunakan teknik-teknik representasi untuk menampilkan informasi kepada pengguna. Langkah satu sampai dengan langkah empat disebut juga sebagai data preprocessing. Data preprocessing dilakukan untuk menyiapkan data dan memodifikasi data sedemikian rupa agar dapat dilakukan data mining. Metodemetode yang sering digunakan dalam data preprocessing antara lain normalisasi, agregasi data, seleksi fitur dan ekstraksi fitur. Spasial data mining merupakan bentuk data mining yang melakukan analisis terhadap data spasial. Data spasial diambil dari tempat tertentu (spasial), dimana dalam. Dengan demikian, setiap titik pengamatan dalam area tersebut mengandung sequential data. Dalam analisis spasial data mining, data-data tersebut dianalisis untuk menemukan pola-pola menarik yaitu pola kemiripan antara satu titik pengamatan dengan titik pengamatan lain. Pola-pola tersebut dicari dengan fungsionalitas tertentu yang ada dalam spasial data mining. Berikut beberapa fungsionalitas dalam data mining (Han & Kamber, 2006, pp ). 8

4 a. Deskripsi konsep atau kelas, terdiri dari karakterisasi dan diskriminasi Karakterisasi data merupakan proses menemukan ciri-ciri umum yang terdapat di dalam data. Proses karakterisasi dilakukan untuk mengumpulkan ciri-ciri yang ada dalam suatu kelas atau suatu konsep data. Sementara itu, diskriminasi data merupakan proses perbandingan antara ciri-ciri umum dalam suatu kelas dengan kelas lain. b. Pattern mining, assoiciation rule dan korelasi Pattern mining merupakan proses menemukan pola-pola yang terjadi secara spesifik atau berulang-ulang. Pola tersebut antara lain pola dalam itemset, subsequence, atau substructure. Dalam association rule, hubungan antardata dihitung berdasarkan probabilitasnya. Support dan confidence merupakan dua unsur yang ada dalam association rule. Jika di dalam suatu basis data D terdapat dua kumpulan data, kumpulan data A dan kumpulan data B, support didefinisikan sebagai persentase jumlah transaksi di D yang mengandung A dan B atau ( ), sedangkan confidence didefinisikan sebagai persentase jumlah transaksi di D yang memiliki hubungan kondisional jika ada A maka ada B atau ( ). Hubungan antardata tersebut dianggap menarik jika support dan confidence melebihi minimum support threshold dan minimum confidence threshold. c. Klasifikasi dan prediksi Klasifikasi dan prediksi merupakan proses menemukan model (atau classifier) yang membedakan antara satu kelas dengan kelas yang lain. Model atau classifier dalam metode klasifikasi dibangun untuk memprediksi label yang berbentuk kategorial. Sementara itu, model atau classifier dalam metode prediksi digunakan untuk memprediksi fungsi bernilai kontinu. Baik klasifikasi maupun prediksi berguna untuk memberi label kepada data yang masih belum terlabelkan. d. Analisis cluster Analisis cluster atau clustering merupakan proses pengelompokkan data-data ke dalam cluster tertentu tanpa ada infomasi label secara langsung dalam data. Cluster merupakan sekumpulan data yang mirip satu sama lain di dalam 9

5 cluster tersebut dan berbeda dengan data yang ada di cluster lain. Kemiripan dalam analisis cluster dihitung dengan fungsi jarak. e. Analisis pencilan Analisi pencilan (outlier) merupakan proses menemukan data pencilan atau data yang memiliki perilaku yang berbeda dengan perilaku data pada umumnya. 2.2 Spasial Clustering Penelitian ini akan berfokus kepada analisis spasial clustering yaitu analisis pengelompokkan data spasial menggunakan algoritma clustering yang sudah ada. Berbeda dengan klasifikasi, dalam analisis spasial clustering tidak memiliki label atau tidak memasukkan label data tersebut ke dalam proses clustering. Dengan kata lain, analisis spasial clustering merupakan proses unsupervised. Untuk data spasial berukuran besar, biaya komputasi spasial clustering biasanya lebih mahal karena harus menemukan label-label masing-masing profil dalam data tersebut. Untuk itu diperlukan algoritma komputasi yang efektif dan efisien untuk memproses data spasial yang berukuran besar dengan dimensi data yang tinggi tersebut. Profil merupakan istilah untuk satu baris data sepanjang jumlah dimensi data. Adapun beberapa kebutuhan-kebutuhan umum yang mendorong penelitian dalam algoritma clustering antara lain sebagai berikut (Han & Kamber, 2006, pp ): skalabilitas, kemampuan untuk menangani berbagai jenis atribut, kemampuan menemukan cluster dalam data yang acak, hanya membutuhkan pengetahuan minimal terhadap domain pengetahuan asal data untuk menentukan parameter masukkan, kemampuan untuk menangani noisy data, clustering bersifat inkremental dan tidak sensitif terhadap urutan masukkan data, kemampuan menangani data berdimensi tinggi, constaint-based clustering, 10

6 hasil clustering dapat diinterpretasikan dan digunakan. Setiap algoritma yang digunakan dalam analisis clustering dapat memberikan hasil yang baik untuk suatu bentuk data, namun dapat memberikan hasil yang tidak baik apabila diimplementasikan terhadap data yang lain. Untuk mengetahui metode yang memberikan akurasi paling baik, diperlukan langkah-langkah tertentu. Langkah-langkah yang umum dilakukan dalam analisis clustering adalah sebagai berikut (Jain, Murty, & Flynn, 1999, hal. 266): pattern representation (termasuk proses ekstraksi atau proses seleksi fitur), pendefinisian cara menghitungan kedekatan atau jarak dalam pola yang sesuai dengan domain data, clustering, proses abstraksi data (opsional), dan peninjauan hasil (opsional). Pattern representation merupakan proses menentukan parameter-parameter masukkan dalam analisis clustering. Proses tersebut antara lain proses menentukan jumlah cluster yang diharapkan dan proses identifikasi jenis, jumlah dan skala atribut-atribut yang dimiliki data. Tidak semua atribut yang dimiliki data perlu diikutsertakan dalam proses analisis spasial clustering. Hanya atributatribut tertentu yang relevan terhadap tujuan spasial clustering yang diperlukan dalam clustering. Seleksi atribut merupakan langkah memilih atribut-atribut yang sesuai dengan tujuan clustering. Meskipun demikian, dalam kasus-kasus tertentu, atribut yang diperlukan tidak secara eksplisit tersedia dalam data. Perlu dilakukan ekstraksi fitur atau atribut terlebih dahulu untuk mendapatkan atribut tersebut. Ekstraksi atribut melakukan pengolahan terhadap data dan menghasilkan atribut baru bedasarkan masukkan dari atribut-atribut yang sudah ada. Penghitungan kedekatan atau jarak antarprofil digunakan untuk menentukan kemiripan dalam profil-profil tersebut. Bisanya perhitungan ini menggunakan rumus jarak tertentu. Rumus perhitungan jarak yang umum digunakan dalam analisis clustering antara lain jarak Euclidean, jarak Minkowski, jarak Manhattan, dan jarak Mahalanobis. a. Rumus pengukuran jarak Euclidean (Han & Kamber, 2006, p. 388) 11

7 ( ) ( ) ( ) ( ) Dengan ( ) dan ( ) merupakan dua profil berdimensi. Adapun dalam bentuk matriks, perhitungan jarak Euclidean dapat dilakuan dengan cara sebagai berikut (Jain, Murty, & Flynn, 1999, hal. 271): ( ) ( ( ) ) b. Rumus pengukuran jarak Manhattan atau dikenal juga dengan city block (Han & Kamber, 2006, p. 388) ( ) c. Rumus pengukuran jarak menggunakan jarak Minkowski (Han & Kamber, 2006, p. 389) ( ) ( ) Adapun dalam bentuk matriks, perhitungan jarak Minkowski dapat dilakukan dengan cara sebagai berikut (Jain, Murty, & Flynn, 1999, hal. 372) ( ) ( ( ) ) d. Rumus pengukuran jarak menggunakan jarak Mahalanobis (Jain, Murty, & Flynn, 1999, hal. 372) ( ) ( ) ( ) Dalam melakukan clustering, untuk bentuk data tertentu digunakan pendekatan algoritma clustering yang berbeda dengan bentuk data yang lain. Dalam jurnal Data Clustering: A Review (Jain, Murty, & Flynn, 1999), terbentuk satu representasi taksonomi metode clustering. Secara umum, pendekatan metode 12

8 clustering dibagi menjadi dua pendekatan utama, yaitu pendekatan secara hirarki dan pendekatan secara partisi. Clustering Hierarchical Partition Single Link Squared Error Graph Theoretic Mixture Resolving Mode Seeking Complete Link K-means Expectation Maximization Gambar 2.2 Taksonomi Pendekatan Clustering Sumber: Jain, Murty, & Flynn, 1999, hal. 275 (telah diolah kembali) Pembentukan taksonomi tersebut berdasarkan beberapa kriteria yang membedakan antara satu algoritma dengan algoritma yang lain. Dibawah ini dijelaskan kriteria-kriteria pembeda yang dimaksud (Jain, Murty, & Flynn, 1999, hal ). a. Pendekatan agglomerative dibandingkan dengan pendekatan divisive Dalam pendekatan agglomerative, mula-mula setiap profil dianggap sebagai satu cluster tersendiri. Dengan menggunakan perhitungan kemiripan, profilprofil yang memiliki kemiripan kemudian digabung sampai memenuhi kriteria tertentu. Sebaliknya, dalam pendekatan divisive, mula-mula seluruh profil dianggap sebagai satu cluster yang sama. Dengan menggunakan perhitungan kemiripan, cluster tersebut kemudian dipecah menjadi beberapa cluster sampai memenuhi kriteria tertentu. b. Pendekatan monothetic dibandingkan dengan pendekatan polythetic Dalam pendekatan monothetic, perhitungan kemiripan profil menggunakan atribut yang dimasukkan secara bertahap. Dalam hal ini, setiap kali tambahan 13

9 atribut dimasukkan, cluster kemudian dipecah sesuai masukkan atribut baru tersebut. Berbeda dengan pendekatan monothetic, dalam pendekatan polythetic, semua atribut dimasukkan dalam perhitungan kemiripan secara bersama-sama. Metode clustering yang ada pada umumnya menggunakan pendekatan polythetic. c. Pendekatan hard clustering dibandingkan dengan pendekatan fuzzy clustering Dalam pendekatan hard clustering, satu profil menjadi anggota satu cluster saja. Sementara itu, dalam pendekatan fuzzy clustering, satu profil memiliki derajat keanggotaan di semua cluster. Pendekatan fuzzy clustering dapat diubah menjadi hard clustering dengan memilih derajat keanggotaan paling tinggi sebagai cluster data tersebut. d. Pendekatan deterministic dibandingkan dengan pendekatan sthocastic Dalam pendekatan secara deterministic, optimisasi fungsi squared error dilakukan dengan teknik tradisional, sedangkan dalam pendekatan secara stochastic, optimisasi fungsi squared error dilakukan dengan random search terhadap state space yang terdiri dari keseluruhan label yang mungkin. e. Pendekatan non-inkremental dibandingkan dengan pendekatan inkremental Dalam pendekatan non-inkremental, seluruh profil yang akan dianalisis diproses secara bersama-sama. Hal ini berkaitan dengan kemampuan dari komputasi, alokasi waktu, dan alokasi memori yang harus disediakan. Dengan pendekatan inkremental, jumlah profil yang diproses disesuaikan dengan batasan kemampuan komputasi, memori dan waktu tersebut. 2.3 Algoritma DBSCAN Density-based Spatial Clustering of Application with Noise atau lebih dikenal dengan sebutan DBSCAN termasuk ke dalam algoritmas clustering berbasis kepadatan (density-based). DBSCAN mencari kumpulan data dengan kepadatan yang tinggi untuk dijdikan sebagai cluster. Bentuk cluster yang dihasilkan oleh DBSCAN bergantung kepada kepadatan tersebut. Sehingga dengan algoritma ini dimungkinkan untuk menghasilkan bentuk cluster yang sembarang. Suatu cluster dalam DBSCAN didefinisikan sebagai sekumpulan maksimum data yang terhubung di dalam kepadatan tersebut (density-connected). Keanggotaan dari 14

10 setiap profil dihitung berdasarkan rumus jarak. DBSCAN termasuk ke dalam unsupervised clustering karena jumlah cluster yang dihasilkan ditentukan oleh bentuk persebaran data itu sendiri, bukan diinisialisasi di awal. Gambar 2.3 Contoh Clustering dengan algoritma DBSCAN Sumber: (Ester, Kriegel, Sander, & Xu, August 1996) Algoritma DBSCAN pertama kali diperkenalkan dalam jurnal ilmiah yang berjudul A Density-Based Algorithm for Discovering Clusters in Large Spatial Database with Noise. Dalam jurnal ilmiah tersebut diperkenalkan beberapa komponen baru dalam proses analisis clustering yang ada di dalam DBSCAN. Komponen-komponen tersebut antara lain (Ester, Kriegel, Sander, & Xu, August 1996): a. Epsilon Epsilon kekerabatan dari sebuah profil atau Eps-neigborhood dari sebuah profil, ( ), didefinisikan sebagai ( ) * ( ) + D adalah basis data yang dianalisis, q adalah profil lain. Eps adalah nilai ambang jarak antarprofil untuk dapat dimasukkan ke dalam cluster yang sama. Dari definisi tersebut, profil p dapat berkerabat dengan profil q (berada dalam satu cluster yang sama) jika jarak dari p ke q tidak lebih dari nilai Eps. b. Minimum Points Meskipun p berada dalam Eps-neigborhood dari q, akan tetapi jika hanya dua profil itu saja yang berkerabat, maka akan ada kasus dimana terdapat banyak cluster dengan jumlah anggota yang sedikit. Untuk mengantisipasi hal tersebut, 15

11 diperkenalkan istilah minimum points atau MinPts. MinPts merupakan nilai ambang yang merepresentasikan jumlah minimal profil yang berada dalam Eps-neigborhood profil p agar dapat terbentuk cluster. Dengan nilai ambang ini, maka ada tiga klasifikasi jenis profil di DBSCAN, yaitu profil yang berada di berada di luar daerah padat disebut outlier, profil yang berada di pangkal daerah padat disebut border point, dan profil yang berada di dalam daerah padat disebut core point. c. Directly density-reachable Sebuah profil p dikatakan directly density-reachable terhadap profil q jika ( ), dan ( ) (q merupakan core point) Dari definisi tersebut dapat diketahui bahwa agar profil p directly densityreachable terhadap profil q, maka harus memenuhi dua syarat yaitu profil p berada pada Eps-neighborhood profil q dan profil q merupakan core poin. Directly density-reachable bersifat simetris jika p dan q keduanya adalah core point. Artinya, jika p directly density-reachable terhadap q, maka q directly density-reachable terhadap p. Gambar 2.4 Contoh sepasang profil yang directly density-reachable Sumber: Ester, Kriegel, Sander, & Xu, August 1996 (telah diolah kembali) d. Density-reachable Sebuah profil p dikatakan density-reachable terhadap profil q jika terdapat rantai, dengan dan, sedemikian sehingga bersifat directly density-reachable terhadap. Dari definisi tersebut dapat diketahui bahwa dua buah profil dikatakan density-reachable jika ada satu rantai profil 16

12 sedemikian sehingga dari profil satu ke profil lain di dalam rantai tersebut bersifat directly density-reachable. Sifat density-reachable tidak menjamin dua border point bersifat density-reachable. Gambar 2.5 Contoh sepasang profil yang density-reachable Sumber: Ester, Kriegel, Sander, & Xu, August 1996 (telah diolah kembali) e. Density-connected Sebuah profil p dikatakan density-connected terhadap profil q jika terdapat profil o sedemikian sehingga profil p dan profil q bersifat density-reachable terhadap poin o. Dengan demikian, setidaknya dua profil di dalam satu cluster bersifat density-connected. Density-connected bersifat simetris dan refleksif. Artinya, jika profil p bersifat density-connected terhadap poin q, maka profil q bersifat density-connected terhadap profil p. Gambar 2.6 Contoh sepasang profil yang density-connected Sumber: Ester, Kriegel, Sander, & Xu, August 1996 (telah diolah kembali) Nilai eps dan MinPts harus diketahui untuk dapat menjalankan algoritma DBSCAN. Algoritma DBSCAN dimulai dengan memilih satu profil p secara acak, kemudian mencari profil-profil lain yang density-reachable terhadap profil p. Jika p merupakan core point, maka terbentuk suatu cluster. Akan tetapi jika p adalah border point, maka DBSCAN akan mengambil profil lain dari basis data. Dalam 17

13 proses tersebut, terdapat kemungkinan dua cluster bergabung jika kedua custer tersebut dekat. Berikut pseudocode dari algoritma DBSCAN: DBSCAN (SetOfPoints, Eps, MinPts) // SetOfPoints is UNCLASIFIED ClusterId := nextid(noise) FOR i FROM 1 TO SetOfPoints.size DO Point = SetOfPoints.get(i) IF Point.ClID = UNCLASSIFIED THEN IF ExpandCluster(SetOfPoints, Point, ClusterId, Eps, MinPts) THEN ClusterId := nextid(clusterid) END IF END IF END FOR END; // DBSCAN Algoritma 2.1 Pseudocode fungsi DBSCAN untuk algoritma DBSCAN Sumber: (Ester, Kriegel, Sander, & Xu, August 1996) ExpandCluster(SetOfPoints, Point, ClID, Eps, MinPts) : Boolean; seeds:= SetOfPoints.regionQuery(Point, Eps); IF seeds.size < MinPts THEN // no core point SetOfPoints.changeClIds(Point, NOISE); RETURN False ELSE // all points in seeds are density- // reachable from point SetOfPoints.changeClID(seeds, ClId); seeds.delete(point); WHILE seeds <> Empty DO currentp := seeds.first(); result := SetOfPoints.regionQuery(currentP, Eps); IF result.size >= MinPts THEN FOR i FROM 1 TO result.size DO resultp := result.get(i); IF resultp.clid IN {UNCLASSIFIED, NOISE} THEN IF resultp.clid = UNCLASSIFIED 18

14 THEN END IF; seeds.append(resultp); SetOfPoints.changeClId( resultp, ClId); END IF; // UNCLASSIFIED or NOISE END FOR; END IF; // result.size >= MinPts seeds.delete(currentp); END WHILE; // seeds <> Empty Return True; END IF END // ExpandCluster Algoritma 2.2 Pseudocode fungsi ExpandCluster untuk algoritma DBSCAN Sumber: (Ester, Kriegel, Sander, & Xu, August 1996) Dan berikut flowchart dari algoritma DBSCAN: Gambar 2.7 Flowchart Algoritma DBSCAN 19

15 Berdasarkan gambar diatas, dalam algoritma DBSCAN dilakukan input data yang akan digunakan, kemudian dilakukan proses loop. Pada proses loop ini dilakukan pengecekan tiap nilai yang density reachable. Jika data yang dicek ini merupakan titik inti maka akan dibentuk cluster. Jika tidak,maka akan dicek apakah titik itu merupakan titik tepi, jika iya maka titik itu akan melakukan proses pengecekan kembali. Jika tidak, maka akan dimasukkan kedalam kategori noise. Proses ini berlanjut hingga semua titik diperiksa. 2.4 Metode Silhouette Index Setiap algoritma clustering memiliki kelebihan dalam menganalisis cluster untuk jenis data tertentu, namun belum tentu lebih baik jika diaplikasikan terhadap data lain. Dengan demikian, perlu ada satu metode khusus yang dapat membandingkan secara objektif hasil-hasil analisis clustering tersebut. Dalam clustering, perbandingan tersebut dikenal sebagai cluster evaluation atau cluster validation. Evaluasi clustering dilakukan dengan memvalidasi hasil analisis clustering. Pelabelan keanggotaan terhadap setiap profil dievaluasi dengan menggunakan teknik validasi tertentu. Validasi diperlukan untuk menghitung nilai akurasi dari hasil cluster tersebut. Nilai akurasi tersebut diperlukan antara lain untuk membandingkan akurasi hasil clustering dengan menggunakan beberapa algoritma terhadap data yang sama. Dalam penelitian ini, metode validasi hasil analisi spasial clustering yang digunakan adalah metode Silhouette index. Metode Silhouette index pertama kali diperkenalkan oleh Rousseeuw (1987) dalam jurnal ilmiah yang berjudul Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Dalam jurnal tersebut, Rousseeuw memperkenalkan metode validasi dengan mengukur kesamaan atau ketidaksamaan antara profil yang ada dalam satu cluster dengan cluster lain hasil analisis clustering. Pengukuran kesamaan atau ketidaksamaan tesebut dihitung dengan rumus jarak. Jika diketahui data yang dianalisis * + jumlah profil dalam data, dan diketahui A adalah salah satu cluster yang dihasilkan, maka dapat dicari: ( ) = jarak rata-rata profil ke terhadap profil lain yang ada dalam cluster A 20

16 Jika diketahui terdapat cluster C dimana, maka dapat dicari ( ) jarak rata-rata profil ke terhadap profil yang ada dalam cluster C. Jika terdapat lebih dari satu cluster lain selain cluster A, maka perlu dicari cluster yang paling dekat dengan cluster A dengan menghitung ( ) ( ) Silhouette index terhadap profil ke yaitu ( ) didefinisikan sebagai berikut (Rousseeuw, 1987, hal. 56): ( ) ( ) ( ) * ( ) ( )+ Gambar 2.8 Ilustrasi Silhouette indeks Contoh elemen yang terlibat dalam perhitungan ( ). Profil i berada di cluster A Sumber: (Rousseeuw, 1987, hal. 55) Rentang nilai ( ) yang diperoleh dari perhitungan tersebut adalah ( ). Nilai ( ) lebih dekat ke 1 menunjukkan bahwa data tersebut sudah well clustered. Artinya, kemiripan data tersebut dengan data lain yang ada dalam cluster yang sama jauh lebih besar dibandingkan dengan kemiripan data tersebut dengan data dari cluster lain yang berdekatan. Nilai ( ) lebih dekat ke 0 menunjukkan bahwa data tersebut termasuk dalam intermediate case. Artinya, kemiripan data tersebut dengan data lain yang ada dalam cluster yang sama relatif sama besar dibandingkan dengan kemiripan data tersebut dengan data dari cluster lain yang berdekatan. Data yang berada pada intermediate case dapat dipindah ke cluster yang berdekatan. Nilai ( ) lebih dekat ke -1 menunjukkan bahwa data 21

17 tersebut misclassified. Artinya, kemiripan data tersebut dengan data lain yang ada di cluster yang sama dibandingkan dengan data di cluster yang berdekatan jauh lebih mirip terhadap data dari cluster yang berdekatan. Setelah menghitung masing-masing nilai Silhouette index dalam data, maka dapat diketahui yaitu rata-rata nilai Silhouette index dari data: ( ) menyatakan cluster ke-i, menyatakan data ke dalam cluster ke, dan ( ) menyatakan nilai Silhouette index data ke dalam cluster ke. Nilai dari menyatakan akurasi hasil analisi clustering. 2.5 Studi Literatur Dalam studi literatur ini akan dijabarkan tiga buah penelitian yang telah dilakukan menggunakan algoritma DBSCAN. Penelitian pertama yaitu Aplikasi Algoritma Spasial dan Temporal Clustering pada Data Curah Hujan, penelitian kedua Pengembangan Aplikasi berbasis Clustering dan Prediksi Untuk Pemetaan Potensi Sumberdaya Perikanan Ikan Tuna di Indonesia, dan penelitian ketiga Comparative Study Between Density Based Clustering - DBSCAN and OPTICS. TAHUN PENELITI JUDUL DATA METODE HASIL 2012 Wawan Aplikasi Data Penelitian Dari hasil Setiawan Algoritma curah yang eksperimen, Spasial dan hujan dilakukan disimpulkan bahwa Temporal untuk algoritma paling Clustering mendapatka akurat dalam pada Data n algoritma proses spasial Curah Hujan spasial clustering adalah clustering algoritma dan DBSCAN dan algoritma algoritma paling temporal akurat dalam 22

18 clustering proses temporal yang akurat clustering adalah dan cepat algoritma Iterative terhadap K-means. Waktu data curah komputasi hujan. algoritma Iterative Implementa K-means hampir si yang 20 kali lebih cepat dilakukan dibandingkan adalah dengan algoritma melakukan K-means. Selain perbandinga perbandingan hasil n akurasi clustering, dan waktu penelitian juga komputasi menghasilkan pola- terhadap pola persebaran masing- curah hujan yang masing diperoleh dari hasil algoritma. clustering Dr.Achmad Pengembang Data Peneiti Algoritma spatio- Nizar an Aplikasi tangkap melakukan temporal clustering Hidayanto, berbasis an ikan integrasi yang digunakan S.Kom., Clustering dilaut data cluster untuk menentukan M.Kom, dan Prediksi spatio- area penangkapan Prof. Dr. Untuk temporal ikan dilakukan Aniati Murni Pemetaan tangkapan dengan 2 skema, Arymurthy, Potensi ikan dengan skema 1 secara M.Sc, Sumberdaya data berjenjang, yaitu Devi Fitrianah, Perikanan oseanografi spasial terlebih S.Kom., MTI Ikan Tuna di dahulu baru Dina Chahyati, Indonesia kemudian 23

19 S.Kom., M.Kom algoritma temporal, skema 2 yaitu dengan cara bersamaan, dimana data spasial dan temporal diproses secara bersamaan. Untuk skema 1, algoritma spasial yang digunakan adalah algoritma DBSCAN yang ditambahkan modifikasi berupa threshold untuk menentukan area penangkapan dengan jumlah tangkapan tertinggi. Kemudian dari hasil identifikasi area tangkapan tertinggi dilakukan algoritma temporal untuk melihat periode tangkapan tertinggi Pranjal Dubey, Comparative Data Peneliti Hasilnya pada Anand rajavat Study Yang mencoba kerapatan dengan Between Diguna melakukan DBSCAN, boolean 24

20 Density kan analisa valuenya itu high Based Data perbandinga atau low. Dan Clustering - Rando n clustering keanggotaan DBSCAN m dengan clusternya, boolean and OPTICS DBSCNA valuenya itu yes dan atau no. OPTICS Sedangkan, dengan OPTICS, hasil kerapatannya memiliki numerical value yaitu core dan distance. Dan keanggotaan clusternya memiliki numerical value reachable distance Rizky Algian Analisa Data Peneliti Peneliti Kurniaputra, Spasial koordin melakukan mendapatkan hasil Dr. Devi Clustering at penerapan clustering dengan Fitrianah, Dengan mahasis algoritma beberapa parameter S.Kom., MTI Menggunaka wa spasial yang berbeda. Dan n Algoritma universi clustering peneliti DBSCAN. tas yaitu mendapatkan mercu DBSCAN kesimpulan dari buana pada data hasil clustering, koordinat validasi clustering, mahasiswa index. universitas mercubuana 25

PENGELOMPOKAN SUNSPOT PADA CITRA DIGITAL MAHATARI MENGGUNAKAN METODE CLUSTERING DBSCAN

PENGELOMPOKAN SUNSPOT PADA CITRA DIGITAL MAHATARI MENGGUNAKAN METODE CLUSTERING DBSCAN PENGELOMPOKAN SUNSPOT PADA CITRA DIGITAL MAHATARI MENGGUNAKAN METODE CLUSTERING DBSCAN Gregorius Satia Budhi 1, Rudy Adipranata 2, Matthew Sugiarto 3, Bachtiar Anwar 4, Bambang Setiahadi 5 1,2,3 Universitas

Lebih terperinci

Modifikasi DBSCAN (Density-Based Spatial Clustering With Noise) pada Objek 3 Dimensi

Modifikasi DBSCAN (Density-Based Spatial Clustering With Noise) pada Objek 3 Dimensi Jurnal Komputer Terapan Vol. 3, No. 1, Mei 2017, 41-52 41 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Modifikasi DBSCAN (Density-Based Spatial Clustering With Noise) pada Objek 3 Dimensi Ibnu

Lebih terperinci

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV IMPLEMENTASI DAN PENGUJIAN BAB IV IMPLEMENTASI DAN PENGUJIAN Bab ini berisi penjelasan mengenai proses implementasi dan pengujian yang dilakukan dalam penelitian mengenai aplikasi algoritma spasial clustering pada data mahasiswa

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Hal-hal yang dipaparkan pada Bab Tinjauan Pustaka adalah penelaahan kepustakaan yang mendasari proses perancangan dan pembuatan aplikasi meliputi data mining, Customer Relationship

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian

2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian 3 Ruang Lingkup Penelitian 1. Teknik yang digunakan dalam membentuk clustering titik panas adalah DBSCAN. 2. Data yang digunakan pada penelitian ini adalah data titik panas kebakaran hutan di Indonesia

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data mining merupakan serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan

Lebih terperinci

Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan

Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Ni Made Anindya Santika Devi, I Ketut Gede Darma Putra, I Made Sukarsa Jurusan Teknologi Informasi, Universitas Udayana Bukit Jimbaran,

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Penelitian Terkait Pada penelitian ini, peneliti melakukan penelitian yang didasarkan pada penelitian terdahulu yang terkait dengan penelitian yang akan dilakukan peneliti.

Lebih terperinci

(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M

(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M (M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M 1Toza Sathia Utiayarsih, 2 Yadi Suprijadi, 3 Bernik Maskun 1Mahasiswa Magister Statistika

Lebih terperinci

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

Pengenalan Pola. Klasterisasi Data

Pengenalan Pola. Klasterisasi Data Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN Bab ini berisi pembahasan mengenai gambaran umum penelitian dalam analisis spasial clustering pada data mahasiswa Universitas Mercu Buana. Pembahasan diawali dengan penjelasan mengenai

Lebih terperinci

3 METODOLOGI PENELITIAN

3 METODOLOGI PENELITIAN 19 3 METODOLOGI PENELITIAN 3.1. Kerangka Berpikir Kebakaran hutan yang sering terjadi di Indonesia berkaitan erat dengan dua faktor utama yaitu faktor alam dan faktor manusia. Kemungkinan terdapat karakteristik

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Sponge atau poriferans berasal dari bahasa Latin yaitu porus yang artinya pori dan ferre yang artinya memiliki. Sponge adalah hewan berpori, pada umumnya terdapat di lautan,

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Perkembangan teknologi informasi yang sangat pesat yang terjadi dewasa ini menuntut manusia untuk mampu beradaptasi dengan perkembangan tersebut. Upaya adaptasi yang dilakukan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Performansi Hasil Cluster

HASIL DAN PEMBAHASAN. Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Performansi Hasil Cluster Performansi Hasil Cluster Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Pada tahap ini dilakukan analisis terhadap hasil cluster. Analisis yang digunakan adalah analisis cluster ce. Besarnya

Lebih terperinci

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. 2.1. Data Mining Data mining adalah suatu istilah yang digunakan

Lebih terperinci

SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR

SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR Diajukan Guna Memenuhi Sebagian Persyaratan Dalam Rangka Menyelesaikan Pendidikan Sarjana Strata

Lebih terperinci

2.2 Data Mining. Universitas Sumatera Utara

2.2 Data Mining. Universitas Sumatera Utara Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record

Lebih terperinci

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

CLUSTERING DATASET TITIK PANAS DENGAN ALGORITME RDBC MENGGUNAKAN WEB FRAMEWORK SHINY PADA BAHASA R ARIES SANTOSO

CLUSTERING DATASET TITIK PANAS DENGAN ALGORITME RDBC MENGGUNAKAN WEB FRAMEWORK SHINY PADA BAHASA R ARIES SANTOSO CLUSTERING DATASET TITIK PANAS DENGAN ALGORITME RDBC MENGGUNAKAN WEB FRAMEWORK SHINY PADA BAHASA R ARIES SANTOSO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Bab ini berisi penjelasan mengenai image clustering, pengukuran kemiripan dan pengukuran jarak, representasi citra, ruang warna, algoritma clustering, dan penelitian yang berhubungan.

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN. Metode penelitian yang digunakan dalam penelitian ini adalah :

BAB III ANALISIS DAN PERANCANGAN. Metode penelitian yang digunakan dalam penelitian ini adalah : BAB III ANALISIS DAN PERANCANGAN 3.1 Metode Penelitian Metode penelitian yang digunakan dalam penelitian ini adalah : Gambar 4 Flowchart metode penelitian Berikut adalah penjelasan dari flowchart diatas:

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU Gita Premashanti Trayasiwi Program Studi Teknik Informatika S1,

Lebih terperinci

IMPLEMENTASI DENSITY BASED SPATIAL CLUSTERING APPLICATION WITH NOISE (DBSCAN) DALAM PERKIRAAN TERJADI BANJIR DI BANDUNG

IMPLEMENTASI DENSITY BASED SPATIAL CLUSTERING APPLICATION WITH NOISE (DBSCAN) DALAM PERKIRAAN TERJADI BANJIR DI BANDUNG IMPLEMENTASI DENSITY BASED SPATIAL CLUSTERING APPLICATION WITH NOISE (DBSCAN) DALAM PERKIRAAN TERJADI BANJIR DI BANDUNG Bima Aryo Putro¹, Kemas Rahmat Saleh Wiharja², Shaufiah³ ¹Teknik Informatika,, Universitas

Lebih terperinci

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009 Konsep Data Mining Pendahuluan Bertalya Universitas Gunadarma 2009 Latar Belakang Data yg dikumpulkan semakin bertambah banyak Data web, e-commerce Data pembelian di toko2 / supermarket Transaksi Bank/Kartu

Lebih terperinci

Ekstraksi Objek pada Citra Radar FM-CW dengan Metode DBSCAN. Object Extraction on FM-CW Radar Image Using DBSCAN Method

Ekstraksi Objek pada Citra Radar FM-CW dengan Metode DBSCAN. Object Extraction on FM-CW Radar Image Using DBSCAN Method Ekstraksi Objek pada Citra Radar FM-CW dengan Metode DBSCAN Object Extraction on FM-CW Radar Image Using DBSCAN Method Vicky Zilvan UPT LPSN Lembaga Ilmu Pengetahuan Indonesia (LIPI), Jl. Ranggamalela

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

Pembuatan Aplikasi Pendeteksi Anomali Pada Pola Konsumsi Listrik Pelanggan Kota Surabaya Menggunakan Algoritma Klasterisasi Berbasis Densitas

Pembuatan Aplikasi Pendeteksi Anomali Pada Pola Konsumsi Listrik Pelanggan Kota Surabaya Menggunakan Algoritma Klasterisasi Berbasis Densitas 1 Pembuatan Aplikasi Pendeteksi Anomali Pada Pola Konsumsi Listrik Pelanggan Kota Surabaya Menggunakan Algoritma Klasterisasi Berbasis Densitas Achmad Zainuddin Zakariya, Arif Djunaidy, Renny Pradina Kusumawardani

Lebih terperinci

II. TINJAUAN PUSTAKA

II. TINJAUAN PUSTAKA II. TINJAUAN PUSTAKA 2.1 Sistem Informasi Manajemen Mcleod R dan Schell G, (2004) membagi sumber daya menjadi dua bagian yaitu sumberdaya fisikal dan sumberdaya konseptual. Sumber daya fisikal terdiri

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Data Mining Data mining adalah bagian dari knowledge discovery di database yang menganalisa database berukuran besar untuk menemukan pola yang berguna pada data (Silberschatz,

Lebih terperinci

PE DAHULUA. Latar Belakang

PE DAHULUA. Latar Belakang Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di

Lebih terperinci

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (

Lebih terperinci

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita Anggraeni, Ragil Saputra, Beta Noranita APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penambangan Data (Data Mining) Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

Gambar 3.1 Contoh Citra yang digunakan

Gambar 3.1 Contoh Citra yang digunakan BAB III DATASET DAN RANCANGAN PENELITIAN Pada bab ini dijelaskan tentang dataset citra yang digunakan dalam penelitian ini serta rancangan untuk melakukan penelitian. 3.1 DATASET PENELITIAN Penelitian

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

Tahapan Proses KDD (Peter Cabena)

Tahapan Proses KDD (Peter Cabena) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (Business

Lebih terperinci

SEGMENTASI CITRA REMOTE SENSING LAUT DENGAN METODE CLUSTERING DBSCAN

SEGMENTASI CITRA REMOTE SENSING LAUT DENGAN METODE CLUSTERING DBSCAN SEGMENTASI CITRA REMOTE SENSING LAUT DENGAN METODE CLUSTERING DBSCAN Magister Teknik Elektro, Program Pascasarjana, Universitas Udayana Kampus Sudirman, Denpasar, Bali *Email: putrasuwija@gmail.com Abstrak

Lebih terperinci

Gambar Tahap-Tahap Penelitian

Gambar Tahap-Tahap Penelitian BAB III METODELOGI PENELITIAN Dalam menyelesaikan penelitian ini dibuat beberapa tahapan. Tahap-tahap kegiatan dijelaskan dalam Gambar 3.1 Studi Literatur Pengumpulan Data Retrieve Data Pre-Processing

Lebih terperinci

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA 4 BAB 2 TINJAUAN PUSTAKA Pada bab ini membahas tentang sistem pendataan di segala sistem dan data data yang digunakan dalam teknik data mining dan aplikasinya. Tesis ini fokus pada pengelompokan data multidimensi

Lebih terperinci

IMPLEMENTASI ALGORITMA PENENTUAN PARAMETER DENSITAS PADA METODE DBSCAN UNTUK PENGELOMPOKAN DATA

IMPLEMENTASI ALGORITMA PENENTUAN PARAMETER DENSITAS PADA METODE DBSCAN UNTUK PENGELOMPOKAN DATA TUGAS AKHIR KI1502 IMPLEMENTASI ALGORITMA PENENTUAN PARAMETER DENSITAS PADA METODE DBSCAN UNTUK PENGELOMPOKAN DATA AKHMAD BAKHRUL ILMI NRP 5111100087 Dosen Pembimbing I Dr. Eng. Chastine Fatichah, S.Kom.,

Lebih terperinci

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Pola pengaksesan pengguna terhadap sebuah situs web biasanya tergambarkan dalam sebuah pola sekuensial. Pola sekuensial mengindikasikan bahwa transaksi biasanya terjadi secara

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer

Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer Mewati Ayub Jurusan Teknik Informatika, Fakultas Teknologi Informasi Universitas Kristen Maranatha, Bandung Email : mewati.ayub@eng.maranatha.edu

Lebih terperinci

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Sistem Informasi Pengertian Sistem Informasi pada dasarnya merupakan hasil dari dua arti, yakni sistem dan informasi yang digabungkan. Berikut definisi sistem menurut para ahli

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Data mining adalah salah satu teknik dan proses untuk menemukan suatu pola dan pengetahuan dari data yang berjumlah besar (Han dkk., 2011). Proses yang dilakukan

Lebih terperinci

BAB IV METEDOLOGI PENELITIAN

BAB IV METEDOLOGI PENELITIAN BAB IV METEDOLOGI PENELITIAN 4.1. Desain Penelitian Desain penelitian yang digunakan adalah pendekatan cross sectional. Penelitian cross sectional dicirikan dengan satu pengukuran atau observasi untuk

Lebih terperinci

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD) Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika Knowledge Discovery in Databases (KDD) Knowledge Discovery in Databases (KDD) Definisi Knowledge Discovery

Lebih terperinci

Metode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN Methods of Density-Based Clustering Algorithm using DBSCAN

Metode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN Methods of Density-Based Clustering Algorithm using DBSCAN Prosiding Statistika ISSN: 2460-6456 Metode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN Methods of Density-Based Clustering Algorithm using DBSCAN 1 Nur Arsih, 2 Nusar Hajarisman, 3 Sutawanir

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Text Mining Text mining, yang juga disebut text data mining (TDM) atau knowledge discovery in text( KDT), secara umum mengacu pada proses ekstraksi informasi dari dokumen-dokumen

Lebih terperinci

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009 Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES Bertalya Universitas Gunadarma 2009 Data Mining (DM) DM merupakan suatu proses penjelajahan otomatis untuk mendapatkan informasi berguna

Lebih terperinci

dengan Algoritma K Means

dengan Algoritma K Means K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

BAB 6 ANALISIS CLUSTER

BAB 6 ANALISIS CLUSTER BAB 6 ANALISIS CLUSTER Pendahuluan Analisis cluster membagi data ke dalam grup (cluster) yang bermakna, berguna, atau keduanya. Jika tujuannya mencari grup yang memiliki makna, maka cluster seharusnya

Lebih terperinci

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE Warih Maharani Fakultas

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM

METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1), Wahyu Catur Wibowo 2) 1) Program Studi Sistem Informasi, Universitas Jember 2) Fakultas Ilmu Komputer,

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan

Lebih terperinci

Pengenalan Pola. K-Means Clustering

Pengenalan Pola. K-Means Clustering Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan

Lebih terperinci

2.1 Penelitian Terkait

2.1 Penelitian Terkait BAB II TINJAUAN PUSTAKA 2.1 Penelitian Terkait Penelitian yang dilakukan oleh Dinda Setiawati Devi dengan menggunakan metode Apriori untuk analisa keranjang pasar untuk 100 data transaksi dan 55 jenis

Lebih terperinci

PENERAPAN DYNAMIC DENSITY BASED CLUSTERING PADA DATA KEBAKARAN HUTAN FANI WULANDARI

PENERAPAN DYNAMIC DENSITY BASED CLUSTERING PADA DATA KEBAKARAN HUTAN FANI WULANDARI PENERAPAN DYNAMIC DENSITY BASED CLUSTERING PADA DATA KEBAKARAN HUTAN FANI WULANDARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENERAPAN

Lebih terperinci

Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means

Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means Nielza Atthina Jurusan Teknik Informatika Universitas Islam Indonesia Yogyakarta 09523458@students.uii.ac.id

Lebih terperinci

Manajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM :

Manajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : Manajemen Data Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : 1011601026 MAGISTER ILMU KOMPUTER UNIVERSITAS BUDI LUHUR 2011 DIT TI / DJHKI SKPL-DJHKI-01.04.2011.xx Halaman 0

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Sistem Pendukung Keputusan II.1.1 Definisi Sistem Pendukung Keputusan Berdasarkan Efraim Turban dkk, Sistem Pendukung Keputusan (SPK) / Decision Support System (DSS) adalah sebuah

Lebih terperinci

MODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015

MODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015 1 MODEL DATA MINING N. Tri Suswanto Saptadi CAPAIAN PEMBELAJARAN Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 1 3 Definisi Mining : proses atau usaha untuk mendapatkan sedikit barang

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 40 BAB III METODOLOGI PENELITIAN 3.1 DESAIN PENELITIAN Dalam melakukan penelitian, dibutuhkan desain penelitian agar penelitian yang dilakukan dapat berjalan dengan baik. Berikut ini merupakan desain penelitian

Lebih terperinci

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDHULUN Listrik merupakan sumber daya yang sangat dibutuhkan saat ini. Penggunaan listrik setiap tahun, bahkan setiap bulan terus meningkat. Hal ini dibuktikan dengan selalu bertambahnya

Lebih terperinci

Bab 2 Tinjauan Pustaka

Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Adapun penelitian terdahulu yang berkaitan dalam penelitian ini berjudul Penentuan Wilayah Usaha Pertambangan Menggunakan Metode Fuzzy K-Mean Clustering

Lebih terperinci

APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA

APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA Yuli Asriningtias, Rodhyah Mardhiyah Program Studi Teknik Informatika Fakultas Bisnis & Teknologi Informasi, Universitas Teknologi

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci