Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: Yogyakarta, Maret 2016

Ukuran: px
Mulai penontonan dengan halaman:

Download "Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: Yogyakarta, Maret 2016"

Transkripsi

1 PENERAPAN DATA MINING PEMAKAIAN AIR PELANGGAN UNTUK MENENTUKAN KLASIFIKASI POTENSI PEMAKAIAN AIR PELANGGAN BARU DI PDAM TIRTA RAHARJA MENGGUNAKAN ALGORITMA K-MEANS Gunawan Abdillah, Firman Ananda Putra, Faiza Renaldi Program Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Jenderal Achmad Yani Jl. Terusan Jenderal Sudirman, PO BOX 148 Cimahi, Jawa Barat, Indonesia ABSTRAKS Rekomendasi yang dibuat oleh PDAM (Perusahaan Daerah Air Minum) Tirta Raharja untuk mengelompokkan dan memprediksi potensi pendapatan dan pemakaian air calon pelanggan baru sangat berpengaruh pada performa dan kemajuan PDAM. Namun, karena banyaknya kriteria untuk rekomendasi pengevaluasian potensi pendapatan dan pemakaian air calon pelanggan baru dari PDAM akan menghasilkan kombinasi kriteria yang sangat banyak dan mengkonsumsi waktu yang tidak sedikit. Berdasarkan permasalahan tersebut, PDAM membutuhkan suatu aplikasi komputer yang dapat mengcluster/mengelompokkan data menggunakan Data Mining dengan metode K-Means untuk rekomendasi pengevaluasian potensi pendapatan dan pemakaian air calon pelanggan baru. Aplikasi yang dibangun akan memberikan rekomendasi pengevaluasian potensi pendapatan dan pemakaian air calon pelanggan baru PDAM disesuaikan dengan kriteria pemakaian air pelanggan baru yang telah ditentukan oleh PDAM. Pada penelitian ini menggunakan metode K-Means dengan beberapa tahapan yaitu tahap pertama menentukan jumlah cluster (k) pada data set. Tahap kedua menentukan nilai pusat (centroid). Tahap ketiga pada masing-masing record, hitung jarak terdekat dengan centroid. Tahap keempat mengelompokan objek berdasarkan jarak ke centroid terdekat. Tahap kelima mengulangi langkah ke-2, lakukan iterasi hingga centroid bernilai optimal. Adapun hasil uji coba menunjukkan bahwa penerapan data mining pemakaian air pelanggan dengan algoritma ini memiliki penilaian fungsi-fungsi yang ada pada sistem ini yaitu 95,80% sistem dapat berjalan. Kata Kunci: kriteria, data mining, K-Means 1. PENDAHULUAN 1.1 Pendahuluan PDAM (Perusahaan Daerah Air Minum) Tirta Raharja merupakan satu-satunya Badan Usaha Milik Daerah (BUMD) yang mempunyai tugas memberikan pelayanan air bersih untuk masyarakat Kota Cimahi. Pada saat ini PDAM Tirta Raharja terbagi dalam 5 cabang dan 20 kota pelayanan yang tersebar di Kabupaten Bandung Barat, Kota Cimahi dan Kabupaten Bandung. Saat ini PDAM kota Cimahi mampu melayani kurang lebih 60% dari seluruh penduduk kota Cimahi, sedangkan target pelayanan air bersih untuk skala kota besar adalah 80%. Hal ini terjadi karena kebutuhan air bersih dari tahun ke tahun selalu meningkat akibat dari penambahan jumlah penduduk, kemajuan teknologi serta peningkatan ekonomi masyarakat sedangkan debit air baku yang diolah PDAM selalu tetap. PDAM sebagai sebuah perusahaan memiliki kewajiban untuk meningkatkan keuntungan. Salah satu cara dalam meningkatkan keuntungan tersebut adalah dengan cara mendapatkan pelanggan baru yang berpotensi besar. Kriteria pelanggan baru yang berbeda-beda sehingga perlu dilakukan klasifikasi data pelanggan berdasarkan tingkat kelayakan yaitu sangat tinggi, tinggi, normal, rendah, dan sangat rendah. Algoritma K-Means merupakan salah satu algoritma/metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Beberapa penelitian telah melakukan algoritma K-Means sebagai teknik clustering untuk mengelompokkan data nonhierarki (sekatan) yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok sehingga data berkarakteristik sama dimasukkan ke dalam satu kelompok yang sama dan data yang berkarakteristik berbeda dikelompokkan kedalam kelompok yang lain[1]. Sementara penelitian lain menggunakan Data Mining dengan algoritma K-Means yang penerapannya dapat membantu untuk menganalisa data yang diperoleh dari transaksi[3]. Penelitian yang dilakukan yaitu membuat sistem yang dapat mengelompokkan dan memprediksi pendapatan calon pelanggan baru berdasarkan potensi pemakaian air menggunakan algoritma K-Means. 1.2 Landasan Teori Data Mining Data Mining merupakan proses ekstraksi data menjadi informasi yang sebelumnya belum tersampaikan, dengan teknik yang tepat proses data mining akan memberikan hasil yang optimal. Data mining lebih tepat disebut sebagai penambangan pengetahuan dari data, langkah-langkah penting dalam proses penambangan pengetahuan dari data secara umum sebagai berikut : 498

2 1. Pembersihan data (data cleaning), yaitu proses menghapus data pengganggu (noise) yang dikatakan tidak konsisten atau tidak diperlukan. 2. Integrasi data (data integration), yaitu menggabungkan berbagai sumber data. 3. Pemilihan data (data selection), yaitu memilih data yang dipilih sesuai kebutuhan analisis. 4. Transformasi data (data transformation), yaitu proses transformasi data ke dalam format untuk diproses dan siap ditambang. 5. Penggalian data (data mining), yaitu menerapkan metode kecerdasan untuk ekstraksi pola. 6. Evaluasi pola (pattern evaluation), yaitu mengidentifikasi pola-pola yang menarik yang merepresentasikan pengetahuan. 7. Penyajian pola (knowledge presentation), yaitu teknik untuk memvisualisasikan pola pengetahuan ke pengguna. Data mining membantu perusahaan atau organisasi untuk mendapatkan pola dari data-data yang tersimpan di dalam basis data perusahaan. Pengetahuan yang diperoleh tersebut akan menjadi pedoman dalam mengambil tindakan-tindakan bisnis sebagai upaya pemeliharaan dan peningkatan tingkat kompetitif bisnis perusahaan. Walaupun sudah banyak perangkat lunak yang menawarkan kemampuan dalam proses data mining, keterlibatan manusia sangat dibutuhkan dalam setiap fase proses data mining itu sendiri. Pemahaman terhadap model statistik dan matematik yang digunakan dalam perangkat lunak sangat dituntut. Data mining adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu lain, seperti database sistem, data warehousing, statistik, machine learning, information retrieval, dan komputasi tingkat tinggi. Selain itu, data mining didukung oleh ilmu lain seperti neural network, pengenalan pola, spatial data analysis, image database, signal processing. Data mining didefinisikan sebagai proses menemukan pola-pola dalam data. Proses ini otomatis atau seringnya semiotomatis. Pola yang ditemukan harus penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan secara ekonomi. Data yang dibutuhkan dalam jumlah besar. Karakteristik data mining adalah sebagai berikut: 1. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya. 2. Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya. 3. Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi. Berdasarkan beberapa pengertian tersebut dapat ditarik kesimpulan bahwa data mining adalah suatu teknik menggali informasi berharga yang terpendam atau tersembunyi pada suatu koleksi data (database) yang sangat besar sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak diketahui. Kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu data mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistic dan database Clustering Clustering termasuk ke dalam descriptive methods, dan juga termasuk unsupervised learning dimana tidak ada pendefinisian kelas objek sebelumnya. Sehingga clustering dapat digunakan untuk menentukan label kelas bagi data-data yang belum diketahui kelasnya. Konsep dasar dari clustering adalah mengelompokkan sejumlah objek ke dalam cluster dimana cluster yang baik adalah cluster yang memiliki tingkat kesamaan yang tinggi antar objek di dalam suatu cluster dan tingkat ketidaksamaan yang tinggi dengan objek cluster yang lainnya. Terdapat banyak algoritma clustering yang dalam penggunaannya tergantung pada tipe data yang akan dikelompokkan dan apa tujuan dari pembuatan aplikasinya. Algoritma tersebut dapat digunakan untuk mengelompokkan objek ke dalam cluster-cluster, kemudian dari hasil clustering akan dideteksi keberadaan outlier dalam data tersebut. Sedangkan data yang digunakan bertipe data numeric. Algoritma clustering diklasifikasikan ke dalam 5 kategori, yaitu : 1. Partitioning methods Pengelompokkan objek dimana tiap objek dimiliki oleh 1 cluster. Algoritma partisi dapat meminimalkan mean kuadrat jarak dari setiap titik data ke pusat terdekatnya[4]. Yang termasuk ke dalam metode ini adalah algoritma k-means, k-medoid atau PAM, CLARA, dan CLARANS. PAM 2. Hierarchical methods Pengelompokkan objek dapat dilakukan dengan 2 cara, agglomerative yang dimulai dengan menggabungkan beberapa cluster hingga menjadi satu, atau divisive yang dimulai dengan cluster yang sama kemudian dipecah menjadi beberapa cluster yang lebih kecil. Yang termasuk ke dalam metode ini adalah algoritma CURE, BIRCH, dan Chameleon. 3. Density-based methods Pengelompokkan objek berdasarkan tingkat kerapatan objek atau densitas. Yang termasuk dalam metode ini adalah algoritma DBSCAN, DENCLUE, dan OPTICS. 4. Grid-based methods Pengelompokkan objek dengan menggunakan struktur data grid multiresolusi yang mampu 499

3 menangani data berdimensi tinggi. Yang termasuk dalam metode ini adalah algoritma CLIQUE, WaveCluster, dan STING. 5. Model-based methods Pengelompokkan objek dengan memodelkan tiap cluster, dan mencoba mengoptimasikan kesesuaian data dengan model matematika. Yang termasuk ke dalam metode ini adalah algoritma COBWEB Preprocessing Dataset Preprocessing merupakan salah satu tahapan awal dalam data mining, yang terdiri dari proses pembersihan data, transformasi data, dan reduksi data. Tujuan dari preprocessing adalah agar data yang digunakan untuk aplikasi data mining mudah diinterpretasikan untuk dianalisis. Selain itu, agar data yang digunakan sesuai dengan aplikasi yang dibangun sehingga hasil yang dikeluarkan juga sesuai dan optimal. Dalam penelitian terdahulu preprocessing digunakan untuk menghilangkan noise yang sangat tinggi[9] Algoritma K-Means Metode K-Means adalah Metode clustering berbasis jarak yang membagi data kedalam cluster dan algoritma ini bekerja pada atribut numerik. Metode K-Means termasuk dalam partitioning clustering yang memisahkan data ke k daerah bagian yang terpisah[2]. Metode K-Means sangat terkenal karena kemudahan dan kemampuannya untuk mengelompokkan data besar dan outlier dengan sangat cepat. Dalam metode K-Means setiap data harus termasuk ke cluster tertentu pada suatu tahapan proses, pada tahapan proses berikutnya dapat berpindah ke cluster yang lain[3]. Berikut ini adalah langkah-langkah dalam algoritma K-means[1] : 1. Tentukan jumlah cluster (k) pada data set 2. Tentukan nilai pusat (centroid) Penentuan nilai centroid pada tahap awal dilakukan secara random dengan rumus menentukan target awal k-means, rumus tersebut digunakan untuk mendapatkan target data atau jarak antara kelompok, yaitu titik pusat awal untuk menghitung algoritma k-means iterasi 0 seperti pada persamaan 2.1 berikut ini: (2.1) Keterangan: Jumlah data = Jumlah data yang akan digunakan Jumlah class = Jumlah kelompok yang telah ditentukan sebelumnya seperti sangat tinggi, tinggi, normal, rendah, sangat rendah. sedangkan pada tahap iterasi digunakan rumus rata-rata, pada rumus tersebut dilakukan perhitungan untuk mencari nilai rata-rata seperti pada persamaan 2.2 berikut ini: (2.2) Keterangan: Vij = centroid rata-rata cluster ke-i untuk variabel ke-j Ni = jumlah anggota cluster ke-i i, k = indeks dari cluster j = indeks dari variabel Xkj = nilai data ke-k variabel ke-j dalam cluster tersebut 3. Pada masing-masing record, hitung jarak terdekat dengan centroid Jarak centroid yang digunakan adalah Euclidean Distance, dengan rumus seperti pada persamaan 2.3: (2.3) Keterangan: De = Euclidean Distance i = banyaknya objek (x, y) = koordinat objek (s, t) = koordinat centroid 4. Kelompokkan objek berdasarkan jarak ke centroid terdekat 5. Ulangi langkah ke-2, lakukan iterasi hingga centroid bernilai optimal K-Nearest Neighbor Algoritma k-nearest neighbor (k-nn atau KNN) adalah sebuah metode yang berfungsi untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut dan menguji data pelanggan baru berdasarkan perhitungan jarak minimum cluster terdekat. K-Nearest Neighbor berdasarkan konsep learning by analogy. Data learning dideskripsikan dengan atribut numerik n-dimensi. Tiap data learning merepresentasikan sebuah titik, yang ditandai dengan c, dalam ruang n-dimensi. Jika sebuah data query yang labelnya tidak diketahui diinputkan, maka K-Nearest Neighbor akan mencari k buah data learning yang jaraknya paling dekat dengan data query dalam ruang n-dimensi. Jarak antara data query dengan data learning dihitung dengan cara mengukur jarak antara titik yang merepresentasikan data query dengan semua titik yang merepresentasikan data learning dengan rumus Euclidean Distance. Pada fase training, algoritma ini hanya melakukan penyimpanan vektor-vektor fitur dan klasifikasi data training sample. Pada fase 500

4 klasifikasi, fitur fitur yang sama dihitung untuk testing data (klasifikasinya belum diketahui). Jarak dari vektor yang baru ini terhadap seluruh vektor training sample dihitung, dan sejumlah k buah yang paling dekat diambil. Titik yang baru klasifikasinya diprediksikan termasuk pada klasifikasi terbanyak dari titik titik tersebut. Nilai k yang terbaik untuk algoritma ini tergantung pada data; secara umumnya, nilai k yang tinggi akan mengurangi efek noise pada klasifikasi, tetapi membuat batasan antara setiap klasifikasi menjadi lebih kabur. Nilai k yang bagus dapat dipilih dengan optimasi parameter, misalnya dengan menggunakan cross-validation. Kasus khusus di mana klasifikasi diprediksikan berdasarkan data pembelajaran yang paling dekat (dengan kata lain, k = 1) disebut algoritma nearest neighbor. Ketepatan algoritma k-nn ini sangat dipengaruhi oleh ada atau tidaknya fitur-fitur yang tidak relevan, atau jika bobot fitur tersebut tidak setara dengan relevansinya terhadap klasifikasi. Riset terhadap algoritma ini sebagian besar membahas bagaimana memilih dan memberi bobot terhadap fitur, agar performa klasifikasi menjadi lebih baik. K buah data learning terdekat akan melakukan voting untuk menentukan label mayoritas. Label data query akan ditentukan berdasarkan label mayoritas dan jika ada lebih dari satu label mayoritas maka label data query dapat dipilih secara acak di antara label-label mayoritas yang ada. Gambar di bawah ini menunjukkan flowchart dari algoritma K-Nearest Neighbor. START Tentukan jumlah tetangga terdekat Hitung jarak uji terhadap data latih Urutkan data berdasarkan jarak euclidean terkecil Tentukan kelompok data uji berdasarkan label mayoritas pada centroid END 2. PEMBAHASAN DAN HASIL 2.1 Rancangan Flowmap sistem yang berjalan Gambar 2 Flowmap sistem yang berjalan 2.2 Analisis Sistem Berjalan Analisis sistem berjalan pada Gambar 2 di atas menjelaskan alur kegiatan yang sedang berjalan di PDAM Tirta Raharja dalam melakukan prediksi pemakaian air pelanggan baru yang bertujuan untuk menentukan pengelompokkan data pemakaian air. Pertama, admin mencatat data pemakaian air mulai dari pemakaian air tahun 2014 sampai tahun 2015, catatan data tersebut didapat dari data pemakaian air pelanggan lama yang telah dikumpulkan kepada admin. Setelah melakukan pencatatan data pemakaian air, admin melakukan pengumpulan dokumen pemakaian air dalam bentuk laporan pemakaian air. Setelah adanya rekap pemakaian air, admin melakukan prediksi pemakaian air tujuh bulan yang akan datang dengan melakukan perhitungan dengan memanfaatkan laporan pemakaian air bulan sebelumnya. Setelah melakukan prediksi pemakaian air untuk tujuh bulan yang akan datang, sistem menghasilkan laporan hasil prediksi yang dapat diakses oleh Admin PDAM Tirta Raharja. 501

5 2.3 Rancangan Gambaran umum sistem Gambar 3 Gambaran umum sistem 2.4 Proses Data Mining 1. Pembersihan data Pembersihan data yaitu membersihkan atau membuang data-data yang tidak penting/tidak relevan, seperti data-data pemakaian air yang bernilai kosong atau nol (0) atau minus (-). 2. Seleksi data/pemilihan data Seleksi data/pemilihan data yaitu dari data pemakaian dengan total data hanya diambil 20%-nya saja jadi data. Jadi sekarang yang dipilih hanya data saja. 3. Penggalian data (data mining) Dari data tersebut dikelompokkan pemakaian airnya berupa range-range distribusi normal ke dalam 5 cluster yaitu sangat tinggi, tinggi, normal, rendah, sangat rendah. Cari centroidnya dari kelima cluster di atas menggunakan metode K- means dengan 2 parameter/atribut yaitu pekerjaan dan jumlah penghuni tetap. Kemudian hasil centroid disimpan di dalam database. Lalu pada proses pengujian : Di data uji, data pelanggan baru dibandingkan dengan jarak terdekat terhadap 5 cluster dari hasil centroid yang disimpan dalam database. Dihitung jarak terdekatnya dengan metode KNN (K- Nearest Neighbors). 2.5 Proses Input Data Calon Pelanggan Baru dan Data Latih yaitu Data Pelanggan Lama Tahap pertama yaitu mengumpulkan datadata calon pelanggan baru dan data latih yaitu data pelanggan lama yang didapat dari PDAM Tirta Raharja. Isi dari data calon pelanggan baru yaitu berupa daftar nama-nama, pekerjaan pelanggan di PDAM Tirta Raharja, status rumah, dan jumlah penghuni tetap, data latih yaitu berupa data pelanggan lama. Data-data tersebut akan menjadi nilai masukan pada sistem dan dijadikan sebagai acuan untuk melakukan prediksi pemakaian air yang bertujuan untuk menentukan pemakaian air pelanggan baru di masa yang akan datang. Sebelum masuk pada setiap tahapan yang ada pada proses, data tersebut akan melalui tahapan proses data mining dan tahapan pre-processing yang didalamnya terdapat data cleaning yang bertujuan untuk menghilangkan noise data yang tidak konsisten. Selanjutnya yaitu masuk pada tahapan data selection yang bertujuan dimana data yang relevan dengan tugas analisis dikembalikan ke dalam database. Selanjutnya masuk pada tahapan data transformation dimana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi. 2.6 Proses Distribusi Normal Pemakaian Air Proses distribusi normal yang dilakukan pada penelitian ini yaitu dengan mengelompokkan data pemakaian air pelanggan lama, yang bertujuan untuk membagi nilai pemakaian air di tiap clusternya berdasarkan range pemakaian air yang telah ditentukan. Proses ini dilakukan masih secara konvensional. Sebelum data pemakaian air pelanggan dibentuk ke dalam distribusi normal, dibutuhkan sebuah data sample agar proses perhitungan yang dibutuhkan dapat dijalankan. Data sample yang akan digunakan yaitu data pelanggan di PDAM Tirta Raharja pada tahun 2014 dan menggunakan 50 data sample pelanggan lama (data latih) seperti yang ada pada Tabel

6 Tabel 1 Data Sample Pelanggan Lama Tahun 2014 (Data Latih) Tabel 2 Range Pemakaian Air Pelanggan PDAM Berdasarkan range yang telah ditentukan maka dapat disimpulkan bahwa setiap pelanggan lama yang merupakan data latih telah diketahui kelompok potensi pemakaian airnya seperti yang dapat dilihat pada Tabel 3. Tabel 3 Pengelompokkan Potensi Pemakaian Air Pelanggan Lama PDAM Tabel 1 Data Sample Pelanggan Lama Tahun 2014 (Data Latih) (Lanjutan) Data sample Pelanggan Lama Tahun 2014 (Data Latih) pada tabel 1 merupakan contoh data yang akan digunakan untuk melakukan distribusi normal terhadap pemakaian air. Tahap selanjutnya adalah menentukan range pemakaian air untuk pembagian distribusi normal yang ditunjukkan pada Tabel 2. Tabel 3 Pengelompokkan Potensi Pemakaian Air Pelanggan Lama PDAM (Lanjutan) 503

7 2.7 K-Means Clustering Pada tahapan ini yaitu menentukan centroid K- means dari data pelanggan lama tahun 2014, menentukan target K-means bertujuan untuk mendapatkan target data atau jarak antar class (kelompok) yaitu titik pusat kelompok awal untuk menghitung algoritma K-means. Tabel 4 sampai dengan Tabel 8 merupakan hasil perhitungan k-means pada data sample pelanggan lama tahun 2014 (data latih) yang berasal dari pembagian distribusi. Tabel 4 Target K-means Data Sample Pelanggan Lama Tahun 2014 (Data Latih) pada C1 Tabel 7 Target K-means Data Sample Pelanggan Lama Tahun 2014 (Data Latih) pada C4 Tabel 8 Target K-means Data Sample Pelanggan Lama Tahun 2014 (Data Latih) pada C5 Tabel 5 Target K-means Data Sample Pelanggan Lama Tahun 2014 (Data Latih) pada C2 Dari 5 cluster tersebut didapatkan 5 centroid yang menjadi pusat pada masing-masing cluster. Tabel 9 menunjukkan hasil centroid yang dihitung dari rata-rata tiap cluster. Tabel 9 Hasil Centroid dari Tiap Cluster Tabel 6 Target K-means Data Sample Pelanggan Lama Tahun 2014 (Data Latih) pada C3 2.8 K-Nearest Neighbor Langkah selanjutnya adalah pengujian dengan KNN yaitu sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Pada penelitian ini terdiri dari 2 atribut dengan skala kuantitatif yaitu Xi dan Yi yang masing-masing merupakan jenis pekerjaan dan jumlah penghuni tetap dan akan diuji oleh pelanggan baru. Dari perhitungan terakhir yang ditunjukkan oleh Tabel 9 diperoleh masing-masing centroid pada setiap cluster. Jika hasil input data pelanggan baru menunjukkan (Xj,Yj) = (64,5) maka perhitungan untuk metode KNN ditunjukkan pada Tabel

8 Tabel 10 Hitung jarak Pelanggan Baru dengan Data Latih Gambar 6 Tampilan (screenshoot) Range Setting Setelah kudrat dengan data jarak diketahui hasil setiap jaraknya terhadap centroid, maka langkah selanjutnya adalah urutkan jarak tersebut dan tetapkan tetangga terdekat berdasarkan jarak minimum ke-centroid yang ditunjukkan pada Tabel 11. Tabel 11 Urutan Jarak Minimum Terhadap Centroid Gambar 7 Tampilan (screenshoot) Pelanggan Lama Berdasarkan Tabel 11, jarak data uji (64,5) yang terdekat adalah terhadap centroid cluster C1, maka dapat disimpulkan data uji (64,5) masuk ke dalam cluster C1, yaitu pelanggan baru yang memiliki potensi pemakaian air yang sangat rendah. Gambar 8 Tampilan (screenshoot) K-Means Clustering Berikut gambar tampilan (screenshoot) dari program klasifikasi potensi pemakaian air pelanggan baru: Gambar 9 Tampilan (screenshoot) Hasil Clustering Gambar 4 Tampilan (screenshoot) Utama Sistem Gambar 10 Tampilan (screenshoot) Cek Potensi Pelanggan Baru Gambar 5 Tampilan (screenshoot) Jenis Pekerjaan 3. KESIMPULAN 3.1 Kesimpulan Pada penelitian ini telah menghasilkan sebuah penerapan data mining pemakaian air pelanggan untuk menentukan klasifikasi potensi pemakaian air pelanggan baru di PDAM Tirta Raharja. Sistem ini dapat 505

9 mengelompokkan dan memprediksi potensi pendapatan dan pemakaian air untuk calon pelanggan baru PDAM ke dalam 5 cluster, yaitu sangat tinggi, tinggi, normal, rendah, dan sangat rendah sehingga dapat mempercepat kinerja yang dapat membantu PDAM untuk proses evaluasi dalam mengelompokkan dan memprediksi potensi pendapatan dan pemakaian air calon pelanggan baru PDAM (Perusahaan Daerah Air Minum) Tirta Raharja. Proses pada penerapan data mining ini menggunakan metode K-Means clustering untuk mengelompokkan potensi pendapatan dan pemakaian air. Sistem menghasilkan output berupa kelompok potensi pendapatan dan pemakaian air berdasarkan tingkat kelayakannya. Dengan melihat hasil pengujian yang telah dilakukan hasil penilaian terhadap sistem memiliki nilai 95,80% dari 100% nilai total bobot dari semua proses yang di uji. Semua fungsi pada sistem ini dapat berjalan dan sesuai dengan tujuan yang dicapai, sehingga dapat disimpulkan bahwa setiap proses atau fungsifungsi yang diuji memiliki nilai sesuai dengan apa yang diuji. Secara umum hal ini menunjukkan bahwa perangkat lunak ini dapat digunakan dan telah menunjukkan kualitas yang baik. 3.2 Saran Saran yang dikemukakan diharapkan dapat lebih meningkatkan hasil yang telah didapatkan. Saran yang disampaikan sebagai masukan untuk penelitian selanjutnya antara lain adalah : a. Menambah parameter lain dari potensi pemakaian air agar dapat menghasilkan informasi pendukung yang mampu membantu dalam evaluasi potensi pendapatan dan pemakaian air calon pelanggan baru tidak hanya dari proses prediksi saja. Parameter lain dapat berupa kelurahan, kecamatan, kode pos, dan lain-lain. b. Libatkan dinas terkait untuk membangun sistem agar dapat memberikan informasi yang mendukung sistem. 4. PUSTAKA [1] Khotimah, T. (2014). "Pengelompokan Surat dalam Al Qur an Menggunakan Algoritma K-Means". Jurnal SIMETRIS, Vol. 5 No. 1 April 2014 Universitas Muria Kudus. [2] Rismawan, T. Kusumadewi, S. (2008). "Aplikasi K-Means untuk Pengelompok Mahasiswa Berdasarkan Nilai Body Mass Index (BMI) & Ukuran Kerangka". Seminar Nasional Aplikasi Teknologi Informasi 2008 (SNATI 2008) Yogyakarta, 21 Juni 2008 FTI, UII. [3] Afrisawati. (2013). "Implementasi Data Mining Pemilihan Pelanggan Potensial Menggunakan Algoritma K-Means". Pelita Informatika Budi Darma, Volume: V, Nomor: 3, Desember 2013 STMIK Budi Darma Medan. [4] Ediyanto. Mara, MN. Satyahadewi, N. (2013). "Pengklasifikasian Karakteristik dengan Metode K-Means Cluster Analysis". Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 02, No. 2 (2013), hal [5] Septioko, T. Parhusip, HA. Mahatma, T. (2012). "Aplikasi K-Means untuk Pengelompokan Rumah Tangga di Salatiga Berdasarkan Data SUSENAS 2011". Proceeding for Call Paper PEKAN ILMIAH DOSEN FEB-UKSW, 14 DESEMBER 2012 FSM UKSW. [6] Narwati. (2010). "Pengelompokan Mahasiswa Menggunakan Algoritma K-Means". Jurnal Dinamika Informatika Vol. 2, No. 2, 2010 Fakultas Teknologi Informasi. [7] Gosno, EB. Arieshanti, I. Soelaiman, R. (2013). "Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen". JURNAL TEKNIK POMITS Vol. 2, No. 2, (2013) Institut Teknologi Sepuluh Nopember (ITS). [8] Andri. Paulus. Wong, NP. Gunawan, T. (2014). "Segmentasi Buah Menggunakan Metode K-Means Clustering dan Identifikasi Kematangannya Menggunakan Metode Perbandingan Kadar Warna". JSM STMIK Mikroskil VOL 15, NO 2, OKTOBER 2014 STMIK Mikroskil. [9] Tahta Alfina, Budi Santosa, dan Ali Ridho Barakbah. "Analisa Perbandingan Metode Hierarchical Clustering, K- Means dan Gabungan Keduanya dalam Membentuk Cluster Data (Studi Kasus : Problem Kerja Praktek Jurusan Teknik Industri ITS)". Jurnal Teknik Pomits Vol.1, No.1, September 2012, ISSN : BIODATA PENULIS 1. Gunawan Abdillah Dosen Jurusan Informatika FMIPA Unjani 2. Firman Ananda Putra Alumni Jurusan Informatika FMIPA Unjani 3. Faiza Renaldi Dosen Jurusan Informatika FMIPA Unjani 506

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI)

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI) K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI) Disusun Oleh : Alfian Sukma 081116007 Dian Ramadhan 081211631003 Bagus Puji Santoso 081211631061 Tiara Ratna Sari 081211632014 Ni

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering

Lebih terperinci

Penerapan Data Mining Untuk Pengelompokan Wahana Terfavorit Pada CV. Hairos Indah Menggunakan Metode K- Means

Penerapan Data Mining Untuk Pengelompokan Wahana Terfavorit Pada CV. Hairos Indah Menggunakan Metode K- Means Sains dan Komputer (SAINTIKOM) Vol.17, No.1, Februari 2018, pp. 92-104 ISSN: 1978-6603 92 Penerapan Data Mining Untuk Pengelompokan Wahana Terfavorit Pada CV. Hairos Indah Menggunakan Metode K- Means Zulham

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA 1 Yulison Herry Chrisnanto, 2 Gunawan Abdillah 1,2 Jurusan Informatika Fakultas

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET

PENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET PENERAPAN ALGORITMA K-MEANS UNTUK MENETAPKAN KELOMPOK MUTU KARET Handi Kurniawan Sohdianata 1, Sushermanto 2 Jurusan Teknik Informatika STMIK Banjarbaru 1, Jurusan Sistem Informasi STMIK Banjarbaru 2 Jl.

Lebih terperinci

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Data mining adalah salah satu teknik dan proses untuk menemukan suatu pola dan pengetahuan dari data yang berjumlah besar (Han dkk., 2011). Proses yang dilakukan

Lebih terperinci

ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO

ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO Olha Musa 1 dan Alang 2 1 0lh4mu54@gmail.com, 2 virus.stimik@gmail.com 12 STMIK Ichsan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS 1 KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS (Study Kasus : Tim Hockey Kabupaten Kendal) Alith Fajar Muhammad Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula No. 5-11 Semarang-50131

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan mahasiswa berdasarkan status gizi Body Mass Index (BMI) dan ukuran kerangka.

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama pembuatan penelitian tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat

Lebih terperinci

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra

Lebih terperinci

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga BAB I PENDAHULUAN I.1. Latar Belakang Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga informasi akan menjadi

Lebih terperinci

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci

APLIKASI K-MEANS UNTUK PENGELOMPOKKAN MAHASISWA BERDASARKAN NILAI BODY MASS INDEX (BMI) & UKURAN KERANGKA

APLIKASI K-MEANS UNTUK PENGELOMPOKKAN MAHASISWA BERDASARKAN NILAI BODY MASS INDEX (BMI) & UKURAN KERANGKA APLIKASI K-MEANS UNTUK PENGELOMPOKKAN MAHASISWA BERDASARKAN NILAI BODY MASS INDEX (BMI) & UKURAN KERANGKA Tedy Rismawan 1 dan Sri Kusumadewi 2 1 Laboratorium Komputasi dan Sistem Cerdas, Jurusan Teknik

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 9 NO. 1 April 2016

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 9 NO. 1 April 2016 ANALISA DAN PENERAPAN DATA MINING UNTUK MENENTUKAN KUBIKASI AIR TERJUAL BERDASARKAN PENGELOMPOKAN PELANGGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING Sri Tria Siska 1 ABSTRACT This study aims to determine

Lebih terperinci

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA Domma Lingga Mahasiswa Program Studi Teknik Informatika STMIK Budidarma Medan Jl. Sisingamangaraja

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 ANALISA PERBANDINGAN METODE HIERARCHICAL CLUSTERING, K-MEANS DAN GABUNGAN KEDUANYA DALAM MEMBENTUK CLUSTER DATA (STUDI KASUS : PROBLEM KERJA PRAKTEK JURUSAN

Lebih terperinci

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung

Lebih terperinci

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS

PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Jurnal Ilmiah ILKOM Volume 8 mor (Agustus 16) ISSN: 87-1716 PENGELOMPOKAN MINAT BACA MAHASISWA MENGGUNAKAN METODE K-MEANS Widya Safira Azis 1 dan Dedy Atmajaya 1 safiraazis18@gmail.com dan dedy.atmajaya@umi.ac.id

Lebih terperinci

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita Anggraeni, Ragil Saputra, Beta Noranita APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita

Lebih terperinci

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN)

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) Fitri Yunita Fakultas Teknik dan Ilmu Komputer, Universitas Islam Indragiri Email:Fitriyun@gmail.com Abstrak Diabetes

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan analisa datadan algoritma Fuzzy C-Means untuk mangetahui pola perilaku konsumen. 2.1. Pola

Lebih terperinci

DATA MINING DENGAN TEKNIK CLUSTERING UNTUK MENGGALI INFORMASI TENTANG BIMBINGAN KONSELING SISWA (STUDI KASUS : SMA NEGERI 1 X KOTO SINGKARAK)

DATA MINING DENGAN TEKNIK CLUSTERING UNTUK MENGGALI INFORMASI TENTANG BIMBINGAN KONSELING SISWA (STUDI KASUS : SMA NEGERI 1 X KOTO SINGKARAK) Jurnal Ilmiah Fakultas Teknik LIMIT S Vol.13 No 1 Maret 2017 38 DATA MINING DENGAN TEKNIK CLUSTERING UNTUK MENGGALI INFORMASI TENTANG BIMBINGAN KONSELING SISWA (STUDI KASUS : SMA NEGERI 1 X KOTO SINGKARAK)

Lebih terperinci

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author) TEKNOSI, Vol. 02, No. 03, Desember 2016 31 PENERAPAN DATA MINING DALAM MENINGKATKAN MUTU PEMBELAJARAN PADA INSTANSI PERGURUAN TINGGI MENGGUNAKAN METODE K-MEANS CLUSTERING (STUDI KASUS DI PROGRAM STUDI

Lebih terperinci

Pengenalan Pola. K-Means Clustering

Pengenalan Pola. K-Means Clustering Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan

Lebih terperinci

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Konsep Pemasaran Dalam merancang dan mengembangkan produk, baik yang berupa jasa maupun barang, tidak terlepas dari konsep pemasaran yang bertujuan memenuhi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan

Lebih terperinci

TEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel )

TEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel ) TEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel ) Ahlihi Masruro 1) 1) Teknik Informatika STMIK AMIKOM Yogyakarta Jl. Ring Road Utara Condong Catur

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian Penerapan Data Mining dengan Menggunakan Metode Clustering K-Mean Untuk Mengukur Tingkat Ketepatan Kelulusan Mahasiswa Program Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang

Lebih terperinci

SISTEM PENENTUAN PEMASANGAN SALURAN AIR PDAM KOTA CIMAHI DENGAN MENGGUNAKAN CBR DAN ALGORITMA NEAREST NEIGHBORS

SISTEM PENENTUAN PEMASANGAN SALURAN AIR PDAM KOTA CIMAHI DENGAN MENGGUNAKAN CBR DAN ALGORITMA NEAREST NEIGHBORS SISTEM PENENTUAN PEMASANGAN SALURAN AIR PDAM KOTA CIMAHI DENGAN MENGGUNAKAN CBR DAN ALGORITMA NEAREST NEIGHBORS ABSTRAKS Feri Frasetiyono 1, Gunawan Abdillah 2, Asep Id Hadiana 3 Program Studi Informatika,

Lebih terperinci

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) 157 Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) Elly Muningsih AMIK BSI Yogyakarta E-Mail : elly.emh@bsi.ac.id Abstrak Berkembangnya

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

PENGELOMPOKAN KOLEKSI BUKU PERPUSTAKAAN BERDASARKAN LAMA PEMINJAMAN BUKU MENGGUNAKAN K-MEANS

PENGELOMPOKAN KOLEKSI BUKU PERPUSTAKAAN BERDASARKAN LAMA PEMINJAMAN BUKU MENGGUNAKAN K-MEANS PENGELOMPOKAN KOLEKSI BUKU PERPUSTAKAAN BERDASARKAN LAMA PEMINJAMAN BUKU MENGGUNAKAN K-MEANS SKRIPSI Diajukan untuk memenuhi salah satu syarat guna memperoleh gelar Sarjana Komputer (S.Kom.) Pada Program

Lebih terperinci

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI PENGGUNAAN PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI Entin Martiana S.Kom,M.Kom, Nur Rosyid Mubtada i S. Kom, Edi Purnomo Jurusan Teknik Informatika

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA Diajeng Tyas Purwa Hapsari Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email :

Lebih terperinci

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING Marlindawati1), Andri2) 1), 2) Sistem Informasi UNIVERSITAS BINA DARMA Palembang Jl, Jend. A.Yani

Lebih terperinci

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN) Klasifikasi Helpdesk Universitas Jenderal Achmad ni... (Herawan dkk.) KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST

Lebih terperinci

PENERAPAN DATA MINING DALAM PEMILIHAN PENERIMA BEASISWA BERPRESTASI DI POLITEKNIK DAN STMIK LPKIA DENGAN MENERAPKAN METODE K-MEANS CLUSTERING

PENERAPAN DATA MINING DALAM PEMILIHAN PENERIMA BEASISWA BERPRESTASI DI POLITEKNIK DAN STMIK LPKIA DENGAN MENERAPKAN METODE K-MEANS CLUSTERING PENERAPAN DATA MINING DALAM PEMILIHAN PENERIMA BEASISWA BERPRESTASI DI POLITEKNIK DAN STMIK LPKIA DENGAN MENERAPKAN METODE K-MEANS CLUSTERING 1 Wahyu Nurjaya W.K, 2 Nurjaman 1 Program Studi Sistem Informasi

Lebih terperinci

PERANCANGAN APLIKASI MENENTUKAN BERAT BADAN IDEAL DENGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING

PERANCANGAN APLIKASI MENENTUKAN BERAT BADAN IDEAL DENGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PERANCANGAN APLIKASI MENENTUKAN BERAT BADAN IDEAL DENGAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING Johan Candra Juliner Hutabarat Mahasiswa Program Studi Teknik Informatika STMIK Budi Darma Medan Jl. Sisingamangaraja

Lebih terperinci

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa

Lebih terperinci

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri

Lebih terperinci

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA

PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA Artikel Skripsi PENGKLASIFIKASIAN DATA SEKOLAH PENGGUNA INTERNET PENDIDIKAN MENGGUNAKAN TEKNIK CLUSTERING DENGAN ALGORITMA K-MEANS STUDI KASUS PT TELKOM SURABAYA SKRIPSI Diajukan Untuk Memenuhi Sebagian

Lebih terperinci

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK REKOMENDASI PEMILIHAN BIDANG KEAHLIAN PADA PROGRAM STUDI TEKNIK INFORMATIKA

METODE CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK REKOMENDASI PEMILIHAN BIDANG KEAHLIAN PADA PROGRAM STUDI TEKNIK INFORMATIKA 1 METODE CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK REKOMENDASI PEMILIHAN BIDANG KEAHLIAN PADA PROGRAM STUDI TEKNIK INFORMATIKA Muhammad Faisal Mirza A11.2009.04930 Program Studi Teknik Informatika

Lebih terperinci

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia Prosiding Statistika ISSN: 2460-6456 Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia Supiyah, 2 Aceng Komarudin Mutaqin, 3 Teti

Lebih terperinci

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki

Lebih terperinci

Prosiding SENATEK 2015 Fakultas Teknik, Universitas Muhammadiyah Purwokerto Purwokerto, 28 November 2015, ISBN

Prosiding SENATEK 2015 Fakultas Teknik, Universitas Muhammadiyah Purwokerto Purwokerto, 28 November 2015, ISBN SISTEM KLASTERISASI MENGGUNAKAN METODE K-MEANS DALAM MENENTUKAN POSISI ACCESS POINT BERDASARKAN POSISI PENGGUNA HOTSPOT DI UNIVERSITAS MUHAMMADIYAH PURWOKERTO Achmad Fauzan*, Abid Yanuar Badharudin, Feri

Lebih terperinci

DATA PREPROCESSING. Budi Susanto (versi 1.2)

DATA PREPROCESSING. Budi Susanto (versi 1.2) DATA PREPROCESSING Budi Susanto (versi 1.2) Kenali Data Anda Atribut Data Memahami tipe atribut Membantu membetulkan data saat integrasi data Deskripsi Statistik Data Memudahkan untuk mengisi nilai yang

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Tinjauan Studi Sebelum penelitian ini dilakukan, sudah terdapat beberapa penelitian yang menjadi dasar untuk menyelesaikan penelitian ini, penelitian tersebut diantaranya sebagai

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

PENGELOMPOKAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

PENGELOMPOKAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS PENGELOMPOKAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS Narwati Dosen Fakultas Teknologi Informasi Abtrack Makalah ini membahas pengelompokan mahasiswa berdasarkan data akademik menggunakan teknik clustering

Lebih terperinci

PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS Yulius Palumpun 1), Sitti Nur Alam 2) 1) Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Manajemen (FIKOM) - Universitas

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

IMPLEMENTASI SEGMENTASI CITRA DAN ALGORITMA LEARNING VECTOR QUANTIZATION (LVQ) DALAM PENGENALAN BENTUK BOTOL

IMPLEMENTASI SEGMENTASI CITRA DAN ALGORITMA LEARNING VECTOR QUANTIZATION (LVQ) DALAM PENGENALAN BENTUK BOTOL IMPLEMENTASI SEGMENTASI CITRA DAN ALGORITMA LEARNING VECTOR QUANTIZATION (LVQ) DALAM PENGENALAN BENTUK BOTOL Andri STMIK Mikroskil Jl. Thamrin No. 122, 124, 140 Medan 20212 andri@mikroskil.ac.id Abstrak

Lebih terperinci

PENERAPAN K-MEANS CLUSTERING PADA DATA PENERIMAAN MAHASISWA BARU (STUDI KASUS : UNIVERSITAS POTENSI UTAMA)

PENERAPAN K-MEANS CLUSTERING PADA DATA PENERIMAAN MAHASISWA BARU (STUDI KASUS : UNIVERSITAS POTENSI UTAMA) Seminar Nasional Teknologi Informasi dan Multimedia 5 ISSN : 3-385 STMIK AMIKOM Yogyakarta, 6-8 Februari 5 PENERAPAN K-MEANS CLUSTERING PADA DATA PENERIMAAN MAHASISWA BARU (STUDI KASUS : UNIVERSITAS POTENSI

Lebih terperinci

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING Marlindawati 1) Andri 2) 1) Manajemen Informatika Universitas Bina Darma Jl. Ahmad Yani No. 3, Palembang

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan

Lebih terperinci

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas 1. Memahami cakupan materi dan sistem perkuliahan Data Mining.

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI II-8 BAB II LANDASAN TEORI 2.1. Perencanaan Produksi Pengertian perencanaan produksi, menurut Martin K.Starr (1997) adalah sebagai berikut production planning is an old venerable term used by engineers,

Lebih terperinci

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS Muhammad Toha, 1), I Ketut Edy Purnama 2) dan Surya Sumpeno 3) 1) Bidang Keahlian Telematika (Konsentrasi CIO) Jurusan Teknik Elektro

Lebih terperinci

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP Page 87 Iin Parlina 1, Agus Perdana Windarto 2, Anjar Wanto 3, M.Ridwan Lubis

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id

Lebih terperinci

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521 JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: 2301-9271 A-521 Analisa Perbandingan Metode Hierarchical Clustering, K-means dan Gabungan Keduanya dalam Cluster Data (Studi kasus : Problem Kerja Praktek Jurusan

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan

Lebih terperinci

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

Apa itu is K-Nearest Neighbor (KNN) Algorithm? K-Nearest Neighbor Pendahuluan K-Nearest Neighbour atau KNN adalah salah dari algoritma instance based learning atau case-based reasoning. Definisi case based reasoning: KNN digunakan dalam banyak aplikasi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Customer Relationship Management (CRM) CRM adalah perpaduan antara teori, metode, teknik, kompetensi dan software enterprise untuk mengembangkan jangka panjang perusahaan dengan

Lebih terperinci

PRESENTASI TUGAS AKHIR KI091391

PRESENTASI TUGAS AKHIR KI091391 PRESENTASI TUGAS AKHIR KI091391 IMPLEMENTASI KD-TREE K-MEANS CLUSTERING PADA KLASTERISASI DOKUMEN (Kata kunci: KD-Tree K-Means Clustering, Klasterisasi Dokumen, K- Dimensional Tree, K-Means Clustering)

Lebih terperinci

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4

Lebih terperinci