BAB II KAJIAN PUSTAKA

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II KAJIAN PUSTAKA"

Transkripsi

1 BAB II KAJIAN PUSTAKA Sumber-sumber yang digunakan dalam pembuatan tugas akhir, baik yang diambil dari buku, internet, maupun jurnal diuraikan secara terperinci pada Bab Tinjuan Pustaka. Konsep dan definisi dari data mining serta hubungannya dengan customer relationship management melalui atribut recency, frequency dan monetary, penjelasan Metode K-Means dan Particle Swarm Optimization dijelaskan pula pada Bab ini. 2.1 State of the Art Penelitian mengenai data mining yang berhubungan dengan proses segmentasi pelanggan telah beberepa kali dilakukan. Penelitian segmentasi pelanggan menggunakan Metode Fuzzy C-Means dan Fuzzy Subtractive serta Model Fuzzy Recency Frequency Monetary (RFM) pada perusahaan retail diteliti oleh Yohana Nugraheni. Pada penelitian tersebut diungkapkan bahwa kekurangan dari Algoritma Fuzzy Subratctive, yaitu tidak dapat membentuk cluster yang tergolong dalam label superstar dan golden customer, sehingga dapat dikatakan Algoritma Fuzzy Subtractive Clustering kurang mendukung proses data mining pada perusahaan retail untuk mendapatkan konsumen potensial (Yohana Nugrahaeni 2011, h. 123). Penelitian sejenis juga dilakukan oleh Ni Putu Putri Yuliari dengan Metode Fuzzy C-Means dan Fuzzy RFM untuk segmentasi pelanggan pada perusahaan furniture. Pada penelitian tersebut diungkapkan bahwa Metode Fuzzy C-Means dapat menghasilkan cluster yang tergolong superstar dengan kombinasi Fuzzy RFM. (Putri Yuliari 2015, h. 107). Metode lain yang dapat digunakan untuk melakukan segmentasi pelanggan adalah Metode Density Based Spatial Clustering of Application with Noise (DBSCAN). Penelitian segmentasi pelanggan menggunakan Metode DBSCAN 6

2 7 pada perusahaan perhotelan dilakukan oleh Ni Made Anindya Santika Devi. Pada penelitian tersebut diungkapkan bahwa Metode DBSCAN yang digabungkan dengan Model RFM telah dapat menghasilkan proses segmentasi dengan cukup baik, dapat dilihat dari beragam kelas pelanggan yang dihasilkan (Anindya Santika Devi 2015, h. 114). Hasil serupa juga diperoleh melalui penelitian yang dilakukan oleh Luh Putu Dian Shavitri Handayani mengenai segmentasi pelanggan pada perusahaan retail dengan Metode ART 2 dan Model RFM. Algoritma ART 2 yang digabungkan dengan model RFM telah dapat melakukan proses segmentasi dengan cukup baik dapat dilihat dari beragam kelas pelanggan yang dihasilkan (Dian Shavitri Handayani 2012, h. 107). Segmentasi pelanggan pada pelanggan industri telekomunikasi dengan memanfaatkan Metode K-Means dan RFM diteliti oleh Arumawadu, Rathanyaka dan Illangarathne. Pada penelitian tersebut didapat kekurangan dari Metode K- Means dalam menentukan titik pusat cluster sehingga proses clustering menjadi lebih lambat (Arumawadu, Rathnayaka & Illangarathne, 2015, Vol. 3, hh ). Penelitian mengenai metode kombinasi yang sesuai untuk mengoptimasi Metode K-Means dilakukan oleh Chiu dan kawan-kawan. Metode Particle Swarm Optimization (PSO) diuji coba untuk mengoptimasi Metode K-Means. Pada hasil dari penelitian tersebut dinyatakan bahwa gabungan Metode K-Means dan PSO dapat menghasilkan cluster yang lebih akurat dan efisien (Chiu et al. 2011, vol. 36, hh ). Kinerja PSO dalam mengoptimalkan Metode K-Means juga diteliti oleh G. Komarasamy dan Amitabh Wahi. Dibuktikan pada penelitian tesebut bahwa kelemahan PSO yang cenderung bekerja secara lambat dalam proses menentukan nilai global optimum dapat diimbangi oleh Metode K-Means yang bekerja secara cepat dalam menentukan nilai optimum. Kombinasi kedua algoritma tersebut dapat melengkapi kekurangan satu sama lain terbukti dengan hasil clustering yang lebih baik telah dihasilkan dibandingkan dengan hasil clustering Metode K-Means standar. Nilai titik cluster dapat ditemukan secara otomatis dengan menggunakan

3 8 nilai optimal number dari setiap cluster (Komarasamy & Wahi 2011, vol 1, hh ). Penelitian mengenai Konsep CRM (Customer Relationship Management) dilakukan oleh Injazz J. Chen dan Karen Popovich. Pada penelitian tersebut diuraikan konsep CRM yang merupakan kombinasi antar manusia, proses dan teknologi. Konsep CRM dapat digunakan untuk memahami karakteristik pelanggan suatu perusahaan melalui pendekatan yang terintegrasi untuk memanajemen hubungan dengan pelanggan (Chen & Popovich 2003, vol. 9, hh ). Berikut ini adalah daftar penelitian mengenai data mining yang berkaitan dengan segmentasi pelanggan disajikan dalam Tabel 2.1 Tabel 2.1 Daftar State of the Art No. Penelitian Metode Deskripsi 1. Yohana Fuzzy C-Means Metode Fuzzy C-Means dan Fuzzy Nugrahaeni dan Fuzzy Subtractive digunakan untuk (2011) Subtractive segmentasi pelanggan pada 2. Ni Putu Yuliari (2015) 3. Ni Made Anindya Santika Devi (2015) 4. Luh Putu Dian Shavitri Handayani (2012) 5. Arumawadu, Rathanyaka & Illangarathne Fuzzy C-Means dan Fuzzy RFM DBSCAN dan Model RFM ART 2 dan Model RFM (2015) 6. Chiu et all (2009) K-Means dan PSO perusahaan retail Segmentasi pelanggan pada perusahaan furniture dilakukan dengan Metode Fuzzy C-Means dan Fuzzy Recency Frequency Monetary (Fuzzy RFM) Penelitian segmentasi pelanggan dilakukan dengan Metode DBSCAN pada perusahaan perhotelan Segmentasi pelanggan pada perusahaan retail dengan Metode ART 2 dan Model RFM K-Means Proses segmentasi pelanggan pada industry telekomunikasi dengan Metode K-Means dan RFM. Menguji metode PSO untuk dikombinasikan dengan K-Means.

4 9 No. Penelitian Metode Deskripsi 6. G. Komarasamy K-Means dan dan Amitabh PSO Wahi (2011) Means 7. Injazz J. Chen Customer dan Karen Relationship Popovich (2003) Management Menguji kinerja PSO dalam mengoptimalkan Metode K- Menguraikan konsep CRM untuk data mining State of the art diatas menguraikan bahwa belum ada penelitian mengenai segmentasi pelanggan dengan Metode K-Means dan PSO serta Model RFM yang digunakan untuk melakukan segmentasi pelanggan pada perusahaan distributor produk farmasi yang mengambil studi kasus di PT. X. State of the art dari judul tugas akhir ini dapat divisualisasikan pada diagram fishbone yang ditunjukkan Gambar 2.1 Gambar 2.1 Diagram Fishbone Pada Gambar 2.1, dapat dijelaskan bahwa judul tugas akhir ini mengambil konsep data mining terutama pada metode clustering data mining, sedangkan platform yang digunakan berbasis desktop. Tools yang digunakan adalah MATLAB dengan DBMS yang dipilih adalah SQL Server. Jenis metode clustering yang dipilih adalah Metode K-Means, dikombinasikan dengan salah satu jenis swarm intelligence yaitu Particle Swarm Optimization. Segmentasi pelanggan yang pernah dilakukan antara lain di bidang penjualan pakaian, pulsa, retail dan hotel, sedangkan segmentasi yang akan dilakukan adalah pada perusahaan distributor di bidang

5 10 produk farmasi. Metode validasi cluster yang akan digunakan adalah Metode Davies-bouldin Index dan Silhouette Index. Diagram fishbone menghasilkan kesimpulan bahwa penelitian mengenai segmentasi pelanggan menggunakan Metode K-Means dan Particle Swarm Optimization belum pernah dilakukan pada perusahaan distributor di bidang produk farmasi. 2.2 Data Mining Data dalam skala besar yang diekstrasi untuk mendapat pengetahuan dan informasi yang berguna disebut dengan data mining. Data Mining digunakan untuk menyelesaikan masalah dengan melakukan analisis pada data dalam jumlah besar. (Han and Kamber, 2006). Menurut Sumanthi dan Sivanandam (2006, hh. 1-20), penerapan data mining dapat dilakukan di berbagai bidang industri meliputi bidang keuangan, pelayanan kesehatan, manufaktur, transportasi dan lain sebagainya, juga telah menggunakan data mining untuk mengambil manfaat dari analisis historikal data. Istilah data mining dan knowledge discovery in databases (KDD) sering kali digunakan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis data yang besar. Salah satu tahapan dalam keseluruhan proses KDD adalah data mining. Proses KDD secara garis besar dapat dijelaskan sebagai berikut (Fayyad et al, 1996). Gambar 2.2 Proses KDD Sumber: Fayyad et al, 1996, h.5

6 11 Gambar 2.2 mengambarkan tahapan KDD. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup proses data selection yaitu pemilihan data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Proses cleaning yaitu proses cleaning pada data yang menjadi fokus KDD. Proses transformation yaitu transformasi pada data yang telah dipilih, sehingga data tersebut sesuai proses data mining. Proses data mining yaitu proses mencari pola atau informasi menarik dalam data terpilih menggunakan teknik atau metode tertentu. Terakhir, proses interpretation yaitu pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. 2.3 Hubungan Data Mining dalam Kerangka Kerja CRM CRM adalah strategi untuk membentuk, menata dan memperkuat loyalitas pelanggan. Kombinasi CRM dan data mining banyak digunakan perusahaanperusahaan untuk mengidentifikasi pelanggan potensial dengan menggunakan segmentasi pelanggan (Tsiptsis & Charianopoulus, 2009). Data mining dapat digunakan untuk menganalisis pelanggan potensial, teknik data mining yang sering digunakan untuk menganalisi pelanggan adalah clustering dan aturan asosiasi. Inti dari kombinasi antara data mining dalam kerangka kerja CRM adalah memanfaatkan data yang telah dimiliki suatu perusahaan agar berguna bagi masa depan perusahaan itu sendiri. Kombinasi ini dapat memperolah gambaran atas kebutuhan, selera dan pelayanan yang diinginkan oleh pelanggan (Ziafat, 2014, Vol. 4, h. 72). Implementasi data mining dalam kerangka CRM harus mengikuti skema Cross Industry Standard Process for Data Mining (CRIPS-DM) yang dapat dilihat pada Gambar 2.3.

7 12 Gambar 2.3 Skema CRIPS-DM Sumber: Ziafat, 2014, h.73 Tahapan dari skema CRIPS-DM antara lain sebagai berikut: 1. Business Understanding, sebuah projek data mining harus memahami proses bisnis secara subjektif, agar dapat mendefinisikan dan merencanakan projek yang akan dikembangkan. 2. Data Understanding, fase ini melibatkan data yang dibutuhkan untuk mengembangkan projek. Fase ini meliputi pengumpulan data dan analisis data untuk menemukan masalah potensial. 3. Data Preparation, fase ini mengidentifikasi data ke dalam model data mining. Fase ini meliputi integrasi data, transformasi format data ke bentuk yang dibutuhkan oleh projek serta proses cleaning data. 4. Modelling, pada fase ini, analis harus memilih model yang sesuai proses bisnis, dimana data akan diubah ke dalam bentuk model yang diinginkan dengan menggunakan algoritma untuk mencapai hasil terbaik. 5. Evaluation, model yang telah dihasilkan kemudian dievaluasi agar sesuai dengan bisnis proses perusahaan. 6. Deployment, merupakan proses final dimana model yang dihasilkan dapat diterapkan pada proses bisnis perusahaan.

8 Model RFM Menurut Shajahan (2004, hh ) Model Recency, Frequency dan Monetary adalah sebuah pemodelan bisnis yang dapat diaplikasikan di berbagai situasi yang dapat mengambarkan berbagai tindakan atau prilaku pelanggan dengan melakukan survei tertentu. Pelanggan yang melakukan transaksi pada perusahaan tersebut dapat dihitung komponen recency (R) dan frequentcy (F) serta jumlah transaksi terhadap produk tertantu melalui komponen monetary (M). Menurut Hughes (1994), model RFM dapat diuraikan sebagai berikut: 1. Recency Recency merepresentasikan jarak diantara transaksi terbaru dengan transaksi sebelumnya. Makin kecil jarak transaksi nilai recency akan semakin besar. 2. Frequency Frequency merepresentasikan jumlah transaksi yang dilakukan dalam periode tertentu. Semakin banyak frekuensi yang ada maka nilai frequency akan semakin besar. 3. Monetary Monetary merepresentasikan jumlah uang yang telah ditransaksikan pada periode tertentu. Semakin besar jumlah transaksi jumlah monetary akan semakin besar. Implementasikannya recency, frequency dan monetary secara bersamasama dapat berdampak pada perusahaan untuk mendapatkan indikator dari ketertarikan pelanggan terhadap produk perusahaan tersebut. Asumsi umum dari proses tersebut adalah sebagai berikut: 1. Pelanggan yang baru saja bertransaksi, akan lebih senang bertransaksi kembali dibanding pelanggan yang sudah lama tidak melakukan transaksi. 2. Pelanggan yang bertransaksi secara rutin akan lebih senang bertransaksi daripada pelanggan yang baru saja melakukan satu atau dua transaksi. 3. Pelanggan yang paling banyak bertransaksi secara total akan lebih senang melakukan transaksi. Menurut Zumstein (2007, h. 40), metode RFM dapat digunakan untuk mendeskripsikan atribut recency, frequency, dan monetary dengan variabel

9 14 linguistik. Sebagai contoh, atribut recency dideskripsikan dengan bahasa natural long ago (lama) dan very recent (baru saja). Atribut frequency dideskripsikan dengan bahasa natural rare (jarang) dan frequent (sering). Atribut monetary dideskripsikan dengan bahasa natural low value (rendah) dan high value (tinggi). Menurut Tsiptsis dan Chorianopoulos (2009, hh ) terdapat enam pembagian pelanggan para perusahaan retail berdasarkan nilai RFM yang didefinisian secara lebih spesifik pada Tabel 2.2. Tabel 2.2 Klasifikasi Customer Kelas Pelanggan Superstar Golden Customer Typical Customer Occational Customer Everyday Shopper Dormant Customer Deskripsi Kelas Pelanggan - Customer dengan tingkat loyalitas paling tinggi. - Nilai (value) yang paling tinggi. - Frekuensi yang paling tinggi. - Melakukan transaksi terbesar. - Nilai (value) terbesar kedua. - Frekuensi tinggi. - Melakukan transaksi standar rata-rata. - Memiliki nilai (value) dan frekuendi standar rata-rata. - Melakukan transaksi standar rata-rata. - Memiliki frekuendi terendah setelah dormant - Memiliki recency rendah (memiliki waktu yang lama dengan rentang waktu terakhir pembelian) - Melakukan transaksi dalam jumlah besar (large basket) - Memiliki peningkatan dalam transaksi - Melakukan transaksi dalam jumlah kecil (small basket) - Memiliki nilai dengan skala menengah (medium) hingga rendah (low) - Memiliki frekuensi dan nilai (value) terendah - Memiliki waktu yang lama ketika masa terakhir pembelian (recency terendah) Sumber: Tsiptsis dan Chorianopoulos 2009, hh

10 Normalisasi Data Proses clustering dapat terdiri dari berbagai interval nilai yang menyebabkan perbedaan jarak antar satu nilai dengan nilai lainnya, diperlukannya proses normaslisasi agar data memiliki nilai rata-rata 0 atau zero mean (Putra, Darma 2010, h.310). Suatu data atau fitur dapat dinormalisasi dengan rumus berikut. X = X X...(2.1) σ x Nilai X dinyatakan sebagai data atau fitur X yang telah ternormalisasi, X dinyatakan sebagai rata-rata dari X, dan σ menyatakan nilai standar deviasi dari X. Sebagai contoh, misalkan vektor data X = (2,3,5,10,15) maka X = 7, σ = 5.43, sehingga vektor X yang telah ternormalisasi adalah sebagai berikut. X = ( 0.92, 0.73, 0.37, 0.55, 1.47) Setelah dinormalisasi, pada data dapat dilakukan proses scalling agar nilai data berada pada suatu interval tertentu. Proses scalling berfungsi agar suatu fitur memiliki batas atas S dan batas bawah R dapat diperoleh dengan rumus berikut. X = X X min X max X min (S R) + R... (2.2) Data yang telah ternormalisasi di atas diskalakan dengan batas S = 1 dan batas bawah R = 0 maka: X = X = X = X ( 0.92) (1 0) ( 0.92) ( , , , , ) 1.47 ( 0.92) (0, 0.2, 0.55, 1.47, 2.39) 2.39 = (0, 0.8, 0.23, 0.62, 1) Dari hasil di atas terlihat nilai fitur data berada dalam interval [0,1]. 1

11 Metode Clustering Proses dari pengelompokan objek fisik atau abstrak ke dalam kelas yang memiliki kemiripan disebut dengan proses clustering, sedangkan cluster adalah koleksi data yang memiliki kemiripan satu sama lain dengan objek yang berada pada cluster yang sama dan memiliki perbedaan dengan objek yang berada pada cluster yang lain (Han, Kamber & Pei 2007, h. 108). Menurut Kantardzic (2011, h. 250), analisis cluster didasari oleh pengelompokan secara natural, secara pengukuran atau melihat dari segi kesamaan dan perbedaan objek tersebut. Metode K-Means merupakan salah satu jenis metode clustering yang digunakan untuk melakukan pengelompokkan. 2.7 Metode K-Means Metode clustering yang digunakan dalam tugas akhir ini adalah Metode K- Means. Metode K-Means melakukan pencarian pusat dan batas cluster melalui proses perulangan (iterative). Kedekatan atau kemiripan (similarity) suatu objek dengan objek lain atau dengan pusat cluster dihitung dengan menggunakan perhitungan jarak. Algoritma ini pertama kali diusulkan oleh MacQueen (1967, hh ) dengan tujuan untuk dapat membagi data point dalam dimensi kedalam sejumlah cluster, dimana proses clustering dilakukan dengan meminimalkan jarak sum squares antara data dengan masing-masing pusat cluster (centroid-based). Algoritma K-Means dalam penerapannya memerlukan tiga parameter yang seluruhnya ditentukan pengguna yaitu jumlah cluster k, inisialisasi pusat cluster, dan jarak sistem. Tahapan awal, Algoritma K-Means adalah memilih secara acak k buah objek sebagai centroid dalam data, kemudian jarak objek dan centroid dihitung menggunakan Metode Euclidean Distance. Algoritma K-Means secara iterative meningkatkan variasi nilai dalam tiap cluster dimana obyek selanjutnya ditempatkan dalam kelompok yang terdekat, dihitung dari titik tengah cluster. Titik tengah baru ditentukan bila semua data telah ditempatkan dalam cluster terdekat. Proses penentuan titik tengah dan penempatan data dalam cluster diulangi sampai nilai titik tengah dari semua cluster yang terbentuk tidak berubah lagi (Han, Kamber & Pei 2006, hh ).

12 17 Menurut Darma Putra (2010, h. 340), langkah-langkah Algoritma K-Means dijelaskan secara lebih rinci dalam uraian berikut: 1. Inisialisasi K pusat cluster adalah z1(1), z2(2),, zk(1). Pusat-pusat cluster ini biasanya dipilih secara acak dari sekumpulan data yang akan dikelompokkan. 2. Pada iterasi ke-k sampel data {x} di antara K domain cluster, dengan menggunakan hubungan sebagai berikut: x S j (k) jika x z j (k) 2 < x z i (k)... (2.3) Untuk semua I = 1, 2, K, I j, dengan Sj(k) menyatakan himpunan sampel dengan pusat cluster adalah zj (k). 3. Hasil pada langkah 2, hitung pusat-pusat cluster baru zj (k+1), j = 1, 2,.., K, sehingga jumlah seluruh jarak dari semua titik dalam Sj(k) ke pusat cluster yang baru minimal, dengan kata lain, pusat cluster baru zj (k+1) dihitung sehingga unjuk kerja indeks: j i = x z j (k + 1) 2 x (K), j = 1,2,. K... (2.4) zj (k+1) yang meminimalkan persamaan di atas adalah dengan menyederhanakan nilai rata-rata dari sampel pada Sj(k), maka dari itu, pusat cluster baru ditunjuk oleh: z j (k + 1) = 1 N x S j (k) X, j = 1,2,,K... (2.5) j Dengan Nj menyatakan jumlah sampel dalam Sj(k). 4. Bila zj (k+1) = zj (k) untuk j = 1, 2,, K, maka algoritma telah konvergen dan proses berakhir. Bila tidak maka kembali ke langkah 2. Contoh perhitungan dari MetodeK-Means adalah sebagai berikut. Tabel 2.3 merupakan data sumber yang akan digunakan dalam perhitungan. Tabel 2.3 Data Sumber Objek ke -n Kordinat X Kordinat Y

13 18 Tahapan perhitungan adalah sebagai berikut. 1. Banyak cluster yang digunakan adalah dua, jadi k = 2. Banyaknya cluster lebih kecil dari jumlah data atau k < n. 2. Tentukan titik pusat (centroid) setiap cluster. Centroid awal ditentukan secara acak dapat dilihat pada Tabel. 2.4 Tabel 2.4 Titik Pusat Iterasi ke-1 Titik Pusat ke-n Kordinat X Kordinat Y C1 1 1 C2 2 1 Iterasi selanjutnya tidak menghitung centroid secara acak. Titik pusat ditentukan dengan mencari nilai rata-rata data pada setiap cluster. Jika titik pusat yang didapat berbeda dengan titik pusat sebelumnya maka iterasi tetap dilakukan hingga mendapat titik pusat yang sama dengan iterasi sebelumnya. 3. Menghitung jarak data dengan titik pusat dapat dilakukan dengan tiga cara, yaitu Euclidean Distance, Manhattan / City Block, Minkowski. Perhitungan jarak yang dapat dilakukan pada Metode K-Means adalah dengan menggunakan Rumus Euclidean Distance. d = (x j, c j ) = n (x j c j ) 2 j=1... (2.6) d = jarak j = banyaknya data c = centroid x = data Jarak data dengan titik pusat cluster pertama adalah sebagai berikut. d(x 1, c 1 ) = (a 1 c 1a ) 2 + (b 1 c 1b ) 2 = (1 1) 2 + (1 1) 2 = 0 d(x 2, c 1 ) = (a 2 c 1a ) 2 + (b 2 c 1b ) 2 = (2 1) 2 + (1 1) 2 = 1 d(x 3, c 1 ) = (a 3 c 1a ) 2 + (b 2 c 1b ) 2 = (4 1) 2 + (3 1) 2 = d(x 4, c 1 ) = (a 4 c 1a ) 2 + (b 3 c 1b ) 2 = (5 1) 2 + (4 1) 2 = 5 Jarak data dengan titk pusat cluster kedua adalah sebagai berikut.

14 19 d(x 1, c 2 ) = (a 1 c 2a ) 2 + (b 1 c 2b ) 2 = (1 2) 2 + (1 1) 2 = 1 d(x 2, c 2 ) = (a 2 c 2a ) 2 + (b 2 c 2b ) 2 = (2 2) 2 + (1 1) 2 = 0 d(x 3, c 2 ) = (a 3 c 2a ) 2 + (b 2 c 2b ) 2 = (4 2) 2 + (3 1) 2 = d(x 4, c 2 ) = (a 4 c 2a ) 2 + (b 3 c 2b ) 2 = (5 2) 2 + (4 1) 2 = Seterusnya, hitung jarak pada setiap baris data. Hasil perhitungan dapat dilihat pada Tabel 2.5. Tabel 2.5 Hasil Perhitungan Jarak Objek ke X Y dc1 dc2 c1 c Ok Ok Ok Ok 4. Kembali lagi ke tahap kedua hingga menemukan titik pusat cluster yang sama seperti sebelumnya. 2.8 Metode Particle Swarm Optimization Menurut Talukder (2011, hh ), Metode Particle Swarm Optimization (PSO) merupakan algoritma yang memiliki sifat pencarian dengan melibatkan banyak pelaku didalamnya. Pelaku dapat berupa populasi partikel yang merepresentasikan solusi potensial di dalam setiap populasi. Semua partikel melewati ruang pencarian multidimensional yang disesuaikan dengan posisi berdasarkan experience dan tetangga yang dimilikinya. x t i menunjuk vektor dari partikel i di ruang pencarian multidimensional pada tahapan waktu t, lalu posisi setiap partikel diperbaharui di ruang pencarian. Semua partikel diinisiasi secara acak, kemudian dievaluasi untuk dikomputasi nilai kecocokannya dengan mencari Personal Best atau nilai terbaik dari setiap partikel dan Global Best nilai terbaik dari keseluruhan populasi. Perulangan dilakukan untuk menemukan solusi optimal. Kecepatan partikel pertama diperbaharui melalui nilai Personal atau Global Best, dan posisi setiap

15 20 partikel diperbaharui dengan kecepatan yang berlaku. Perulangan berhenti dengan aturan yang ditetapkan di awal Personal Best dan Global Best Particle Swarm Optimization Personal Best adalah posisi terbaik setiap individu partikel yang didapat melalui iterasi perubahan kecepatan gerak partikel. Sebaliknya Global Best adalah posisi terbaik yang ditemukan dari nilai Personal Best partikel secara keseluruhan (Talukder 2011, hh ). Metode ini menggunakan topologi bintang, seperti Gambar 2.4 Gambar 2.4 Topologi Bintang Sumber: Talukder 2011, h. 11 Topologi ini memungkinkan partikel untuk medapatkan informasi secara keseluruhan mengenai keseluruhan partikel. Setiap partikel individu i [1,, n] dimana n > 1 memiliki posisi terbaru di dalam area pencarian xi dan kecepatan terbaru vi serta posisi Personal Best Pbest,i. Posisi Personal Best Pbest,i berkorespondensi dengan posisi di area pencarian dimana partikel i memiliki nilai terkecil yang dipengaruhi oleh fungsi objektif f. Keadaan dimana posisi menghasilkan nilai terkecil diantara posisi Personal Best lainnya maka disebut dengan Global Best yang dinotasikan sebagai Gbest. Posisi Personal Best berikutnya dihitung dengan rumus berikut:

16 21 P t+1 best,i = { P best,i t+1 if f(x t+1 t+1 i ) > P best,i t+1 X i t+1 if f(x i t+1 ) P best,i... (2.8) Dimana f :R n R adalah fungsi fitness. Posisi Global Best pada tahap waktu t dihitung dengan: G best = min{p t+1 best,i }, dimana i [1,, n] dan n > 1... (2.9) berikut: Untuk menghitung kecepatan partikel pada Global Best digunakan rumus v t+1 ij = v t ij + c 1 r t ij [P t+1 best,i X t+1 i ] + c 2 r t 2j [G best X t i ]... (2.10) Contoh Perhitungan Particle Swarm Optimization Menurut Budi Santosa (2011) contoh perhitungan dengan menggunakan Metode Particle Swarm Optimization (PSO) adalah sebagai berikut. Misal terdapat persoalan optimasi dengan satu variabel. f(x) = (100 x) 2 dimana 60 X Tentukan jumlah partikel N = 4 Tentukan populasi awal secara random, misalkan didapat x 1 (0) = 80, x 2 (0) = 90, x 3 (0) = 110, x 4 = Evaluasi nilai fungsi tujuan untuk setiap partikel x j (0) untuk j = 1,2,3,4. Dan nyatakan dengan f 1 = f(80) = 400, f 2 = f(90) = 100, f 3 = f(110) = 100, f 4 = f(75) = 625,

17 22 3. Tentukan kecepatan awal v 1 (0) = v 2 (0) = v 3 (0) = v 4 (0) = 0. Tentukan iterasi i = Temukan P best,1 = 80, P best,2 = 90, P best,3 = 110, P best,4 = 75, G best = 90. Hitung v(j) dengan c 1 = c 2 = 1. Misalkan nilai random yang didapat, r 1 = 0,4, r 2 = 0,5 dengan rumus V j (i) = V j (i 1) + c 1 r 1 [P best.j x j (i 1)] + c 2 r 2 [G best.j x j (i 1)] diperoleh: x 1 (1) = = 85 x 2 (1) = = 90 x 3 (1) = = 100 x 4 (1) = = Evaluasi nilai fungsi tujuan sekarang pada partikel x j (1), f 1 (1) = f(85) = 225, f 2 (1) = f(90) = 100, f 3 (1) = f(100) = 0 f 4 (1) = f(82.5) = Sedangkan pada iterasi sebelumnya kita dapatkan f 1 (1) = f(80) = 400, f 2 (1) = f(90) = 100, f 3 (1) = f(110) = 100, f 4 (1) = f(75) = 625, Nilai dari f dari iterasi sebelumnya tidak ada yang lebih baik sehingga Pbest untuk masing-masing partikel sama dengan nilai x. Gbest = Cek apakah solusi x sudah konvergen, dimana nilai x saling dekat. Jika tidak, tingkatkan ke iterasi berikutnya i = 2. Lanjutkan ke langkah P best,1 = 85, P best,2 = 90, P best,3 = 100, P best,4 = 75, G best = 100. Hitung kecepatan baru dengan r 1 = 0.3 dan r 2 = 0.6. v 1 (2) = (85 85) + 0.6(100 85) = 14 v 2 (2) = (90 90) + 0.6(100 90) = 6 v 3 (2) = ( ) + 0.6( ) = 10 v 4 (2) = ( ) + 0.6( ) = 18

18 23 Sedangkan untuk nilai x adalah x 1 (2) = = 99 x 1 (2) = = 96 x 1 (2) = = 90 x 1 (2) = = Evaluasi nilai fungsi tujuan sekarang pada partikel x j (2), f 1 (2) = f(99) = 1, f 2 (2) = f(96) = 16, f 3 (2) = f(90) = 100, f 4 (2) = f(100.5) = 0.25, Jika dibandingkan dengan nilai f dari iterasi sebelumnya, ada nilai yang lebih baik dari nilai f sekarang yaitu f 3 (1) = 0, sehingga P best untuk partikel 3 sama dengan 100, dan G best dicari dari min{1,16,0,0.25} = 0 yang dicapai pada x 3 (1) = 100. Sehingga untuk iterasi berikutnya P best = (99,96,100,100.5) dan G best = Cek apakah solusi sudah konvergen, dimana nilai x saling dekat. Jika tidak konvergen, set i = 3, masuk ke iterasi berikutnya. Lanjutkan ke langkah berikutnya dengan menghitung kecepatan v dan ulangi langkah-langkah selanjutnya sampai mencapai konvergen. 2.9 Validasi Cluster Cluster yang dihasilkan terbentuk dari parameter-parameter yang diinputkan. Pembentukan jumlah cluster dapat divalidasi dengan menggunakan metode validasi cluster untuk mengetahui input terbaik dalam pembentukan cluster, Metode validasi cluster yang digunakan antara lain Metode Davies-bouldin Index dan Silhouette Index Validasi Cluster dengan Davies-bouldin Index Menurut Bouldin dan Davies (1979, h.224) Metode Davies-boulding Index dapat digunakan untuk menghitung jumlah ideal cluster, berdasarkan nilai rata-rata rasio cluster scatter untuk semua cluster dan jarak diantara dua cluster. Davies-

19 24 bouldin Index didapatkan berdasarkan kemiripan dari cluster (Rij) yang merupakan ukuran dipersi cluster (si) dan ketidakmiripan (dij). Nilai Rij ditentukan dengan menggunakan cara berikut R ij = s i+ s j d ij... (2.12) d ij = d(v i + v j ), s i = 1 berikut: c j x c d(x, v i i)... (2.13) Sedangkan rumus dari Metode Davies-bouldin Index didefinisikan sebagai n c DB = 1 R n i, c i=1... (2.14) R i= max, j = 1 nc, i j... (2.15) (R ij ), i = 1 n c... (2.16) Validasi Cluster dengan Silhouette Index Menurut Rousseeuw, Peter J (1987) setiap cluster dapat direpresentasikan kedalam sebuah silhouette. Metode Silhouette dapat menunjukkan cluster terbaik untuk setiap objeknya. Rata-rata silhouette dapat digunakan untuk menunjukkan validasi cluster dan jumlah optimal pembentukan cluter. Proses validasi cluster dengan menggunakan Metode Silhouette adalah sebagai berikut. 1. Setiap objek i, dihitung rata-rata jarak dari objek i dengan seluruh objek yang berada dalam satu cluster sehingga didapat nilai rata-rata a(i). 2. Setiap objek i dihitung rata-rata jarak dari objek i dengan objek yang berada di cluster lainnya. Nilai terkecil dari semua rata-rata jarak kemudian digunakan. Nilai tersebut merupakan nilai dari b(i). 3. Semua variabel kemudian dihitung silhouette coefisien dengan persamaan berikut. s(i) = b(i) a(i) max {a(i),b(i)}... (2.17)

20 Profil Perusahaan PT. X PT. X dikenal secara nasional telah berdiri semejak Tahun Pada awal mulanya perusahaan tersebut terdiri dari empat kantor cabang. Fokus perusahaan adalah terlibat dalam distribusi bahan baku farmasi dan barang jadi, sekarang ini PT. X merupakan salah satu distributor farmasi yang masuk peringkat sepuluh besar distributor farmasi terbaik di Indonesia dengan jumlah cabang tersebar diseluruh Indonesia sebanyak 31 cabang.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN Bab Pendahuluan terdiri dari uraian latar belakang yang mendasari pembuatan tugas akhir, pengenalan masalah yang dibahas didalam tugas akhir, manfaat maupun tujuan penelitian yang ingin

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 State of the Art Penelitian mengenai segmentasi pasar pada sebuah perusahaan telah banyak digunakan dengan tujuan untuk mengetahui strategi pasar yang baik dan dapat menguntungkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Hal-hal yang dipaparkan pada Bab Tinjauan Pustaka adalah penelaahan kepustakaan yang mendasari proses perancangan dan pembuatan aplikasi meliputi data mining, Customer Relationship

Lebih terperinci

SEGMENTASI PELANGGAN MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION DAN K-MEANS

SEGMENTASI PELANGGAN MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION DAN K-MEANS SEGMENTASI PELANGGAN MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION DAN K-MEANS TUGAS AKHIR Diajukan guna memenuhi sebagian persyaratan dalam rangka menyelesaikan Pendidikan Sarjana Strata Satu (S1) Program

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Customer Relationship Management (CRM) Pelanggan adalah aset yang paling penting dari sebuah organisasi. Tidak mungkin terdapat prospek bisnis tanpa memuaskan pelanggan yang

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Analisa adalah suatupemahaman terhadap permasalahan sebelum mengambil suatu tindakan atau keputusan yang akan dilakukan. Disini akan dianalisa tentang sistem

Lebih terperinci

BABI PENDAHULUAN. 1.1 Latar Belakang

BABI PENDAHULUAN. 1.1 Latar Belakang BABI PENDAHULUAN 1.1 Latar Belakang Setiap perusahaan dituntut untuk siap menghadapi persaingan yang semakin ketat dengan perusahaan lain. Makin intensifnya persaingan yang dihadapi, telah menyebabkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Customer Relationship Management (CRM) CRM adalah perpaduan antara teori, metode, teknik, kompetensi dan software enterprise untuk mengembangkan jangka panjang perusahaan dengan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

Segmentasi Nasabah Tabungan Menggunakan Model RFM (Recency, Frequency,Monetary) dan K-Means Pada Lembaga Keuangan Mikro

Segmentasi Nasabah Tabungan Menggunakan Model RFM (Recency, Frequency,Monetary) dan K-Means Pada Lembaga Keuangan Mikro Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015 463 Segmentasi Nasabah Tabungan Menggunakan Model RFM (Recency, Frequency,Monetary) dan K-Means Pada Lembaga Keuangan Mikro Tikaridha

Lebih terperinci

SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR

SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR Diajukan Guna Memenuhi Sebagian Persyaratan Dalam Rangka Menyelesaikan Pendidikan Sarjana Strata

Lebih terperinci

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) 157 Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) Elly Muningsih AMIK BSI Yogyakarta E-Mail : [email protected] Abstrak Berkembangnya

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Pada penelitian yang dilakukan oleh (Chen, Sain, & Guo, 2012) berfokus untuk mengetahui pola penjualan, pelanggan mana yang paling berharga, pelanggan mana yang

Lebih terperinci

METODE PENELITIAN. Tahapan pengembangan sistem PSP (Penetapan Strategi Penjualan) 1.0 seperti pada Gambar 2 di bawah ini. Mulai

METODE PENELITIAN. Tahapan pengembangan sistem PSP (Penetapan Strategi Penjualan) 1.0 seperti pada Gambar 2 di bawah ini. Mulai III. METODE PENELITIAN 3.1 Kerangka Kerja Penelitian Tahapan pengembangan sistem PSP (Penetapan Strategi Penjualan) 1.0 seperti pada Gambar 2 di bawah ini. Mulai Analisis Sistem, keluaran: - Deskripsi

Lebih terperinci

Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan

Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Implementasi Metode Clustering DBSCAN pada Proses Pengambilan Keputusan Ni Made Anindya Santika Devi, I Ketut Gede Darma Putra, I Made Sukarsa Jurusan Teknologi Informasi, Universitas Udayana Bukit Jimbaran,

Lebih terperinci

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas

Lebih terperinci

Bab 2 Tinjauan Pustaka

Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Adapun penelitian terdahulu yang berkaitan dalam penelitian ini berjudul Penentuan Wilayah Usaha Pertambangan Menggunakan Metode Fuzzy K-Mean Clustering

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata [email protected]

Lebih terperinci

PE DAHULUA. Latar Belakang

PE DAHULUA. Latar Belakang Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di

Lebih terperinci

Segmentasi Pelanggan Menggunakan Metode Fuzzy C-Means dan Fuzzy Recency Frequency Monetary pada Perusahaan Furniture TUGAS AKHIR

Segmentasi Pelanggan Menggunakan Metode Fuzzy C-Means dan Fuzzy Recency Frequency Monetary pada Perusahaan Furniture TUGAS AKHIR Segmentasi Pelanggan Menggunakan Metode Fuzzy C-Means dan Fuzzy Recency Frequency Monetary pada Perusahaan Furniture TUGAS AKHIR Diajukan Guna Memenuhi Sebagian Persyaratan Dalam Rangka Menyelesaikan Pendidikan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU Gita Premashanti Trayasiwi Program Studi Teknik Informatika S1,

Lebih terperinci

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa

Lebih terperinci

Perbandingan Metode SOM/Kohonen dengan ART 2 pada Data Mining Perusahaan Retail

Perbandingan Metode SOM/Kohonen dengan ART 2 pada Data Mining Perusahaan Retail Teknologi Elektro, Vol. 16, No. 02, Mei - Agustus 2017 55 Perbandingan Metode SOM/Kohonen dengan ART 2 pada Data Mining Perusahaan Retail Anak Agung Gede Bagus Ariana 1, I Ketut Gede Darma Putra 2, Linawati

Lebih terperinci

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) Meriska Defriani 1, Noviyanti 2 1 STT Wastukancana 2 Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Konsep Pemasaran Dalam merancang dan mengembangkan produk, baik yang berupa jasa maupun barang, tidak terlepas dari konsep pemasaran yang bertujuan memenuhi

Lebih terperinci

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING

LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA. Modul II CLUSTERING LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul II CLUSTERING TUJUA PRAKTIKUM 1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam

Lebih terperinci

SEGMENTASI PELANGGAN MENGGUNAKAN ALGORITMA K-MEANS UNTUK CUSTOMER RELATIONSHIP MANAGEMENT (CRM) PADA HIJAB MIULAN

SEGMENTASI PELANGGAN MENGGUNAKAN ALGORITMA K-MEANS UNTUK CUSTOMER RELATIONSHIP MANAGEMENT (CRM) PADA HIJAB MIULAN SEGMENTASI PELANGGAN MENGGUNAKAN ALGORITMA K-MEANS UNTUK CUSTOMER RELATIONSHIP MANAGEMENT (CRM) PADA HIJAB MIULAN Oleh: Gita Febrina Wulandari Jurusan Sistem Informasi Fakultas Ilmu Komputer Universitas

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS Muhammad Toha, 1), I Ketut Edy Purnama 2) dan Surya Sumpeno 3) 1) Bidang Keahlian Telematika (Konsentrasi CIO) Jurusan Teknik Elektro

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

UCAPAN TERIMA KASIH. Perbandingan Metode SOM/Kohonen Dengan Adaptive Resonance Theory 2

UCAPAN TERIMA KASIH. Perbandingan Metode SOM/Kohonen Dengan Adaptive Resonance Theory 2 UCAPAN TERIMA KASIH Puji syukur kita panjatkan kehadirat Tuhan Yang Maha Esa atas segala rahmat dan hidayah-nya penulis dapat menyelesaikan tesis dengan judul Perbandingan Metode SOM/Kohonen Dengan Adaptive

Lebih terperinci

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya [email protected] Nama Mahasiswa NIM Kelas Memahami definisi, proses serta teknik data mining. Pengenalan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Dalam bagian ini dijelaskan aktifitas yang dilakukan dalam melakukan penelitian dibagi menjadi 2 (dua) yaitu: 1) Perancangan Skenario; dan 2) Penerapan Skenario. 3.1. Perancangan

Lebih terperinci

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung

Lebih terperinci

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan BAB I PENDAHULUAN 1.1 Latar Belakang PT. Bali Sinar Mentari adalah perusahaan yang bergerak pada bidang usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan domestik maupun mancanegara

Lebih terperinci

SEGMENTASI PELANGGAN PADA PERUSAHAAN RETAIL DENGAN METODE ART 2 DAN MODEL RFM JUDUL TUGAS AKHIR

SEGMENTASI PELANGGAN PADA PERUSAHAAN RETAIL DENGAN METODE ART 2 DAN MODEL RFM JUDUL TUGAS AKHIR SEGMENTASI PELANGGAN PADA PERUSAHAAN RETAIL DENGAN METODE ART 2 DAN MODEL RFM JUDUL TUGAS AKHIR Diajukan Guna Memenuhi Sebagian Persyaratan dalam Rangka Menyelesaikan Pendidikan Sarjana Strata Satu (S1)

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

1BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

1BAB I PENDAHULUAN 1.1 Latar Belakang Masalah 1BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Clustering merupakan sebuah teknik pemrosesan data yang digunakan untuk menemukan pola-pola tersembunyi pada kumpulan data (Žalik, 2008). Clustering telah

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: [email protected] Abstrak Pembentukan cluster merupakan

Lebih terperinci

BAB I PENDAHULUAN A. Latar Belakang

BAB I PENDAHULUAN A. Latar Belakang BAB I PENDAHULUAN A. Latar Belakang Promosi adalah salah satu faktor yang diperlukan bagi keberhasilan bagi suatu perusahaan atau organisasi, maka promosi merupakan salah satu senjata ampuh bagi perusahaan

Lebih terperinci

Pengenalan Pola. K-Means Clustering

Pengenalan Pola. K-Means Clustering Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan

Lebih terperinci

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS

KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS 1 KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS (Study Kasus : Tim Hockey Kabupaten Kendal) Alith Fajar Muhammad Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula No. 5-11 Semarang-50131

Lebih terperinci

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Penelitian Terkait Pada penelitian ini, peneliti melakukan penelitian yang didasarkan pada penelitian terdahulu yang terkait dengan penelitian yang akan dilakukan peneliti.

Lebih terperinci

Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means

Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means Nielza Atthina Jurusan Teknik Informatika Universitas Islam Indonesia Yogyakarta [email protected]

Lebih terperinci

Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata

Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata Cakra Ramadhana 1, Yohana Dewi Lulu W 2, Kartina Diah K. W. 3 1,2 Program Studi Sistem Informasi, Politeknik

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

Practical Work Material KS Introduction to Information System

Practical Work Material KS Introduction to Information System 2012 Practical Work Material KS091302 Introduction to Information System Module 5: Customer Relationship Management Modul ini menjelaskan tentang apa itu Customer Relationship Management dan implementasinya

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

UKDW BAB I PENDAHULUAN Latar Belakang

UKDW BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Konsumsi, Finansial, semakin menjadi hal yang tidak dapat dipisahkan seiring terus berkembangnya suatu negara. Transaksi, jual, beli, sudah menjadi kata yang sangat

Lebih terperinci

Lingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan

Lingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan sehingga dapat diproses dengan SOM. Pada tahap seleksi data, dipilih data perkembangan anak berdasarkan kategori dan rentang usianya. Kategori perkembangan tersebut merupakan perkembangan kognitif, motorik

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

PERBANDINGAN ALGORITMA PARTICLE SWARM OPTIMIZATION DAN REGRESI PADA PERAMALAN WAKTU BEBAN PUNCAK

PERBANDINGAN ALGORITMA PARTICLE SWARM OPTIMIZATION DAN REGRESI PADA PERAMALAN WAKTU BEBAN PUNCAK Jurnal POROS TEKNIK, Volume 6, No. 2, Desember 2014 : 55-10 PERBANDINGAN ALGORITMA PARTICLE SWARM OPTIMIZATION DAN REGRESI PADA PERAMALAN WAKTU BEBAN PUNCAK Nurmahaludin (1) (1) Staff Pengajar Jurusan

Lebih terperinci

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya [email protected] Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami pemrosesan awal data yang akan diproses

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Sistem Informasi Pengertian Sistem Informasi pada dasarnya merupakan hasil dari dua arti, yakni sistem dan informasi yang digabungkan. Berikut definisi sistem menurut para ahli

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA Diajeng Tyas Purwa Hapsari Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email :

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP Page 87 Iin Parlina 1, Agus Perdana Windarto 2, Anjar Wanto 3, M.Ridwan Lubis

Lebih terperinci

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING Moh Ahsan Universitas Kanjuruhan Malang [email protected] ABSTRAK. Universitas Kanjuruhan Malang

Lebih terperinci

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5 PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5 Annisak Izzaty Jamhur Universitas Putera Indonesia YPTK Padang e-mail: [email protected] Abstract

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam

BAB II TINJAUAN PUSTAKA. Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam 12 BAB II TINJAUAN PUSTAKA Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam melakukan penelitian data mining dengan metode asosiasi menggunakan algoritma apriori yang terdiri dari state

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada bab ini dilakukan pendefinisian permasalahan dari penelitian yang akan dilakukan. Dalam Cross Industry Standard Process for Data Mining[3], tahapan ini

Lebih terperinci

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Perkembangan teknologi informasi telah mampu mengubah persepsi manusia terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV IMPLEMENTASI DAN PENGUJIAN BAB IV IMPLEMENTASI DAN PENGUJIAN Bab ini berisi penjelasan mengenai proses implementasi dan pengujian yang dilakukan dalam penelitian mengenai aplikasi algoritma spasial clustering pada data mahasiswa

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penambangan Data (Data Mining) Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

Implementasi automatic clustering menggunakan particle swarm optimization dan genetic algorithm pada data kemahasiswaan

Implementasi automatic clustering menggunakan particle swarm optimization dan genetic algorithm pada data kemahasiswaan Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Implementasi automatic clustering menggunakan particle swarm optimization dan genetic algorithm pada data kemahasiswaan

Lebih terperinci

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada

Lebih terperinci

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS Yudis Anggara Putra Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN 1 K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN Rani Nooraeni*, Dr. Jadi Supriadi, DEA, Zulhanif, S.Si,M.Sc Jurusan statistika terapan, Fakultas MIPA UNPAD [email protected]* Abstrak.Membagi suatu data

Lebih terperinci

Tahapan Proses KDD (Peter Cabena)

Tahapan Proses KDD (Peter Cabena) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (Business

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan analisa datadan algoritma Fuzzy C-Means untuk mangetahui pola perilaku konsumen. 2.1. Pola

Lebih terperinci