PERBANDINGAN ALGORITME CLUSTERING ROCK DAN QROCK UNTUK DATA KATEGORIK (STUDI KASUS : DATA SPONGE) MARISA ANGGRAENI

Ukuran: px
Mulai penontonan dengan halaman:

Download "PERBANDINGAN ALGORITME CLUSTERING ROCK DAN QROCK UNTUK DATA KATEGORIK (STUDI KASUS : DATA SPONGE) MARISA ANGGRAENI"

Transkripsi

1 PERBANDINGAN ALGORITME CLUSTERING ROCK DAN QROCK UNTUK DATA KATEGORIK (STUDI KASUS : DATA SPONGE) MARISA ANGGRAENI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

2 PERBANDINGAN ALGORITME CLUSTERING ROCK DAN QROCK UNTUK DATA KATEGORIK (STUDI KASUS : DATA SPONGE) Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Oleh : MARISA ANGGRAENI G DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

3 ABSTRAK MARISA ANGGRAENI. Perbandingan Algoritme Clustering ROCK dan QROCK untuk Data Kategorik (Studi Kasus : Data Sponge). Dibimbing oleh ANNISA, dan HARI AGUNG. Sponge adalah hewan laut berpori yang memompa air melalui tubuhnya untuk menyaring partikel partikel sebagai makanannya. Beberapa ahli taksonomi berpendapat adanya kelas baru dari sponge. Iosune Uriz dan Marta Domingo melakukan riset dan pengumpulan data sponge jenis O.Hadromerida (Demospongiae. Porifera) yang termasuk kelas Demospongiae di Laut Atlantik pada tahun Tujuan riset dan pengumpulan data tersebut adalah untuk mengetahui model cluster berdasarkan anatomy dan phisiology sponge. Model cluster tersebut diharapkan dapat direpresentasikan pada klasifikasi taksonomi sehingga dapat memprediksi ada atau tidaknya kemungkinan species atau kelas baru dari data sponge tersebut. Sebagian besar atribut data sponge tersebut merupakan data kategorik. Clustering adalah proses data mining untuk melihat pola pendistribusian data yang akan digunakan untuk melihat karakteristik dari data. Pada penelitian ini data riset Iosune Uriz dan Marta Domingo akan dikelompokkan oleh algoritme ROCK dan QROCK. Algoritme ROCK digunakan karena memiliki kualitas dan penanganan data kategorik yang lebih baik dari algoritme clustering distance pada umumnya, sedangkan algoritme QROCK merupakan perbaikan dari algoritme ROCK karena dari segi waktu lebih efisien dan dapat mendeteksi outlier pada ROCK. Algoritme ROCK yaitu algoritme clustering hirarki aglomeratif untuk mengelompokkan data kategorik yang membangun link untuk menggabungkan cluster-cluster-nya. QROCK adalah perbaikan dari algoritme ROCK yang memiliki metode yang lebih efisien untuk menghasilkan cluster akhir algoritme ROCK ketika ROCK sudah tidak memiliki link antar cluster-nya. Pada penelitian ini cluster yang dihasilkan merepresentasikan pola data sponge. Cluster hasil dari algoritme ROCK dan QROCK untuk data sponge akan dibandingkan. Total cohesion dari cluster yang dihasilkan ROCK lebih kecil dibandingkan separation-nya, sedangkan total cohesion dari cluster yang dihasilkan QROCK lebih besar dibandingkan nilai separation-nya. Hal tersebut membuktikan bahwa cluster yang dihasikan QROCK lebih baik dari ROCK. Dibuktikan pula bahwa algoritme QROCK dapat mendeteksi outlier dari algoritme ROCK pada saat nilai threshold 0,9. Kata kunci : Clustering, ROCK, QROCK, Data Kategorik, Sponge, Link.

4 Judul : Perbandingan Algoritme Clustering ROCK dan QROCK untuk Data Kategorik Nama : Marisa Anggraeni NIM : G Menyetujui: Pembimbing I, Pembimbing II, Annisa, S.Kom, M.Kom NIP Hari Agung, S.Kom, M.Si NIP Mengetahui: Dekan Fakultas Matematika Dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Dr. drh. Hasim, DEA NIP Tanggal Lulus:

5 RIWAYAT HIDUP Penulis dilahirkan di Sumedang tanggal 19 Februari 1986, anak ke dua dari tiga bersaudara dari pasangan O.Ridwan dan Metini. Tahun 2004, penulis lulus dari SMU Negeri 1 Cimalaka, Sumedang dan pada tahun yang sama penulis diterima sebagai mahasiswa S1 Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk Institut Pertanian Bogor (USMI). Pada tahun 2007, penulis melaksanakan kegiatan Praktik Kerja Lapangan di Lembaga Riset Perkebunan Indonesia (LRPI) selama dua bulan. Dari hasil praktik lapang tersebut penulis telah membuat laporan dengan judul Pembuatan website Pusat Penelitian Teh dan Kina Gambung.

6 PRAKATA Alhamdulillahi Rabbil alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas limpahan rahmat dan hidayah-nya sehingga tugas akhir dengan judul Perbandingan Algoritme Clustering ROCK dan QROCK untuk Data Kategorik dapat diselesaikan. Shalawat serta salam juga penulis ucapkan kepada junjungan kita Nabi Muhammad SAW beserta seluruh sahabat dan umatnya hingga akhir zaman. Dalam menyelesaikan tugas akhir ini penulis mendapatkan banyak sekali bantuan, bimbingan dan dorongan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih kepada semua pihak yang telah membantu dalam penyelesaian tugas akhir ini, antara lain: 1 Ketiga orangtua tersayang, Bapak Deden dan Mama Metini serta Mpah O.Ridwan atas segala do a, kasih sayang, dan dukungannya. 2 Aa Geri Ridwandini dan Ade Silvie Delasani tersayang yang selalu memberikan do a, semangat dan motivasi dalam penyelesaian tugas akhir ini. 3 Ibu Annisa, S.Kom, M.Kom selaku pembimbing pertama atas bimbingan dan arahannya selama pengerjaan tugas akhir ini. 4 Bapak Hari Agung, S.Kom, M.Si selaku pembimbing kedua atas bimbingan dan arahannya selama pengerjaan tugas akhir ini. 5 Bapak Endang, S.Kom, M.Kom selaku moderator dan penguji tugas akhir ini. 6 Efrian Muharrom yang telah memberi dukungan, semangat, bantuan dan do a saat penulis merasa jenuh dan kesulitan dalam penyelesaian tugas akhir ini. 7 Anizza, Popi, Ineza, Fathimah, Gananda, Imam, Henri, Lewe, Denny dan Maulana atas semangat dan dukungannya. 8 Ayudya Paramita, Nurdian Setiawan, dan Riza Mahendra atas semangat dan do a selama bimbingan bersama. 9 Imam Abu Daud, Irfan Sidqon, M.Syadid, Rizki Peburdi, dan Arif Nurwidiantoro atas bantuan dan ilmu yang telah dibaginya. 10 Seluruh teman-teman Program Studi Ilmu Komputer angkatan 41 yang tidak dapat disebutkan namanya satu-persatu. Penulis juga mengucapkan terima kasih kepada semua pihak yang telah membantu selama pengerjaan penyelesaian tugas akhir ini yang tidak dapat disebutkan satu-persatu. Semoga penelitian ini dapat memberikan manfaat. Bogor, Agustus 2008 Marisa Anggraeni

7 DAFTAR ISI Halaman DAFTAR TABEL... vi DAFTAR GAMBAR... vi DAFTAR LAMPIRAN... vi_toc PENDAHULUAN... 1 Latar Belakang...1 Tujuan...1 Ruang Lingkup...1 Manfaat Penelitian...1 TINJAUAN PUSTAKA... 1 Knowledge Discovery in Database (KDD)...1 Data Mining...2 Clustering...2 Agglomerative Hirarchical Clustering...3 Data Kategorik...3 ROCK (RObust Clustering using links)...3 QROCK (Quick RObust Clustering using links)...4 Evaluasi Cluster...5 Outlier...5 METODE PENELITIAN... 5 Proses Knowledge Discovery in Database...5 Lingkungan Pengembangan...8 HASIL DAN PEMBAHASAN... 8 Preprocessing Data...8 Data Mining...8 Evaluasi Pola...10 Ukuran Cluster dan Nilai Cohesion...11 Nilai Threshold dan Nilai Cohesion...12 Mendeteksi Outlier...13 KESIMPULAN DAN SARAN Kesimpulan...14 Saran...14 DAFTAR PUSTAKA v

8 DAFTAR TABEL Halaman 1 Cluster hasil algoritme ROCK untuk ukuran k = 8 dan = 0, Persentase dan jumlah anggota cluster algoritme ROCK untuk ukuran k = 8 dan = 0, Cluster yang dihasilkan oleh algoritme QROCK pada ukuran k = 6 dan = 0, Persentase dan jumlah anggota cluster algoritme QROCK pada ukuran k = 6 dan = 0, Nilai cohesion dan nilai separation algoritme ROCK untuk cluster delapan dan = Nilai cohesion dan nilai separation algoritme QROCK untuk cluster enam dan = Nilai total cohesion dan ukuran cluster algoritme ROCK pada nilai threshold Hubungan antar nilai threshold dan nilai cohesion pada algoritme ROCK pada ukuran cluster delapan DAFTAR GAMBAR Halaman 1 Tahapan dalam KDD (Han & Kamber, 2006) Langkah-langkah KDD dalam penelitian Proses algoritme (a) ROCK dan (b) QROCK Grafik nilai cohesion terhadap nilai k pada algoritme ROCK Grafik nilai cohesion terhadap nilai k pada algoritme QROCK Perbandingan nilai cohesion terhadap ukuran cluster untuk ROCK dan QROCK Grafik nilai threshold terhadap nilai cohesion pada algoritme ROCK Grafik nilai threshold terhadap nilai cohesion pada algoritme QROCK Perbandingan nilai cohesion terhadap nilai threshold untuk ROCK dan QROCK DAFTAR LAMPIRAN Halaman 1 Keterangan anggota Struktur dari 27 atribut non numeric, 15 atribut boolean, dan tiga atribut numeric Nilai total cohesion untuk clustering algoritme ROCK dari setiap kombinasi ukuran k dan nilai threshold Nilai total cohesion untuk clustering algoritme QROCK dari setiap nilai threshold yang dicobakan Perbandingan hasil cluster algoritme ROCK dan QROCK pada nilai threshold vi

9 Latar Belakang PENDAHULUAN Sponge atau poriferans berasal dari bahasa Latin yaitu porus yang artinya pori dan ferre yang artinya memiliki. Sponge adalah hewan berpori, pada umumnya terdapat di lautan, yang memompa air melalui tubuhnya untuk menyaring partikel partikel sebagai makanannya. Berdasarkan tipe spicules dari kerangka tubuhnya bunga karang dikelompokan menjadi tiga kelas yaitu Calcarea, Hexactenellida, dan Demospongiae. Beberapa ahli taksonomi berpendapat adanya kelas lain yaitu Sclerospongiae. Ditemukannya kelas dan species baru mendorong ilmuwan ilmuwan ahli taksonomi untuk melakukan penelitian lebih lanjut terhadap bunga karang berdasarkan anatomy, phisiology, geological history, dan lineage untuk memperoleh kemungkinan mendapatkan kelas dan species baru. Iosune Uriz dan Marta Domingo melakukan riset dan pengumpulan data terhadap bunga karang (sponge) di Lautan Atlantik. Jenis bunga karang pada data tersebut adalah O.Hadromerida (Demospongiae. Porifera) dan berdasarkan taksonominya termasuk kelas Demospongiae. Salah satu tujuan riset dan pengumpulan data tersebut adalah untuk mengetahui model cluster berdasarkan anatomy dan phisiology sponge. Model cluster tersebut diharapkan dapat direpresentasikan pada klasifikasi taksonomi sehingga dapat memprediksikan ada atau tidaknya kemungkinan species atau bahkan kelas baru dari data sponge tersebut. Data mining merupakan proses ekstraksi informasi atau pola yang penting dalam basis data yang berukuran besar (Han & Kamber, 2006). Data mining yang diterapkan pada data bunga karang tersebut diharapkan mampu menggali informasi pola cluster data tersebut. Clustering adalah proses data mining untuk melihat pola pendistribusian data yang akan digunakan untuk melihat karakteristik dari data (Han & Kamber 2006). Pola yang dihasilkan adalah pengelompokan himpunan objek ke dalam kelas-kelas berdasarkan nilai maksimal kemiripan data antar cluster. Sebagian besar data bunga karang adalah data kategorik. Algoritme ROCK dan QROCK merupakan algoritme clustering hirarki aglomeratif untuk data kategorik, oleh karena itu algoritme yang digunakan adalah algoritme ROCK dan QROCK. ROCK (RObust Clustering using links) adalah algoritme yang membangun link untuk menggabungkan cluster-cluster-nya dan tidak menggunakan jarak (distance) seperti pada algoritme clustering pada umumnya. Algoritme ROCK tidak hanya menghasilkan kualitas yang lebih baik daripada algoritme clustering distance tetapi juga memiliki penanganan data kategorik yang lebih baik (Guha et al 2000). QROCK adalah perbaikan dari algoritme ROCK karena dari segi waktu iterasi lebih efisien dan dapat mendeteksi outlier dari hasil proses algoritme ROCK (M.Dutta et al. 2005). Tujuan Tujuan dari penelitian ini adalah : 1 Menerapkan teknik clustering ROCK dan QROCK pada data kategorik dari bunga karang. 2 Membandingkan kualitas cluster yang dihasilkan oleh algoritme ROCK dan QROCK pada data kategorik dari bunga karang. Ruang Lingkup Penelitian ini dibatasi pada penggunaan teknik clustering untuk data kategorik dengan menggunakan algoritme ROCK dan QROCK. Data yang digunakan adalah data bunga karang jenis O.Hadromerida (Demospongiae. Porifera) yang terdapat di Lautan Atlantik hasil penelitian Iosune Uriz dan Marta Domingo pada tahun Data dapat diunduh pada situs Manfaat Penelitian Penelitian ini diharapkan dapat bermanfaat bagi pihak-pihak yang membutuhkan informasi tentang penjelasan cara kerja ROCK dan QROCK, serta perbandingan diantara keduanya. TINJAUAN PUSTAKA Knowledge Discovery in Database (KDD) Knowledge Discovery in Database (KDD) adalah proses menentukan informasi yang berguna serta pola-pola yang ada dalam data (Goharian & Grossman, 2003). Informasi ini terkandung dalam basis data yang berukuran besar yang sebelumnya tidak diketahui dan potensial bermanfaat (Han & Kamber, 2006). KDD merupakan sebuah proses yang terdiri dari serangkaian proses iterative yang terurut. 1

10 Data mining merupakan salah satu langkah dalam prosess KDD. Tahapan proses KDD dapat dilihat pada Gambar 1. Gambar 1 Tahapan dalam KDD (Han & Kamber, 2006). Tahapan proses KDD menurut Han & Kamber (2006) terdiri dari : 1 Pembersihan data Pembersihan data dilakukan untuk menghilangkan data yang tidak konsisten dan mengandung noise. 2 Integrasi data Proses integrasi data dilakukan untuk menggabungkan data dari berbagai sumber menjadi bentuk sebuah penyimpanan data yang saling berhubungan, seperti dalam data warehousing. 3 Seleksi data Proses seleksi data mengambil data yang relevan digunakan untuk proses analisis. 4 Tranformasi data Proses ini mentransformasikan atau menggabungkan data ke dalam bentuk yang tepat untuk dilakukan proses mine dengan cara melakukan peringkasan atau operasi agregasi. Dalam beberapa kasus proses tranformasi dilakukan sebelum proses seleksi, misalnya dalam kasus data warehouse. 5 Data mining Data mining merupakan proses yang penting, di mana metode-metode cerdas diaplikasikan untuk mengekstrak polapola dalam data. 6 Evaluasi pola Evaluasi pola diperlukan untuk mengidentifikasi beberapa pola yang menarik dalam merepresentasikan pengetahuan. 7 Presentasi pengetahuan Penggunaan visualisasi dan teknik representasi untuk menunjukan pengetahuan hasil penggalian dari tumpukan data kepada pengguna. Data Mining Data mining merupakan suatu proses untuk menemukan pola-pola yang menarik dari data berukuran besar yang disimpan di basis data, data warehouse, atau sarana penyimpanan yang lain (Han & Kamber, 2006). Proses data mining dapat dibedakan menjadi dua tujuan utama yaitu (Kantardzic 2003) : 1 Descriptive data mining Deskripsi konsep atau task-relevan data dalam bentuk yang ringkas, informatif, dan diskriminatif. 2 Predictive data mining Dari hasil analisis data dibuat model untuk dijadikan alat prediksi tren dan data yang tidak diketahui nilainya. Clustering Clustering merupakan proses dari data mining untuk mengelompokkan kumpulan objek ke dalam kelas-kelas atau cluster sehingga objek-objek dalam satu cluster memiliki kemiripan yang tinggi tetapi tidak mirip terhadap objek dari cluster lain (Han & Kamber, 2006). Ukuran kemiripan dan ketidakmiripan dinilai berdasarkan nilai atribut yang mendeskripsikan objek. Metode yang umum digunakan dalam clustering dapat diklasifikasikan sebagai berikut (Han & Kamber, 2006) : 1 Metode partisi Metode yang membangun berbagai partisi (bagian) kemudian mengevaluasinya dengan beberapa kriteria. Metode ini akan memindahkan objek dari satu kelompok ke kelompok lain. 2 Metode hirarki Metode yang membangun dekomposisi hirarki dari himpunan data (objek) menggunakan beberapa kriteria. 3 Metode berdasarkan kepekatan Metode yang berdasarkan kepada keterhubungan diantara objek dan fungsi kepadatan. 2

11 4 Metode berdasarkan grid Metode yang berdasarkan kepada struktur multiple level granularity. 5 Metode berdasarkan model Metode yang menjadikan sebuah model merupakan patokan bagi setiap cluster mendapatkan model yang tepat terhadap suatu data dengan model yang diberikan. Agglomerative Hirarchical Clustering Agglomerative hirarchical clustering adalah metode clustering hirarki yang pada langkah awal menganggap masing-masing objek adalah cluster, cluster digabungkan pada coarser partition atau partisi yang lebih kasar dan proses penggabungan tersebut berlangsung sampai trivial partition terbentuk yaitu ketika semua objek berada pada satu cluster (Kantardzic 2003). Sebagian besar algoritme agglomerative hirarchical clustering terdiri dari algoritme single link atau algoritme complete link. Pada single link method jarak antara dua cluster adalah minimum jarak antardua objek dari dua cluster (minimum jarak antardua cluster). Sedangkan complete link method jarak antardua cluster adalah maksimum jarak antara dua objek dari dua cluster (maksimum jarak antardua cluster) (Kantardzic 2003). Data Kategorik Data kategorik yaitu data non-numeric (symbolic) yang variabelnya memiliki dua relasi. Contoh dari data kategorik seperti warna mata, jenis kelamin, dan kewarganegaraan (Kantardzic 2003). Biasanya data kategorik adalah data hasil pengamatan. Data numerik adalah data metric atau data yang merupakan hasil pengukuran. Data kategorik diklasifikasikan menjadi dua yaitu : 1. Data nominal yaitu data kategorik yang tak dapat dinyatakan bahwa kategori yang satu lebih baik dari kategori lainnya. Contoh dari data nominal yaitu pria wanita, ungu biru. 2. Kategorik ordinal, yaitu data kategorik yang mempunyai urutan tertentu namun jarak antar kategori sulit untuk dinyatakan sama. Contoh dari data ordinal yaitu keadaan baik, sedang, dan buruk. ROCK (RObust Clustering using links) ROCK adalah algoritme clustering hirarki aglomeratif untuk mengelompokkan data kategorik (Guha et al. 2000). ROCK merupakan algoritme yang membangun link untuk menggabungkan cluster-cluster-nya dan tidak menggunakan distance seperti algoritme clustering pada umumnya (Guha et al. 2000). Link antar dua tuple pada ROCK adalah nilai common neighbor yang mereka miliki dari data set. Common neighbor yaitu jumlah tetangga yang sama diantara dua objek data. Algoritme ROCK akan berhenti ketika (M.Dutta et al. 2005) : 1 Jumlah dari cluster yang diharapkan sudah terpenuhi, 2 Tidak ada lagi link antar cluster-clusternya. Langkah-langkah dalam algoritme ROCK yaitu (M.Dutta et al. 2005) : 1 Menentukan inisialisasi untuk masingmasing data poin sebagai cluster pada awalnya. 2 Menghitung similaritas antarcluster dengan cluster lainnya dengan menggunakan persamaan : dan...(1) adalah pasangan cluster yang akan dihitung similaritasnya, k merupakan nomor atribut dan adalah jumlah kandidat atribut ke k. Penjumlahan satu perjumlah kandidat atribut dilakukuan untuk atribut yang bukan anggota atribut irisan dan. 3 Mencari nilai nbrlist antarcluster dengan cluster lainnya. Nbrlist yaitu matrik nilai tetangga yang didapat dari threshold yang diberikan (nilai threshold antara 0 dan 1). Suatu objek dan bertetangga jika...(2) 4 Menghitung link antarcluster dengan cluster lainnya. antar objek diperoleh dari jumlah common neighbor dan. Jika 3

12 bernilai besar maka kemungkinan besar dan berada pada cluster yang sama. 5 Menentukan local heap. Local heap yaitu nilai goodness measure untuk setiap cluster dengan cluster lainnya jika link 0. Goodness measure yaitu persamaan yang menghitung jumlah link dibagi dengan kemungkinan link yang akan terbentuk dilihat dari ukuran cluster-nya. Persamaan untuk mencari goodness measure :...(3) adalah jumlah common neighbor dari dan, adalah jumlah anggota cluster i dan adalah jumlah anggota cluster j, dengan persamaan :...(4) 6 Menentukan global heap. Global heap yaitu nilai maksimum goodness measure antar kolom di baris ke i. 7 Ulangi langkah 5 dan 6 hingga mendapat kan nilai maksimum di global heap dan local heap. 8 Selama ukuran data > k, dengan k adalah jumlah kelas yang ditentukan lakukan penggabungan cluster yang memiliki nilai local heap terbesar dengan global heap terbesar menjadi satu cluster, tambahkan link antar cluster yang digabungkan, hapus cluster yang digabungkan dari local heap dan update global heap dengan nilai hasil penggabungan. 9 Lakukan langkah 8 hingga menemukan jumlah cluster yang diharapkan (k) atau cluster akan dibangkitkan secara otomatis ketika tidak ada lagi link antar clusternya. yaitu Time complexity pada saat worst case n adalah jumlah data, neighbor, dan neighbor. dengan maksimum jumlah nilai rata-rata jumlah QROCK (Quick RObust Clustering using links) QROCK adalah algoritme yang memiliki metode yang lebih efisien untuk menghasilkan cluster akhir algoritme ROCK ketika ROCK sudah tidak memiliki link antar cluster-nya (M.Dutta, et al. 2005). QROCK tidak lagi menggunakan link untuk menggabungkan cluster-cluster-nya tetapi menggunakan primitif tipe data abstrak MFSET. MFSET (Merge Find Set) atau disjoint set adalah suatu struktur data yang menggunakan dua operasi yaitu : 1 Find: menentukan himpunan yang berisi elemen khusus. Digunakan untuk menentukan dua elemen yang berada pada himpunan yang sama. 2 Merge: menggabungkan dua himpunan menjadi satu himpunan. MFSET yang digunakan pada QROCK yaitu (M.Dutta et al ): 1 Merge (A,B) : menggabungkan komponen A dan B. 2 Find (x) : mencari komponen yang salah satu anggota dari komponen tersebut adalah x. 3 Initial (x) : membuat komponen yang hanya berisi elemen x. Langkah-langkah dalam algoritme QROCK yaitu (M.Dutta et al ) : 1 Menentukan inisialisasi untuk masingmasing data poin sebagai cluster pada awalnya. 2 Menghitung similaritas antar cluster dengan cluster lainnya dengan menggunakan persamaan (1). 3 Mencari nilai nbrlist antar cluster dengan cluster lainnya. 4 Inisialisasi MFSET yang terdiri dari count, first element, set name, next element. 5 Inisialisasi elemen x adalah anggota himpunan data. 6 Inisialisasi elemen y adalah semua nilai nbrlist x = 1. 7 Find nilai A sebagai first element nilai x. 8 Find nilai B sebagai first element nilai y. 9 Jika nilai A B maka merge A dan B, selainnya passed. 10 Ulangi langkah 5 dan 6 selama y berada dalam nbrlist. 4

13 Time complexity dari algoritme QROCK yaitu. Evaluasi Cluster Cluster validation adalah kemampuan untuk mendeteksi ada atau tidaknya suatu stuktur tidak acak dalam data. Beberapa aspek penting dalam cluster validation yaitu (Tan et al. 2006) : 1 Menentukan clustering tendency dari data. Clustering tendency yaitu kecenderungan sifat dari suatu cluster. 2 Menentukan jumlah cluster yang tepat. 3 Mengevaluasi seberapa baik hasil analisis cluster tanpa diberikan informasi eksternal. 4 Membandingkan hasil analisis cluster terhadap hasil eksternal yang diketahui, misalnya label kelas eksternal. 5 Membandingkan dua himpunan cluster untuk menentukan yang lebih baik. Pada aspek satu, dua dan tiga tidak diperlukan informasi eksternal yang merupakan teknik unsupervised, sedangkan aspek empat membutuhkan informasi eksternal. Aspek empat termasuk teknik supervised. Aspek lima dapat dilakukan pada teknik supervised atau unsupervised. Perhitungan evaluasi dapat digolongkan menjadi tiga jenis yaitu (Tan et al. 2006) : 1 Unsupervised. Mengukur goodness dari struktur clustering tanpa informasi eksternal. Besaran unsupervised dibagi dua yaitu : cluster cohesion (seberapa dekat suatu objek dalam suatu cluster) dan cluster separation atau isolation (perbedaan atau seberapa jauh suatu cluster dengan cluster lainnya). 2 Supervised. Mengukur kecocokan struktur clustering dengan struktur eksternal. 3 Relative. Membandingkan clustering yang beda. Besaran evaluasi cluster relative merupakan teknik unsupervised atau supervised yang digunakan untuk perbandingan. Algoritme ROCK dan QROCK merupakan teknik unsupervised dan graphbase sehingga cohesion didapatkan dengan menjumlahkan bobot link dari proximity graf yang terhubungkan pada cluster dengan persamaan (Tan et al. 2006) :..(5) Demikian juga dengan separation antar dua cluster dapat dihitung dari jumlah bobot link suatu objek data dalam suatu cluster ke objek data di cluster lain dengan persamaan :...(6) Fungsi proximity dapat berupa similarity, dissimilarity atau fungsi kuantitas lainnya. Dikarenakan fungsi kuantitas dari algoritme ROCK dan QROCK adalah fungsi goodness pada persamaan (3) maka persamaan yang digunakan untuk menghitung nilai evaluasi cluster-nya adalah persamaan goodness measure dibagi m yaitu cluster yang terbentuk. Persamaan cohesion dan separation tersebut yaitu :...(7)...(8) Dengan sama dengan persamaan (4). Semakin tinggi nilai total cohesion dan semakin minimum nilai separation maka semakin baik suatu cluster terhadap yang lainnya. Karena fungsi yang digunakan adalah fungsi goodness measure yang semakin besar nilai goodness-nya maka semakin dekat suatu objek cluster dengan objek lainnya. Outlier Outlier menurut ilmu statistik adalah data yang terdapat di atas batas atas atau di bawah batas bawah rentangan data (Huntsbergen 1987). Outlier adalah data yang tidak mengikuti tingkahlaku umum sebagian besar data, perbedaan yang penting atau sesuatu yang tidak konsisten dalam himpunan data (Kantardzic 2003). METODE PENELITIAN Proses Knowledge Discovery in Database Penelitian ini akan dianalisis dengan menggunakan langkah-langkah Knowledge Discovery in Database (KDD) (Han & Kamber, 2006) dengan tahapan seperti pada Gambar 2. 5

14 objek diperoleh dari jumlah common neighbor dan. Gambar 2 Langkah-langkah KDD dalam penelitian. 1 Preprocessing data Praproses data meliputi pembersihan data, integrasi data, seleksi data, dan transformasi data. 2 Data mining Dalam penelitian ini digunakan algoritme ROCK dan QROCK. Algoritme ROCK dan QROCK digunakan untuk mengelompokan data bunga karang (sponge) sehingga didapatkan pola-pola cluster bunga karang jenis O.Hadromerida (Demospongiae. Porifera) berdasarkan anatomi dan fisiologinya. Perbandingan langkah-langkah algoritme ROCK dan QROCK digambarkan pada Gambar 3. Penjelasan dari tahapan algoritme ROCK yaitu : 1 Menentukan inisialisasi untuk masing-masing data poin sebagai cluster pada awalnya. 2 Menghitung similaritas antar cluster dengan cluster lainnya 3 Mencari nilai nbrlist antar cluster dengan cluster lainnya. 4 Menghitung link antar cluster dengan cluster lainnya. antar 5 Mengitung nilai goodness measure untuk setiap cluster dengan cluster lainnya jika link 0 yang disebut local heap. 6 Memilih nilai maksimum goodness measure antar kolom di baris ke i yang disebut global heap. 7 Ulangi langkah 5 dan 6 hingga mendapatkan nilai maksimum di global heap dan local heap. 8 Selama ukuran data > k, dengan k adalah jumlah kelas yang ditentukan lakukan penggabungan cluster yang memiliki nilai local heap terbesar dengan global heap terbesar menjadi satu cluster, tambahkan link antar cluster yang digabungkan, hapus cluster yang digabungkan dari local heap dan update nilai global heap dengan nilai hasil penggabungan. 9 Lakukan langkah 8 hingga menemukan jumlah cluster yang diharapkan atau tidak ada lagi link antar clusternya. Langkah-langkah dari algoritme QROCK tersebut yaitu : 1 Menentukan inisialisasi untuk masing-masing data poin sebagai cluster pada awalnya. 2 Menghitung similaritas antarcluster dengan cluster lainnya. 3 Mencari nilai nbrlist antar cluster dengan cluster lainnya. 4 Inisialisasi MFSET yang terdiri dari count, first element, set name, next element. 5 Inisialisasi elemen x adalah anggota himpunan data. 6 Inisialisasi elemen y adalah semua nilai nbrlist x = 1. 7 Find nilai A sebagai first element nilai x. 8 Find nilai B sebagai first element nilai y. 9 Jika nilai A B maka merge A dan B, selainnya passed. 6

15 Gambar 3 Proses algoritme (a) ROCK dan (b) QROCK. 10 Ulangi langkah 5 dan 6 selama y berada dalam nbrlist. 3 Evaluasi pola Pada tahap ini dipergunakan persamaan (7) untuk menghitung cohesion dan persamaan (8) untuk menghitung separation. 4 Presentasi pengetahuan Tahap presentasi pengetahuan adalah tahap akhir. Dalam tahap ini akan dipresentasikan hasil dari perhitungan tahap kedua dan ketiga dalam bentuk tabel hasil clustering. 7

16 Setelah dilakukan analisis clustering maka algoritme tersebut akan dibandingkan berdasarkan cluster yang terbentuk dari hasil analisis cluster-nya. Hasil perbandingan diharapkan dapat membuktikan bahwa algoritme QROCK lebih baik dari ROCK. Lingkungan Pengembangan Aplikasi ini dibangun dengan menggunakan perangkat keras dan lunak dengan spesifikasi sebagai berikut : Perangkat keras : Processor Intel Pentium 4 RAM 512 MB DDR 1 HDD 80 GB Monitor 14 Mouse dan keyboard Perangkat lunak : Sistem operasi Windows XP SP 2 Bahasa Pemrograman Matlab 7 Microsoft Excel 2007 HASIL DAN PEMBAHASAN Preprocessing Data Data yang digunakan pada penelitian ini adalah data bunga karang atau sponge jenis O.Hadromerida (Demospongiae. Porifera) yang terdapat di Lautan Atlantik. Data diperoleh dari hasil penelitian Iosune Uriz dan Marta Domingo pada tahun Data ini memiliki 76 record dan 45 atribut. Format awal data adalah format txt. Tahap praproses data dilakukan terhadap data bunga karang meliputi: 1 Data selection Pada proses ini dilakukan dua tahapan : a b Seleksi record. Dari 76 record data terdapat 22 missing data pada atribut ke 39, oleh karena itu diperlukan pemilihan record yang sesuai sehingga data yang hilang tidak mempengaruhi hasil. Pada penelitian ini seleksi record dilakukan dengan cara membuang 22 record missing data, sehingga dihasilkan 54 record data. Data sponge tersebut dapat dilihat pada Lampiran 1. Seleksi atribut. Dalam data yang digunakan terdapat 45 atribut yang terdiri dari 27 atribut non-numerik, 15 atribut boolean, dan tiga atribut numeric. Karena tiga atribut numeric dalam bentuk bilangan diskret maka diasumsikan bahwa nilai dari atribut tersebut merupakan hasil pengamatan yang didiskretkan sehingga dapat dijadikan kategori. Oleh karena semua atribut yang ada berhubungan dengan struktur anatomi dan fisiologi dari bunga karang maka semua atribut digunakan dalam proses data mining. Atribut yang digunakan dapat dilihat pada Lampiran 2. 2 Data transformation Pada tahapan proses ini dilakukan tranformasi data dari format.txt ke format.xls agar dapat diproses dengan mudah oleh MATLAB. Kemudian dilakukan inisialisasi untuk setiap data kedalam bentuk integer untuk mempermudah proses perhitungan similaritas. Data Mining Pada tahap ini dilakukan clustering menggunakan langkah-langkah dari algoritme ROCK dan QROCK. Pada langkah pertama akan dilakukan proses clustering menggunakan algoritme ROCK. Percobaan clustering dilakukan untuk ukuran cluster dua sampai 13 (k = 2 13). Untuk masing masing ukuran cluster dilakukan percobaan dengan nilai threshold diambil pada selang 0 sampai 1 (0:0.1:1). Cluster hasil ditentukan sedemikian sehingga cluster hasil memiliki nilai cohesion yang tinggi dan telah merepresentasikan pola anatomi dari sponge. Cluster yang dihasilkan oleh algoritme ROCK berjumlah tujuh cluster dengan nilai threshold 0.6. Hasil algortme ROCK tersebut disajikan pada Tabel 1. Tabel 1 Cluster hasil algoritme ROCK untuk ukuran k = 7 dan = 0,6 Cluster Anggota 1 [ ] 2 [ ] 3 [ ] 4 [ ] 5 [ ] 6 [ ] 7 [ ] Persentase dan jumlah anggota masingmasing cluster algoritme ROCK dengan ukuran k = 7 dan threshold = 0,6 disajikan dalam Tabel 2. 8

17 Tabel 2 Persentase dan jumlah anggota cluster algoritme ROCK untuk ukuran k = 7 dan = 0,6 Cluster Jumlah anggota Persentase (%) Pola anatomi yang direpresentasikan dari cluster hasil algoritme ROCK yaitu : 1 Anggota cluster satu merupakan sponge yang tidak memiliki bagian dalam cortex, tidak memiliki espicula, megasclera tipe satu dan warnanya selain warna biru, kuning dan orange permukaan halus. 2 Anggota cluster dua merupakan sponge yang memiliki cortex, tidak memiliki tipe espicula, megasclera tipe tiga, dan bentuk lapisan permukaannya keras. 3 Cluster tiga merupakan sponge yang tidak memiliki cortex, tidak memiliki espicula, megasclera tipe satu, berwarna kuning dan lapisan permukaan kasar. 4 Anggota cluster empat merupakan sponge yang tidak memiliki cortex, tidak memiliki espicula, megasclera tipe satu dan dua, berwarna kuning, selain biru dan orange, memiliki lapisan permukaan halus namun keras. 5 Cluster lima merupakan sponge yang memiliki cortex, memiliki espicula, megasclera tipe tiga dan satu, warnanya selain warna biru dan orange, bentuk lapisan permukaannya beragam dan keras. 6 Cluster enam merupakan sponge yang tidak memiliki cortex, tidak memiliki espicula, megasclera tipe satu, dua, dan tiga, berwarna kuning, selain biru dan orange, memiliki lapisan permukaan halus dan kasar serta keras. 7 Cluster tujuh merupakan sponge yang memiliki cortex, tidak memiliki espicula dan memiliki espicula, megasclera tipe satu, dua, dan tiga, berwarna kuning, selain biru dan orange, memiliki permukaan yang keras. Pada percobaan untuk algoritme QROCK tidak diperlukan penentuan ukuran cluster karena ukuran cluster akan dibangkitkan otomatis oleh algoritme QROCK. Pada algoritme ini hanya diperlukan masukan data dan nilai threshold. Nilai threshold pada percobaan ini diambil pada selang 0 sampai dengan 1 (0:0.05:1). Percobaan clustering dilakukan dengan memasukan nilai threshold yang bervariasi hingga menghasilkan cluster yang memiliki nilai cohesion yang tinggi dan telah merepresentasikan pola anatomi dari sponge. Cluster yang dihasilkan oleh algoritme QROCK berjumlah enam cluster dengan nilai threshold Hasil algoritme QROCK tersebut disajikan pada Tabel 3. Tabel 3 Cluster yang dihasilkan oleh algoritme QROCK pada ukuran k = 6 dan = 0,85 Cluster Anggota 1 [1] [ ] 3 [10] [ ] 5 [42 43] 6 [46 47] Persentase dan jumlah anggota masingmasing cluster algoritme QROCK pada ukuran k = 6 dan threshold = 0,85 disajikan dalam Tabel 4. Tabel 4 Persentase dan jumlah anggota cluster algoritme QROCK pada ukuran k = 6 dan = 0,85 Cluster Jumlah anggota Persentase (%)

18 Pola anatomi yang direpresentasikan dari cluster hasil algoritme QROCK yaitu : 1 Anggota cluster satu merupakan sponge yang memiliki cortex, tidak ada espicula, megasclera tipe satu, warna selain kuning, biru dan orange, permukaannya kasar. 2 Cluster dua sponge yang memiliki cortex, megascleras tipe satu dan dua, tidak memiliki espicula, warna kuning dan selain biru dan orange, permukaan halus dan keras. 3 Anggota cluster tiga sponge yang memiliki cortex dan espicula, megasclera tipe tiga, permukaannya halus dan warnanya kuning. 4 Cluster empat sponge yang memiliki cortex dan tidak memiliki espicula, megasclera tipe tiga, warna selain kuning, biru dan orange, permukaan halus tapi keras. 5 Cluster lima sponge yang tidak memiliki cortex namun memiliki espicula, megasclera tipe tiga, warna kuning, lapisan permukaan halus dan kasar. 6 Cluster enam merupakan sponge yang memiliki cortex dan tidak memiliki espicula, tidak memiliki megasclera, warna selain kuning, biru dan orange, permukaannya berbentuk poligon besar dan kasar. Pada kasus algoritme ROCK yang membutuhkan dua parameter ukuran cluster dan nilai threshold, algoritme berhenti setelah mendapatkan k cluster yang ditentukan maka k > untuk nilai threshold. Cluster tambahan ( buah) tidak lain merupakan calon anggota cluster, namun karena nilai k terpenuhi maka proses merge tidak sempat dikerjakan. Selain itu, kondisi data dalam jumlah besar dan kemungkinan memiliki outliers sangat sulit untuk menentukan nilai k. Algoritme QROCK lebih mudah dan natural karena tidak harus menentukan ukuran k dibandingkan algoritme ROCK. Evaluasi Pola Hasil clustering dari setiap kombinasi ukuran cluster dan nilai threshold dievaluasi menggunakan total cohesion dengan menggunakan persamaan (7) dan nilai separation dengan menggunakan persamaan (8). Nilai total cohesion untuk clustering algoritme ROCK disajikan pada Lampiran 3. Pada algoritme ROCK pola anatomi sponge dapat direpresentasikan setelah ukuran cluster tujuh. Pada tabel di Lampiran 3 dapat terlihat bahwa untuk ukuran cluster tujuh dengan nilai cohesion yang paling tinggi terdapat pada nilai threshold 0.6, maka cluster yang dipilih untuk algoritme ROCK adalah ukuran cluster tujuh dengan = 0.6. Nilai cohesion dan nilai separation untuk cluster tujuh dan = 0.6 tersebut disajikan pada Tabel 5. Tabel 5 Nilai cohesion dan nilai separation algoritme ROCK untuk cluster delapan dan = 0.7 Cluster Jumlah Anggota Cohesion Separation , , Nilai total cohesion untuk clustering dari setiap kombinasi nilai threshold bagi algoritme QROCK disajikan pada Lampiran 4. Pada algoritme QROCK pola anatomi sponge dapat direpresentasikan pada ukuran cluster enam. Pada tabel di Lampiran 4 dapat dilihat bahwa untuk nilai (threshold) = 0.85 total cohesion memiliki nilai cohesion yang tinggi dibandingkan dengan cluster sembilan yang dihasilkan oleh nilai threshold = 0.87, maka cluster yang dipilih untuk algoritme QROCK adalah cluster ukuran enam dengan = Nilai cohesion dan nilai separation untuk ukuran cluster enam dan = 0.85 tersebut disajikan pada Tabel 6. 10

19 Tabel 6 Nilai cohesion dan nilai separation algoritme QROCK untuk cluster enam dan = 0.85 Cluster Jumlah anggota Cohesion Separation Semakin besar nilai cohesion (intracluster) menunjukkan kemiripan (similaritas) objek-objek tersebut semakin besar (Mali & Mitra, 1998). Semakin kecil nilai separation yang menggunakan persamaan similaritas maka perbedaan atau jarak suatu cluster dengan cluster lainnya semakin besar (Tan et al. 2006). Dengan demikian suatu cluster dikatakan baik jika nilai cohesion lebih besar dari nilai separation-nya. Dari Tabel 5 dapat dilihat bahwa algoritme ROCK memiliki nilai total cohesion 7.498,6 dan nilai separation Nilai separation lebih besar dibandingkan nilai cohesion-nya. Sedangkan dari Tabel 6 terlihat bahwa algoritme QROCK memili ki nilai cohesion ,3 dan nilai total separation 0. Nilai separation algoritme QROCK lebih kecil dibandingkan nilai cohesion-nya. Dengan demikian berdasarkan hasil penelitian ini, cluster yang dihasilkan algoritme QROCK lebih baik dibandingkan cluster yang dihasilkan algoritme ROCK. Ukuran Cluster dan Nilai Cohesion Nilai cohesion menentukan kualitas suatu cluster sementara ukuran cluster menentukan nilai total cohesion. Nilai cohesion menentukan kualitas suatu cluster karena dengan semakin tinggi nilai cohesion maka semakin baik kualitas suatu cluster. Ukuran cluster menentukan nilai total cohesion karena semakin banyak cluster yang terbentuk maka semakin sedikit anggota suatu cluster dan semakin sedikit pula nilai total cohesion-nya. Hubungan antar ukuran cluster dan nilai cohesion pada algoritme ROCK dapat dilihat pada Lampiran 3. Nilai total cohesion dan ukuran cluster pada nilai threshold 0.7 untuk algoritme ROCK dapat dilihat pada Tabel 7. Tabel 7 Nilai total cohesion dan ukuran cluster algoritme ROCK pada nilai threshold 0.6 Cluster Threshold Berdasarkan Tabel 7 dapat dilihat grafik nilai k terhadap nilai total cohesion pada Gambar 4. Gambar 4 Grafik nilai cohesion terhadap nilai k pada algoritme ROCK. Nilai total cohesion dan ukuran cluster pada algoritme QROCK dapat dilihat pada Lampiran 4. Nilai k terhadap total cohesion dari Lampiran 4 diplotkan pada grafik dalam Gambar 5. 11

20 kumpulan cluster sebagai sekumpulan komponen graf L (M.Dutta et al. 2005). Misalkan adalah jumlah cluster akhir graf L berdasarkan. Nilai dapat diambil pada rentang 0 sampai dengan 1, sedemikian sehingga nilai konstan. Sehingga jika maka nbrlist dari nbrlist, jumlah anggota cluster jumlah anggota Gambar 5 Grafik nilai cohesion terhadap nilai k pada algoritme QROCK. Dari grafik Gambar 4 dan 5 dapat disimpulkan bahwa semakin besar jumlah k maka semakin kecil nilai total cohesion-nya, hal ini disebabkan semakin banyak cluster mengakibatkan jumlah anggota suatu cluster semakin sedikit sehingga menyebabkan nilai total cohesion menjadi kecil. Perbandingan nilai cohesion terhadap ukuran cluster antara algoritme ROCK dan QROCK dapat dilihat pada Gambar 6. Gambar 6 Perbandingan nilai cohesion terhadap ukuran cluster untuk ROCK dan QROCK. Pada algoritme QROCK menurunnya nilai cohesion lebih dipengaruhi oleh nilai threshold dibandingkan oleh ukuran cluster karena ukuran clusternya ditentukan secara otomatis oleh algoritme QROCK berdasarkan nilai threshold yang ditentukan. cluster, cluster cluster (M.Dutta et al. 2005). Hubungan antar nilai threshold dan nilai cohesion pada algoritme ROCK dapat dilihat pada Tabel 8. Tabel 8 Hubungan antar nilai threshold dan nilai cohesion pada algoritme ROCK pada ukuran cluster tujuh Threshold Cluster Berdasarkan Tabel 8 dapat digambarkan grafik hubungan nilai threshold terhadap nilai total cohesion pada Gambar 7. Nilai Threshold dan Nilai Cohesion Nilai threshold pada algoritme ROCK menentukan kepadatan dari graf L (graf yang dibangkitkan oleh algoritme ROCK), sehingga menentukan hasil akhir algoritme ROCK. Pada saat nilai k tidak diberikan, algoritme ROCK akan berhenti secara otomatis dengan 12

21 Gambar 7 Grafik nilai threshold terhadap nilai cohesion pada algoritme ROCK. Pada algoritme QROCK, cluster akhir hanya ditentukan oleh nilai threshold sehingga proses algoritme dapat berhenti secara natural (M.Dutta et al 2005). Nilai total cohesion dan ukuran cluster pada algoritme QROCK dapat dilihat pada Lampiran 4. Nilai k terhadap total cohesion dari Lampiran 4 digambarkan pada grafik dalam Gambar 8. Gambar 8 Grafik nilai threshold terhadap nilai cohesion pada algoritme QROCK. Dari grafik Gambar 7 dan 8 dapat disimpulkan bahwa semakin besar nilai threshold maka semakin kecil nilai total cohesion-nya ini dikarenakan nilai nbrlist semakin kecil mengakibatkan jumlah anggota suatu cluster semakin sedikit sehingga menyebabkan nilai total cohesion menjadi kecil. Perbandingan nilai cohesion terhadap nilai threshold antara algoritme ROCK dan QROCK dapat dilihat pada Gambar 9. Gambar 9 Perbandingan nilai cohesion terhadap nilai threshold untuk ROCK dan QROCK. Mendeteksi Outlier Algoritme ROCK akan berhenti ketika : jumlah cluster yang diharapkan terpenuhi atau tidak ada lagi link diantara cluster-cluster-nya. Pada suatu kasus algoritme ROCK berhenti ketika tidak ada lagi link antar cluster-nya dikarenakan sudah tidak memiliki link yang tidak nol antara mereka, namun ketika kasus yang sama diproses oleh algoritme QROCK ternyata masih memiliki link antar clusternya. Teorema 1 : Jika cluster akhir hasil algoritme ROCK sudah tidak memiliki link yang tidak nol antara mereka maka cluster tersebut tidak lain adalah sebuah link graf L yang komponenkomponennya saling berhubung (M.Dutta et al. 2005). Pembuktian dari teorema tersebut ada dua yaitu : 1 Jika algoritme ROCK berhenti karena tidak ada lagi link yang tidak nol (global heap semuanya nol proses algoritme ROCK berhenti), maka cluster yang terbentuk merupakan komponen terhubung dari graf L. 2 Komponen terhubung tersebut sebenarnya adalah cluster itu sendiri yang merupakan hasil algoritme ROCK (M.Dutta et al. 2005). Pembuktian pertama terjadi pada saat nilai threshold 0.9 untuk kombinasi ukuran cluster dua sampai dengan 13 cluster yang terbentuk sebanyak 23 cluster. Hal tersebut dikarenakan tidak ada lagi link yang tidak nol maka algoritme ROCK menghasilkan secara otomatis 23 cluster. Pada algoritme QROCK 13

22 ketika nilai threshold 0.9 cluster yang terbentuk adalah 19 cluster, dimana data ke 14 masih dapat digabung dengan data ke 19, data ke 42 digabung dengan data ke 43, data ke 46 masih bisa digabung dengan data ke 47, dan data ke 18 digabung dengan data ke 27. Dari hasil penelitian tersebut terbukti bahwa algoritme QROCK dapat mendeteksi outlier pada algoritme ROCK. Perbandingan hasil cluster algoritme ROCK dan QROCK pada nilai threshold 0.9 dapat dilihat pada Lampiran 5. KESIMPULAN DAN SARAN Kesimpulan Pada penelitian ini dilakukan proses clustering menggunakan algoritme ROCK dan QROCK untuk data bunga karang (sponge). Percobaan clustering untuk algoritme ROCK dilakukan untuk ukuran cluster dua sampai 13 (k = 1 13) untuk masing masing ukuran cluster dilakukan percobaan dengan nilai threshold diambil pada selang 0 sampai 1 (0:0,1:1). Pada algoritme QROCK ukuran cluster akan dibangkitkan otomatis oleh algoritmenya, algoritme QROCK hanya membutuhkan nilai threshold untuk menghasilkan cluster. Percobaan cluster pada algoritme QROCK dilakukan berdasarkan variasi nilai threshold pada selang 0 sampai 1 (0:0,05:1). Algoritme QROCK terbukti lebih mudah dibandingkan algoritme ROCK karena tidak perlu menentukan ukuran dari cluster. Dari percobaan diperoleh hasil clustering terbaik untuk algoritme ROCK adalah clustering dengan ukuran cluster tujuh dan nilai threshold 0.6, memiliki nilai total cohesion 7.498,6 dan nilai separation Clustering terbaik untuk algoritme QROCK yaitu cluster berukuran enam dan nilai threshold Nilai total cohesion ,3 dan nilai total separation 0. Dilihat dari nilai cohesion dan separation algoritme ROCK memiliki nilai cohesion lebih kecil dibandingkan nilai separationnya. Sedangkan untuk algoritme QROCK nilai cohesion lebih besar dari pada nilai separationnya. Dengan demikian dapat disimpulkan algoritme QROCK lebih baik dibandingkan algoritme ROCK. Pada percobaan untuk nilai threshold 0.9 algoritme ROCK menghasilkan 23 cluster karena sudah tidak ada lagi nilai link yang tak nol, sedangkan pada algoritme QROCK dengan nilai threshold 0.9 dihasilkan 19 cluster. Dengan demikian dapat disimpulkan bahwa algoritme QROCK dapat mendeteksi outlier pada algoritme ROCK. Algoritme ROCK dan QROCK dapat digunakan untuk data kategorik, namun menurut hasil dari penelitian ini algoritme QROCK lebih baik dari pada algoritme ROCK. Saran Penelitian ini dapat dilanjutkan dengan menentukan klasifikasi taksonomi dari data sponge dari cluster-cluster yang telah dihasilkan. Perbandingan hasil clustering algoritme QROCK dapat dilakukan dengan algoritme lain yang berbeda base misal algoritme conceptual clustering yaitu COWEB dan ITERATE, sehingga dari perbandingan tersebut dapat diketahui algoritme mana yang lebih efektif digunakan untuk data kategorik. DAFTAR PUSTAKA Goharian & Grossman Introduction to Data Mining. Slide/DM-Introduction.pdf. [Juni 2008]. Guha S, Rajeev R, & Kyuseok S ROCK: A Robust Clustering Algorithm for Categorical Attributes. Proceedings of the IEEE International Conference on Data Engineering, Sydney, Maret Han J dan Kamber M Data Mining Concepts and Techniques Edisi Ke-2. San Francisco: Morgan Kaufmann Publisher. Huntsbergen Elemen of Statistical Inference. Edisi Ke-6. New York : Allyn and Balon, Inc. Kantardzic M Data Mining: Concepts, Model, Methods, and Algorithm. New Jersey: John Wiley & Sons inc. Mali K, Mitra S Clustering Validation In A Symbolic Framework. AG E/Fast.Clustering.pdf. [juli 2008]. M.Dutta, A.Kakoti M & Arun K QROCK : A Quick Version of the ROCK Algorithm for Clustering of Categorical Data. Proceedings of the 14

23 IEEE International Conference on Data Engineering, Tan P, Michael S, & Vipin K Introduction to Data Mining. Pearson Education, Inc. 15

24 LAMPIRAN

25 Lampiran 1 Keterangan anggota No Nama sponge 1 AAPTOS_AAPTOS 2 CLIONA_CARTERI 3 CLIONA_CELATA 4 CLIONA_LABYRINTHICA 5 CLIONA_SCHMIDTI 6 CLIONA_VIRIDIS 7 DIPLASTRELLA_BISTELLATA 8 LAXOSUBERITES_FERRERHERNANDEZI 9 LAXOSUBERITES_RUGOSUS 10 OXYCORDYLA_PELLITA 11 POLYMASTIA_AGGLUTINARIS 12 POLYMASTIA_ECTOFIBROSA 13 POLYMASTIA_FUSCA 14 POLYMASTIA_INFLATA 15 POLYMASTIA_INFRAPILOSA 16 POLYMASTIA_MAMMILLARIS 17 POLYMASTIA_MARTAE 18 POLYMASTIA_RADIOSA 19 POLYMASTIA_SPINULA 20 POLYMASTIA_TENAX 21 POLYMASTIA_TISSIERI 22 PROSUBERITES_EPIPHYTUM 23 PROSUBERITES_LONGISPINA 24 PROSUBERITES_RUGOSUS 25 PSEUDOSUBERITES_HYALINUS 26 PSEUDOSUBERITES_SULFUREUS 27 QUASILINA_INTERMEDIA 28 QUASILINA_RICHARDII 29 RHIZAXINELLA_BISETA 30 RHIZAXINELLA_ELONGATA 31 RHIZAXINELLA_PYRIFERA 32 RHIZAXINELLA_UNISETA 33 SPHAEROTYLUS_ANTARCTICUS 34 SPHAEROTYLUS_CAPITATUS 35 SPINULARIA_SPINULARIA 36 SPIRASTRELLA_CUNCTATRIX 37 SPIRASTRELLA_MINAX 38 SUBERITES_CAMINATUS 39 SUBERITES_CARNOSUS_V.INCRUSTANS 40 SUBERITES_CARNOSUS_V.RAMOSUS 41 SUBERITES_CARNOSUS_V.TYPICUS 43 SUBERITES_FICUS 42 SUBERITES_DOMUNCULA 44 SUBERITES_GIBBOSICEPS 45 TERPIOS_FUGAX 46 TETHYA_AURANTIUM 47 TETHYA_CITRINA 17

26 Lampiran 1 Lanjutan No Nama sponge 48 TIMEA_HALLEZI 49 TIMEA_MIXTA 50 TIMEA_STELLATA 51 TIMEA_UNISTELLATA 52 TRICHOSTEMA_HEMISPHAERICUM 53 WEBERELLA_BURSA 54 WEBERELLA_VERRUCOSA 18

27 Lampiran 2 Struktur dari 27 atribut non numeric, 15 atribut boolean, dan tiga atribut numeric No Atribut Non Numeric Atribut Boolean Atribut numeric 1 Lapisan Cortex Cortex Jumlah Papilas 2 Struktur Bagian Dalam Cortex Tiang Espiculas Dalam Panjang Megascleras Pompon di Cortex 3 Jenis Serat Cortex Tipe Akar Espicula Ketebalan Cortex Deactina 4 Bentuk Tangen Espiculas Dalam Jenis Tipe Espicula Cortex 5 Bagian Aneh Dalam Cortex Jenis Tipe Espiculas Ukuran 2 6 Penambahan Tilostilo Jenis Tipe Espiculas Tilostilo 7 Tipe Jumlah Megascleras Tipe Espiculas Estrongiloxa 8 Jenis Spicula Tipe Espiculas Tilostilo 9 Jenis Spicula Tilostilo Microscleras 10 Bentuk Dasar Tilostilo Aster 11 Bentuk Dasar Tilostilo Ectosomico Papilas 12 Bentuk Megasclera Ectosomica Tempat Tinggal Sementara 13 Tipe Megasclera Ectosomica Lapisan Tajam 14 Tipe Exostilo Peseudoraices 15 Bentuk Lapisan Tengah Megasclera Jenis Tipe Espiculas Oxas 16 Tipe Lapisan Tengah Megasclera 17 Tipe Microsclera 18 Diameter Esferaster 19 Tipe Aster 20 Tipe Diplaster 21 Tipe Esferaster 22 Bentuk Dasar 23 Bentuk Permukaan 24 Warna 25 Struktur Kerangka Espicular 26 Bentuk Lapisan 27 Susunan Megascleras Ectosilas Dalam Etosoma 19

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Sponge atau poriferans berasal dari bahasa Latin yaitu porus yang artinya pori dan ferre yang artinya memiliki. Sponge adalah hewan berpori, pada umumnya terdapat di lautan,

Lebih terperinci

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data Setelah dilakukan analisis clustering maka algoritme tersebut akan dibandingkan berdasarkan cluster yang terbentuk dari hasil analisis cluster-nya. Hasil perbandingan diharapkan dapat membuktikan bahwa

Lebih terperinci

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Pembersihan Data Lingkungan Pengembangan Sistem HASIL DAN PEMBAHASAN

Pembersihan Data Lingkungan Pengembangan Sistem HASIL DAN PEMBAHASAN 3 Nilai fuzzy support bagi frequent sequence dengan ukuran k diperoleh dengan mengkombinasikan frequent sequence dengan ukuran k-1. Proses ini akan berhenti jika tidak memungkinkan lagi untuk membangkitkan

Lebih terperinci

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian Implementasi Sistem Clustering FCM diimplementasikan pada program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Tahap implementasi sistem mengikuti langkahlangkah melakukan clustering dengan FCM,

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

VISUALISASI K-MEANS CLUSTERING PADA DATA POTENSI PERTANIAN DESA DI BOGOR MENGGUNAKAN MAPSERVER HENRI HARIANJA

VISUALISASI K-MEANS CLUSTERING PADA DATA POTENSI PERTANIAN DESA DI BOGOR MENGGUNAKAN MAPSERVER HENRI HARIANJA VISUALISASI K-MEANS CLUSTERING PADA DATA POTENSI PERTANIAN DESA DI BOGOR MENGGUNAKAN MAPSERVER HENRI HARIANJA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

II. TINJAUAN PUSTAKA

II. TINJAUAN PUSTAKA II. TINJAUAN PUSTAKA 2.1 Sistem Informasi Manajemen Mcleod R dan Schell G, (2004) membagi sumber daya menjadi dua bagian yaitu sumberdaya fisikal dan sumberdaya konseptual. Sumber daya fisikal terdiri

Lebih terperinci

PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak

PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Dini Fakta Sari Teknik Informatika STMIK AKAKOM Yogyakarta dini@akakom.ac.id Abstrak Tenaga

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak DATA MINING MELIHAT POLA HUBUNGAN NILAI TES MASUK MAHASISWA TERHADAP DATA KELULUSAN MAHASISWA UNTUK MEMBANTU PERGURUAN TINGGI DALAM MENGAMBIL KEBIJAKAN DALAM RANGKA PENINGKATAN MUTU PERGURUAN TINGGI Timor

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE

SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE WRS Nurwidodo 1) dan Mochamad Hariadi 2) Jurusan Teknik Elektro FTI, ITS, Surabaya Kampus ITS Keputih,

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

PE DAHULUA. Latar Belakang

PE DAHULUA. Latar Belakang Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di

Lebih terperinci

HASIL DAN PEMBAHASAN Praproses Data Clustering

HASIL DAN PEMBAHASAN Praproses Data Clustering Perangkat lunak: Sistem operasi: Windows XP Home Edition, WEKA versi 3.5.7, ArcView GIS 3.3, Map Server For Windows (ms4w) 2.3.1 Chameleon 2.4.1 Perangkat keras: Prosessor intel Pentium 4 ~2GHz Memory

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN METODE PENELITIAN Proses Dasar Sistem Proses dasar pengembangan sistem secara umum terdiri dari tahapan sebagai berikut: 1 Praproses. Pada tahap ini dilakukan persiapan yang meliputi seleksi data, transformasi

Lebih terperinci

METODE PENELITIAN. Gambar 2 Tahapan penelitian. Praproses Data

METODE PENELITIAN. Gambar 2 Tahapan penelitian. Praproses Data daerah dalam lingkup R dan f(r) adalah fungsi yang dijalankan pada lingkup R. Mekanisme algoritme Naive adalah sebagai berikut : 1 Menentukan dataset D yang merupakan himpunan seluruh poligon / daerah

Lebih terperinci

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. 2.1. Data Mining Data mining adalah suatu istilah yang digunakan

Lebih terperinci

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING Marlindawati1), Andri2) 1), 2) Sistem Informasi UNIVERSITAS BINA DARMA Palembang Jl, Jend. A.Yani

Lebih terperinci

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING Marlindawati 1) Andri 2) 1) Manajemen Informatika Universitas Bina Darma Jl. Ahmad Yani No. 3, Palembang

Lebih terperinci

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4

Lebih terperinci

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support 6 Representasi Pengetahuan Tahap ini merupakan tahap akhir dari proses KDD. Sederetan aturan atau rule disajikan kepada pengguna dengan menggunakan algoritme Rule Generation. Mulai Data transaksi Pembersihan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Terdapat tiga tahapan utama dalam penelitian ini. Ketiga tahapan tersebut yaitu, pembentukan klaster data SMS, pembentukan model klasifikasi, serta implementasi model klasifikasi

Lebih terperinci

dengan Algoritma K Means

dengan Algoritma K Means K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Data Mining Data mining adalah bagian dari knowledge discovery di database yang menganalisa database berukuran besar untuk menemukan pola yang berguna pada data (Silberschatz,

Lebih terperinci

CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE

CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE Lutfi Hidayat Ramdhani¹, Hetti Hidayati², Mahmud Dwi Suliiyo³ ¹Teknik Informatika,, Universitas Telkom Abstrak K-Modes

Lebih terperinci

BAB 1 PENDAHULUAN Building A Data WareHouse for Decision Support Second Edition Data Mining : Concepts, Models, Methods, and Algorithms

BAB 1 PENDAHULUAN Building A Data WareHouse for Decision Support Second Edition Data Mining : Concepts, Models, Methods, and Algorithms BAB 1 PENDAHULUAN 1.1. Pendahuluan Mesin hitung bernama Komputer sejak satu dekade ini telah tumbuh dan berkembang dengan pesat. Perkembangan ini meliputi sisi teknologi, kapasitas media penyimpanan, dan

Lebih terperinci

Lingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan

Lingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan sehingga dapat diproses dengan SOM. Pada tahap seleksi data, dipilih data perkembangan anak berdasarkan kategori dan rentang usianya. Kategori perkembangan tersebut merupakan perkembangan kognitif, motorik

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

BAB 1 PENDAHULUAN. Wiley & Sons, 2003, Hal : 1. 1 Poe Vidette, Klauer Patricia dan Brobst Stephen, Building A Data WareHouse for Decision Support

BAB 1 PENDAHULUAN. Wiley & Sons, 2003, Hal : 1. 1 Poe Vidette, Klauer Patricia dan Brobst Stephen, Building A Data WareHouse for Decision Support BAB 1 PENDAHULUAN 1.1. Pendahuluan Dewasa ini fungsi komputer semakin dimanfaatkan baik pada perusahaan menengah ke atas maupun pada perusahaan kecil. Adapun fungsi dari komputer itu sendiri adalah mengolah

Lebih terperinci

HASIL DAN PEMBAHASAN. Microsoft SQL Server Microsoft Sharepoint Microsoft.Net Framework 4.0.

HASIL DAN PEMBAHASAN. Microsoft SQL Server Microsoft Sharepoint Microsoft.Net Framework 4.0. 3 warehouse dan data mart memiliki batasan yang sangat tipis, namun perbedaan ini tidak perlu dikhawatirkan karena secara subtansi tujuan dari pembuatannya memiliki kesamaan (Noviandi 2010). Konsep data

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN 1.1. Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Analisis cluster merupakan salah satu alat yang penting dalam pengolahan data statistik untuk melakukan analisis data. Analisis cluster merupakan seperangkat metodologi

Lebih terperinci

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita Anggraeni, Ragil Saputra, Beta Noranita APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Short Message Service (SMS) Short Message Service (SMS) adalah sebuah layanan dasar yang membolehkan pertukaran pesan teks singkat antarpelanggan. Pesan ini dapat dikirim dari perangkat

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN : Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 PENERAPAN DATA MINING UNTUK MEMBENTUK KELOMPOK BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMPN 19 BANDUNG Andre Catur Prasetyo Teknik Informatika Universitas

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

PENGELOMPOKAN PROGRAM PNPM MANDIRI DENGAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN METODE K-NEAREST NEIGHBOR TUGAS AKHIR

PENGELOMPOKAN PROGRAM PNPM MANDIRI DENGAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN METODE K-NEAREST NEIGHBOR TUGAS AKHIR PENGELOMPOKAN PROGRAM PNPM MANDIRI DENGAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN METODE K-NEAREST NEIGHBOR TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada bab ini akan dijelaskan tahap-tahap yang dilakukan dalam melakukan penelitian. Tahapan penelitian berguna agar pelaksanaan penelitian dapat berjalan dengan baik dan sistematis

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

Kerusakan Barang Jadi

Kerusakan Barang Jadi Penerapan Algoritma C4.5 pada Analisis Kerusakan Barang Jadi (Studi Kasus: PT Kayu Lapis Asli Murni) Ivan Oktana, Seng Hansun Program Studi Teknik Informatika, Universitas Multimedia Nusantara, Tangerang,

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung

Lebih terperinci

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI Diajukan Sebagai Salah satu Syarat Untuk Memperoleh Gelar Sarjana

Lebih terperinci

Training. Level Transformasi Wavelet. Banyak Fitur. Ukuran Dimensi. 0 40x x30 600

Training. Level Transformasi Wavelet. Banyak Fitur. Ukuran Dimensi. 0 40x x30 600 Citra asli Citra ya Inisialisasi: Topologi jaringan, Bobot awal, Lebar tetangga, Nilai laju awal pembelajaran Kriteria pemberhentian Training Error> -6 Epoch< 4 Alpha> HASIL DAN PEMBAHASAN Pada penelitian

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN Pada bab ini akan diuraikan mengenai pelaksanaan terhadap hasil perancangan yang telah diperoleh sebelumnya. Hasil perancangan pada tahap perancangan akan diimplemetasikan menjadi

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

Penentuan Pola Sekuensial pada Data Transaksi Perpustakaan IPB Menggunakan Algoritma Graph Search Techniques

Penentuan Pola Sekuensial pada Data Transaksi Perpustakaan IPB Menggunakan Algoritma Graph Search Techniques Penentuan Pola Sekuensial pada Data Transaksi Perpustakaan IPB Menggunakan Algoritma Graph Search Techniques Imas S. Sitanggang 1, Firman Ardiansyah 1 dan Hamzah Agung 2 1 Staf Pengajar Departemen Ilmu

Lebih terperinci

2.2 Data Mining. Universitas Sumatera Utara

2.2 Data Mining. Universitas Sumatera Utara Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Perkembangan teknologi informasi yang sangat pesat yang terjadi dewasa ini menuntut manusia untuk mampu beradaptasi dengan perkembangan tersebut. Upaya adaptasi yang dilakukan

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDHULUN Listrik merupakan sumber daya yang sangat dibutuhkan saat ini. Penggunaan listrik setiap tahun, bahkan setiap bulan terus meningkat. Hal ini dibuktikan dengan selalu bertambahnya

Lebih terperinci

ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE

ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE Dyah Paminta Rahayu(dyahp@ut.ac.id) Jurusan Matematika FMIPA Universitas Terbuka ABSTRAK Pengelompokkan merupakan salah satu

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal

Lebih terperinci

3.1 Metode Pengumpulan Data

3.1 Metode Pengumpulan Data BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data Sebuah penelitian memerlukan pengumpulan data dan metode pengumpulan data karena sangat berpengaruh terhadap akurasi dan kualitas data yang digunakan

Lebih terperinci

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO)

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO) PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO) Levina Fitri Rahmawati, Isnandar Slamet, dan Diari Indriati Program

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti

Lebih terperinci

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN Devi Sugianti Program Studi Sistem Informasi,STMIK Widya Pratama Jl. Patriot 25 Pekalongan Telp (0285)427816 email

Lebih terperinci

Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata

Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata Cakra Ramadhana 1, Yohana Dewi Lulu W 2, Kartina Diah K. W. 3 1,2 Program Studi Sistem Informasi, Politeknik

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki

Lebih terperinci

4 Web server mengakses kubus data Palo server melalui Palo PHP API. Aplikasi OLAP menggunakan library JpGraph untuk menampilkan grafik.

4 Web server mengakses kubus data Palo server melalui Palo PHP API. Aplikasi OLAP menggunakan library JpGraph untuk menampilkan grafik. 5 4 Web server mengakses kubus data Palo server melalui Palo PHP API. Aplikasi OLAP menggunakan library JpGraph untuk menampilkan grafik. Lapis atas: Web browser Grafik Laptop JpGraph Line Plot Presentasi

Lebih terperinci

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Jurnal Teknik Komputer Unikom Komputika Volume 3, No.2-2014 TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Selvia Lorena Br Ginting 1), Wendi Zarman

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB 4 IMPLEMENTASI DAN EVALUASI BAB 4 IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Kebutuhan Program Untuk menjalankan aplikasi ini ada beberapa kebutuhan yang harus dipenuhi oleh pengguna. Spesifikasi kebutuhan berikut ini merupakan spesifikasi

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 38 BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Studi Literatur: Peramalan, Curah Hujan, Knowledge Discovery in Database, Jaringan Saraf Tiruan, Backpropagation, Optimalisasasi Backpropagation Pengumpulan

Lebih terperinci

BAB IV IMPLEMENTASI DAN EVALUASI

BAB IV IMPLEMENTASI DAN EVALUASI 84 BAB IV IMPLEMENTASI DAN EVALUASI Pada bab ini akan dibahas mengenai implementasi sistem yaitu spesifikasi sistem dan cara menggunakan aplikasi segmentasi citra dengan menggunakan metode Fuzzy C- Means

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

Manajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM :

Manajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : Manajemen Data Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : 1011601026 MAGISTER ILMU KOMPUTER UNIVERSITAS BUDI LUHUR 2011 DIT TI / DJHKI SKPL-DJHKI-01.04.2011.xx Halaman 0

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Performansi Hasil Cluster

HASIL DAN PEMBAHASAN. Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Performansi Hasil Cluster Performansi Hasil Cluster Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Pada tahap ini dilakukan analisis terhadap hasil cluster. Analisis yang digunakan adalah analisis cluster ce. Besarnya

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Dalam suatu universitas, salah satu analisis yang dapat dilakukan untuk melihat perkembangan prestasi akademik seorang mahasiswa adalah dengan memantau nilai

Lebih terperinci

METODE PENELITIAN. Proses Dasar Sistem

METODE PENELITIAN. Proses Dasar Sistem Gagasan utama dari sequential pattern mining adalah untuk menemukan semua pola sekuensial yang memiliki nilai support lebih besar dari nilai minimum support yang diberikan (Fiot. C et al ). Diagram alir

Lebih terperinci

III. METODOLOGI PENELITIAN

III. METODOLOGI PENELITIAN III. METODOLOGI PENELITIAN 3.1. Kerangka Pemikiran Penelitian Informasi merupakan suatu unsur kunci yang penting di dalam suatu sistem konseptual. Suatu informasi dapat terbentuk melalui berbagai cara

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Analisis data historis dan pengolahan data multidimensi bukan merupakan hal yang baru untuk mendukung suatu pengambilan keputusan. Namun perubahan objek data yang dicatat, membuat

Lebih terperinci

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak TEKNIK DATA MINING MENGGUNAKAN METODE BAYES CLASSIFIER UNTUK OPTIMALISASI PENCARIAN PADA APLIKASI PERPUSTAKAAN (STUDI KASUS : PERPUSTAKAAN UNIVERSITAS PASUNDAN BANDUNG) Oleh : Selvia Lorena Br Ginting,

Lebih terperinci

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

4 HASIL DA PEMBAHASA

4 HASIL DA PEMBAHASA 4 HASIL DA PEMBAHASA 4.1 Pengumpulan Data Pada proses pengumpulan data, diperoleh data awal berjumlah 5883 mahasiswa non aktif Program Studi Matematika FMIPA-UT dengan 33 atribut kategori dan numerik.

Lebih terperinci

penyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN

penyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN 1 PENDAHULUAN Latar Belakang Kemiskinan merupakan suatu hal yang memiliki batasan yang luas, tetapi bagaimanapun juga batasan mengenai kemiskinan harus tetap diukur untuk kebijakan pemerintah. Menurut

Lebih terperinci

PENGELOMPOKKAN ANGKA PARTISIPASI PENDIDIKAN WAJIB BELAJAR SE-INDONESIA MENGGUNAKAN METODE FUZZY C-MEANS. Abstrak

PENGELOMPOKKAN ANGKA PARTISIPASI PENDIDIKAN WAJIB BELAJAR SE-INDONESIA MENGGUNAKAN METODE FUZZY C-MEANS. Abstrak 1 PENGELOMPOKKAN ANGKA PARTISIPASI PENDIDIKAN WAJIB BELAJAR SE-INDONESIA MENGGUNAKAN METODE FUZZY C-MEANS Nila Yuliani 1) Mardhiah Fadli 2) Warnia Nengsih 3) Program Studi Sistem Informasi Politeknik Caltex

Lebih terperinci

BAB 4 IMPLEMENTASI DAN EVALUASI. memadai. Berikut ini akan dijelaskan spesifikasi perangkat lunak dan keras yang Spesifikasi Perangkat Keras

BAB 4 IMPLEMENTASI DAN EVALUASI. memadai. Berikut ini akan dijelaskan spesifikasi perangkat lunak dan keras yang Spesifikasi Perangkat Keras BAB 4 IMPLEMENTASI DAN EVALUASI 4.1 Implementasi Dalam membuat program ini diperlukan spesifikasi perangkat keras dan lunak yang memadai. Berikut ini akan dijelaskan spesifikasi perangkat lunak dan keras

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi 4 Perangkat keras berupa Notebook: Processor intel Core i3 2.2 GHz. RAM kapasitas 2. GB. Harddisk Kapasitas 5 GB. Monitor pada resolusi 1366 x 768 piksel. Merek Acer Aspire 475. Perangkat lunak berupa:

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

BAB 1 PENDAHULUAN Pengantar

BAB 1 PENDAHULUAN Pengantar BAB 1 PENDAHULUAN 1.1. Pengantar Dewasa ini fungsi komputer semakin dimanfaatkan dalam segala bidang. Baik di bidang pendidikan, bisnis, ataupun penelitian. Penggunaan komputer kini tidak lagi terbatas

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Pola pengaksesan pengguna terhadap sebuah situs web biasanya tergambarkan dalam sebuah pola sekuensial. Pola sekuensial mengindikasikan bahwa transaksi biasanya terjadi secara

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci