KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER Kartika Wijayati 1 Rully Soelaiman 2
|
|
- Lanny Darmali
- 6 tahun lalu
- Tontonan:
Transkripsi
1 KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER Kartika Wijayati 1 Rully Soelaiman 2 Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember (ITS), Surabaya, 60111, Innesia 1 tika_nn@csitsacid, 2 rully@isitsacid Abstrak - Klasterisasi merupakan salah satu metode untuk mengidentikasi kelas berdasarkan obyek-obyek diantara himpunan obyek-obyek Representasi kesamaan berbeda-beda pada model klasterisasi satu dengan yang lain Di dalam banyak model, konsep kesamaan dihitung berdasarkan fungsi jarak, meliputi Manhattan distance, Euclidean distance lain-lain Tetapi fungsi jarak tidak selalu cukup untuk mengambil korelasi antara obyek-obyek yang jauh Dalam kenyataannya, korelasi-korelasi yang kuat masih ada antar himpunan obyek-obyek yang sama jika himpunan obyekobyek terpisah jauh dari satu sama lain yang dihitung berdasarkan fungsi jarak Tugas Akhir membahas penemuan klaster-klaster obyek yang mempunyai kedekatan nilai kesamaan pola pada subset dimensi yang diperlihatkan oleh obyek-obyek, dengan menggunakan model klasterisasi yang dinamakan dengan algoritma pcluster Dengan menggunakan algoritma pcluster, maka dapat menemukan semua pcluster secara efisien secara efekt, dimana ukuran klaster sesuai dengan threshold, threshold ditentukan sendiri Kata Kunci : penggalian data, klasterisasi, kesamaan pola Notasi 1 Himpunan obyek-obyek 2 Himpunan atribut-atribut pada obyekobyek di dalam 3 Submatrik dari data set, dimana 4 Obyek-obyek di dalam 5 Atribut-atribut di dalam 6 Nilai objek pada atribut 7 Threshold cluster ditentukan sendiri 8 Jumlah minimum kolom dalam pcluster ditentukan sendiri 9 Jumlah minimum baris dalam pcluster ditentukan sendiri 10 Maximal dimension set untuk obyek 11 Maximal dimension set untuk kolom I PENDAHULUAN Metode klasterisasi secara khusus dipelajari dalam berbagai big, meliputi statistik, machine learning, pattern recognition, image processing Banyak riset tercurah pada berbagai masalah dalam klasterisasi, seperti scalability, the curve of dimensionality, lain-lain Dalam kebanyakan model klasterisasi, kesamaan antar obyek-obyek yang berbeda pada semua, sebagian, atau hanya subset dari dimensi dihitung oleh jarak Beberapa fungsi jarak yang terkenal meliputi Euclidian distance, Manhattan distance, cosine distance Tetapi fungsi jarak tidak mampu untuk menangkap korelasi-korelasi antar obyek-obyek Dalam kenyataannya, korelasi-korelasi yang kuat masih ada antar himpunan obyek-obyek yang sama jika himpunan obyek-obyek terpisah jauh dari satu sama lain yang dihitung berdasarkan fungsi jarak Di dalam model klasterisasi tradisional hanya fokus pada kesamaan jarak, mempertimbangkan dua obyek adalah serupa jika beberapa dari obyek-obyek mempunyai nilai koordinat yang dekat Obyek-obyek yang mempunyai jarak yang tidak dekat untuk satu sama lain tidak mungkin dipertimbangkan dalam satu klaster Oleh karena itu, maka dalam Tugas Akhir ini digunakan kesamaan pola untuk menunjukkan korelasi-korelasi antar obyek-obyek yang jauh yang tidak dipertimbangkan dalam model klasterisasi tradisional Untuk menemukan klaster-klaster yang melekat pada subruang data set, yang dikenal dengan klasterisasi pada subruang II RUMUSAN MASALAH Berdasarkan latar belakang yang telah dijelaskan diatas, dapat dirumuskan permasalahan sebagai berikut : 1 Bagaimana menemukan klaster obyek-obyek yang mempunyai kedekatan nilai kesamaan pola pada subset dimensi yang diperlihatkan oleh obyek-obyek dengan menggunakan algoritma pcluster? 2 Bagaimana memodelkan klasterisasi pada subruang dengan menggunakan model pcluster? 3 Bagaimana menemukan semua klaster yang memenuhi syarat algoritma pcluster? III KLASTERISASI dengan PEMODELAN PCLUSTER 31 Pemodelan pcluster Model adalah suatu metode yang menggali klaster pada obyek yang memperlihatkan hubungan Klasterisasi berdasarkan kesamaan pola dengan menggunakan algoritma pcluster 1
2 pola pada himpunan atribut (dimensi) Klasterisasi dilakukan tidak hanya pada himpunan dimensi, namun Diasumsikan Himpunan kolom adalah adalah juga pada subset dari dimensi tersebut Karena itu Maximal Dimension Set (MDS) dari c, jika (2-4) model menggunakan metode MDS, metode tidak ada sehingga termasuk MDS akan dijelaskan pada sub bab berikutnya Definisi 1 (pscore pcluster) Misal adalah Metode MDS dapat digunakan, jika tidak ada, suatu subset dari obyek- obyek di dalam database sehingga obyek dapat juga diklaster pada submatrik ( ), adalah suatu subset dati attribut- Pada properti 1 diketahui bahwa, jelas bahwa attribut Pasangan khusus suatu tidak mungin ada submatrik Dengan, maka Pembahasan di dalam hanya mencakup diiperoleh pscore matrik 2 x 2, sebagai berikut : cluster pada MDSs, karena semua lain dapat pscore diperoleh (2-1) dari maximum dengan menggunakan maximum properti 1 Sesuai dengan Pasangan membentuk jika setiap definisi 2, jelas bahwa atribut dapat muncul di dalam submatrik X (2x2) di dalam, mempunyai lebih dari satu MDS Untuk satu himpunan obyek,, dimana parameter ditentukan mungkin ada lebih dari satu MDS sendiri Jika diketahui himpunan obyek himpunan atribut Berdasarkan definisi, maka diperoleh model, tidak mudah untuk mencari semua maximal yang mempunyai properti sebagai berikut : dimension set (MDS) untuk obyek, karena obyek Properti 1 (Anti-Monotonicity) Misal adalah mungkin klaster pada setiap subset Dibawah ini, suatu -pcluster Setiap submatrik dari, misal dibahas kasus khusus dimana berisi hanya 2 obyek, dimana,, juga termasuk Diketahui obyek, himpunan atribut, -pcluster (2-2) didefinisikan sebagai berikut : Sesuai dengan definisi yang simetris, maka selisih dapat dihitung secara horizontal maupun Berdasarkan definisi, dapat dirumuskan vertical properti 1 sebagai berikut : 32 Algoritma pcluster Pada Algoritma terdapat tiga langkah, sebagai berikut : 1 Pair-Wise Clustering Mencari klaster (kolom) terbesar untuk masingmasing dua obyek, klaster (obyek) terbesar untuk masing-masing dua kolom 2 Pruning Unfruitful pair-wise clustering Mencari yang bukan masing-masing klaster kolom yang bukan klaster obyek di dalam pairwise clustering, dengan menggunakan Pruning Principle 3 Forming Langkah ini merupakan kombinasi dari pruned pairwise untuk membentuk 33 Pairwise Clustering Pairwise Clustering merupakan proses pencarian klaster berdasarkan metode MDS untuk object-pair atau column-pair Dengan menggunakan metode MDS, klaster yang dihasilkan lebih jelas, karena diekstrak dalam bentuk yang unik Klasterisasi dilakukan tidak hanya pada dimensi dari data set, namun juga pada setiap subset dari dimensi (sesuai dengan properti 1) Untuk mencari klaster yang paling maksimal maka digunakan nc (nilai minimal kolom) atau nr (nilai minimal baris) Jika klasterisasi berdasarkan columnpair maka menggunakan nr untuk mencari klaster yang paling maksimal, sebaliknya, jika klasterisasi berdasarkan object-pair maka menggunakan nc untuk mencari klaster yang paling maksimal Dibawah ini, akan diuraikan konsep Maximal Dimension Set (MDS) Diketahui obyek, himpunan dimensi, membentuk pada jika selisih antara nilai terbesar terkecil di dalam tidak lebih dari (2-5) Diketahui obyek, didefinisikan fungsi pada dua dimensi, sebagai berikut : Menurut definisi dari, obyek klaster pada jika Dengan kata lain, adalah, jika terbukti kebenaran sebagai berikut : Mudah untuk menghitung Menurut property diatas, tidak dapat dihitung untuk setiap dua dimensi di dalam Hanya dapat mengetahui nilai terbesar nilai terkecil di dalam Oleh karena itu, maka digunakan untuk menandakan nilai sorted sequence di dalam Adalah, dimana Jadi membentuk pada jika Jika diketahui himpunan atribut, mudah untuk mencari maximal dimension set untuk obyek Diketahui himpunan dimensi, adalah maximal dimension set untuk obyek, jika : Klasterisasi berdasarkan kesamaan pola dengan menggunakan algoritma pcluster 2
3 i adalah subsequence yang berdekatan dari (2-6), ii, dimana Diketahui, menurut pairwise clustering principle, adalah Selanjutnya,, maka diperoleh atau, sebaliknya karena Jika, dari, diperoleh, jadi bukan Di sisi lain, jika, dari, diperoleh, jadi juga bukan Karena tidak dapat diperluas, adalah MDS Menurut Prinsip MDS, MDSs dapat dicari untuk obyek dengan cara sebagai berikut : dimulai dengan kedua sisi, left-end right-end pada elemen pertama dari sorted sequence, pindahkan right-end sebelah kanan satu posisi pada suatu waktu Untuk setiap perpindahan, dihitung selisih nilai pada dua terakhir, sampai selisih lebih besar dari Pada waktu tersebut, element antara dua ujung membentuk maximal dimension set Untuk mencari maximal dimension set selanjutnya, pindahkan left-end sebelah kanan satu posisi, ulangi proses diatas Proses akan berakhir saat right-end menjangkau element terakhir dari sorted sequence Berikut pseucode dari proses diatas terurai dalam Algoritma 1, untuk mencari MDSs object-pair, procedure yang terlibat :, dimana adalah jumlah minimal kolom (parameter ditentukan sendiri) Algoritma 1 Input : : dua obyek, : himpunan kolom, : minimal jumlah kolom, : threshold cluster Output : Semua yang lebih dari kolom /* ie, untuk setiap di dalam */ sort array s /* menandakan ada kolom yang belum di uji di dalam */ v /* memperluas untuk meliputi lebih dari satu kolom */ else Return and Until Return and Langkah-langkah dari algoritma pair cluster object diatas, antara lain : 1 Menghitung variabel data, berdasarkan jumlah baris jumlah kolom 2 Membuat pair-object 3 Pada setiap pair-object yang telah terbentuk, dibuat matrik selisih antar dua object pada seluruh atribut 4 Kemudian hitung selisih per elemen matrik selisih 5 Jika selisih kurang dari threshold selisih index antar dua elemen memenuhi jumlah minimal kolom, maka buat MDS baru untuk pair-object ini Jika selisih lebih besar dari threshold, maka dilakukan pengecekan pada elemen matrik selanjutnya, jika index sudah mencapai akhir kolom selisih index antar dua elemen memenuhi jumlah minimal kolom, maka buat MDS baru untuk pairobject ini 6 Langkah 2-5 akan dilakukan terus menerus sampai pada pair-object terakhir Menurut definisi yang simetris, kolom baris dari data matrik mempunyai arti yang sama Sehingga, metode tersebut dapat digunakan untuk mencari MDSs untuk column-pair, Berikut pseucode dari algoritma 2, untuk mencari MDSs column-pair,, procedure yang terlibat :, dimana adalah jumlah minimal obyek (parameter ditentukan sendiri) Algoritma 2 Input : : dua kolom, : himpunan obyek, : minimal jumlah obyek, : threshold cluster Output : Semua yang lebih dari obyek /* ie, untuk masing-masing di dalam */ sort array s /* menandakan ada obyek yang belum di uji di dalam */ v /* memperluas untuk meliputi lebih dari satu obyek */ else Return and Until Return and Langkah-langkah dari algoritma pair cluster column diatas, antara lain : 1 Menghitung variabel data, berdasarkan jumlah baris jumlah kolom 2 Membuat pair-column Klasterisasi berdasarkan kesamaan pola dengan menggunakan algoritma pcluster 3
4 3 Pada setiap pair-column yang telah terbentuk, dibuat matrik selisih antar dua column pada seluruh atribut 4 Kemudian hitung selisih per elemen matrik selisih 5 Jika selisih kurang dari threshold selisih index antar dua elemen memenuhi jumlah minimal baris, maka buat MDS baru untuk pair-column ini Jika selisih lebih besar dari threshold, maka dilakukan pengecekan pada elemen matrik selanjutnya, jika index sudah mencapai akhir kolom selisih index antar dua elemen memenuhi jumlah minimal kolom, maka buat MDS baru untuk paircolumn ini 6 Langkah 2-5 akan dilakukan terus menerus sampai pada pair-column terakhir 34 Pruning Pruning merupakan suatu proses pencarian klaster dengan melakukan pengurangan, berdasarkan kekurangan Pairwise Clustering yang dieliminasi Langkah pruning di bagi menjadi 2 bagian, yaitu symmetric pruning pruning by block Jika diketahui : = threshold Ukuran cluster = = MDS obyek = MDS kolom Sehingga diperoleh dalil berikut : Misal adalah MDS untuk obyek, Untuk setiap, diperlukan kondisi untuk menjadi dengan syarat,, (2-7) Diasumsikan adalah Karena suatu submatrik dari juga merupakan, diketahui, adalah Menurut definisi MDS, ada paling sedikit satu MDS Jadi ada paling sedikit seperti MDSs Pencarian di dalam dengan ukuran Dengan kata lain, diperlukan, sehingga mampu untuk mencari paling sedikit MDSs column-pair yang berisi MDS Pruning symmetric Berdasarkan dalil 4, maka dapat dilakukan pruning seperti berikut Untuk setiap dimensi di dalam MDS, dihitung jumlah yang berisi Jika jumlah, dikurangi dari Selanjutnya, jika pengurangan membuat, maka juga dikurangi Karena pada definisi 1 model pcluster adalah simetris, maka dalil pruning dapat digunakan untuk MDSs object-pair maupun MDSs column-pair Bahwa, untuk setiap obyek di dalam MDS, dihitung jumlah yang berisi Jika jumlah, dikurangi dari Selanjutnya, jika pengurangan membuat, maka juga dikurangi Ini berarti bahwa diperoleh prune MDSs column-pair maupun MDSs object-pair secara bergantian Tanpa kehilangan generalisasi, pertama mengenerate MDSs column-pair dari data set Selanjutnya, saat mengenerate MDSs object-pair, digunakan MDSs column-pair untuk pruning Kemudian, prune MDSs column-pair menggunakan MDSs object-pair yang sudah diprune Langkah ini berulang sampai tidak ada MDSs yang dapat dieliminasi Algoritma 3 menguraikan tentang deskripsi tingkat tinggi dari proses MDS pruning symmetric, yang dapat diringkas dalam 2 langkah Pertama, mengamati data set untuk mencari MDSs column-pair untuk masingmasing column-pair, MDSs object-pair untuk masing-masing object-pair Langkah ini diperoleh dengan memanggil procedure dalam algoritma 1 algoritma 2 Langkah kedua, terjadi prune MDSs column-pair MDSs object-pair sampai tidak ada perubahan yang dapat dibuat Berikut pseucode dari algoritma 3, untuk mencari MDS pruning symmetric, procedure yang terlibat :, dimana adalah threshold cluster (ditentukan sendiri), adalah jumlah minimal kolom (ditentukan sendiri), adalah jumlah minimal obyek (ditentukan sendiri) Algoritma 3 Input : : data set, : threshold, : jumlah minimal kolom, : jumlah minimal baris Output : semua dengan ukuran for each mencari MDSs columnpair: for each mencari MDSs objectpair: for setiap menggunakan MDSs column-pair untuk prune kolom di dalam menghapus MDS for setiap menggunakan MDSs object-pair untuk prune obyek di dalam menghapus MDS until no pruning takes place Langkah-langkah dari algoritma symmetric prune diatas, antara lain : 1 Mengambil pair + MDS object maupun pair + MDS column, kemudian hitung jumlah masing-masing 2 Melakukan pengecekan pada setiap pair + MDS object, mengambil salah satu elemen MDS 3 Mengambil nilai jumlah pair-object dengan referensi MDS milik pair-column 4 Apabila jumlah pair-object referensi kurang dari jumlah minimal kolom, maka hapus salah satu elemen yang telah dipilih Klasterisasi berdasarkan kesamaan pola dengan menggunakan algoritma pcluster 4
5 5 Dan jika total elemen MDS object nilainya kurang dari jumlah minimal kolom, maka hapus seluruh item (pair + MDS object) 6 Apabila telah mencapai akhir daftar pair + MDS object maka lakukan pengecekan pada setiap pair + MDS column, ulangi langkah Proses akan terus berlangsung, sampai tidak ada MDS yang dapat dihapus MDS Pruning by Object Block MDS Pruning symmetric secara berulang-ulang menghapus MDSs column-pair MDSs object-pair, seperti definisi pcluster yang simetris maka dalil 4, dapat digunakan untuk baris kolom Dalam kenyataannya, dataset yang besar biasanya tidak simetris Pada dasarnya, dataset sering mempunyai lebih banyak obyek (baris) daripada atribut (kolom) Dalam MDS Pruning symmetric, untuk setiap dimensi di dalam MDS, dihitung jumlah yang berisi Saat jumlah dataset bertambah, jumlah setiap MDSs column-pair juga bertambah Ini membawa dampak negat pada efisiensi Pertama, mengenerate MDSs column-pair membutuhkan banyak waktu, seperti proses yang mempunyai kompleksitas Kedua, MDSs column-pair membuat himpunan query yang membutuhkan banyak waktu selama pruning Ketiga, MDSs column-pair juga membuat pruning simetris kurang efekt karena tidak dapat mengurangi setiap column-pair sebelum dikurangi MDSs column-pair yang berisi kurang dari obyek, dapat dikatakan untuk menghapus lebih dari obyek Untuk memecahkan masalah ini, dikelompokkan MDSs object-pair ke dalam blok merepresentasikan blok Sehingga setiap yang berisi obyek harus terletak di dalam Jadi, mengali pada dataset sama dengan mencari di setiap Pruning membutuhkan tempat dalam setiap blok juga, tetapi menghapus masukan di dalam satu blok mungkin memicu pengurangan inputan dalam blok yang lain, dimana dampak pruning lebih efisien Dalam proses MDS pruning berdasarkan blok, diringkas dalam dua langkah : 1 Langkah pertama, menghitung MDSs objectpair MDSs object-pair direpresentasikan dengan bitmap, bit ke- adalah himpunan jika kolom ke- di dalam MDS Tetapi tidak perlu menghitung MDSs column-pair 2 Langkah kedua, prune MDSs object-pair Untuk melakukan langkah ini, mengumpulkan informasi kolom untuk obyek dalam setiap blok Langkah ini lebih efisien dibanding menghitung MDSs column-pair untuk seluruh dataset (perhitungan komplesitas dari untuk setiap pasangan), dapat mendukung pruning across blok menggunakan informasi kolom yang dimaintain di setiap blok Cross pruning terjadi pada tiga level pruning pada level terendah akan memicu pruning pada level tertinggi : i) Menghapus bit di dalam bitmap untuk di dalam akan menyebabkan bit terhapus di dalam ii) Menghapus bitmap (ketika bitmap kurang dari bit) untuk pasangan di dalam akan menyebabkan korespondensi bitmap dikurangi di dalam iii) Menghapus (ketika bitmap berisi kurang dari pasangan ) secara berulangulang Algoritma 4 Input : : data set, : threshold pcluster : minimal jumlah kolom, Output : minimal jumlah baris : pruned object-pair MDSs for setiap, melibatkan untuk mencari MDSs representasi setiap MDS dengan bitmap (kolom) add bitmap ke dalam blok blok for setiap blok for setiap kolom jumlah pasangan yang unik yang mempunyai MDS bitmap untuk himpunan bit ke for setiap inputan di dalam blok MDS bitmap bit hapus bitmap ( hanya MDS bitmap untuk hapus inputan di dalam ) else hapus bit dalam bitmap di dalam eliminasi berisi inputan until no changes take place Langkah-langkah dari algoritma block prune diatas, antara lain : 1 Menghitung variabel data, berdasarkan jumlah baris jumlah kolom 2 Mengambil pair + MDS object 3 Menghitung variable yang mengandung pair + MDS object 4 Membuat MDS bitmap dari MDS object Jika berisi MDS maka bitmap diberi nilai 1, sebaliknya, jika tidak berisi MDS maka bitmap diberi nilai 0 5 Membuat matrik jumlah MDS perkolom untuk per blok (CC) 6 Membuat matrik jumlah MDS secara horizontal untuk per blok (sumb) 7 Melakukan pengecekan jumlah MDS kolom perblok 8 Jika kurang dari jumlah minimum baris, maka lakukan pengecekan terhadap bitmap 9 Jika jumlah MDS secara horizontal kurang dari jumlah minimum kolom pair ini hanya memiliki satu MDS, maka hapus pair Klasterisasi berdasarkan kesamaan pola dengan menggunakan algoritma pcluster 5
6 MDS ini Dan sebaliknya, Jika jumlah MDS secara horizontal lebih dari jumlah minimum kolom, maka hapus elemen bitmap yang terpilih 10 Bila telah mencapai akhir kolom, hitung total pair untuk satu blok 11 Jika total pair untuk satu blok kurang dari jumlah minimum baris, maka hapus pair + MDS lain yang terkait dengan (pair + MDS) lain yang terkait dengan (pair + MDS) saat ini Dan sebaliknya, jika total pair MDS untuk satu blok lebih dari jumlah minimum baris, maka ambil semua pair MDS bitmap yang tersisa 35 Algoritma Klasterisasi Langkah terahkir menemukan clustering Menggali subspace clustering dari pruned MDSs object-pair Tujuannya untuk mengkombinasikan cluster terkecil menjadi bentuk cluster besar berdasarkan antimonotonicity property Dalam Tugas Akhir ini, diperkenalkan metode baru, dengan memadukan unikasi pruning terhadap cluster-cluster yang telah dibentuk, yaitu pruned object-pair MDSs seperti graph, mengali clique dalam graph Setelah MDS pruning dalam langkah kedua, menyisakan obyek yang tampak seperti graph Di dalam graph, setiap node adalah obyek, edge menghubungkan dua node cluster pada MDS Digunakan untuk label edge Property 5 A pcluster of size adalah clique yang memenuhi dimana adalah MDS object-pair dikoneksikan oleh edge di dalam (2-8) Pembuktian Misal adalah clique Setiap dua node, dikoneksikan oleh edge Karena label, yang merepresentasikan MDS,, yang berisi paling sedikit kolom, dapat dikatakan, membentuk pcluster dengan himpunan kolom Jadi, menurut definisi pcluster,, adalah pcluster dengan ukuran Selanjutnya, tidak perlu mencari clique di dalam graph yang terdiri dari inputan himpunan object-pair MDSs Daripada mengalokasikan dalam setiap pruned block Ini karena berisi semua obyekobyek yang dihubungkan ke obyek Jadi, jika obyek tampak di dalam p-cluster harus terletak seluruhnya didalam Dapat juga dikatakan tidak perlu melakukan cliques atau pcluster dengan silang block Algoritma 4 menggambarkan proses pencarian pcluster dari block satu ke block lain Pertama, mengumpulkan semua MDSs yang ada yang terlihat pada masing-masing block Untuk MDSs yang associate nr pada masing-masing objek, sekumpulan cliquer procedure untuk mencari ukuran masingmasing clique setiap ukuran nr Procedure akan mengecek edges diantara objek-objek yang memiliki informasi pada setiap block Dengan mengijinkan satu set maximum pencarian waktu pada pencarian clique Proses selanjutnya, dengan mengenerate MDSs yang baru yang digabung dengan MDSs yang lama mengulangi proses MDSs yang baru kolom nc, dengan menyediakan masing-masing clique yang tidak pada subset pada pencarian pcluster Langkah mengenerate MDSs untuk symmetric pruning yang mempunyai kompleksitas dimana adalah jumlah kolom adalah jumlah obyek Untuk block pruning, dikurangi dengan karena hanya object-pair MDSs yang digenerate Worst case untuk symmetric prune block pruning adalah, walaupun rata-rata kurang, karena rata-rata ukuran column-pair MDS (jumlah obyek di dalam MDS) lebih kecil dari M Di dalam worst case, langkah terakhir dalam algoritma 4 mempunyai kompleksitas exponensial tentang jumlah kolom Bagaimanapun, karena kebanyakan MDSs tidak valid terhapus di dalam langkah pruning, dalam waktu sesungguhnya itu kurang dari mengenerate MDSs pruning MDSs Algorithm 5 Main Algorithm untuk menggali pcluster : pcluster() Input : : data set, : pcluster threshold, : jumlah minimal kolom : jumlah minimal baris Output: semua pcluster dengan ukuran for setiap block semua MDSs yang tampil di dalam (setiap yang terhubung yang tidak kurang dari di dalam ) for setiap MDS Klasterisasi berdasarkan kesamaan pola dengan menggunakan algoritma pcluster 6 obyek-obyek MDS yang bukan subset yang ditemukan dalam pcluster for setiap libatkan cliquer pada obyek-obyek MDS yang terasosiasi dengan : clique ditemukan ouput pcluster prune inputan di dalam block yang terhubung until tidak ada clique yang dapat ditemukan Langkah-langkah dari algoritma pcluster diatas, antara lain : 1 Menghitung variabel data, berdasarkan jumlah baris jumlah kolom 2 Mengambil pair + MDS bitmap dari proses pruning (symmetric/block) 3 Melakukan pengecekan terhadap semua blok yang tersisa dari proses block prune 4 Mencari elemen dari pair-object atau paircolumn yang terasosiasi dengan setiap MDS 5 Menghitung total dari elemen (obyek atau kolom) yang terasosiasi
7 6 Jikail total dari elemen (obyek atau kolom) yang terasosiasi kurang dari jumlah minimal baris, maka hapus pair + MDS yang terpilih pair + MDS yang lain dimana MDSnya sama dengan MDS yang terpilih Dan sebaliknya, jika total dari elemen (obyek atau kolom) yang terasosiasi lebih dari jumlah minimal baris, maka ambil MDS obyekobyek yang terasosiasi untuk diinputkan ke dalam data pcluster 7 Ulangi langkah 5-7 sampai mencapai MDS terakhir pada blok yang terpilih 8 Menghitung total pcluster pada blok yang terpilih 9 Melakukan pengecekan terhadap MDS, jika subset dari MDS telah terisi dalam pcluster, maka tambahkan obyek yang terasosiasi kepada obyek yang telah terdaftar di pcluster Dan sebaliknya, jika subset dari MDS belum terisi dalam pcluster, maka tambahkan MDS obyek yang terasosiasi di pcluster 10 Langkah 9 akan berulang sampai mencapai akhir elemen pcluster blok yang terpilih IV UJICOBA DAN EVALUASI Ujicoba evaluasi akan dilakukan dengan membandingkan antara pcluster menggunakan block dengan symetri Skenario yang pertama adalah uji coba dengan menambahkan jumlah baris di dalam data set Uji coba menggunakan data set sintetis yang digenerate dengan jumlah kolom sebanyak 7, dimana 7 merupakan total yang melekat di dalam data set Uji coba ini dengan menggunakan,,, dimana adalah jumlah baris dari data buatan Skenario yang kedua adalah uji coba dengan menambahkan jumlah kolom di dalam data set Uji coba menggunakan data set sintetis yang digenerate dengan jumlah baris sebanyak 100, dimana 100 merupakan total yang melekat di dalam data set Uji coba ini dengan menggunakan,,, dimana adalah jumlah kolom dari data buatan 41A 41B Gambar 41A Hasil pruning dengan jumlah baris yang berbeda di dalam data set, 52 Hasil pruning dengan jumlah baris yang berbeda di dalam data set 42A 42B Gambar 42A Hasil Klasterisasi dengan jumlah baris yang berbeda di dalam data set, 42B Hasil Klasterisasi dengan jumlah baris yang berbeda di dalam data set Klasterisasi berdasarkan kesamaan pola dengan menggunakan algoritma pcluster 7
8 Skenario yang ketiga adalah uji coba dengan menambahkan jumlah baris di dalam data set Uji coba menggunakan data set sintetis yang digenerate dengan jumlah kolom sebanyak 7, dimana 7 merupakan total yang melekat di dalam data set Uji coba ini dengan menggunakan,,, dimana adalah jumlah baris dari data buatanskenario yang keempat adalah uji coba dengan menambahkan jumlah kolom di dalam data set Uji coba menggunakan data set sintetis yang digenerate dengan jumlah baris sebanyak 100, dimana 100 merupakan total yang melekat di dalam data set Uji coba ini dengan menggunakan,,, dimana adalah jumlah kolom dari data buatan V KESIMPULAN Dari uji coba yang telah dilakukan dengan menganalisis hasil pengujian terhadap sistem ini, dapat diambil beberapa kesimpulan, sebagai berikut : 1 Klasterisasi berdasarkan clique lebih efisien dibandingkan dengan klasterisasi secara langsung 2 Block prune sangat efisien sangat efekt daripada symmetric pruning, karena dapat mengurangi object-pairs maupun column-pairs yang tidak berguna, yang akan memperbaiki performa dari klasterisasi berdasarkan clique REFERENSI [1] Wang Haixun, and Pei Jian, Clustering By Pattern Similarity, Journal Of Computer Science and Technology, vol 23, pp , 2008 [2] Yang J, Wang W, Wang H, Yu P S : Capturing subspace correlation in a large dataset In Proc ICDE, San Jose, USA, 2002, pp [3] Niskanen S, Ostegard P R J Cliquer user s guide, version 10 Technical Report T48, Communications Laboratory, Helsinki University of Technology, Espoo, Finland, Klasterisasi berdasarkan kesamaan pola dengan menggunakan algoritma pcluster 8
KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola)
PRESENTASI TUGAS AKHIR KI091391 KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) Penyusun Tugas Akhir : Kartika Wijayati
Lebih terperinciKLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI
TUGAS AKHIR CI1599 KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI AHMAD DENI DWI PRANOTO NRP 5103 100 015 Dosen Pembimbing I Rully Soelaiman,
Lebih terperinci2.2 Data Mining. Universitas Sumatera Utara
Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record
Lebih terperinciPENGGALIAN POLA CLOSED SEQUENTIAL PADA BASIS DATA YANG BERTAMBAH SECARA BERTAHAP
PENGGALIAN POLA CLOSED SEQUENTIAL PADA BASIS DATA YANG BERTAMBAH SECARA BERTAHAP Budanis Dwi Meilani* dan Arif Djunaidy** Jurusan Teknik Informatika ITS, Surabaya 60111, email: **budanis@yahoo.com, **adjunaidy@its.ac.id
Lebih terperinciPENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA
PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo
Lebih terperinciCLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)
CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing
Lebih terperinciBAB IV ANALISIS DAN PERANCANGAN
BAB IV ANALISIS DAN PERANCANGAN 4.1. Analisa 4.1.1 Analisis Data Pada tahap analisa data ini akan dibahas mengenai citra CT Scan yang akan dilakukan proses segmentasi atau pengelompokan data. Data citra
Lebih terperinciIMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS
IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS Yudis Anggara Putra Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut
Lebih terperinciDETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA
DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA Akmal Hidayat 1) & Entin Martiana 2) 1) Teknik Elektro Politeknik Bengkalis Jl.
Lebih terperinciUKDW BAB I PENDAHULUAN
BAB I PENDAHULUAN 1.1 Latar Belakang Dalam dunia bisnis pada jaman sekarang, para pelaku bisnis senantiasa selalu berusaha mengembangkan cara-cara untuk dapat mengembangkan usaha mereka dan memperhatikan
Lebih terperinciAPLIKASI KOMPRESI CITRA BERBASIS ROUGH FUZZY SET
APLIKASI KOMPRESI CITRA BERBASIS ROUGH FUZZY SET Anny Yuniarti 1), Nadya Anisa Syafa 2), Handayani Tjandrasa 3) 1,2,3) Jurusan Teknik Informatika Institut Teknologi Sepuluh Nopember (ITS) Surabaya Surabaya
Lebih terperinciPENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI
PENGGUNAAN PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI Entin Martiana S.Kom,M.Kom, Nur Rosyid Mubtada i S. Kom, Edi Purnomo Jurusan Teknik Informatika
Lebih terperinciBAB III ANALISIS III.1 Analisis Konseptual Teknik Pengolahan Data
BAB III ANALISIS III.1 Analisis Konseptual Teknik Pengolahan Data Data sudah menjadi bagian penting dalam pengambilan keputusan. Data telah banyak terkumpul baik itu data transaksi perbankan, data kependudukan,
Lebih terperinciTipe Clustering. Partitional Clustering. Hirerarchical Clustering
Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan
Lebih terperinciAnalisis Perbandingan Algoritma Fuzzy C-Means dan K-Means
Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.
Lebih terperinciMETODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami
METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering
Lebih terperinciPenerapan Teknik Dekomposisi Square Root dan Algoritma Mo s pada Rancangan Algoritma Studi Kasus: SPOJ Klasik Counting Diff-Pairs
A5 Penerapan Teknik Dekomposisi Square Root dan Algoritma Mo s pada Rancangan Algoritma Studi Kasus: SPOJ Klasik Counting Diff-Pairs Abdul Majid Hasani, Rully Soelaiman dan Fajar Baskoro Departemen Informatika,
Lebih terperinciKata kunci : Pemilihan gambar, Pencocokan Graph
ALGORITMA PENCOCOKAN OBJEK GEOMETRI CITRA BERBASIS GRAPH UNTUK PEMILIHAN KEMBALI (RETRIEVAL) Yureska Angelia 867 Email : angelia.yureska@gmail.com Bidang Studi Telekomunikasi Multimedia Jurusan Teknik
Lebih terperinciBAB 2 LANDASAN TEORI
6 BAB 2 LANDASAN TEORI 2.1 Pengertian Algoritma Menurut (Suarga, 2012 : 1) algoritma: 1. Teknik penyusunan langkah-langkah penyelesaian masalah dalam bentuk kalimat dengan jumlah kata terbatas tetapi tersusun
Lebih terperinciPRESENTASI TUGAS AKHIR KI091391
PRESENTASI TUGAS AKHIR KI091391 IMPLEMENTASI KD-TREE K-MEANS CLUSTERING PADA KLASTERISASI DOKUMEN (Kata kunci: KD-Tree K-Means Clustering, Klasterisasi Dokumen, K- Dimensional Tree, K-Means Clustering)
Lebih terperinciSEGMENTASI CITRA MENGGUNAKAN PENGHAPUSAN TEKSTUR DAN K-MEANS DENGAN BATASAN RUANG
SEGMENTASI CITRA MENGGUNAKAN PENGHAPUSAN TEKSTUR DAN K-MEANS DENGAN BATASAN RUANG Gama Wisnu Fajarianto 1, Handayani Tjandrasa 2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi
Lebih terperinciBAB 2 LANDASAN TEORI
5 BAB 2 LANDASAN TEORI 2.1 Digital Image 2.1.1 Definisi Digital Image Menurut Gonzalez dan Woods (1992, p6), digital image adalah image f(x,y) yang telah dibedakan berdasarkan koordinat tata letak dan
Lebih terperinciIMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING
IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember
Lebih terperinciBAB III ANALISIS KOMPLEKSITAS ALGORITMA
BAB III ANALISIS KOMPLEKSITAS ALGORITMA 3.1 Kompleksitas Algoritma Suatu masalah dapat mempunyai banyak algoritma penyelesaian. Algoritma yang digunakan tidak saja harus benar, namun juga harus efisien.
Lebih terperinciSEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA
SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA Kamil Malik Jurusan Teknik Informatika STT Nurul Jadid Paiton nomor1001@gmail.com Andi Hutami Endang Jurusan Teknik Informatika
Lebih terperinciTidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan
Terdapat banyak jenis pola: Pola visual Pola temporal Pola logikal Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan Statistik
Lebih terperinciAnalisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering
Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Aufa Bil Ahdi P 1, Kemas Rahmat Saleh W, S.T., M.Eng 2, Anisa Herdiani, S.T., M.T 3 1.2.3 Teknik Informatika,
Lebih terperinciPENCARIAN CITRA BERDASARKAN BENTUK DASAR TEPI OBJEK DAN KONTEN HISTOGRAM WARNA LOKAL
Makalah Nomor: KNSI-472 PENCARIAN CITRA BERDASARKAN BENTUK DASAR TEPI OBJEK DAN KONTEN HISTOGRAM WARNA LOKAL Barep Wicaksono 1, Suryarini Widodo 2 1,2 Teknik Informatika, Universitas Gunadarma 1,2 Jl.
Lebih terperinciKOMBINASI METODE MORPHOLOGICAL GRADIENT DAN TRANSFORMASI WATERSHED PADA PROSES SEGMENTASI CITRA DIGITAL
KOMBINASI METODE MORPHOLOGICAL GRADIENT DAN TRANSFORMASI WATERSHED PADA PROSES SEGMENTASI CITRA DIGITAL Rudy Adipranata Universitas Kristen Petra Jl. Siwalankerto 121-131, Surabaya. Telp. (031) 8439040
Lebih terperinciApa itu is K-Nearest Neighbor (KNN) Algorithm?
K-Nearest Neighbor Pendahuluan K-Nearest Neighbour atau KNN adalah salah dari algoritma instance based learning atau case-based reasoning. Definisi case based reasoning: KNN digunakan dalam banyak aplikasi
Lebih terperinciBAB II TINJAUAN PUSTAKA
2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan:
Lebih terperinciPENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE
PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE Widodo Muda Saputra, Helmie Arif Wibawa, S.Si, M.Cs, dan Nurdin Bahtiar, S.Si, M.T Fakultas Sains dan Matematika, Jurusan Ilmu Komputer
Lebih terperinciUKDW BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Konsumsi, Finansial, semakin menjadi hal yang tidak dapat dipisahkan seiring terus berkembangnya suatu negara. Transaksi, jual, beli, sudah menjadi kata yang sangat
Lebih terperinciPenyelesaian Permainan Sliding Puzzle 3x3 Menggunakan Algoritma Greedy Dengan Dua Fungsi Heuristik
Penyelesaian Permainan Sliding Puzzle 3x3 Menggunakan Algoritma Greedy Dengan Dua Fungsi Heuristik Akbar Gumbira - 13508106 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut
Lebih terperinciSEGMENTASI CITRA CT SCAN TUMOR OTAK MENGGUNAKAN MATEMATIKA MORFOLOGI (WATERSHED) DENGAN FLOOD MINIMUM OPTIMAL
SEGMENTASI CITRA CT SCAN TUMOR OTAK MENGGUNAKAN MATEMATIKA MORFOLOGI (WATERSHED) DENGAN FLOOD MINIMUM OPTIMAL Andi Hendra 1 1 Jurusan Matematika MIPA Universitas Tadulako ABSTRAK Penelitian pengolahan
Lebih terperinciANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)
ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM) Nurani 1, Hamdan Gani 2 1 nurani_nanni@yahoo.com, 2 hamdan.gani.inbox@gmail.com
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma
Lebih terperinciAnalisa dan Perancangan Algoritma. Ahmad Sabri, Dr Sesi 1: 9 Mei 2016
Analisa dan Perancangan Algoritma Ahmad Sabri, Dr Sesi 1: 9 Mei 2016 Apakah algoritma itu? Asal istilah: Al Khwarizmi (± 800 M), matematikawan dan astronomer Persia. Pengertian umum: "suatu urutan langkah-langkah
Lebih terperinciBAB III PERANCANGAN SISTEM. Pada dewasa sekarang ini sangat banyak terdapat sistem dimana sistem tersebut
BAB III PERANCANGAN SISTEM 3.1 Definisi Masalah Pada dewasa sekarang ini sangat banyak terdapat sistem dimana sistem tersebut sudah terintegrasi dengan komputer, dengan terintegrasinya sistem tersebut
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Kondisi pengolahan data yang telah dijabarkan sebelumnya pada bab 1 (satu) memiliki keterkaitan terhadap permasalahan yang teridentifikasi. Yaitu permasalahan terkait desain
Lebih terperinciPENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA
PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA Diajeng Tyas Purwa Hapsari Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281 Email :
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1. Data Mining Data mining adalah bagian dari knowledge discovery di database yang menganalisa database berukuran besar untuk menemukan pola yang berguna pada data (Silberschatz,
Lebih terperinciPemanfaatan Algoritma Hybrid Ant Colony Optimization dalam Menyelesaikan Permasalahan Capacitated Minimum Spanning Tree. Tamam Asrori ( )
Pemanfaatan Algoritma Hybrid Ant Colony Optimization dalam Menyelesaikan Permasalahan Capacitated Minimum Spanning Tree Tamam Asrori (5104 100 146) Pendahuluan Latar Belakang Tujuan Dan Manfaat Rumusan
Lebih terperinciLangkah Awal menuju Analisis Kompleksitas Algoritma
Langkah Awal menuju Analisis Kompleksitas Algoritma Isi Proses Desain dan Analisis Algoritma Tipe-tipe Problem yang penting Kebutuhan akan algoritma yang efisien Analisis framework 2 Proses Desain dan
Lebih terperinciPERANCANGAN APLIKASI PENGACAKAN CITRA MENGGUNAKAN M-SEQUENCE BERDASARKAN PARAMETER
PERANCANGAN APLIKASI PENGACAKAN CITRA MENGGUNAKAN M-SEQUENCE BERDASARKAN PARAMETER Kristian Telaumbanua 1, Susanto 2 Program Studi Teknik Informatika, STMIK Mikroskil Jl. Thamrin No. 122, 124, 140 Medan
Lebih terperinciDEKOMPOSISI MORFOLOGI BENTUK BINER DUA DIMENSI MENJADI POLIGON KONVEKS DENGAN PENDEKATAN HEURISTIK
DEKOMPOSISI MORFOLOGI BENTUK BINER DUA DIMENSI MENJADI POLIGON KONVEKS DENGAN PENDEKATAN HEURISTIK Nanik Suciati, Rosdiana Rahmawati Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi
Lebih terperinciPermasalahan Clique dalam Graf
Permasalahan Clique dalam Graf Adventus W. Lumbantobing, 13505112 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Innesia
Lebih terperinciPENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI
PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4
Lebih terperinciPENGARUH PEMAKAIAN EDGE DETECTION PADA SISTEM PENGENALAN HURUF KAPITAL TULISAN TANGAN
Jurnal Teknik dan Ilmu Komputer PENGARUH PEMAKAIAN EDGE DETECTION PADA SISTEM PENGENALAN HURUF KAPITAL TULISAN TANGAN (The Influence of Edge Detection Use on Capital Letter Hand Writing Recognition System)
Lebih terperinciKata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching
Analisis dan Implementasi Graph Indexing Pada Graph Database Menggunakan Algoritma GIndex Analysis and Implementation of Graph Indexing for Graph Database Using GIndex Algorithm Hadyan Arif 1, Kemas Rahmat
Lebih terperinciPENGELOMPOKAN GAMBAR BERDASARKAN WARNA DAN BENTUK MENGGUNAKAN FGKA (FAST GENETIC KMEANS ALGORITHM) UNTUK PENCOCOKAN GAMBAR
PENGELOMPOKAN GAMBAR BERDASARKAN WARNA DAN BENTUK MENGGUNAKAN FGKA (FAST GENETIC KMEANS ALGORITHM) UNTUK PENCOCOKAN GAMBAR Farah Zakiyah Rahmanti 1, Entin Martiana K. 2, S.Kom, M.Kom, Nana Ramadijanti
Lebih terperinci(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M
(M.3) CLUSTERING PENGGUNA WEBSITE BPS MENGGUNAKAN ALGORITMA SEQUENCE DBSCAN (SEQDBSCAN) DENGAN JARAK SIMILARITAS S 3 M 1Toza Sathia Utiayarsih, 2 Yadi Suprijadi, 3 Bernik Maskun 1Mahasiswa Magister Statistika
Lebih terperinciANALISIS ALGORITMA BINARY SEARCH
ANALISIS ALGORITMA BINARY SEARCH Metode Binary search Binary search merupakan salah satu algoritma untuk melalukan pencarian pada array yang sudah terurut. Jika kita tidak mengetahui informasi bagaimana
Lebih terperinciMASALAH VEKTOR EIGEN MATRIKS INVERS MONGE DI ALJABAR MAX-PLUS
MASALAH VEKTOR EIGEN MATRIKS INVERS MONGE DI ALJABAR MAX-PLUS Farida Suwaibah, Subiono, Mahmud Yunus Jurusan Matematika FMIPA Institut Teknologi Sepuluh Nopember Surabaya,, e-mail: fsuwaibah@yahoo.com
Lebih terperinciBAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.
BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. 2.1. Data Mining Data mining adalah suatu istilah yang digunakan
Lebih terperinciAlgoritma Penentuan Graf Bipartit
Algoritma Penentuan Graf Bipartit Zain Fathoni - 13508079 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung Kampus ITB Jln. Ganesha No. 10 Bandung e-mail:
Lebih terperinciPenerapan Algoritma A* Untuk Pencarian Rute Terdekat Pada Permainan Berbasis Ubin (Tile Based Game)
Penerapan Algoritma A* Untuk Pencarian Rute Terdekat Pada Permainan Berbasis Ubin (Tile Based Game) Febriana Santi Wahyuni 1,*, Sandy Nataly Mantja 1 1 T.Informatika Fakultas Teknologi Industri Institut
Lebih terperinciPENDAHULUAN. 1.1 Latar Belakang
DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan
Lebih terperinciPengelompokan Data dengan Metode...(Luh Joni Erawati Dewi)
ISSN0216-3241 17 PENGELOMPOKAN DATA DENGAN METODE KLASTERISASI HIRARKI Oleh Luh Joni Erawati Dewi Jurusan Manajemen Informatika, FTK, Undiksha Abstrak Pengelompokan data sangat diperlukan untuk mengetahui
Lebih terperinciBAB III ANALISIS. Mekanisme Penyimpanan dan Pengambilan Sequence
BAB III ANALISIS Mula-mula, Bab ini akan mengemukakan analisis yang dilakukan terhadap algoritma PrefixSpan [PEI01]. Kemudian dilakukan rancangan dan implementasi algoritma tersebut. Setelah itu, program
Lebih terperinciClustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means
Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means Sri Redjeki Andreas 1), Andreas Pamungkas, Pamungkas Hastin 2), Hastin Al-fatah Al-fatah 3) 1)2)3) STMIK dzeky@akakom.ac.id
Lebih terperinciTEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL
TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL Nadia Damayanti 1, Nur Rosyid Mubtada i, S.Kom, M.Kom 2, Afrida Helen S.T, M.Kom
Lebih terperinciPenjadwalan Petugas Medis pada Kondisi Darurat dengan Menggunakan Binary Integer Programming Berbasis Web
A497 Penjadwalan Petugas Medis pada Kondisi Darurat dengan Menggunakan Binary Integer Programming Berbasis Web Bryan Alfadhori, Ahmad Saikhu, dan Victor Hariadi Jurusan Tekni Informatika, Fakultas Teknologi
Lebih terperinciBAB II LANDASAN TEORI. Anindita Dwi Respita,2015. a. Penelitian ini menjelaskan tentang tujuan : menggunakan metode market basket analysis.
BAB II LANDASAN TEORI 2.1 Tinjauan Pustaka 2.1.1 Penelitian Terkait 1) Penelitian terdahulu dengan judul Online Shop kecantikan dan kosmetik dengan pemberian saran pembelian produk menggunakan Market Basket
Lebih terperinciUJM 2 (1) (2013) UNNES Journal of Mathematics.
UJM 2 (1) (2013) UNNES Journal of Mathematics http://journal.unnes.ac.id/sju/index.php/ujm PENERAPAN ALGORITMA DIJKSTRA DAN PRIM PADA PENDISTRIBUSIAN AIR DI PDAM KABUPATEN DEMAK Verly Zuli Prasetyo, Amin
Lebih terperinciDesain dan Analisis Algoritma Modifikasi Hungarian untuk Permasalahan Penugasan Dinamis Pada Studi Kasus Permasalahan SPOJ Klasik 12749
JURNAL TEKNIK POMITS Vol. 2, No. 1, (2014) ISSN: 2337-3539 (2301-9271 Print) 1 Desain dan Analisis Algoritma Modifikasi Hungarian untuk Permasalahan Penugasan Dinamis Pada Studi Kasus Permasalahan SPOJ
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Data menjadi sesuatu yang sangat berharga saat ini. Tidak hanya badan pemerintah saja, perusahaan-perusahaan saat ini pun sangat membutuhkan informasi dari data yang
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI Sebagai acuan penulisan penelitian ini diperlukan beberapa pengertian dan teori yang berkaitan dengan pembahasan. Dalam sub bab ini akan diberikan beberapa landasan teori berupa pengertian,
Lebih terperinciGambar (a) PDL for test design
Deriving Test Cases Metode ujicoba berbasis alur dapat diaplikasikan pada detail desain prosedural atau kode sumber. Ujicoba berbasis alur direpresentasikan menjadi beberapa tahapan : 1. Menggunakan desain
Lebih terperinciK-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia
K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id
Lebih terperinciAPLIKASI PERENCANA BELANJA DENGAN PENGURUTAN SKALA PRIORITAS BERBASIS ANDROID
44 Vol. 11 No. 1 Februari 2016 Jurnal Informatika Mulawarman APLIKASI PERENCANA BELANJA DENGAN PENGURUTAN SKALA PRIORITAS BERBASIS ANDROID Barry Nuqoba 1), Faried Effendy 2), 1,2) Departemen Matematika,
Lebih terperinciPrediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov
JURNAL SAINS DAN SENI POMITS Vol. 6, No.2, (2017) 2337-3520 (2301-928X Print) A 39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi Daryono Budi Utomo Jurusan
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan
Lebih terperinciIdentifikasi Tanda Tangan Menggunakan Transformasi Gabor Wavelet dan Jarak Minskowski
Identifikasi Tanda Tangan Menggunakan Transformasi Gabor Wavelet dan Jarak Minskowski Junia Kurniati Computer Engineering Department Faculty of Computer Science Sriwijaya University South Sumatera Indonesia
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Batik Besurek 2.1.1 Sejarah Batik Besurek Bengkulu Kain Batik Besurek merupakan salah satu bentuk batik hasil kerajinan tradisional daerah Bengkulu yang telah diwariskan dari
Lebih terperinciBAB 2 LANDASAN TEORI
6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database
Lebih terperinciPENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN
PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas
Lebih terperinciStrategi Algoritma Penyelesaian Puzzle Hanjie
Strategi Algoritma Penyelesaian Puzzle Hanjie Whilda Chaq 13511601 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia
Lebih terperinciFRAMEWORK OPTIMALISASI TATA LETAK POLA BUSANA PADA KAIN BATIK DENGAN MEMPERTIMBANGKAN KESERASIAN MOTIF
FRAMEWORK OPTIMALISASI TATA LETAK POLA BUSANA PADA KAIN BATIK DENGAN MEMPERTIMBANGKAN KESERASIAN MOTIF Halimatus Sa dyah ), Diana Purwitasari 2), Nanik Suciati 3),2,3 Jurusan Teknik Informatika Institut
Lebih terperinciUJI KINERJA FACE RECOGNITION MENGGUNAKAN EIGENFACES
1 Uji Kinerja Face Recognition Menggunakan Eigenfaces UJI KINERJA FACE RECOGNITION MENGGUNAKAN EIGENFACES ABDUL AZIS ABDILLAH 1 1STKIP Surya, Tangerang, Banten, abdillah.azul@gmail.com Abstrak. Pada paper
Lebih terperinciImplementasi Teori Graf Dalam Masalah Fingerprint Recognition (Pengenalan Sidik Jari)
Implementasi Teori Graf Dalam Masalah Fingerprint Recognition (Pengenalan Sidik Jari) Amalfi Yusri Darusman Jurusan Teknik Informatika Institut Teknologi Bandung, jalan Ganesha 10 Bandung, email : if17023@students.if.itb.a.c.id
Lebih terperinciBAB IV ANALISIS DAN EVALUASI
109 BAB IV ANALISIS DAN EVALUASI 4.1. Analisis dan Evaluasi Pada bab ini akan dijabarkan secara rinci bagaimana langkah langkah yang dilakukan untuk melakukan analisis dan evaluasi dari pengujian sistem.
Lebih terperinciIMPLEMENTASI ALGORITMA FRACTAL NEIGHBOUR DISTANCE UNTUK FACE RECOGNITION
IMPLEMENTASI ALGORITMA FRACTAL NEIGHBOUR DISTANCE UNTUK FACE RECOGNITION Garibaldy W Mukti 13506004 Teknik Informatika ITB alamat : Srigading 29, Bandung 40132 email: subghost1802000@yahoo.com ABSTRAK
Lebih terperinciTUGAS MAKALAH. Testing dan Implementasi Sistem White Box Testing
TUGAS MAKALAH Testing dan Implementasi Sistem White Box Testing Anggota Kelompok II : Komang Dodik Gunawan 13101172 Daniel Eka Saputra 13101882 Teguh Wirawan 13101058 DW GD Surya Damanik 13101461 MD Adhi
Lebih terperinciAnalisis Algoritma Bubble Sort
Analisis Algoritma Bubble Sort Ryan Rheinadi NIM : 13508005 Program Studi Teknik Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10, Bandung e-mail: if18005@students.if.itb.ac.id
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Traveling Salesmen Problem (TSP) Travelling Salesman Problem (TSP) merupakan sebuah permasalahan optimasi yang dapat diterapkan pada berbagai kegiatan seperti routing. Masalah
Lebih terperinciPERANCANGAN APLIKASI PENCARIAN RUTE TERPENDEK MENEMUKAN TEMPAT PARIWISATA TERDEKAT DI KEDIRI DENGAN METODE FLOYD- WARSHALL UNTUK SMARTPHONE
PERANCANGAN APLIKASI PENCARIAN RUTE TERPENDEK MENEMUKAN TEMPAT PARIWISATA TERDEKAT DI KEDIRI DENGAN METODE FLOYD- WARSHALL UNTUK SMARTPHONE SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh
Lebih terperinciREKOMENDASI SOLUSI PADA COMPUTER MAINTENANCE MANAGEMENT SYSTEM MENGGUNAKAN ASSOCIATION RULE, KOEFISEN KORELASI PHI DAN CHI-SQUARE
REKOMENDASI SOLUSI PADA COMPUTER MAINTENANCE MANAGEMENT SYSTEM MENGGUNAKAN ASSOCIATION RULE, KOEFISEN KORELASI PHI DAN CHI-SQUARE Farid Sukmana 1) dan Joko Lianto Buliali 2) 1) Management of Information
Lebih terperinciKLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS
1 KLASTERISASI PROSES SELEKSI PEMAIN MENGGUNAKAN ALGORITMA K-MEANS (Study Kasus : Tim Hockey Kabupaten Kendal) Alith Fajar Muhammad Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula No. 5-11 Semarang-50131
Lebih terperinciPerbandingan Performa Kombinasi Algoritma Pengurutan Quick-Insertion Sort dan Merge-Insertion Sort
Perbandingan Performa Kombinasi Algoritma Pengurutan Quick-Insertion Sort dan Merge-Insertion Sort Muhammad Ezar Al Rivan Teknik Informatika STMIK GI MDP Palembang, Indonesia meedzhar@mdp.ac.id Abstrak
Lebih terperinciSTUDI MENGENAI SERANGAN DIFFERENT CRYPTANALYSIS PADA ALGORITMA SUBSTITUTION PERMUATION NETWORK
STUDI MENGENAI SERANGAN DIFFERENT CRYPTANALYSIS PADA ALGORITMA SUBSTITUTION PERMUATION NETWORK M Gilang Kautzar H Wiraatmadja NIM : 13505101 Program Studi Teknik Informatika, Institut Teknologi Bandung
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciPENJEJAKAN POSISI BOLA PADA MODUL PHYCORE IMX31 MENGGUNAKAN EMBEDDED OPENCV
PENJEJAKAN POSISI BOLA PADA MODUL PHYCORE IMX31 MENGGUNAKAN EMBEDDED OPENCV Aditya Pratama 1, Bima Sena Bayu. D 2, Setiawardhana 2 1 Mahasiswa D4 Teknik Komputer, 2 Dosen Teknik Komputer Politeknik Elektronika
Lebih terperinciKuliah Online : TEKKOM [2013/VI]
Kuliah Online : TEKKOM [2013/VI] Sumber Perancangan Bahasa Pemrograman Bahasa alami (natural language) Konstruksi yang diturunkan dari bahasa alami, karena bahasa alami dapat digunakan sebagai panduan
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling
Lebih terperinciLink Analysis (Superset) 3 Kategori Link Analysis (#1) 3 Kategori Link Analysis (#2) Association Rule Mining. 3 Kategori Link Analysis (#3)
Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #7: Association Rules Mining (Bagian 1) Gunawan Jurusan Teknik Informatika Link Analysis (Superset) Tujuan: Mencari hubungan antara
Lebih terperinciBAB II TINJAUAN PUSTAKA. menggunakan PCA, kemudian penelitian yang menggunakan algoritma Fuzzy C-
8 BAB II TINJAUAN PUSTAKA 2.1 Studi Pendahuluan Sebelumnya telah ada penelitian tentang sistem pengenalan wajah 2D menggunakan PCA, kemudian penelitian yang menggunakan algoritma Fuzzy C- Means dan jaringan
Lebih terperinciMAKALAH ALGORITMA DIVIDE AND CONQUER
MAKALAH ALGORITMA DIVIDE AND CONQUER Galih Pranowo Jurusan Matematika Ilmu Komputer FAKULTAS SAINS TERAPAN INSTITUT SAINS & TEKNOLOGI AKPRIND YOGYAKARTA 1. Pengertian Algoritma Divide and Conquer merupakan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan
Lebih terperinciOleh Lukman Hariadi
ANALISIS PENYELESAIAN PUZZLE SUDOKU DENGAN MENERAPKAN ALGORITMA BACKTRACKING (berbentuk piramida terbalik) PROPOSAL JUDUL Diajukan Untuk Menempuh Tugas Akhir Oleh Lukman Hariadi 14201045 PROGRAM STUDI
Lebih terperinci