PENERAPAN METODE HEURISTIC SEMI-SUPERVISED FUZZY CO- CLUSTERING ALGORITHM WITH RUSPINI S CONDITION (SS-HFCR) UNTUK PENGELOMPOKAN DOKUMEN TEKS

Ukuran: px
Mulai penontonan dengan halaman:

Download "PENERAPAN METODE HEURISTIC SEMI-SUPERVISED FUZZY CO- CLUSTERING ALGORITHM WITH RUSPINI S CONDITION (SS-HFCR) UNTUK PENGELOMPOKAN DOKUMEN TEKS"

Transkripsi

1 JURNAL TEKNIK POMITS Vol., No. 1, (013) ISSN: ( Print) 1 PENERAPAN METODE HEURISTIC SEMI-SUPERVISED FUZZY CO- CLUSTERING ALGORITHM WITH RUSPINI S CONDITION (SS-HFCR) UNTUK PENGELOMPOKAN DOKUMEN TEKS Syahrul Munif, Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya Indonesia chastine@cs.its.ac.id Abstrak Dokumen merupakan sebuah tulisan yang memuat informasi. Banyaknya dokumen bisa menjadi suatu masalah tersendiri dalam mengelompokkannya. Pengelompokan dokumen merupakan bagian dari ilmu machine learning. Pengelompokkan bertujuan untuk mengatur dokumen supaya bisa terkelompok dalam bagian-bagian kelompok/kategori. Heuristic Semi-supervised Fuzzy Co-clustering Algorithm with Ruspini s Condition (SS-HFCR) merupakan salah satu teknik baru dalam pengelompokan dokumen. Metode ini menggabungkan metode fuzzy clustering, co-clustering dan pengelompokan semi-supervised. Pada karya tulis ini menggunakan metode SS-HFCR untuk mengelompokan data teks. Metode ini menghasilkan akurasi yang cukup baik untuk mengelompokan data WebKb dan Reuters-1578 R8. Kata Kunci Clustering, Co-Culstering, Fuzzy, Machine learning, Semi-supervised. I. PENDAHULUAN Dokumen merupakan sebuah tulisan yang memuat informasi [1]. Pada zaman dahulu, dokumen identik dengan informasi yang ditulis di kertas, bambu, kulit hewan dll. Pada zaman sekarang, dokumen tidak hanya yang berbentuk nyata atau hardcopy seperti buku, surat dan lain-lain. Dokumen pada zaman sekarang lebih banyak berbentuk digital atau softcopy. Media penyimpanan digital untuk dokumen ini juga semakin besar. Sehingga semakin banyak dokumen yang tersimpan. Pada suatu institusi atau lembaga, banyaknya dokumen bisa menjadi suatu masalah tersendiri. Dikarenakan banyaknya dokumen, menyusun dokumen sesuai kelompoknya menjadi sulit. Mengelompokan secara manual dapat dilakukan untuk dokumen-dokumen ini. Cara ini mungkin bisa dilakukan jika jumlah dokumen sedikit. Jika dokumen berjumlah terlalu banyak, cara ini tidak bisa dilakukan. Jumlah data yang besar sering menjadikan permasalahan tersendiri dalam pengelompokan. Selain itu, adanya data yang rusak dan data yang saling tumpang tindih juga menjadi permasalahan tersendiri []. Beberapa algoritma pengelompokan dikembangkan untuk menyelesaikan permasalahan pengelompokan ini. Contoh beberapa algoritma yang dikembangkan adalah co-clustering, fuzzy clustering, fuzzy co-clustering, pengelompokan berdasar konsep matriks (NMF) dan lain sebagainya. Setiap metode mempunyai ciri tersendiri, misalnya co-clustering umumnya baik untuk menangani data besar dengan cara secara serentak mengelompokkan dokumen dan kata berdasarkan tingginya hubungan antara keduanya. Fuzzy clustering digunakan untuk permasalahan data yang saling tumpang tindih, tetapi menjadi tidak bagus ketika terdapat anomali data. Di dalam fuzzy coclustering keterkaitan direpresentasikan dengan derajat keanggotaan dokumen terhadap setiap kelompok / kluster. Fuzzy co-clustering merupakan variasi terbaru dari fuzzy c- means dan pendekatan co-clustering yang bekerja pada dataset tertentu. Selain itu, terdapat juga pengelompokan semi-supervised dan unsupervised. Metode pengelompokan yang menggunakan data belum terkelompok sepenuhnya disebut unsupervised.metode yang menggunakan sebagian data yang sudah terkelompok dan data belum terkelompok disebut metode semi-supervised. yang sudah terkelomppok bertujuan meningkatkan kinerja algoritma. Heuristic Semi-supervised Fuzzy Co-clustering Algorithm with Ruspini s Condition (SS-HFCR) merupakan salah satu teknik baru dalam pengelompokan dokumen. Metode ini menggabungkan metode fuzzy clustering, co-clustering dan pengelompokan semi-supervised. Semi-supervised dalam algoritma ini menggunakan pasangan indeks dokumen yang selanjutnya akan dinamakan batasan must link dan can not link. Must link merupakan batasan berupa pasangan indeks dokumen dimana dua dokumen mempunyai label atau kelompok yang sama. Can not link merupakan batasan berupa pasangan indeks dokumen dimana dua dokumen mempunyai label atau kelompok yang beda. Dokumen-dokumen yang dijadikan batasan must link dan can not link merupakan dokumen yang sudah terlabel atau terkelompok. Pada karya tulis ini menggunakan algoritma SS-HFCR untuk pengelompokan dokumen teks dengan pengetahuan terdahulu yang terbatas. II. METODE A. Heuristic Semi-supervised Fuzzy Co-clustering Algorithm with Ruspini s Condition (SS-HFCR) Algoritma heuristic semi-supervised fuzzy co-clustering with ruspini s condition (SS-HFCR) digunakan untuk mengelompokkan data dokumen web yang besar. Di dalam pendekatan ini, proses pengelompokan dilakukan dengan memasukan beberapa pengetahuan sebelumnya dalam bentuk aturan berpasangan yang disediakan oleh pengguna ke kerangka fuzzy co-clustering [].

2 JURNAL TEKNIK POMITS Vol., No. 1, (013) ISSN: ( Print) Notasi D c/c M N x i d ij U,V u ci,v cj T u,t v T d Tabel 1. Daftar Notasi Arti Asosiasi matriks kata dalam dokumen (tfidf) Indeks kelompok/jumlah kelompok Jumlah kata Jumlah dokumen Dokumen ke i dalah R M tf-idf dari kata j dalam dokumen i Dokumen dan kata matrik fuzzy Nila derajat keanggotaan dokumen dan kata Derajat keanggotaan fuzzy yang ditentukan pengguna Bobot faktor (harga penalti) dari constraint bias. Maka dari itu, dalam pendekatan berbasis dual partisi, dua fungsi yang membantu dengan derajat normal yang berbeda dari bagian agregasi dituliskan dalam Persamaan (4) dan Persamaan (5). (4) (5) Setiap aturan menentukan apakah pasangan dokumen "harus terhubung" atau "tidak dapat terhubung" dimasukan dalam klaster yang sama. Selanjutnya, diformulasikan fungsi biaya aglomerasi kompetitif yang juga dapat digunakan untuk pengetahuan sebelumnya di dalam proses pengelompokan. Dalam penjelasan tinjauan pustaka ini terdapat beberapa notasi yang dijelaskan dalam Tabel 1. Fungsi objektif dari SS- HFCR dapat dituliskan pada Persamaan (1). Dengan optimasi fungsi J sesuai Persamaan () dan Persamaan (3). (1) Ini dinamakan pendekatan fuzzy co-clustering, setiap dokumen i diberikan derajat kecenderungan keanggotaan fuzzy u ci terhadap kelompok c. Untuk setiap kata j dalam dataset diberikan derajat kecenderungan fuzzy v cj terhadap kelompok c. Keduanya harus digunakan dalam fungsi objektif. Korelasi antara kata dan dokumen haruslah kuat dalam satu kelompok/kelompok. Sehingga, bagian pertama yang disebut derajat agregasi haruslah semaksimal mungkin terhadap suatu klaster. Sehingga membuat keterkaitan yang tinggi antara dokumen dan kata ( diindikasikan d ij tinggi) menjadi satu klaster. Hal itu dilakukan atas dasar pemikiran bahwa co-cluster yang baik seharusnya mempunyai koherensi ikatan yang kuat antar anggotanya. Memaksimalkan derajat agregasi mungkin akan mendapatkan hasil pengelompokkan yang tidak diinginkan. Misalkan bagian pertama persamaan adalah G:D =,g ij (Setiap elemen G) dinyatakan. Nilai dapat bervariasi antara 0 dan NK. Variasi ini berimplikasi, memaksimalkan derajat agregasi dalam kasus ini akan mengaburkan pembentukan co-cluster dengan besarnya nilai. Nilai tadi tidak bergantung pada jumlah partisi D. Maka dari itu, co-cluster tidak perlu mempunyai nilai yang besar untuk menentukan struktur kelompok yang terikat dari dataset. Nilai juga selalu sama dengan nilai konstan (contoh N) dalam pendekatan perankingan berbasis partisi, untuk alasan ini nilai itu dapat menghindarkan dari masalah () (3) Dengan normalisasi pada J ss- dan pada J ss-1 sehingga didapatkan nilai konstan untuk bagian agregasi dalam Persamaan (4). Seperti dalam pendekatan berbasis pasrtisi-perangkingan. Normalisasi ini digunakan untuk menghindari bias dan juga mengurangi kemungkinan komputasi yang berlebihan. Pengetahuan terdahulu digunakan dalam proses pengelompokan. Pengetahuan ini diberikan dua set aturan berpasangan. Set satu berisi must-link (ML) atau harus terhubung dan yang kedua can not link (CNL) tidak dapat terhubung. Diasumsikan setiap dokumen mempunyai label virtual berupa variabel kelompok. Label ini terdiri dari dua nilai, satu kelompok pemberian pengguna, yang kedua berdasar kenyataan jika informasi tertentu tersedia. Setiap dokumen dengan label ML mempunyai kemiripan isi antar dokumen tersebut. Sedangkan dokumen dengan label CNL mempunyai ketidak miripan isi antar dokumen tersebut. Aturan ML merepresentasikan relasi yang ekuivalen. Maka, memungkinkan mendapatkan koleksi transitive closure dari set ML, dimana setiap dokumen yang berpasangan mempunyai label virtual yang sama. Setiap dokumen didalam aturan berpasangan diberikan derajat yang tinggi terhadap c sesuai label virtualnya, dan derajat rendah terhadap kelompok yang lain. Dalam proses pengelompokan bagian seharusnya mempunyai nilai maksimal jika x i dan x k mempunyai label virtual yang sama dan mempunyai nilai minimal x i dan x k mempunyai label virtual yang tidak sama. Sehingga kombinasi bagian teramati dalam fungsi objektif menjadi dan mempunyai nilai yang seharusnya maksimal. Td adalah faktor nilai bobot yang mengontrol pentingnya pengetahuan terdahulu dari domain dokumen dibandingkan dengan keseluruhan dataset. SS-HFCR memastikan setiap dokumen akan mendapatkan distribusi keanggotaan fuzzy dan pelanggaran terhadap aturan berpasangan menjadi minimal saat di akhir proses pengelompokkan. Tu dan Tv digunakan untuk menyesuaikan tingkat keanggotaan fuzzy dari dokumen dan kata. Permasalahan yang dihadapi sekarang adalah memaksimalkan Persamaan (4) dan Persamaan (5). Permasalahan ini dapat diatasi dengan mencari nilai optimal dai U dan V dengan aturan Persamaan () dan Persamaan (3). Karena u dan v adalah variabel kontinu, dapat menggunakan metode Lagrange multipliers dengan dengan urutan pertama

3 JURNAL TEKNIK POMITS Vol., No. 1, (013) ISSN: ( Print) 3 kondisi yang diperlukan untuk menurunkan aturan pembaharuan untuk u dan v. Fungsi Langrangian dituliskan dalam Persamaan (6) dan Persamaan (7). Dimana dan adalah pengali Lagrange sesuai pada Persamaan () dan Persamaan (3). Untuk memaksimalkan fungsi Lagrangian L 1, dapat menurunkan secara parsial L 1 untuk u ci. Dengan menghitung untuk u ci dan untuk v cj seperti terlihat pada Persamaan (8) dan Persamaan (9). III. PERANCANGAN DAN IMPLEMENTASI Sistem akan teragi menjadi tiga. Pertama bagian penyesuaian Persamaan () dan Persamaan (3). Pada bagian ini, matriks U akan disesuaikan dengan Persamaan () dan (3) hanya saat inisialisasi. Pseudocode penyesuaian ini dapat dilihat pada Gambar 3 dan Gambar 4. Penyesuaian ini terbagi menjadi dua bagian. Tahap 1 merupakan bagian dimana setiap kolom pada matriks akan dikirimkan pada proses tahap. Pada proses tahap, setiap nilai pada kolom akan dibagi dengan jumlah nilai kolom tersebut. Bagian Kedua merupakan inisiasi matriks U. Pada bagian ini, akan dinisiasi juga batasan CNL dan ML. Batasan ini merupakan dokumen berpasangan. CNL menandakan dua dokumen menjadi satu kelompok. ML menandakan dua dokumen berbeda kelompok. Jika a dan b terpilih menjadi batasan CNL atau ML, maka nilai u ca dan u cb akan ditambah 1. Pseudocode inisiasi matriks U dapat dilihat pada Gambar 5. Dalam inisiasi U akan dilakukan penyesuaian Persamaan dan Persamaan 3. Pada inisiasi matriks U dilakukan dua kali penyesuaian. Nilai pada matriks U disesuaikan dua kali dengan tujuan mendapatkan nilai-nilai keanggotaan fuzzy yang menjadi batasan ML dan CNL menjadi 0.5 u ja,u kb 1.0. Sedangkan nilai dari u jb dan u ka bernilai antara 0 u ka,u jb<0.5. Satu dokumen dapat terpilih menjadi batasan CNL dan ML secara bersamaan. (7) (6) (8) (9) Adjust constraint phase 1 Input: N, M, C Output : M 1. For i from 0 to N :. Temporary=Phase ( M column i th) 3. For j from 0 to C: 4. M rows j th column i th = Temporary j th 5. Return M Gambar 3. Pseudocode Penyesuaian Persamaan () dan Persamaan (3) tahap 1 Adjust constraint phase Input: Temporary Output : Temporary 1. K=sum of Temporary value. For i from 0 to length(temporary) : 3. Temporary i th = Temporary i th / K 4. Return Temporary Gambar 4. Pseudocode Penyesuaian Persamaan () dan Persamaan (3) Tahap Initialization matrix U Input: U, number of CNL (NumC), C, Number of ML (NumM), temp matrix length(u) length(u) with 0 Output: CNL, NL, U 1. Adjust constraint (length(u),n,c). Initiate U with random float number 3. U,CNL,temp=Generate constraint (U,temp,NumC,C) 4. U,ML,temp=Generate constraint (U,temp,NumM,M) 5. Adjust constraint (length(u),n,c) 6. Return CNL,NL,U Gambar 5. Pseudocode Inisiasi Nilai Matriks U. Gambar 6. Fungsi Inisiasi Batasan CNL dan ML Pada Inisiasi Matriks Generate Constraint Input: U, number of constraint (Num), temp, Code Output: Constraint, U 1. Set n=0. While n not equal to Num 3. A=Random from 0 to length(u) 4. B= Random from 0 to length(u) 5. If A not equal to B 6. then 7. If temp AB not equal to 1 and Code is M 8. then 9. temp AB = temp BA = u AB = u AB u BA = u BA add (A,B) to Constraint 14. End if 15. End if 16. Return Constraint,U,temp Tetapi hanya boleh menjadi batasan CNL satu kali dan ML satu kali. Penentuan pasangan dokumen dalam CNL dan ML dilakukan secara acak. Setiap dokumen yang sudah berpasangan akan di tandai. Nilai awal U diinisiasi dengan nilai acak antara 0 dan 1. Pseudocode inisiasi CNL dan ML dapat dilihat pada Gambar 6. Bagian ketiga adalah bagian utama metode ini. Pada bagian ketiga akan dilakukan pembaharuan nilai V dan U. Pembaharuan ini akan dilakukan berulang-ulang sampai memenuhi batasan atau. Jumlah iterasi dibatasi dengan ketiga dapat dilihat pada Gambar 7.. Pseudocode bagian

4 JURNAL TEKNIK POMITS Vol., No. 1, (013) ISSN: ( Print) 4 The SS-HFCR algorithm. Input:set D, number of clusters C, Constraint sets: ML&CNL Output:Document membership matrix:u, Word membership matrix: V. 1. Set weighting factor T u,t v,t d, stopping threshold Ɛ, t maxmaximum iteration number. Manually adjust the initial u ci for the documents existed in ML&CNL set to obey all the constraints, then randomly assign the initial u ci for the other documents. 3. REPEAT 4. Update v cj with Eq. (9); 5. Update u ci with Eq. (8) 6. t=t+1 7. UNTIL Gambar 7. Pseudocode SS-HFCR[] Table. set toy Problem Atribut ,7 0,5 0,5 0 0, ,7 0,5 0,5 0 0, ,1 0,3 0,5 0,8 0,5 0,3 0 0, 0,3 0,5 0,7 0,5 0,3 0 0,3 0,3 0,5 0,7 0,6 0,4 0,7 3 0,6 0,4 0,4 0,5 0,6 0,4 0,7 3 Table 3. set Iris Jumlah Iris-Setosa 50 Iris-Versicolor 50 Iris-Virginica 50 Jumlah 150 Tabel 4. set WebKB Jumlah project 493 course 911 faculty 1105 student 1570 Jumlah 4079 Tabel 5. set Reuter R8 Jumlah earn 675 Mobey-fx 348 trade 640 interest 530 crude 740 ship 85 grain 10 acq 4109 Jumlah 1309 IV. UJICOBA DAN EVALUASI Dalam bab ini akan dijelaskan ujicoba metode SS-HFCR dengan empat dataset yaitu toy problem, Iris, WebKB dan Reuters-1578 R8. Perincian data toy ptoblem dapat dilihat pada Tabel. Perincian data Iris dapat dilihat pada Tabel 3. Perinician data WebKB dapat dilihat dalam Tabel 4. Sedangkan perincian data Reuter R8 dapat dilihat pada Tabel 5. Untuk evaluasi ujicoba digunakan fungsi akurasi. Fungsi akurasi tersebut dapat dilihat pada Persamaan 10. Accuracy = (10) Tabel 6. Hasil Ujicoba Pertama set Toy Problem ,04E- 7,36E- 1,91E ,43E-14 9,98 9,98E- 0, E ,94E ,05 4,05E- 5,99E- 3,35E- 0,99916 E Tabel 7. Hasil Ujicoba Kedua set Toy Problem ,04 7,36E,43E- E- 1,91E ,98E- 55 4,05E- 70 9,93E- 55 4,03E , ,99 E- 7 3,35E -4 9,94E- 11 0, Table 8. Hasil Ujicoba Ketiga set Toy Problem ,04E- 7,36E- 1,91E-,43E ,98E- 9,93E- 0,0008 9,94E ,05E- 4,03E- 5,99E- 3,35E- 0, Table 9. Hasil Ujicoba set Iris Percobaan ML (%) CNL (%) Akurasi , , , ,9 A. Ujicoba Toy Problem Setiap ujicoba data toy problem dilakukan tiga kali. Pertama menggunakan CNL dan ML dengan jumlah 0%. Ujicoba kedua menggunakan satu pasang ML dan tanpa CNL. Ujicoba ketiga menggunakan satu pasang CNL dan tanpa ML. Ujicoba pertama variabel Tu di berikan nilai 0,00, Tv diberikan nilai 1 dan Td diberikan nilai serta dengan nilai ε diberikan nilai 0, Ujicoba kedua data toy problem. Variabel Tu di berikan nilai 0,001, Tv diberikan nilai 0,005 dan Td diberikan nilai 1 serta dengan nilai ε diberikan nilai 0, Ujicoba ketiga dan kelima dilakukan dengan menggunakan variable Tu, Td, dan Tv serta ε yang sama dengan percobaan pertama. Ujicoba keempat dan keenam dilakukan dengan menggunakan variable Tu, Td, dan Tv serta ε yang sama dengan percobaan kedua. Pada ujicoba ketiga dan keempat menggunakan nilai CNL / ML dan matriks U yang diacak dalam setiap ujicobanya.. Ujicoba kelima dan keenam menggunakan nilai CNL / ML dan Matriks U acak setiap percobaan. Dari enam percobaan data toy problem, SS-HFCR dapat mengelompokan data ini dengan sempurna. Semua percobaan dengan menggunakan data ini menghasilkan akurasi sempurna 100%. Contoh hasil ujicoba pertama pengelompokan data ini dapat dilihat pada Tabel 6, Tabel 7. dan Tabel 8. B. Ujicoba Iris Ujicoba data Iris dilakukan menggunakan CNL dan ML dengan jumlah 0. Nilai CNL dan ML bertambah dengan nilai

5 JURNAL TEKNIK POMITS Vol., No. 1, (013) ISSN: ( Print) 5 5% pada setiap percobaan. Nilai CNL dan ML maksimal di percobaan data iris adalah berjumlah 15%, untuk ML 10% dan CNL 5%. Variabel Tu di berikan nilai 0,00, Tv diberikan nilai 0,005 dan Td diberikan nilai 1 serta dengan nilai ε diberikan nilai 0, Hasil ujicoba terhadap data ini dapat dilihat dalam Tabel 9. Hasil Terbaik dari percobaan data iris ini mendapatkan hasil yang baik. Akurasi tertinggi dari percobaan data ini adalah 9% dengan jumlah batasan CNL dan ML sebanyak 10%. Tidak seperti data toy problem hasil dari percobaan iris sulit menemukan konvergensi. Sehingga batasan nilai ε memaksa iterasi untuk berhenti. Nilai OF dalam iterasi data iris juga mengalami penurunan. Penurunan terjadi saat ujicoba kedua pada iterasi ke dua dan ketiga. Nilai keanggotaan dalam percobaan iris yang sulit menemui kondisi konvergen. C. Uji Coba WebKB Ujicoba data WebKB dilakukan dengan jumlah CNL dan ML yang selalu meningkat dari satu percobaan ke percobaan selanjutnya. Percobaan akan dimulai dengan CNL dan ML berjumlah 0. Selanjutnya pada setiap percobaan, CNL dan ML akan bertambah jumlahnya dengan 0,3%. Ujicoba akan berhenti ketika jumlah ML dan CNL lebih dari 10%. Variabel Tu di berikan nilai 0,00, Tv diberikan nilai 0,005 dan Td diberikan nilai 1 serta dengan nilai ε diberikan nilai 0,001. Pada setiap percobaan data ini, iterasi berlangsung singkat. Hal ini dikarenakan nilai ε yang mempunyai nilai lebih besar. Percobaan menggunakan data ini, tidak menemui kondisi konvergen. Sehingga nilai akurasi dari iterasi ke iterasi selalu berubah-ubah. Nilai ε mencegah akurasi semakin turun lebih jauh. Hasil terbaik percobaan ini dapat dilihat pada Tabel 10. D. Uji Coba Reuters-1578 R8 Ujicoba data Reuters-1578 R8 dilakukan berungkali dengan jumlah CNL dan ML yang selalu meningkat dari satu percobaan ke percobaan selanjutnya. Percobaan akan dimulai dengan CNL dan ML berjumlah 0. Selanjutnya pada setiap percobaan, CNL dan ML akan bertambah jumlahnya dengan 0,3%. Ujicoba akan berhenti ketika jumlah ML dan CNL lebih dari 10%. Dalam percobaan ini variabel Tu di berikan nilai 0,00, Tv diberikan nilai 0,005 dan Td diberikan nilai 1 serta dengan nilai ε diberikan nilai 0,001. Hasil ujicoba data ini dapat dilihat dalam Tabel 11. Seperti ujicoba pada data WebKb, ujicoba menggunakan data ini tidak menemukan kondisi konvergen. Sehingga akurasi dari iterasi ke iterasi dalam setiap percobaan selalu berubah-ubah. Nilai mencegah perubahan akurasi supaya tidak turun. E. Pembahasan Hasil Ujicoba Pada setiap inisiasi nilai acak matriks U, tidak selalu menghasilkan akurasi baik pada suatu percobaan. Nilai akurasi yang baik akan bisa didapatkan jika nilai U sesuai dengan nilai Tu, Td, dan Tv atau sebaliknya. Nilai Tu, Td dan Tv, memberikan pengaruh terhadap akurasi ketika tidak menemukan nilai U yang tepat. Nilai Tu, Tv, dan Td juga menentukan jumlah iterasi. Karena nilai Tu, Td, dan Tv akan menentukan nilai pada setiap iterasinya. Nilai acak CNL dan ML yang berbeda dapat menghasilkan akurasi yang berbeda walaupun dengan nilai acak U yang sama. Tabel 10. Hasil Ujicoba set WebKb No ML (%) CNL (%) CNL+ML (%) Akurasi ,707 0,3 0 0,3 0, ,3 0,3 0,6 0,74 4 0,6 0,3 0,9 0,74 5 0,6 0,6 1, 0,79 6 0,9 0,6 1,5 0, ,9 0,9 1,8 0, , 0,9,1 0, , 1,,4 0, ,5 1,,7 0, ,5 1,5 3,0 0, ,8 1,5 3,3 0, ,8 1,8 3,6 0,76 14,1 1,8 3,9 0,769 15,1,1 4, 0,766 16,4,1 4,5 0,77 17,4,4 4,8 0,776 18,7,4 5,1 0,784 19,7,7 5,4 0, ,7 5,7 0, ,0 3,0 6,0 0,785 3,3 3,0 6,3 0, ,3 3,3 6,6 0, ,6 3,3 6,9 0,78 5 3,6 3,6 7, 0, ,9 3,6 7,5 0, ,9 3,9 7,8 0, , 3,9 8,1 0, , 4, 8,4 0, ,5 4, 8,7 0, ,5 4,5 9,0 0, ,8 4,5 9,3 0, ,8 4,8 9,6 0, ,1 4,8 9,9 0, ,1 5,1 10, 0,80 Pemilihan nilai CNL dan ML yang tepat dapat meningkatkan akurasi. Nilai Objectife Function (OF) diusahakan maksimal dalam setiap iterasi suatu percobaan. Namun dapat dimungkinkan walaupun nilai OF turun dalam iterasi, tetapi tetap mendapatkan nilai akurasi yang tinggi. Selain nilai U, nilai OF juga dipengaruhi nilai CNL dan ML. Nilai berfungsi untuk menghentikan iterasi jika kondisi terpenuhi. Semakin kecil nilai dapat menghasilkan nilai keanggotan dalam matriks U semakin optimal. Namun ketika tidak menemukan nilai Tu, Td, dan Tv serta U yang tepat. Maka nilai dapat menghasilkan akurasi yang baik.terlihat dalam percobaan data toy problem,nilai ε memberikan nilai optimal pada keanggotan dokumen terhadap kelas. Nilai akan menentukan hasil akurasi saat tidak menemukan konvergensi dan nilai keanggotaan selalu berubah-ubah. Nilai dari iterasi ke iterasi akan turun. Sehingga menentukan nilai yang tepat untuk berhentinya iterasi menjadi penting guna mendapatkan nilai akurasi yang baik. Rekap hasil ujicoba dapat dilihat Tabel 1. Dari hasil ujicoba didapatkan bahwa data iris menghasilkan akurasi terbaik dengan menggunakan jumlah batasan 10%, dengan masing-masing CNL 5% dan ML 5%. WebKb menghasilkan akurasi terbaik selama percobaan dengan menggunakan jumlah batasan 10,% dengan masing-masing CNL 5,1% dan ML 5,1%. Reuters-1578 R8 menghasilkan akurasi terbaik dengan jumlah batasan sebanyak 10,% dengan masing-masing CNL 5,1% dan ML 5,1%.

6 JURNAL TEKNIK POMITS Vol., No. 1, (013) ISSN: ( Print) 6 Tabel 11. Hasil Ujicoba set Reuter-1578 R8 No ML(%) CNL (%) CNL+ML(%) Akurasi ,445 0,3 0 0,3 0, ,3 0,3 0,6 0, ,6 0,3 0,9 0, ,6 0,6 1, 0,50 6 0,9 0,6 1,5 0, ,9 0,9 1,8 0, , 0,9,1 0, , 1,,4 0, ,5 1,,7 0, ,5 1,5 3 0, ,8 1,5 3,3 0,5 13 1,8 1,8 3,6 0,53 14,1 1,8 3,9 0,537 15,1,1 4, 0,537 16,4,1 4,5 0,550 17,4,4 4,8 0,546 18,7,4 5,1 0,564 19,7,7 5,4 0, ,7 5,7 0, ,67 3,3 3 6,3 0, ,3 3,3 6,6 0,79 4 3,6 3,3 6,9 0, ,6 3,6 7, 0, ,9 3,6 7,5 0, ,9 3,9 7,8 0, , 3,9 8,1 0, , 4, 8,4 0, ,5 4, 8,7 0, ,5 4,5 9 0,78 3 4,8 4,5 9,3 0, ,8 4,8 9,6 0, ,1 4,8 9,9 0, ,1 5,1 10, 0,789 Republik Indonesia yang telah memberikan dukungan finansial melalui Beasiswa Bidik Misi tahun DAFTAR PUSTAKA [1] Wikipedia, April [Online]. Available: [] Y. Yan, L. Cheb and W.-C. Tjhi, "Fuzzy semi-supervised co-clustering for text documents," Fuzzy Sets And System, p. 74, 013. [3] C. D. Manning, P. Raghavan and H. Schütze, An Introduction to Information Retrieval, Cambridge: Cambridge University Press, 009. [4] G. Salton, A. Wong and C. S. Yang, "A vector space model for automatic indexing.," Communications of the ACM, vol. 18, pp , November [5] I. S. Dhillon, S. Mallela and D. S. Modha, "Information Theoretic Coclustering," Proceedings of the 9th ACM SIGKDD International Conference, p , 003. [6] K. P. Murphy, Machine Learning: a Probabilistic Perspective, Cambridge,Massachusetts: The MIT Press, 013. [7] A. Hotho, S. Staab and G. Stumme, "Text Clustering Based on Background Knowledge," -. Tabel 1. Hasil Rekapitulasi Ujicoba ML CNL CNL + ML (%) (%) (%) Akurasi Iris ,9 WebKb 5,1 5,1 10, 0,80 Reuters-1578 R8 5,1 5,1 10, 0,789 V. KESIMPULAN/RINGKASAN Kesimpulan yang diperoleh berdasarkan pengujian dan evaluasi yang telah dilakukan adalah sebagai berikut: 1. Nilai Tu, Tv, dan Td serta inisiasi matriks U mempunyai pengaruh terhadap akurasi.. Nilai ε berpengaruh terhadap akurasi jika konvergensi tidak terjadi. 3. Pemilihan batasan CNL dan ML berpengaruh meningkatkan akurasi Adapun saran yang dapat diberikan oleh penulis sebagai berikut: 1. Untuk nilai Tu, Tv, Td, CNL dan ML perlu dilakukan optimasi, serta inisiasi nilai U. Sehingga nilai-nilai tersebut dapat menghasilkan akurasi yang baik.. Jika nilai nilai-nilai pada poin 1 tidak ditemukan, maka nilai ε perlu ditentukan dengan tepat. UCAPAN TERIMA KASIH Penulis mengucapkan terima kasih kepada Direktorat Pendidikan Tinggi, Departemen Pendidikan dan Kebudayaan

Pengelompokan Dokumen Menggunakan Dokumen Berlabel dan Tidak Berlabel Dengan Pendekatan Modified Heuristic Fuzzy Co-Clustering

Pengelompokan Dokumen Menggunakan Dokumen Berlabel dan Tidak Berlabel Dengan Pendekatan Modified Heuristic Fuzzy Co-Clustering Hayati, Pengelompokan Dokumen pada Dokumen Berlabel dan Tidak Berlabel dengan Menggunakan Algoritma Heuristic Fuzzy... 103 Pengelompokan Dokumen Menggunakan Dokumen Berlabel dan Tidak Berlabel Dengan Pendekatan

Lebih terperinci

Pembobotan Berdasarkan Tingkat Kesamaan Semantik pada Metode Fuzzy Semi-Supervised Co-Clustering untuk Pengelompokkan Dokumen Teks

Pembobotan Berdasarkan Tingkat Kesamaan Semantik pada Metode Fuzzy Semi-Supervised Co-Clustering untuk Pengelompokkan Dokumen Teks Pembobotan Berdasarkan Tingkat Kesamaan Semantik pada Metode Fuzzy Semi-Supervised Co-Clustering untuk Pengelompokkan Dokumen Teks Galang Amanda Dwi P., Gregorius Edwadr, Agus Zainal Arifin Jurusan Teknik

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi

Lebih terperinci

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember

Lebih terperinci

IMPLEMENTASI PENGENALAN POLA UNTUK MENGEVALUASI HASIL PEMBELAJARAN DENGAN METODE FUZZY C-MEANS

IMPLEMENTASI PENGENALAN POLA UNTUK MENGEVALUASI HASIL PEMBELAJARAN DENGAN METODE FUZZY C-MEANS SYSTEMIC Vol. 02, No. 02, Desember 2016, 23-28 IMPLEMENTASI PENGENALAN POLA UNTUK MENGEVALUASI HASIL PEMBELAJARAN DENGAN METODE FUZZY C-MEANS Ilham Program Studi Sistem Informasi, Jurusan Teknologi, Fakultas

Lebih terperinci

KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI

KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI TUGAS AKHIR CI1599 KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI AHMAD DENI DWI PRANOTO NRP 5103 100 015 Dosen Pembimbing I Rully Soelaiman,

Lebih terperinci

Optimasi Permasalahan Penugasan Dokter Menggunakan Representasi Graf Bipartit Berbobot

Optimasi Permasalahan Penugasan Dokter Menggunakan Representasi Graf Bipartit Berbobot JURNAL TEKNIK POMITS Vol., No., (0) ISSN: 7-9 (0-97 Print) Optimasi Permasalahan Penugasan Menggunakan Representasi Graf Bipartit Berbobot Laili Rochmah, Ahmad Saikhu, dan Rully Soelaiman Jurusan Teknik

Lebih terperinci

DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara P. ( )

DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara P. ( ) Sidang Tugas Akhir September 2009 Implementasi Metode Ant Colony Optimization untuk Pemilihan Fitur pada Kategorisasi Dokumen Teks DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara

Lebih terperinci

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to

Lebih terperinci

PENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION

PENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2016, pp. 590~595 PENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION 590 Indra Gunawan

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

Desain dan Analisis Algoritma Modifikasi Hungarian untuk Permasalahan Penugasan Dinamis Pada Studi Kasus Permasalahan SPOJ Klasik 12749

Desain dan Analisis Algoritma Modifikasi Hungarian untuk Permasalahan Penugasan Dinamis Pada Studi Kasus Permasalahan SPOJ Klasik 12749 JURNAL TEKNIK POMITS Vol. 2, No. 1, (2014) ISSN: 2337-3539 (2301-9271 Print) 1 Desain dan Analisis Algoritma Modifikasi Hungarian untuk Permasalahan Penugasan Dinamis Pada Studi Kasus Permasalahan SPOJ

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 ANALISA PERBANDINGAN METODE HIERARCHICAL CLUSTERING, K-MEANS DAN GABUNGAN KEDUANYA DALAM MEMBENTUK CLUSTER DATA (STUDI KASUS : PROBLEM KERJA PRAKTEK JURUSAN

Lebih terperinci

Pembuatan Kakas Komunikasi Antar Pengembang Perangkat Lunak

Pembuatan Kakas Komunikasi Antar Pengembang Perangkat Lunak JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) 1 Pembuatan Kakas Komunikasi Antar Perangkat Lunak Anugerah Firdaus, Daniel Oranova Siahaan dan Rizky Januar Akbar Jurusan Teknik

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

ANALISIS KINERJA ALGORITMA CLUSTERING FUZZY TSUKAMOTO DENGAN FUZZY C-MEANS

ANALISIS KINERJA ALGORITMA CLUSTERING FUZZY TSUKAMOTO DENGAN FUZZY C-MEANS ANALISIS KINERJA ALGORITMA CLUSTERING FUZZY TSUKAMOTO DENGAN FUZZY C-MEANS Iin Parlina1, Prof.Herman Mawengkang2, Dr.Syahril Efendi, S.Si, M.IT3 Magister Teknik Informatika, Universitas Sumatera Utara

Lebih terperinci

Break Even Point Estimation Using Fuzzy Cluster(FCM)

Break Even Point Estimation Using Fuzzy Cluster(FCM) Break Even Point Estimation Using Fuzzy Cluster(FCM) Stefant Cristian, Kartina Diah Kusuma W, S.T., Dadang Syarif SS, S.Si, M.Sc. Politeknik Caltex Riau Jl. Umban Sari No. 1, Phone: 0761-53939, Fax: 0761-554224

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN 61 BAB III ANALISIS DAN PERANCANGAN 3.1 Analisis 3.1.1 Analisis Permasalahan Proses Segmentasi citra dapat dilakukan dengan berbagai cara, antara lain dengan metode konvensional secara statistik maupun

Lebih terperinci

BAB 3 ANALISA SISTEM

BAB 3 ANALISA SISTEM BAB 3 ANALISA SISTEM Pada perancangan suatu sistem diperlakukan analisa yang tepat, sehingga proses pembuatan sistem dapat berjalan dengan lancar dan sesuai seperti yang diinginkan. Setelah dilakukan analisis

Lebih terperinci

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS Yudis Anggara Putra Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

OPTIMASI PENJADWALAN CERDAS MENGGUNAKAN ALGORITMA MEMETIKA

OPTIMASI PENJADWALAN CERDAS MENGGUNAKAN ALGORITMA MEMETIKA OPTIMASI PENJADWALAN CERDAS MENGGUNAKAN ALGORITMA MEMETIKA Muhammad Arief Nugroho 1, Galih Hermawan, S.Kom., M.T. 2 1, 2 Universitas Komputer Indonesia Jl. Dipatiukur No. 112-116, Bandung 40132 E-mail

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521 JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: 2301-9271 A-521 Analisa Perbandingan Metode Hierarchical Clustering, K-means dan Gabungan Keduanya dalam Cluster Data (Studi kasus : Problem Kerja Praktek Jurusan

Lebih terperinci

(M.6) FUZZY C-MEANS CLUSTERING DENGAN ANALISIS ROBUST

(M.6) FUZZY C-MEANS CLUSTERING DENGAN ANALISIS ROBUST (M.6) FUZZY C-MEANS CLUSTERING DENGAN ANALISIS ROBUST 1Nor Indah FitriyaNingrum, 2 Suwanda, 3 Anna Chadidjah 1Mahasiswa JurusanStatistika FMIPA UniversitasPadjadjaran 2Jurusan Statistika FMIPA Universitas

Lebih terperinci

KLASIFIKASI SISWA KELAS UNGGULAN MENGGUNAKAN FUZZY C-MEANS

KLASIFIKASI SISWA KELAS UNGGULAN MENGGUNAKAN FUZZY C-MEANS KLASIFIKASI SISWA KELAS UNGGULAN MENGGUNAKAN FUZZY C-MEANS Nunik Mariastuti Wijilestari, Moch. Hariadi Jurusan Teknik Elektro Fakultas Teknologi Industri Institut Teknologi Sepuluh Nopember Surabaya 60

Lebih terperinci

BAB IV ANALISIS DAN PERANCANGAN

BAB IV ANALISIS DAN PERANCANGAN BAB IV ANALISIS DAN PERANCANGAN 4.1. Analisa 4.1.1 Analisis Data Pada tahap analisa data ini akan dibahas mengenai citra CT Scan yang akan dilakukan proses segmentasi atau pengelompokan data. Data citra

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

Break Even Point Estimation Using Fuzzy Cluster(FCM)

Break Even Point Estimation Using Fuzzy Cluster(FCM) SNTIKI III 2011 ISSN : 2085-9902 1 Break Even Point Estimation Using Fuzzy Cluster(FCM) Stefant Cristian, Kartina Diah Kusuma W, S.T., Dadang Syarif SS, S.Si, M.Sc. Politeknik Caltex Riau Jl. Umban Sari

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA Desmin Tuwohingide 1, Mika Parwita 2, Agus Zainal Arifin 3, Diana Purwitasari 4 1,2,3,4 Teknik

Lebih terperinci

Implementasi Metode Improved K-Means Untuk Mengelompokkan Dokumen Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer

Implementasi Metode Improved K-Means Untuk Mengelompokkan Dokumen Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No., Oktober 28, hlm. 3939-3947 http://j-ptiik.ub.ac.id Implementasi Metode Improved K-Means Untuk Mengelompokkan Dokumen

Lebih terperinci

Identifikasi Spasial Calon Walikota Manado Tahun 2015 Menggunakan Algoritma Fuzzy C-Means

Identifikasi Spasial Calon Walikota Manado Tahun 2015 Menggunakan Algoritma Fuzzy C-Means Identifikasi Spasial Calon Walikota Manado Tahun 2015 Menggunakan Algoritma Fuzzy C-Means Winsy Weku 1, Charitas Fibriani 2 1 Program Studi Matematika, FMIPA, UNSRAT Manado, winsy_weku@unsrat.ac.id 2 Program

Lebih terperinci

JURNAL SAINS DAN SENI ITS Vol. 4, No.2, (2015) ( X Print) A-31

JURNAL SAINS DAN SENI ITS Vol. 4, No.2, (2015) ( X Print) A-31 JURNAL SAINS DAN SENI ITS Vol 4, No2, (2015) 2337-3520 (2301-928X Print) A-31 Perbandingan Performansi Metode Peramalan Fuzzy Time Series yang Dimodifikasi dan Jaringan Syaraf Tiruan Backpropagation (Studi

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami METODE CLUSTERING DENGAN ALGORITMA K-MEANS Oleh : Nengah Widya Utami 1629101002 PROGRAM STUDI S2 ILMU KOMPUTER PROGRAM PASCASARJANA UNIVERSITAS PENDIDIKAN GANESHA SINGARAJA 2017 1. Definisi Clustering

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola)

KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) PRESENTASI TUGAS AKHIR KI091391 KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) Penyusun Tugas Akhir : Kartika Wijayati

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Clustering adalah proses di dalam mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Clustering

Lebih terperinci

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa Aidina Ristyawan 1), Kusrini 2), Andi Sunyoto

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

Penjadwalan Mata Kuliah Menggunakan Algoritma Genetika di Jurusan Sistem Informasi ITS

Penjadwalan Mata Kuliah Menggunakan Algoritma Genetika di Jurusan Sistem Informasi ITS JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) A-127 Mata Kuliah Menggunakan Algoritma Genetika di Jurusan Sistem Informasi ITS Wiga Ayu Puspaningrum, Arif Djunaidy, dan Retno

Lebih terperinci

K-Means Clustering. Tim Asprak Metkuan. What is Clustering?

K-Means Clustering. Tim Asprak Metkuan. What is Clustering? K-Means Clustering Tim Asprak Metkuan What is Clustering? Also called unsupervised learning, sometimes called classification by statisticians and sorting by psychologists and segmentation by people in

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Fuzzy Local Binary Pattern (FLBP) Fuzzifikasi pada pendekatan LBP meliputi transformasi variabel input menjadi variabel fuzzy, berdasarkan pada sekumpulan fuzzy rule. Dalam

Lebih terperinci

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov JURNAL SAINS DAN SENI POMITS Vol. 6, No.2, (2017) 2337-3520 (2301-928X Print) A 39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi Daryono Budi Utomo Jurusan

Lebih terperinci

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode

BAB III K-MEANS CLUSTERING. Analisis klaster merupakan salah satu teknik multivariat metode BAB III K-MEANS CLUSTERING 3.1 Analisis Klaster Analisis klaster merupakan salah satu teknik multivariat metode interdependensi (saling ketergantungan). Oleh karena itu, dalam analisis klaster tidak ada

Lebih terperinci

PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak

PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM. Achmad Maududie 1 Wahyu Catur Wibowo 2. Abstrak PERBAIKAN INISIALISASI K-MEANS MENGGUNAKAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1 Wahyu Catur Wibowo 2 1 Program Studi Sistem Informasi, Universitas Jember 2 Fakultas Ilmu Komputer, Universitas Indonesia,

Lebih terperinci

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-664

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-664 JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-664 Rancang Bangun Pixel Art Converter Menggunakan Segmentasi berbasis K-means Clustering Yuna Sugianela, Nanik Suciati, dan

Lebih terperinci

CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN

CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN Fitri Wulandari, Rinto Setiawan Jurusan Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif

Lebih terperinci

PENERAPAN METODE CLUSTERING UNTUK MEMETAKAN POTENSI TANAMAN KEDELAI DI JAWA TENGAH DENGAN ALGORITMA FUZZY C- MEANS

PENERAPAN METODE CLUSTERING UNTUK MEMETAKAN POTENSI TANAMAN KEDELAI DI JAWA TENGAH DENGAN ALGORITMA FUZZY C- MEANS 1 PENERAPAN METODE CLUSTERING UNTUK MEMETAKAN POTENSI TANAMAN KEDELAI DI JAWA TENGAH DENGAN ALGORITMA FUZZY C- MEANS Indra Setiawan 1 1 Teknik Informatika Universitas Dian Nuswantoro Semarang E-mail :

Lebih terperinci

PERBANDINGAN KINERJA METODE K-HARMONIC MEANS DAN PARTICLE SWARM OPTIMIZATION UNTUK KLASTERISASI DATA

PERBANDINGAN KINERJA METODE K-HARMONIC MEANS DAN PARTICLE SWARM OPTIMIZATION UNTUK KLASTERISASI DATA PERBANDINGAN KINERJA METODE K-HARMONIC MEANS DAN PARTICLE SWARM OPTIMIZATION UNTUK KLASTERISASI DATA Ahmad Saikhu, Yoke Okta 2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi

Lebih terperinci

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem

Lebih terperinci

ARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL

ARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL ARTIKEL PENERAPAN METODE K-MEANS DALAM PROSES CLUSTERING PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL Oleh: IRFAN DWI NURCAHYO BUDIARTO 13.1.03.02.0117 Dibimbing oleh : 1. Hermin Istiasih, ST.,M.M.,M.T.

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430 JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-430 VISUALISASI SIMILARITAS TOPIK PENELITIAN DENGAN PENDEKATAN KARTOGRAFI MENGGUNAKAN SELF- ORGANIZING MAPS (SOM) Budi Pangestu,

Lebih terperinci

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

PERBANDINGAN SEGMENTASI CITRA BERWARNA DENGAN FUZZY CMEANS CLUSTERING PADA BEBERAPA REPRESENTASI RUANG WARNA

PERBANDINGAN SEGMENTASI CITRA BERWARNA DENGAN FUZZY CMEANS CLUSTERING PADA BEBERAPA REPRESENTASI RUANG WARNA PERBANDINGAN SEGMENTASI CITRA BERWARNA DENGAN FUZZY CMEANS CLUSTERING PADA BEBERAPA REPRESENTASI RUANG WARNA Naser Jawas Sistem Komputer STMIK STIKOM Bali Jl Raya Puputan No.86 Renon, Denpasar, Bali 80226

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA Nama : Nandang Syaefulloh NPM : 55412243 Fakultas : Teknologi Industri Jurusan : Teknik Informatika Pembimbing

Lebih terperinci

ANALISIS KLASTERING LIRIK LAGU INDONESIA

ANALISIS KLASTERING LIRIK LAGU INDONESIA ANALISIS KLASTERING LIRIK LAGU INDONESIA Afdilah Marjuki 1, Herny Februariyanti 2 1,2 Program Studi Sistem Informasi, Fakultas Teknologi Informasi, Universitas Stikubank e-mail: 1 bodongben@gmail.com,

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS SISTEM PENDUKUNG KEPUTUSAN PENENTUAN PEMBERIAN BANTUAN BIAYA PENDIDIKAN MENGGUNAKAN ALGORITMA K-MEANS Sinawati ), Ummi Syafiqoh 2) ), 2) Sistem Informasi STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos

Lebih terperinci

BAB 3 METODOLOGI Metode Penelitian. Dalam melakukan penelitian akan permasalahan ini, penulis menggunakan metode

BAB 3 METODOLOGI Metode Penelitian. Dalam melakukan penelitian akan permasalahan ini, penulis menggunakan metode BAB 3 METODOLOGI 3.1. Metode Penelitian Dalam melakukan penelitian akan permasalahan ini, penulis menggunakan metode rapid application development (RAD), dengan alur pengerjaan sebagai berikut: Gambar

Lebih terperinci

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN IMPLEMENTATION OF COMPLETE AND AVERAGE LINKAGE TO THE FORMATION FACULTY RESEARCH GROUP Oleh: DEVY SURYANINGTYAS 12.1.03.02.0366

Lebih terperinci

Implementasi Algoritma K-Nearest Neighbour yang berdasarkan One Pass Clustering untuk Kategorisasi Teks

Implementasi Algoritma K-Nearest Neighbour yang berdasarkan One Pass Clustering untuk Kategorisasi Teks Implementasi Algoritma K-Nearest Neighbour yang berdasarkan One Pass Clustering untuk Kategorisasi Teks Penyusun: Andreas Daniel Arifin - 5108100132 Pembimbing: Isye Arieshanti, S.Kom, M.Phil Dr. Agus

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN UNTUK MAHASISWA BERPRESTASI DI STIKES MUHAMMADIYAH PRINGSEWU DENGAN METODE SAW

SISTEM PENDUKUNG KEPUTUSAN UNTUK MAHASISWA BERPRESTASI DI STIKES MUHAMMADIYAH PRINGSEWU DENGAN METODE SAW SISTEM PENDUKUNG KEPUTUSAN UNTUK MAHASISWA BERPRESTASI DI STIKES MUHAMMADIYAH PRINGSEWU DENGAN METODE SAW Fitria Ningsih Jurusan Manajemen Informatika STMIK Pringsewu Lampung Jl. Wismarini no.09 Pringsewu

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

BAB III LANDASAN TEORI. Definisi Peramalan adalah memperkiraan atau memproyeksikan sesuatu

BAB III LANDASAN TEORI. Definisi Peramalan adalah memperkiraan atau memproyeksikan sesuatu BAB III LANDASAN TEORI 3.1 Definisi Peramalan Definisi Peramalan adalah memperkiraan atau memproyeksikan sesuatu yang akan terjadi dimasa sekarang maupun yang akan datang. dikarena masa yang akan datang

Lebih terperinci

PENENTUAN SISWA BERPRESTASI PADA SMK WIDYA YAHYA GADINGREJO DENGAN METODE SAW

PENENTUAN SISWA BERPRESTASI PADA SMK WIDYA YAHYA GADINGREJO DENGAN METODE SAW PENENTUAN SISWA BERPRESTASI PADA SMK WIDYA YAHYA GADINGREJO DENGAN METODE SAW RATIH ERNAWATI Jurusan Sistem Informasi, Sekolah Tinggi Manajemen dan Informatika STMIK Pringsewu Lampung Jl. Wismarini no.09

Lebih terperinci

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian Penerapan Data Mining dengan Menggunakan Metode Clustering K-Mean Untuk Mengukur Tingkat Ketepatan Kelulusan Mahasiswa Program Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang

Lebih terperinci

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN : Clustering Data Status Tugas Belajar Dan Ijin Belajar Menggunakan Metode Fuzzy C-Means (Studi Kasus : Di Lingkungan Pemerintah Provinsi Kalimantan Timur) Fevin Triyas Rantika 1, Indah Fitri Astuti, M.Cs

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

BAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI

BAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI BAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI 2.1 Penelitian Terkait Ada beberapa penelitian terkait dengan penggunaan Data Mining metode cluster dengan menggunakan Algoritma Fuzzy C-Means untuk dapat mengelompokkan

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

PEMBELAJARAN BERTINGKAT PADA ARSITEKTUR JARINGAN SARAF FUNGSI RADIAL BASIS

PEMBELAJARAN BERTINGKAT PADA ARSITEKTUR JARINGAN SARAF FUNGSI RADIAL BASIS PEMBELAJARAN BERTINGKAT PADA ARSITEKTUR JARINGAN SARAF FUNGSI RADIAL BASIS Diana Purwitasari 1, Glory Intani Pusposari 2, Rully Sulaiman 3 Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari BAB I PENDAHULUAN 1.1 Latar Belakang Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari internet ataupun milik pribadi juga semakin berkembang. Permasalahan utama adalah bagaimana memperoleh

Lebih terperinci

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN

K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN 1 K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN Rani Nooraeni*, Dr. Jadi Supriadi, DEA, Zulhanif, S.Si,M.Sc Jurusan statistika terapan, Fakultas MIPA UNPAD rnooraeni@gmail.com* Abstrak.Membagi suatu data

Lebih terperinci

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Pada bab ini dijelaskan landasan teori dan metode yang digunakan pada tugas akhir ini dalam pengklasifikasian dokumen teks. Pembahasan dimulai dengan penjelasan mengenai klasifikasi

Lebih terperinci

Partitional clustering KLASTERING DENGAN METODE K-MEANS

Partitional clustering KLASTERING DENGAN METODE K-MEANS Partitional clustering KLASTERING DENGAN METODE K-MEANS PENDAHULUAN K-mean merupakan teknik klastering yang paling umum dan sederhana. Tujuan klastering ini adalah mengelompokkan obyek ke dalam k klaster/kelompok.

Lebih terperinci

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL Nadia Damayanti 1, Nur Rosyid Mubtada i, S.Kom, M.Kom 2, Afrida Helen S.T, M.Kom

Lebih terperinci

Fuzzy C-means Clustering menggunakan Cluster Center Displacement

Fuzzy C-means Clustering menggunakan Cluster Center Displacement Fuzzy C-means Clustering menggunakan Cluster Center Displacement Fitri Hidayah Sundawati 1), Jadi Suprijadi 2), Titi Purwandari 3) 1) Mahasiswa Statistika Terapan, UniversitasPadjadjaran-Indonesia 2) Pengajar

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

The 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang

The 6 th University Research Colloquium 2017 Universitas Muhammadiyah Magelang Penerapan Seleksi Atribut Berdasarkan Koefisien Variansi dan Korelasi untuk Inisialisasi Pusat Awal Klaster pada Algoritma K- Means dalam Pemetaan E-Government Tahun 2016 Ivon Dewi Apriliyaningsih 1*,

Lebih terperinci

3. METODOLOGI. Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi

3. METODOLOGI. Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi 3. METODOLOGI A. Kerangka Pemikiran Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi dan Pembuatan Prototipe Sistem (Gambar 3.1). Tahap Persiapan terdiri dari pengumpulan dokumen, input

Lebih terperinci

Segmentasi Citra Berwarna Menggunakan Deteksi Tepi dan Fuzzy C-Means yang Dimodifikasi Berdasarkan Informasi Ketetanggaan

Segmentasi Citra Berwarna Menggunakan Deteksi Tepi dan Fuzzy C-Means yang Dimodifikasi Berdasarkan Informasi Ketetanggaan Segmentasi Citra Berwarna Menggunakan Deteksi Tepi dan Fuzzy C-Means yang Dimodifikasi Berdasarkan Informasi Ketetanggaan Septi Wulansari (5109100175) Pembimbing I: Prof. Ir. Handayani Tjandrasa, M.Sc.,

Lebih terperinci

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE JURNA TEKNIK, (2014) 1-6 1 AIKASI DATA MINING UNTUK MEMREDIKSI ERFORMANSI MAHASISWA DENGAN METODE KASIFIKASI DECISION TREE Irfan Fahmi, Budi Santosa Jurusan Teknik Industri, Fakultas Teknologi Industri,

Lebih terperinci

DATA MINING DAN WAREHOUSE A N D R I

DATA MINING DAN WAREHOUSE A N D R I DATA MINING DAN WAREHOUSE A N D R I CLUSTERING Secara umum cluster didefinisikan sebagai sejumlah objek yang mirip yang dikelompokan secara bersama, Namun definisi dari cluster bisa beragam tergantung

Lebih terperinci

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Aufa Bil Ahdi P 1, Kemas Rahmat Saleh W, S.T., M.Eng 2, Anisa Herdiani, S.T., M.T 3 1.2.3 Teknik Informatika,

Lebih terperinci

Penerapan Algoritma K-Means untuk Clustering

Penerapan Algoritma K-Means untuk Clustering Seminar Perkembangan dan Hasil Penelitian Ilmu Komputer (SPHP-ILKOM) 71 Penerapan Algoritma K-Means untuk ing Dokumen E-Jurnal STMIK GI MDP Ernie Kurniawan* 1, Maria Fransiska 2, Tinaliah 3, Rachmansyah

Lebih terperinci

BAB I PENDAHULUAN. informasi yang berbeda-beda. Berita yang dipublikasi di internet dari hari ke hari

BAB I PENDAHULUAN. informasi yang berbeda-beda. Berita yang dipublikasi di internet dari hari ke hari BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang semakin maju dan maraknya penggunaan internet saat ini, tidak sedikit lembaga media mendistribusikan informasi berita secara online. Tidak

Lebih terperinci