CLUSTERING DOKUMEN DENGAN SEMANTIC WORD HOLONIM DAN FUZZY ASSOCIATION RULE MINING

Ukuran: px
Mulai penontonan dengan halaman:

Download "CLUSTERING DOKUMEN DENGAN SEMANTIC WORD HOLONIM DAN FUZZY ASSOCIATION RULE MINING"

Transkripsi

1 CLUSTERING DOKUMEN DENGAN SEMANTIC WORD HOLONIM DAN FUZZY ASSOCIATION RULE MINING Fahrur Rozi 1), Rikie Kartadie 2) 1), 2) Pendidikan Teknologi Informasi STKIP PGRI Tulungagung Jl Mayor Sujadi Timur no.7. Tulungagung 1 1), rikie.kartadie@gmail.com 2) Abstrak Meningkatnya penggunaan dokumen teks berimbas pada semakin menumpuknya file dokumen teks sehingga memerlukan pengorganisasian terhadap file dokumen teks tersebut. Salah satu metode yang dapat mengelompokkan dokumen dengan tepat adalah menggunakan fuzzy association rule. Tahap mendapatkan keyword serta tipe fuzzy yang digunakan berpengaruh terhadap kualitas pengelompokan dokumen. Penggunaan holonim untuk mendapatkan keyword yang selanjutnya digunakan untuk membentuk suatu klaster label dapat memperluas makna dari klaster label, sehingga dapat diperoleh suatu meaningful klaster labe. Penelitian ini mengusulkan sebuah metode yaitu clustering dokumen menggunakan semantic word holonim dan fuzzy association rule mining. Metode ini terdiri dari empat tahap, yaitu : preprocessing dokumen, ekstraksi key terms dari holonim, ekstraksi kandidat klaster, dan konstruksi klaster tree. Pengujian terhadap metode ini dilakukan dengan tiga jenis data berbeda, yaitu Classic, Reuters, dan 20 Newsgroup. Pengujian dilakukan dengan membandingkan nilai overall f- measure dari metode tanpa semantic (non semantic), dan holonim. Kata kunci: association rule, clustering dokumen, fuzzy, holonim 1. Pendahuluan Salah satu bentuk metode pengelolaan teks yang cukup baik untuk mengefisienkan serta melakukan peringkasan teks adalah clustering dokumen [1]. Clustering dapat ditingkatkan kualitasnya dengan beberapa hal, diantaranya : mengatasi dimensi tinggi yang diakibatkan besarnya jumlah dokumen dan jumlah kata dalam dokumen, meningkatkan skalabilitas agar mampu bekerja dengan jumlah dokumen dalam skala kecil ataupun besar (scalable), meningkatkan akurasi, memberikan label cluster yang bermakna, mampu mengatasi overlapping, serta memperhitungkan kesamaan konseptual istilah dari kata [2]. Beberapa metode telah dikembangkan untuk mendapatkan clustering dokumen dengan kualitas yang baik. Salah satunya adalah dengan menggunakan logika fuzzy sebagai metode untuk mengelompokkan dokumen [3]. Penggunaan metode logika fuzzy ini mampu menghasilkan cluster yang overlapping. Selain penggunaan fuzzy metode lain yang sering digunakan dalam clustering maupun pengambilan keputusan adalah association rule mining [4]. Namun, berdasarkan penelitian Fung,dkk bahwa association rule saja tidak scalable [5]. Sehingga untuk menghasilkan metode yang scalable, Fung dkk mengembangkan metode Frequent Itemset Hierarchical Clustering (FIHC) yang merupakan algoritma hasil pengembangan frequent-itemset yang berasal dari association rule mining untuk membangun hierarchical tree untuk topik cluster. Terdapat beberapa metode hybrid yang menggabungkan 2 buah metode dimana salah satunya menggunakan fuzzy. Seperti pada penggabungan antar logika fuzzy dan jaringan syaraf tiruan atau biasa disebut Adaptive Neuro Fuzzy Inference System (ANFIS) [6]. Penggabungan antara fuzzy dan association rule mining yaitu Fuzzy Frequent Itemset-Based Hierarchical Clustering (F2IHC) mampu meningkatkan tingkat akurasi serta menghasilkan cluster yang overlapping dalam clustering dokumen [7]. Beberapa penelitian HFTC [8], FIHC [5], dan F 2 IHC dengan fuzzy set tipe-2 [9] masih menggunakan term yang berada dalam dokumen teks sebagai label cluster. Meskipun hal tersebut dibenarkan, namun pelabelan cluster yang lebih umum akan memudahkan melakukan analisis terutama dalam domain pengetahuan [10], [11]. Penelitian dengan menggunakan semantic dalam mendapatkan keyword dengan fuzzy association rule mining dapat memperluas makna dari suatu kata dalam dokumen [2],[12],[13]. Pada penelitian sebelumnya [13], penggunaan semantic hipernim dan sinonim untuk mendapatkan keyword dapat meningkatkan nilai akurasi, karena mampu mengelompokkan suatu dokumen dengan karakteristik yang sama. Selain semantic menggunakan hipernim dan sinonim, penggunaan holonim dalam pengelompokan dokumen mampu mengurangi dimensional yang tinggi [13] [15]. Dengan menggunakan holonim permasalahan mengenai dokumen yang terdiri dari beberapa term yang berbeda namun memiliki makna yang sama dapat terselesaikan [14]. Selain penggunaan semantic word hipernim dan sinonim penggunaan semantic word holonim untuk mendapatkan suatu cluster label juga dapat memperluas makna dari cluster label, sehingga dapat diperoleh suatu meaningful

2 cluster label. Oleh karena itu, penelitian ini bertujuan membangun metode clustering dokumen dengan semantic word holonim dan fuzzy association rule mining. 2. Pembahasan Rancangan sistem dalam penelitian ini terdiri atas empat bagian utama yaitu : (1) preprocessing dokumen, (2) ekstraksi key term dari sinonim, (3) ekstraksi candidate cluster, dan (4) konstruksi cluster tree. (1) Preprocessing Dokumen Terdapat beberapa tahap yang dilakukan dalam preprocessing dokumen, yaitu : ektraksi term, penghilangan stopwords, stemming, dan seleksi term. Pada tahap awal, hasil dari ekstraksi dokumen dikumpulkan dalam suatu koleksi single word T D = {t 1, t 2,, t n }. T D menyatakan koleksi term (t) dalam dokumen (D), n menyatakan jumlah term dalam T D. Hasil yang didapatkan dari ekstraksi term T D digunakan sebagai input untuk dilanjutkan dengan penghilangan stopwords dan proses stemming. Algoritma stemming yang digunakan dalam penelitian ini adalah Porter stemmer yang ditemukan oleh Martin Porter pada tahun Langkah terakhir yang dilakukan dalam preprocessing dokumen adalah seleksi term dengan menghitung bobot tfidf (1) setiap term dalam T D. ), (1) dimana tf.iff ij adalah bobot term t j dalam dokumen d i. Untuk mencegah bias dokumen yang panjang, bobot frekuensi term dinormalisasi dengan total frekuensi semua term dalam dokumen d i. Variabel D adalah jumlah seluruh dokumen dan {d i t j Єd i,d i ЄD } adalah jumlah dokumen yang memiliki term t j. (2) Mendapatkan Keyword dengan Holonim Holonim adalah bagian yang lebih besar yang disusun dari meronim, sementara meronim adalah bagian atau anggota penyusun sesuatu. Contoh, mata adalah holonim dari kornea. Sehingga jika suatu term dan holonimnya terdapat dalam satu dokumen yang sama, maka nilai frekuensinya akan dihitung sebagai satu kesatuan seperti yang dijabarkan dalam persamaan 3. Hf ij = hf ij + h ij, (3) dimana adalah frekuensi term dalam dokumen i, dan hf ij adalah frekuensi holonim dari term tj dalam dokumen d i. (3) Ekstraksi Kandidat Cluster Terdapat empat proses yang harus dilalui untuk mendapatkan kandidat cluster, diantaranya : menghitung nilai membership function dengan fuzzy set tipe-2, menemukan candidate-1 itemset, menemukan candidate- 2 itemset, dan seleksi kandidat cluster. Fuzzy set tipe-2 dalam penelitian ini menggunakan dua jenis tipe fungsi keanggotaan, yaitu : fungsi kenggotaan jenis triangular sebagai LMF (Lower Membership Function) dan fungsi keanggotaan jenis trapezoidal sebagai UMF (Upper Membership Function). Setiap term j dalam dokumen i r.z dengan frekuensi fij memiliki bobot w ij yang menyatakan bobot atau fungsi keanggotaan term j dalam dokumen i yang terdapat dalam wilayah fungsi r.z keanggotaan fuzzy set tipe-2. Variabel r dalam w ij merupakan variabel linguistik, yaitu : Low, Medium, dan High. Sementara z merepresentasikan LMF dan UMF. Hasil bobot fuzzy tipe-2 dari setiap term selanjutnya akan digunakan untuk menentukan candidate 1-frequent itemset. Untuk menemukan term yang digunakan sebagai candidate 1-itemset, setiap term dilakukan perhitungan nilai support. Perhitungan nilai support didapatkan dari hasil perbandingan antara nilai bobot fuzzy dengan jumlah dokumen. Hasil term j yang diperoleh dari candidate 1-itemset akan diasosiasikan terhadap term yang lain untuk mendapatkan candidate 2-itemset. Setiap pasang term yang memiliki nilai support dan confidence lebih dari minimum support dan minimum confidence akan dijadikan sebagai candidate 2-itemset. Hasil dari candidat 1-itemset dan candidate 2- itemset dijadikan sebagai candidat cluster set c ~q k },dimana D merupakan koleksi dokumen, q merupakan jumlah q-itemset, dan adalah jumlah semua kandidat cluster c yang didapatkan dari candidat 1-itemset dan candidate 2-itemset. (4) Konstruksi cluster tree Untuk membentuk cluster tree dibutuhkan beberapa tahap, yaitu membentuk Document-Term Matrix (DTM), membentuk Term-Cluster Matrix (TCM), dan membentuk Document-Cluster Matrix (DCM) [12], [13]. Diagram alir dari pengelompokan dokumen terdapat pada gambar 1. Evaluasi F-measure merupakan salah satu perhitungan evaluasi dalam sistem temu kembali informasi yang mengkombinasikan antara recall dan precision. Ukuran yang menampilkan timbal balik antara recall dan precision adalah f-measure yang merupakan bobot harmonic mean dari recall dan precision. Recall merupakan dokumen yang ditemukan dan relevan dengan query yang dimasukkan oleh user dalam suatu sistem temu balik informasi. Recall terkait dengan kemampuan suatu sistem untuk mendapatkan dokumen yang relevan. Sementara, precision merupakan jumlah kelompok dokumen yang relevan dari total jumlah dokumen yang ditemukan oleh sistem. Precision terkait dengan tingkat efektivitas sistem temu balik informasi. F(C) dapat didefinisikan dalam persamaan 4., dimana, (4)

3 Start Prepocessing Dokumen Holonym Ekstraksi Term Ekstraksi Kandidat Cluster Konstruksi Cluster Tree End Gambar 1. Diagram Alir Pengelompokan Dokumen dimana D merupakan jumlah dokumen dalam dataset D. Variabel c merupakan cluster yang terdapat dalam sistem. Variabel L merupakan label kelas yang diperoleh dari dataset. c i merupakan jumlah dokumen dalam cluster C(c i Є C). c i merupakan jumlah dokumen dalam class L ( L). Persamaan I j menyatakan jumlah dokumen yang berada tepat dalam kedua cluster c i dan l j. Dataset Terdapat tiga jenis dataset yang digunakan dalam penelitian ini, yaitu : 1. Classic : merupakan dataset dari abstract jurnal ilmiah yang terdiri atas kombinasi empat kelas CACM, CISI, CRANFIELD, dan MEDICAL. Jumlah data yang digunakan dalam dateset classic ini berjumlah 1000 data, dimana setiap kelas, yaitu : CACM, CISI, CRANFIELD dan MEDICAL berjumlah 250 data. CACM merupakan jurnal dengan topik akademis, CISI merupakan jurnal dengan topik informatian retreival, CRAN merupakan jurnal dengan topik sistem penerbangan, dan MED merupakan jurnal dengan topik medis. 2. Reuters : merupakan dataset yang berasal dari koleksi Reuters newswire. Dalam dataset ini terdapat beberapa kelas, diantaranya reut2-001, reut2-002, reut2-003, dan reut Masing-masing kelas terdiri dari 250 data, sehingga total keseluruhan data adalah 1000 data Newsgroup : merupakan kumpulan dari dokumen newsgroup yang terbagi kurang lebih 20 kelas berbeda kelas yang digunakan dalam dataset 20 Newsgroup adalah 4 kelas yang terdiri dari : comp.sys.mac.hardware, rec.sport.baseball, sci.space, dan talk.politics.mideast. Masing masing kelas terdiri dari 150 data, sehingga total terdapat 600 data. Pengujian Metode yang diusulkan dilakukan pengujian dengan menggunakan dua buah skenario berbeda, yaitu : pengujian tanpa penggunaan semantic word holonim dan penggunaan semantic word holonim dalam mendapatkan keyword dari suatu dokumen. Masing masing skenario pengujian dilakukan untuk mencari nilai overall f- measures terbaik berdasarkan jumlah dataset yang berbeda beda. Jumlah dataset yang digunakan adalah 5 jenis data yang berbeda dengan rincian jumlah 200, , dan Hasil dari pengujian ini untuk dataset Classic terdapat pada Tabel 1 dan Gambar 2, untuk dataset Reuters terdapat pada Tabel 2 dan Gambar 3, dan untuk dataset 20 Newsgroup terdapat pada Tabel 3 dan Gambar 4. Tabel 1. Hasil Pengaruh Jumlah Data Terhadap Overall f-measure pada Data Classic Jumlah Data Overall F-Measure Non Holonim Holonim Tabel 2. Hasil Pengaruh Jumlah Data Terhadap Overall f-measure pada Data Reuters Jumlah Data Overall F-Measure Non Holonim Holonim

4 Tabel 3. Hasil Pengaruh Jumlah Data Terhadap Overall f-measure pada Data 20 Newsgroup suatu dokumen. Penggunaan semantic word holonim menghasilkan nilai overall f-measures terbaik pada Jumlah Data Overall F-Measure Non Holonim Holonim Gambar 6. Grafik Pengaruh Jumlah Data Terhadap Overall f-measure pada Data 20 Newsgroup Gambar 4. Grafik Pengaruh Jumlah Data Terhadap Overall f-measure pada Data Classic Gambar 5. Grafik Pengaruh Jumlah Data Terhadap Overall f-measure pada Data Reuters Berdasarkan Tabel 1, Tabel 2, dan Tabel 3 serta Gambar 4, Gambar 5, dan Gambar 6 diketahui bahwa setiap pada dataset memiliki hasil overall f-measures yang berbeda. Pada penggunaan dataset Classic metode yang diusulkan dengan menggunakan semantic word holonim mampu menghasilkan nilai overall f-measures yang lebih baik dibandingkan metode yang tanpa menggunakan holonim sebagai metode untuk mendapatkan keyword dalam jumlah dataset 200 dengan nilai overall f-measures Setiap pengujian yang dilakukan dengan jumlah dataset yang berbeda juga mendapatkan hasil yang sama yaitu nilai overall f-measures metode yang menggunakan holonim lebih baik dibandingkan metode yang tidak menggunakan holonim. Holonim sebagai metode tambahan untuk mendapatkan keyword terbukti mampu untuk mendapatkan keyword yang memiliki karakteristik yang hampir sama, sehingga mampu mengelompokkan dokumen yang memiliki keyword dengan karakteristik yang sama. Pada penggunaan dataset Reuters metode yang diusulkan dengan menggunakan semantic word holonim mampu menghasilkan nilai overall f-measures yang lebih baik dibandingkan metode yang tanpa menggunakan holonim sebagai metode untuk mendapatkan keyword dalam suatu dokumen. Penggunaan semantic word holonim menghasilkan nilai overall f-measures terbaik pada jumlah dataset 1000 dengan nilai overall f-measures Setiap pengujian yang dilakukan dengan jumlah dataset yang berbeda juga mendapatkan hasil yang sama yaitu nilai overall f-measures metode yang menggunakan holonim lebih baik dibandingkan metode yang tidak menggunakan holonim kecuali pada penggunaan dataset 400 dimana nilai overall f-measures metode non holonim lebih baik dibanding metode dengan holonim. Holonim sebagai metode tambahan untuk mendapatkan keyword terbukti mampu untuk mendapatkan keyword yang memiliki karakteristik yang hampir sama, sehingga mampu mengelompokkan dokumen yang memiliki keyword dengan karakteristik yang sama. Pada penggunaan dataset 20 Newsgroup metode yang diusulkan dengan menggunakan semantic word holonim mampu menghasilkan nilai overall f-measures yang lebih baik dibandingkan metode yang tanpa menggunakan holonim sebagai metode untuk mendapatkan keyword dalam suatu dokumen

5 Penggunaan semantic word holonim menghasilkan nilai overall f-measures terbaik pada jumlah dataset 1000 dengan nilai overall f-measures Setiap pengujian yang dilakukan dengan jumlah dataset yang berbeda juga mendapatkan hasil yang sama yaitu nilai overall f- measures metode yang menggunakan holonim lebih baik dibandingkan metode yang tidak menggunakan holonim kecuali pada penggunaan dataset 400 dimana nilai overall f-measures metode non holonim lebih baik dibanding metode dengan holonim. Holonim sebagai metode tambahan untuk mendapatkan keyword terbukti mampu untuk mendapatkan keyword yang memiliki karakteristik yang hampir sama, sehingga mampu mengelompokkan dokumen yang memiliki keyword dengan karakteristik yang sama. 3. Kesimpulan Berdasarkan pengujian didapatkan bahwa penggunaan holonim dalam mendapatkan keyword mampu menghasilkan rata-rata overall f-measure yang lebih baik dibanding non semantic dan hipernim dengan nilai rata rata overall f-measures sebesar untuk data classic, untuk data reuters, dan untuk data 20 newsgroup. Berdasarkan nilai overall f-measures yang didapatkan dapat disimpulkan bahwa penggunaan metode yang disulkan yaitu semantic word holonim untuk mendapatkan keyword dalam suatu dokumen memiliki akurasi yang lebih baik. Hal ini disebabkan dalam mendapatkan keyword dengan menggunakan holonim akan memperluas makna dari suatu kata, sehingga dokumen yang memiliki karakteristik sama akan dikelompokkan menjadi satu kelompok dokumen. in Institut Teknologi Sepuluh Nopember, [10] Y. H. Tseng, Generic title labeling for clustered documents, Generic title labeling Clust. Doc., vol. 37, pp , [11] F. Rozi, S. H. Wijoyo, S. A. Isanta, Y. Azhar, and D. Purwitasari, Pelabelan Klaster Fitur Secara Otomatis pada Perbandingan Review Produk, J. Teknol. Inf. dan Ilmu Komput., vol. 1, no. 2, pp , [12] F. Rozi, C. Fatichah, and D. Purwitasari, Ektraksi Kata Kunci Berdasarkan Hipernim dengan Inisialisasi Klaster Menggunakan Fuzzy Association Rule Mining pada Pengelompokan Dokumen, J. Teknol. Inf., vol. 13, no. 2, pp , [13] F. Rozi and R. Kartadie, Sinonim untuk Ekstraksi Kata Kunci Pada Pengelompokan Dokumen Menggunakan Fuzzy Associotion Rule Mining, Semnasteknomedia, vol. 4, no. 1, [14] R. Baghel and R. Dhir, A Frequent Concepts Based Document Clustering Algorithm, Int. J. Comput. Appl., vol. 4, no. 5, pp. 6 12, [15] G. Bharati and G. Venkatesan, Improving Information Retreival Using Document Cluster and Semantic Synoym Extraction, J. Theor. Appl. Inf. Technol., vol. 36, no. 2, pp , Biodata Penulis Fahrur Rozi, S.Kom., M.Kom., memperoleh gelar Sarjana Komputer (S.Kom), Universitas Brawijaya. Memperoleh gelar Magister Komputer (M.Kom) Jurusan Teknik Informatika, Fakultas Teknologi Informasi, ITS Surabaya pada tahun Saat ini menjadi dosen di STKP PGRI Tulungagung. Rikie Kartadie, S.T., M.Kom., Mendapatkan gelar Sarjana Teknik (S.T.) pada tahun 2001 dari Universitas Pembangunan Nasional Veteran Yogyakarta, mendapatkan gelar Master Komputer (M.Kom.) pada Mei 2014 Konsentrasi Sistem Informasi dari STMIK AMIKOM Yogyakarta, dan menjadi dosen di STKP PGRI Tulungagung. Daftar Pustaka [1] C. Lou, L. Yanjun, and S. M. Chung, Text document clustering based on neighbors, Text Doc. Clust. based neighbors, vol. 68, no. 1, pp , [2] C. L. Chien, F. S. C. Tseng, and T. Liang, An Integration of WordNet and fuzzy association rule mining for multi-label document clustering, Data Knowl. Eng., vol. 69, no. 1, pp , [3] R. Saracoglu, K. Tutuncu, and N. Allahverdi, A new approach on search for similiar documents with multiple categories using fuzzy clustering, Expert Syst. Appl., pp , [4] F. Sukmana and J. L. Bulaili, Rekomendasi Solusi pada Computer Maintenance Management System Menggunakan Association Rule, Koefisien Korelasi Phi dan Chi-Square, in Prosiding Seminar Nasional Manajemen Teknologi XXII, 2015, pp [5] B. C. M. Fung, K. Wang, and M. Ester, Hierarchical document clustering using frequent itemset, in Simon Fraser University, [6] F. Rozi and F. Sukmana, Metode Siklis dan Adaptive Neuro Fuzzy Inference System untuk Peramalan Cuaca, J. Ilm. Penelit. dan Pembelajaran Inform., vol. 1, no. 1, pp. 7 13, [7] C. Chen, F. S. C. Tseng, and T. Liang, Mining fuzzy frequent itemset for hierarchical document clustering, Inf. Process. Manag., vol. 46, pp , [8] F. Beil, M. Ester, and X. Xu, Frequent Term-Based Text Clustering, in Proc. of Int l Conf. on knowledge Discovery and Data Mining, 2002, pp [9] S. Sari, Clustering berbasis dokumen secara hierarki barbasis fuzzy set tipe-2 trapezoidal dan triangular dari frequent itemset,

6 2.1-18

SINONIM UNTUK EKSTRAKSI KATA KUNCI PADA PENGELOMPOKAN DOKUMEN MENGGUNAKAN FUZZY ASSOCIATION RULE MINING

SINONIM UNTUK EKSTRAKSI KATA KUNCI PADA PENGELOMPOKAN DOKUMEN MENGGUNAKAN FUZZY ASSOCIATION RULE MINING STMIK AMIKOM Yogyakarta 6-7 Februari 2016 SINONIM UNTUK EKSTRAKSI KATA KUNCI PADA PENGELOMPOKAN DOKUMEN MENGGUNAKAN FUZZY ASSOCIATION RULE MINING Fahrur Rozi1) Rikie Kartadie2) 1) 2) Pendidikan Teknologi

Lebih terperinci

CLUSTERING DOKUMEN SECARA HIERARKI BERBASIS FUZZY SET TIPE-2 TRAPEZOIDAL DAN TRIANGULAR DARI FREQUENT ITEMSET

CLUSTERING DOKUMEN SECARA HIERARKI BERBASIS FUZZY SET TIPE-2 TRAPEZOIDAL DAN TRIANGULAR DARI FREQUENT ITEMSET CLUSTERING DOKUMEN SECARA HIERARKI BERBASIS FUZZY SET TIPE- TRAPEZOIDAL DAN TRIANGULAR DARI FREQUENT ITEMSET Susiana Sari 1*), Agus Zainal Arifin danwijayanti Nurul Khotimah Informatics Department, Faculty

Lebih terperinci

PENGGUNAAN MOVING AVERAGE DENGAN METODE HYBRID ARTIFICIAL NEURAL NETWORK DAN FUZZY INFERENCE SYSTEM UNTUK PREDIKSI CUACA

PENGGUNAAN MOVING AVERAGE DENGAN METODE HYBRID ARTIFICIAL NEURAL NETWORK DAN FUZZY INFERENCE SYSTEM UNTUK PREDIKSI CUACA E-ISS : 2540-8984 PEGGUAA MOVIG AVERAGE DEGA METODE HYBRID ARTIFICIAL EURAL ETWORK DA FUZZY IFERECE SYSTEM UTUK PREDIKSI CUACA Fahrur Rozi 1), Farid Sukmana 2) 1) Jurusan Pendidikan Teknologi Informasi,

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

OPTIMASI SUFFIX TREE CLUSTERING DENGAN WORDNET DAN NAMED ENTITY RECOGNITION UNTUK PENGELOMPOKAN DOKUMEN

OPTIMASI SUFFIX TREE CLUSTERING DENGAN WORDNET DAN NAMED ENTITY RECOGNITION UNTUK PENGELOMPOKAN DOKUMEN Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) p-issn: 2355-7699 Vol. 4, No. 4, Desember 2017, hlm. 263-267 e-issn: 2528-6579 OPTIMASI SUFFIX TREE CLUSTERING DENGAN WORDNET DAN NAMED ENTITY RECOGNITION

Lebih terperinci

PENGEMBANGAN WEBSITE DAN SISTEM INFORMASI DESA DI KABUPATEN TULUNGAGUNG

PENGEMBANGAN WEBSITE DAN SISTEM INFORMASI DESA DI KABUPATEN TULUNGAGUNG PENGEMBANGAN WEBSITE DAN SISTEM INFORMASI DESA DI KABUPATEN TULUNGAGUNG Fahrur Rozi 1), Tomi Listiawan 2) 1) 2) Jurusan Pendidikan Teknologi Informasi, STKIP PGRI Tulungagung Jl Mayor Sujadi Timur no.7.

Lebih terperinci

Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen

Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen Dyah Herawatie Prodi Sistem Informasi Fakultas Sains dan Teknologi Universitas Airlangga Surabaya, Indonesia dy4h_h3r4@yahoo.com

Lebih terperinci

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI

Lebih terperinci

IMPROVEMENT OF SENTENCES SCORING BASED NEWS FEATURE FOR NEWS SUMMARY ON SOCIAL MEDIA ISSUES

IMPROVEMENT OF SENTENCES SCORING BASED NEWS FEATURE FOR NEWS SUMMARY ON SOCIAL MEDIA ISSUES IMPROVEMENT OF SENTENCES SCORING BASED NEWS FEATURE FOR NEWS SUMMARY ON SOCIAL MEDIA ISSUES Nur Hayatin* 1, Gita I. Marthasari 2 1,2 Informatic Engineering Departement, Engineering Departement Universitas

Lebih terperinci

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah Metode Latent Semantic Analysis dan Algoritma Weighted Tree Similarity untuk Pencarian berbasis b Semantik oleh : Umi Sa adah 5109201030 Pembimbing : Prof. Drs.Ec. Ir. Riyanarto Sarno, M.Sc, Ph.D Umi Laili

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan

Lebih terperinci

PERBANDINGAN SEGMENTASI CITRA BERWARNA DENGAN FUZZY CMEANS CLUSTERING PADA BEBERAPA REPRESENTASI RUANG WARNA

PERBANDINGAN SEGMENTASI CITRA BERWARNA DENGAN FUZZY CMEANS CLUSTERING PADA BEBERAPA REPRESENTASI RUANG WARNA PERBANDINGAN SEGMENTASI CITRA BERWARNA DENGAN FUZZY CMEANS CLUSTERING PADA BEBERAPA REPRESENTASI RUANG WARNA Naser Jawas Sistem Komputer STMIK STIKOM Bali Jl Raya Puputan No.86 Renon, Denpasar, Bali 80226

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari BAB I PENDAHULUAN 1.1 Latar Belakang Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari internet ataupun milik pribadi juga semakin berkembang. Permasalahan utama adalah bagaimana memperoleh

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

METODE WEIGHTED MAXIMUM CAPTURING UNTUK KLASTERISASI DOKUMEN BERBASIS FREQUENT ITEMSETS

METODE WEIGHTED MAXIMUM CAPTURING UNTUK KLASTERISASI DOKUMEN BERBASIS FREQUENT ITEMSETS Vol. 6, No. 2, September 2013 ISSN 1979-5661 METODE WEIGHTED MAXIMUM CAPTURING UNTUK KLASTERISASI DOKUMEN BERBASIS FREQUENT ITEMSETS Gede Aditra Pradnyana 1, Arif Djunaidy 2 1 Jurusan Teknik Informatika,

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

KLASIFIKASI FITUR DALAM DOKUMEN REVIEW PRODUK DENGAN METODE LOCAL POINTWISE MUTUAL INFORMATION

KLASIFIKASI FITUR DALAM DOKUMEN REVIEW PRODUK DENGAN METODE LOCAL POINTWISE MUTUAL INFORMATION KLASIFIKASI FITUR DALAM DOKUMEN REVIEW PRODUK DENGAN METODE LOCAL POINTWISE MUTUAL INFORMATION Yufis Azhar Program Studi Teknik Informatika Fakultas Teknik, Universitas Muhammadiyah Malang Email : yufis.az@gmail.com

Lebih terperinci

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi

Lebih terperinci

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB I PENDAHULUAN 1.1 LATAR BELAKANG BAB I PENDAHULUAN Pada bab ini akan dibahas latar belakang penelitian, perumusan masalah, tujuan penelitian, manfaat penelitian dan batasan masalah. 1.1 LATAR BELAKANG Perkembangan penggunaan informasi

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

Pengelompokan Dokumen Menggunakan Dokumen Berlabel dan Tidak Berlabel Dengan Pendekatan Modified Heuristic Fuzzy Co-Clustering

Pengelompokan Dokumen Menggunakan Dokumen Berlabel dan Tidak Berlabel Dengan Pendekatan Modified Heuristic Fuzzy Co-Clustering Hayati, Pengelompokan Dokumen pada Dokumen Berlabel dan Tidak Berlabel dengan Menggunakan Algoritma Heuristic Fuzzy... 103 Pengelompokan Dokumen Menggunakan Dokumen Berlabel dan Tidak Berlabel Dengan Pendekatan

Lebih terperinci

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA Desmin Tuwohingide 1, Mika Parwita 2, Agus Zainal Arifin 3, Diana Purwitasari 4 1,2,3,4 Teknik

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

Lili Tanti. STMIK Potensi Utama, Jl. K.L. Yos Sudarso Km. 6,5 No. 3A Tj. Mulia Medan ABSTRACT

Lili Tanti.   STMIK Potensi Utama, Jl. K.L. Yos Sudarso Km. 6,5 No. 3A Tj. Mulia Medan ABSTRACT Lili, Penerapan Data Mining Untuk 35 PENERAPAN DATA MINING UNTUK MENENTUKAN JUMLAH MAHASISWA PADA SATU DAERAH DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Lili Tanti Email : lili@potensi-utama.ac.id STMIK

Lebih terperinci

DAFTAR ISI Transformasi data... 47

DAFTAR ISI Transformasi data... 47 DAFTAR ISI HALAMAN JUDUL... i HALAMAN PENGESAHAN... ii HALAMAN PERNYATAAN... iii PRAKATA... iv DAFTAR ISI... vi DAFTAR TABEL... ix DAFTAR GAMBAR... xi INTISARI... xiii ABSTRACT... xiv BAB I PENDAHULUAN...

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

Link Analysis (Superset) 3 Kategori Link Analysis (#1) 3 Kategori Link Analysis (#2) Association Rule Mining. 3 Kategori Link Analysis (#3)

Link Analysis (Superset) 3 Kategori Link Analysis (#1) 3 Kategori Link Analysis (#2) Association Rule Mining. 3 Kategori Link Analysis (#3) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #7: Association Rules Mining (Bagian 1) Gunawan Jurusan Teknik Informatika Link Analysis (Superset) Tujuan: Mencari hubungan antara

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Document summarization adalah proses pengambilan teks dari sebuah dokumen dan membuat sebuah ringkasan yang mempunyai informasi yang lebih berguna bagi user

Lebih terperinci

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means

Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.

Lebih terperinci

KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI

KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI TUGAS AKHIR CI1599 KLASTERISASI PADA SUBRUANG DENGAN ALGORITMA PEMBOBOTAN ENTROPI PADA K-MEANS PADA SPARSE DATA BERDIMENSI TINGGI AHMAD DENI DWI PRANOTO NRP 5103 100 015 Dosen Pembimbing I Rully Soelaiman,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

ANALISA KONSISTENSI POLA PEMINJAMAN BUKU MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus: UPT Perpustakaan Universitas Sebelas Maret)

ANALISA KONSISTENSI POLA PEMINJAMAN BUKU MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus: UPT Perpustakaan Universitas Sebelas Maret) ANALISA KONSISTENSI POLA PEMINJAMAN BUKU MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus: UPT Perpustakaan Universitas Sebelas Maret) Miranda Nur Qolbi Aprilina 1, Wiranto 2,Widodo 3 1,2 Program Studi Informatika,

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN I-1 BAB I PENDAHULUAN 1.1 Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas merupakan sebuah bukti nyata bahwa informasi sangat diperlukan bagi pencari informasi [16]. Dengan munculnya

Lebih terperinci

ANALISIS KLASTERING LIRIK LAGU INDONESIA

ANALISIS KLASTERING LIRIK LAGU INDONESIA ANALISIS KLASTERING LIRIK LAGU INDONESIA Afdilah Marjuki 1, Herny Februariyanti 2 1,2 Program Studi Sistem Informasi, Fakultas Teknologi Informasi, Universitas Stikubank e-mail: 1 bodongben@gmail.com,

Lebih terperinci

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki

Lebih terperinci

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430 JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-430 VISUALISASI SIMILARITAS TOPIK PENELITIAN DENGAN PENDEKATAN KARTOGRAFI MENGGUNAKAN SELF- ORGANIZING MAPS (SOM) Budi Pangestu,

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Salah satu faktor penting penunjang globalisasi ialah internet. Semakin majunya teknologi internet menyebabkan banyaknya pengembang perangkat lunak membuat berbagai

Lebih terperinci

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1 ANALISA PERBANDINGAN METODE HIERARCHICAL CLUSTERING, K-MEANS DAN GABUNGAN KEDUANYA DALAM MEMBENTUK CLUSTER DATA (STUDI KASUS : PROBLEM KERJA PRAKTEK JURUSAN

Lebih terperinci

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom

Lebih terperinci

KLASIFIKASI KECENDERUNGAN PENYAKIT MATA DI JAWA BARAT DENGAN ASSOCIATION RULE DAN NAÏVE BAYES CLASSIFIER

KLASIFIKASI KECENDERUNGAN PENYAKIT MATA DI JAWA BARAT DENGAN ASSOCIATION RULE DAN NAÏVE BAYES CLASSIFIER KLASIFIKASI KECENDERUNGAN PENYAKIT MATA DI JAWA BARAT DENGAN ASSOCIATION RULE DAN NAÏVE BAYES CLASSIFIER Zillan Taufiq Budiman 1), Wina Witanti 2), Dian Nursantika 3) 1), 2), 3) Informatika Universitas

Lebih terperinci

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN IMPLEMENTATION OF COMPLETE AND AVERAGE LINKAGE TO THE FORMATION FACULTY RESEARCH GROUP Oleh: DEVY SURYANINGTYAS 12.1.03.02.0366

Lebih terperinci

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL Nadia Damayanti 1, Nur Rosyid Mubtada i, S.Kom, M.Kom 2, Afrida Helen S.T, M.Kom

Lebih terperinci

Penerapan Algoritma K-Means untuk Clustering

Penerapan Algoritma K-Means untuk Clustering Seminar Perkembangan dan Hasil Penelitian Ilmu Komputer (SPHP-ILKOM) 71 Penerapan Algoritma K-Means untuk ing Dokumen E-Jurnal STMIK GI MDP Ernie Kurniawan* 1, Maria Fransiska 2, Tinaliah 3, Rachmansyah

Lebih terperinci

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Saat ini, perkembangan teknologi telah memberikan pengaruh yang sangat besar di dalam kehidupan manusia. Salah satu pengaruh tersebut di bidang informasi yaitu dalam

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi komputer khususnya di jaringan Internet telah berkembang dengan sangat cepat. Semua orang dapat saling bertukar dan mendapatkan informasi

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM : PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS

Lebih terperinci

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521 JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: 2301-9271 A-521 Analisa Perbandingan Metode Hierarchical Clustering, K-means dan Gabungan Keduanya dalam Cluster Data (Studi kasus : Problem Kerja Praktek Jurusan

Lebih terperinci

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP Teguh Pradana 1) 1) Program Studi/Prodi Teknik Informatika, STMIK Yadika, email: INTI_PERSADA_SOFTWARE@yahoo.co.id Abstrak: Perkembangan

Lebih terperinci

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM) ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM) Nurani 1, Hamdan Gani 2 1 nurani_nanni@yahoo.com, 2 hamdan.gani.inbox@gmail.com

Lebih terperinci

KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola)

KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) PRESENTASI TUGAS AKHIR KI091391 KLASTERISASI BERDASARKAN KESAMAAN POLA DENGAN MENGGUNAKAN ALGORITMA PCLUSTER (Kata kunci: Penggalian Data, Klasterisasi Kesamaan Pola) Penyusun Tugas Akhir : Kartika Wijayati

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang 1.1 Latar Belakang BAB I PENDAHULUAN Peningkatan jumlah dokumen ilmiah yang ada menimbulkan kebutuhan akan suatu sistem yang dapat memberikan rekomendasi dokumen ilmiah yang baik. Recommendation system

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM

METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM METODE ADAPTIVE-SECTING DIVISIVE CLUSTERING DENGAN PENDEKATAN GRAF HUTAN YANG MINIMUM Achmad Maududie 1), Wahyu Catur Wibowo 2) 1) Program Studi Sistem Informasi, Universitas Jember 2) Fakultas Ilmu Komputer,

Lebih terperinci

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) Andika Elok Amalia 1), Muhammad Zidny Naf an 2) 1), 2) Program Studi Informatika ST3 Telkom Jl D.I.

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat

Lebih terperinci

PENGGUNAAN ALGORITMA APRIORI UNTUK MENENTUKAN REKOMENDASI STRATEGI PENJUALAN PADA TOSERBA DIVA SKRIPSI

PENGGUNAAN ALGORITMA APRIORI UNTUK MENENTUKAN REKOMENDASI STRATEGI PENJUALAN PADA TOSERBA DIVA SKRIPSI PENGGUNAAN ALGORITMA APRIORI UNTUK MENENTUKAN REKOMENDASI STRATEGI PENJUALAN PADA TOSERBA DIVA SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom.) Pada Program

Lebih terperinci

Implementasi Generalized Vector Space Model Menggunakan WordNet

Implementasi Generalized Vector Space Model Menggunakan WordNet Implementasi Generalized Vector Space Model Menggunakan WordNet Adi Wibowo*, Andreas Handojo**, Charistian Widjaja*** Jurusan Teknik Informatika Fakultas Teknologi Industri, Universitas Kristen Petra E-Mail:

Lebih terperinci

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang 58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

II. TINJAUAN PUSTAKA

II. TINJAUAN PUSTAKA II. TINJAUAN PUSTAKA 2.1 Sistem Informasi Manajemen Mcleod R dan Schell G, (2004) membagi sumber daya menjadi dua bagian yaitu sumberdaya fisikal dan sumberdaya konseptual. Sumber daya fisikal terdiri

Lebih terperinci

PENERAPAN METODE APRIORI ASOSIASI TERHADAP PENJUALAN PRODUCT COSMETIC UNTUK MENDUKUNG STRATEGI PENJUALAN

PENERAPAN METODE APRIORI ASOSIASI TERHADAP PENJUALAN PRODUCT COSMETIC UNTUK MENDUKUNG STRATEGI PENJUALAN PENERAPAN METODE APRIORI ASOSIASI TERHADAP PENJUALAN PRODUCT COSMETIC UNTUK MENDUKUNG STRATEGI PENJUALAN SKRIPSI Diajukan untuk memenuhi salah satu syarat guna memperoleh gelar Sarjana Komputer (S.Kom)

Lebih terperinci

JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI)

JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI) JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI) CLASSIFICATION OF THESIS USING SELF ORGANIZING MAPS CLUSTERING

Lebih terperinci

POLA KEMAMPUAN ANAK BERDASARKAN RAPOR MENGGUNAKAN TEXT MINING DAN KLASIFIKASI NEAREST NEIGHBOR

POLA KEMAMPUAN ANAK BERDASARKAN RAPOR MENGGUNAKAN TEXT MINING DAN KLASIFIKASI NEAREST NEIGHBOR Seminar Nasional Teknologi Informasi dan Multimedia 07 STMIK AMIKOM Yogyakarta, 4 Februari 07 ISSN : 30-3805 POLA KEMAMPUAN ANAK BERDASARKAN RAPOR MENGGUNAKAN TEXT MINING DAN KLASIFIKASI NEAREST NEIGHBOR

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Pola pengaksesan pengguna terhadap sebuah situs web biasanya tergambarkan dalam sebuah pola sekuensial. Pola sekuensial mengindikasikan bahwa transaksi biasanya terjadi secara

Lebih terperinci

2.2 Data Mining. Universitas Sumatera Utara

2.2 Data Mining. Universitas Sumatera Utara Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record

Lebih terperinci

3 METODE. Implementasi Document Index Graph. Penetapan nilai jarak intercluster. Penetapan nilai jarak intracluster. Stemming Penetapan jumlah dokumen

3 METODE. Implementasi Document Index Graph. Penetapan nilai jarak intercluster. Penetapan nilai jarak intracluster. Stemming Penetapan jumlah dokumen 3 METODE Metode penelitian metafile penyusun struktur digraf menggunakan algoritme Document Index Graph (DIG) terdiri atas beberapa tahapan yaitu tahap analisis masalah dan studi literatur dari penelitian

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN 25 BAB III METODE PENELITIAN 3.1 Desain Penelitian Penelitian ini menggunakan jenis penelitian eksperimen, dengan tahapan penelitian sebagai berikut: 1. Pengumpulan Data Pengumpulan data merupakan langkah

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Di dalam landasan teori ini, akan dibahas tentang teori teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. 2.1 Basis Data (Database) Basis data diperlukan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses atau bagaimana mencari informasi, namun

Lebih terperinci

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Aufa Bil Ahdi P 1, Kemas Rahmat Saleh W, S.T., M.Eng 2, Anisa Herdiani, S.T., M.T 3 1.2.3 Teknik Informatika,

Lebih terperinci

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL Nur Rosyid M, Entin Martiana, Damitha Vidyastana, Politeknik Elektronika

Lebih terperinci

PREDIKSI OUTLIER MENGGUNAKAN DATA TEPI CLUSTER UNTUK MENINGKATKAN KUALITAS PENGETAHUAN HASIL DATA MINING

PREDIKSI OUTLIER MENGGUNAKAN DATA TEPI CLUSTER UNTUK MENINGKATKAN KUALITAS PENGETAHUAN HASIL DATA MINING PREDIKSI OUTLIER MENGGUNAKAN DATA TEPI CLUSTER UNTUK MENINGKATKAN KUALITAS PENGETAHUAN HASIL DATA MINING Barry Nuqoba, Arif Djunaidy Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

BAB 3 ANALISA DAN PERANCANGAN

BAB 3 ANALISA DAN PERANCANGAN BAB 3 ANALISA AN PERANCANGAN 3.1 Gambaran Umum Pada masa sekarang ini, proses pencarian dokumen dalam web seperti Google, Yahoo, dan sebagainya dilakukan dengan menginput query yang diinginkan pada kotak

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang 1 BAB I PENDAHULUAN Bab pendahuluan ini membahas tentang latar belakang masalah yaitu fenomena perkembangan data yang terus bertambah tetapi informasi yang dihasilkan monoton, sehingga diperlukan data

Lebih terperinci

KOMBINASI TEKNIK CHI SQUARE DAN SINGULAR VALUE DECOMPOSITION UNTUK REDUKSI FITUR PADA PENGELOMPOKAN DOKUMEN

KOMBINASI TEKNIK CHI SQUARE DAN SINGULAR VALUE DECOMPOSITION UNTUK REDUKSI FITUR PADA PENGELOMPOKAN DOKUMEN KOMBINASI TEKNIK CHI SQUARE DAN SINGULAR VALUE DECOMPOSITION UNTUK REDUKSI FITUR PADA PENGELOMPOKAN DOKUMEN Catur Supriyanto 1, Affandy 2 1,2 Fakulti Teknologi Maklumat dan Komunikasi, Universiti Teknikal

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR

WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR Achmad Thoriq B, Nelly Indriani W Abstract News aggregator is one type of aggregator system (collector) which collects

Lebih terperinci

REKOMENDASI SOLUSI PADA COMPUTER MAINTENANCE MANAGEMENT SYSTEM MENGGUNAKAN ASSOCIATION RULE, KOEFISEN KORELASI PHI DAN CHI-SQUARE

REKOMENDASI SOLUSI PADA COMPUTER MAINTENANCE MANAGEMENT SYSTEM MENGGUNAKAN ASSOCIATION RULE, KOEFISEN KORELASI PHI DAN CHI-SQUARE REKOMENDASI SOLUSI PADA COMPUTER MAINTENANCE MANAGEMENT SYSTEM MENGGUNAKAN ASSOCIATION RULE, KOEFISEN KORELASI PHI DAN CHI-SQUARE Farid Sukmana 1) dan Joko Lianto Buliali 2) 1) Management of Information

Lebih terperinci

APLIKASI MONITORING KETERSEDIAAN STOK BARANG MINIMARKET DENGAN METODE MARKET BASKET ANALYSIS (MBA)

APLIKASI MONITORING KETERSEDIAAN STOK BARANG MINIMARKET DENGAN METODE MARKET BASKET ANALYSIS (MBA) Seminar Nasional Teknologi Informasi dan Multimedia 2016 APLIKASI MONITORING KETERSEDIAAN STOK BARANG MINIMARKET DENGAN METODE MARKET BASKET ANALYSIS (MBA) Sugiyatno 1), Adhika Pramita Widyasari 2) 1),

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci